Apache Kafka — это распределённая платформа для потоковой передачи событий с открытым исходным кодом, разработанная под эгидой Apache Software Foundation. Платформа была создана в 2010 году в LinkedIn для обработки больших объёмов данных в реальном времени. С тех пор Apache Kafka значительно расширила свои возможности и стала одним из ведущих инструментов для построения высокопроизводительных систем обработки данных.
Apache Kafka позволяет реализовывать масштабируемую и устойчивую инфраструктуру для потоковой передачи данных, обеспечивая быстрый обмен сообщениями между различными компонентами системы. Платформа использует концепцию "тем", которые служат для организации данных в виде последовательностей событий. Каждое событие записывается в журнал, что обеспечивает надежность и возможность повторного воспроизведения данных.
- Производительность: Обеспечивает высокую пропускную способность для чтения/записи данных, что позволяет обрабатывать миллионы сообщений в секунду.
 - Масштабируемость: Позволяет горизонтально масштабировать систему, добавляя новые узлы без остановки работы.
 - Устойчивость: Данные хранятся на дисках, что обеспечивает надёжность и защиту от потери информации.
 - Поддержка многопоточности: Позволяет одновременно обрабатывать данные нескольким потребителям.
 - Упрощённая интеграция: Поддерживает множество клиентов на различных языках программирования, что позволяет легко интегрировать с другими приложениями и системами.
 - Возможности планирования: Позволяет настраивать условия доставки сообщений и обработки данных в реальном времени.