Что выбрать Python-разработчику для работы с Kafka: confluent-kafka vs kafka-python
Почему производительность confluent-kafka выше, чем у kafka-python, чем еще отличаются эти Python-библиотеки для разработки клиентов Apache Kafka, и что выбирать. Хотя Java считается более подходящей для создания высоконагруженных приложений, многие разработчики используют Python, который намного проще. Этот язык программирования подходит даже для написания продюсеров и потребителей Apache Kafka. Но в этом случае перед разработчиком встает выбор: какую библиотеку использовать. Например, раньше я обычно пользовалась библиотекой kafka-python...
Apache Kafka в Python: краткое руководство для разработчиков
Apache Kafka — распределенная платформа для потоковой обработки данных, способная обрабатывать миллионы событий в секунду. В этой статье разберем, как работать с Kafka в Python: от настройки до продвинутых сценариев. - Топик (Topic): Логический канал для сообщений (например, user_activity). - Партиция (Partition): Топик делится на партиции для параллельной обработки. - Производитель (Producer): Приложение, отправляющее сообщения в топик. - Потребитель (Consumer): Приложение, читающее сообщения из топика...
167 читали · 2 года назад
Проект инженерии данных с DAG Airflow «от и до». Часть 1
Источник: Nuances of Programming Инструментарий Обзор Сделаем конвейер данных, целиком оркестрируемый в Airflow. Сначала создадим тему Kafka, затем отправим сообщения, в которых в качестве записей содержатся электронная почта и одноразовый пароль OTP. Таким образом проиллюстрируем потоковую передачу данных в тему Kafka. Далее получим эти данные из темы Kafka, вставим их в таблицу Cassandra и в коллекцию MongoDB и проверим наличие в них корректных данных. Если таковые имеются, отправим письмо на электронную почту и сообщение в Slack с адресом почты и одноразовым паролем OTP...