Программу мы поделили на две части: Python Track и Data Track. Доклады будут идти параллельно, но не страшно, если вы что-то пропустите: после конференции подготовим видеозаписи и вышлем ссылку всем участникам PyconRussia-2022. А теперь к докладам.
Python Track
- Евгений Афонасьев из Тинькофф расскажет, как проходят собеседования в крупных компаниях, как к ним готовиться и что надо знать и уметь, если ты претендуешь на должность синьера. «А не синьер ли ты часом!?»
- Артем Приходько из Avito покажет, с какими проблемами можно столкнуться, затаскивая мультипроцессинг в реальные продакшн сервисы. «Python vs multiprocessing»
- Автор блога «Берлога программиста» Виктор Тыщенко научит упаковывать python приложения и покажет, как реализована контейнеризация в linux. «Контейнеризация python без боли»
- Алексей Смирнов из Profiscope пройдется по текущему состоянию PyPI (от статистики по пакетам и отдельным характеристикам хранимых артефактов, до трактовки тенденций в python-сообществе) и поговорит о безопасности компонентной базы и цепочки поставки в целом. «PyPI сегодня – радости статистики и печали безопасности»
- Сергей Петров из Selectel расскажет, можно ли сделать конфиги для сложных сервисов красивыми и легкими и если да, то какие способы для этого существуют. «Программируемые конфиги»
- Александр Галкин из Литрес поговорит об архитектуре приложений и на конкретных примерах кода покажет, как структурировать легаси системы с помощью стратегических и тактических паттернов DDD. «Делаем модульный монолит с использованием DDD»
- Арсений Григорьев и Василий Близнецов из Positive Technologies поделятся историей о том, как они переписали и интегрировали систему для управления макетом кибер полигона. «Архитектура сервисов полигона для кибер учений»
- Григорий Макеев из РН-БашНИПИнефть попытается опровергнуть мнение, что Python не пишут серьёзные десктоп-приложения для пользователей. (Вангуем жаркую дискуссию после доклада). «Промышленный инженерный софт на Python – неужели?»
- Сергей Васечко из Точки поделится интересным опытом маршрутизации на RABBITMQ и расскажет, что заставило их выбрать именно такой путь. «Менеджер распределенных заданий на кролике без celery»
- Сурен Хоренян из МТС AI расскажет, как подружить OpenAPI и JSON:API и почему они не захотели использовать Django с DRF и расширение для JSON:API, а выбрали именно FastAPI. «Использование JSON:API в разработке приложений на FastAPI»
- Дмитрий Легчиков и Ксения Вергелес из ЦИАН расскажут, как превратить графы знаний в удобный корпоративный инструмент, который объединяет и связывает данные внутри компании из разных источников. «Объединение данных компании с помощью графа знаний»
- Александр Караваев из Тинькофф расскажет, что делать, если из-за особенностей работы баз данных невозможно хранить все данные в одном месте и как построить максимально расширяемую и кастомизируемую систему с минимальным ущербом остальным ее параметрам. «Сбалансированная система хранения и поиска данных на python»
- Олег Пригода из Лаборатории Касперского расскажет, как они разрабатывали инструмент для запуска разнородных тестов на разнородном железе. «Пилим питона на конструктор. Как мы кастомизировали PyTest для счастья разработчиков, билд-инженеров, тестировщиков и менеджеров»
- Денис Аникин из Райффайзенбанк расскажет, как разрабатывался и эволюционировал их командный набор CI/CD пайплайнов и поделится мыслями о том, каким он вообще должен быть и с чего начать разработку конвейера. «Современный CI/CD пайплайн для python микросервисов»
Data Track
- Александр Ошурков из МКБ расскажет про выбор компонентов решения MLOps и первые шаги внедрения. «MLOps и создание управляемой среды для моделей машинного обучения»
- Иван Канашов из Тинькофф расскажет, как в компании строят свою систему типа Data Catalog и наполняют ее метаданными из более чем 25 источников, используя Apache Airflow. «Удобное тестирование ETL процессов Apache Airflow»
- Никита Дмитриев из Катбуст поделится историей о том, как они создавали инструмент для пообъектного сравнения, позволяющий понять на каких объектах разные модели ML ведут себя лучше, а на каких хуже. «Как мы переизобретали эксель для MLops’а»
- Ольга Филиппова из Evidently AI поговорит о том, зачем и как делать мониторинг ML-моделей в production, что такое data drift и как его измерить. «Мониторинг ML-моделей в production: как измерить data drift и интегрировать это в ML-пайплайн»
- Никита Корольков из SberCloud покажет всем, что kubernetes не такой страшный и что можно не бояться с ним работать через python. «Дружим python с kubernetes. Или сказ о том, как запускать ML jobs, jupyter notebooks, inferences на больших железяках»
- Денис Рогинский из Яндекса познакомит с новой моделью ML для прогнозирования дождя, которая впервые в истории опирается не только на данные специализированных приборов наблюдения за погодой, но и на сообщения пользователей об осадках. «Meteum: 2.0 – как сделать прогноз погоды точнее с помощью сообщений пользователей»
- Андрей Попов из Positive Technologies расскажет, какие проблемы ожидают ETL проект во время фазы активного увеличения кодовой базы, как их можно эффективно решать с помощью изолированных идемпотентных шагов пайпланов. «Отказоустойчивое масштабирование ETL систем»
- Олег Кочергин из СберЗдоровье поделится своим видением платформы данных и расскажет про предпосылки появления в СберЗдоровье и конкретную архитектуру на основе современных open-source компонентов. «Современная платформа данных»
- Денис Усачёв из Сбердевайсы расскажет, что делать, если маленький наколенный проект с 2 RPS для использования несколькими людьми, выстрелил и накрылся волной фича реквестов и пользователей из десятков команд. «Как мы один pet-project масштабировали»
- Юрий Кацер со всех сторон рассмотрит задачу changepoint detection, методы для обнаружения точек изменения состояния и библиотеки на python, с помощью которых можно эту задачу решать. «Поиск точек изменения состояния (changepoint detection) на python»
Вуф, вроде бы все детали рассказали, если остались вопросы – готовы отвечать. А еще у нас есть чат PyconRussia в телеграм, еще больше информации там.