Это первый митап для дата-инженеров и дата-сайентистов компаний Альфа-групп: Альфа-Банк, Альфа-Банк Беларусь, билайн, Х5, АльфаСтрахование, Альфа-Капитал. Собираемся, чтобы познакомиться, обменяться знаниями и поделиться экспертизой.
А ещё, будем петь под гитару, играть в покер и мафию, и все это на фоне ковров.
👩💻Welcome coffee, регистрация гостей. Открытие конференции
10.30 — 10.40
🤚Приветственное слово организаторов
DE
10.40 — 11.00
Спиливаем spill'ы:
Что такое spill'ы? Почему они возникают? Устранение в зависимости от вида spill'a
Александр Маркачёв Старший инженер данных, билайн
11.00 — 11.20
Как мы делали бэкап Greenplum в Ceph
Александр Молчанский Менеджер направления «Развитие платформы больших данных», X5 Group
Алексей Кузнецов Системный архитектор развития платформы больших данных, Х5 Group
11.20 — 11.30
☕️Coffee & 🎸Guitar Break
11.30 — 11.50
Change Data Capture в Hadoop.
Необходимость репликации с минимальной задержкой или зачем нам CDC? Debezium — что это такое и с чем его едят. Разбираемся в нюансах и принципах работы. Поток открыли, а как заливать? Выбираем инструмент загрузки изменений в Hadoop: NiFi vs Spark Streaming vs Kafka Connect
Иван Биленко Data engineer, АльфаСтрахование
11.50 — 12.10
FeatureStore: организация единого процесса работы с данными.
Доклад об инструментах для создания единого процесса работы с модельными данными, которые: — помогают DE создавать структурированные ETL процессы — дают возможность DS переиспользовать фичи — ускоряют вывод моделей в прод ML-инженерами
Егор Моренко Руководитель направления развития фреймворков, Альфа-Банк
12.10 — 12.20
☕️Coffee & 🎸Guitar Break
12.20 — 12.50
Круглые столы
12.50 — 13.30
🍽Обед
DS
13.30 — 13.50
Приемы повышения точности геолокации телефонов на сети мобильного оператора.
Мы восстанавливаем треки пользователей по вспышкам на БС: их координатам и свечениям. С целью планирования транспортной инфраструктуры, прогнозирования нагрузки, поиска трендов и спасения людей в случае беды. И в этом докладе мы расскажем, как
Артём Каледин Старший разработчик математических моделей и алгоритмов в команде Геоаналитики, билайн
13.50 — 14.10
Как мы искали структуру в чеках, и зачем нам это понадобилось.
Расскажем о том, как мы работали с чеками ОФД. Данный источник содержит детальную информацию о тратах клиентов, однако данные являются крайне неструктурированными. Расскажем, как выделить необходимую структуру в этих данных, зачем тут машинное обучение и как не разориться на разметке данных для этих задач
Демид Гаибов Младший специалист по интеллектуальному анализу данных, Альфа-Банк
14.10 — 14.20
☕️Coffee & 🎸Guitar Break
14.20 — 14.40
Выявление и удержание клиентов ЮЛ, склонных к переходу в другой банк.
Доклад будет интересен, если вы хотите узнать: — в чём связь наличия счёта в другом банке и оттока клиента — почему стандартная модель прогноза оттока не подходит для удержания клиентов со счётом в другом банке
Мария Самоделкина Специалист по интеллектуальному анализу данных, Альфа-Банк
14.40 — 15.00
Индивидуальные курсы валют.
Расскажем про модель ценообразования по валютообменным операциям для физических лиц. А если проще, то модель индивидуального курса по валютообменке. Розничный бизнес.
Константин Бичун Отдел продвинутой аналитики, ведущий специалист по работе с данными, Альфа-Банк Беларусь
15.00 — 15.10
☕️Coffee & 🎸Guitar Break
15.10 — 15.30
Наш опыт CV в страховании.
Два кейса: — работа с CAPTCH'а и анонимизация фото — как мы применяли и дообучали нейросети
Иван Земляной Data scientist, АльфаСтрахование
15.30 — 15.50
ML в HR: подбор сотрудников методами машинного обучения
Арсений Расов Старший специалист по интеллектуальному анализу данных, Альфа-Банк
Вячеслав Носов Старший специалист по интеллектуальному анализу данных, Альфа-Банк
15.50 — 16.00
☕️Coffee & 🎸Guitar Break
16.00 — 16.40
Круглые столы
16.40 — 23.00
🥂After Party: Игры — покер, мафия Песни под гитару и многое другое