Первая конференция Yandex Cloud про Open Source инструменты для обработки данных и создания корпоративных хранилищ.
Data Open Source Day — это доклады экспертов, которые создают решения с открытым исходным кодом для реальных задач бизнеса. Это дискуссии о применении Open Source на практике, о безопасности технологий, о развитии сообщества и о социально-значимых проектах на базе открытых технологий.
Что обсудили:
Какие реальные бизнес-задачи можно решать с помощью Open Source продуктов Яндекса, например, YDB и YTsaurus.
Как большие компании строят работу по хранению и обработке данных, развивают аналитические системы и решают задачи машинного обучения на основе продуктов с открытым исходным кодом. Опытом поделится Ozon и не только.
Какой вклад команда Yandex Cloud вносит в развитие Greenplum® и ClickHouse®.
Как Open Source комьюнити помогает делать технологии и проекты на их базе лучше.
Как сделать социально-значимый проект с открытым кодом и помочь научному сообществу во всем мире.
Встреча была полезна всем, кто интересуется разработкой систем на базе Open Source технологий, архитекторам, ML-разработчикам, CDO, CTO, IT-директорам.
15:00 | Вводное слово |
15:05 | Платформа YDB: год после выхода в Open Source и перспективы развития Поговорим о том, как мы вышли в Open Source, как взаимодействуем с сообществом и контрибьюторами. Покажем роадмап развития платформы, а также поделимся результатами сравнения YDB с другими СУБД с открытым исходным кодом. Ещё поговорим о том, как высоконагруженные сервисы Яндекса, например Метрика, используют YDB. ![]() |
15:35 | YTsaurus: как устроена платформа обработки больших данных Яндекса Расскажем про основные возможности YTsaurus и отличия от экосистемы Apache™ Hadoop®. Рассмотрим, как Яндекс Такси строит хранилище данных с YTsaurus. ![]() |
16:05 | Yandex Data Streams: как передавать 80/120 ГБ данных в секунду Расскажем про корпоративную шину данных с открытым исходным кодом, зачем мы придумали этот сервис, и как устроена поставка данных в Яндексе. Как 5 инженеров управляют тысячами серверов с помощью Yandex Data Streams. Наш опыт может быть полезен компаниям, которые поддерживают большой парк оборудования и стремятся сократить усилия на его сопровождение. ![]() |
16:35 | Сбор данных о сервисах, которые используют Kafka в Ozon Расскажем, зачем нам понадобилось знать, как клиенты используют Kafka, а также о том, как мы выбирали решение и почему решили форкнуть Kafka, чтобы добавить свой счётчик операций. ![]() |
17:05 | Использование Open Source технологий для резервирования данных клиентов Расскажем, какие архитектуры резервирования данных мы используем в Yandex Cloud на основе Open Source технологий, и почему так важна парадигма loosely coupled. Покажем, как работаем с хранилищем, базами данных и сервисами очередей для решения бизнес-задач. ![]() |
17:35 | Дискуссия Open Source для решения реальных задач по обработке данных В дискуссии примут участие руководители команд разработки Яндекса и других крупных технологических компаний, а также архитекторы продуктов безопасности. ![]() ![]() ![]() ![]() ![]() |
18:05 | Перерыв |
18:35 | Как сохранить время ответа при пятикратном росте RPS: опыт Яндекс Игр в Yandex Cloud Как бэкенд Яндекс Игр живёт в Yandex Cloud и использует управляемые сервисы PostgreSQL, Redis, YDB. Расскажем о процессе миграции в YDB и нашем опыте работы с ней, как мы храним огромные объёмы данных и обрабатываем тысячи запросов в секунду. ![]() |
18:55 | Невероятные идеи по развитию GreenPlum от инженеров Yandex Cloud Расскажем, как мы сделали фиксы и мониторинговые фичи в GreenPlum, а также о нашей крупнейшей разработке — point-in-time recovery, которую мы принесли из мира Postgres и сделали доступной для всех пользователей GreenPlum. Поговорим про реализованные фичи, которые уже работают на стендах разработчиков, и поделимся планами. ![]() |
19:15 | Как Yandex Cloud развивает Open Source ClickHouse для пользователей платформы Мы активно контрибьютим в развитие СУБД ClickHouse. Расскажем про сделанные фичи, поделимся идеями и планами на будущее. ![]() |
19:35 | Открытые данные: как Open Source помогает науке Вы узнаете, как датасеты из открытого доступа помогают продвигать научные и социальные проекты с применением ML. На реальном примере с задачей по мониторингу озера Байкал покажем, почему правильно собранные данные важнее параметров модели их обработки. ![]() |
19:55 | Нетворкинг |