Запись

Data Open Source Day

11 июля 2023 г. в 15:00Москва, Экстрополис
  • Managed Service for ClickHouse®

Запись

О мероприятии

Первая конференция Yandex Cloud про Open Source инструменты для обработки данных и создания корпоративных хранилищ.

Data Open Source Day — это доклады экспертов, которые создают решения с открытым исходным кодом для реальных задач бизнеса. Это дискуссии о применении Open Source на практике, о безопасности технологий, о развитии сообщества и о социально-значимых проектах на базе открытых технологий.

Что обсудили:

  • Какие реальные бизнес-задачи можно решать с помощью Open Source продуктов Яндекса, например, YDB и YTsaurus.

  • Как большие компании строят работу по хранению и обработке данных, развивают аналитические системы и решают задачи машинного обучения на основе продуктов с открытым исходным кодом. Опытом поделится Ozon и не только.

  • Какой вклад команда Yandex Cloud вносит в развитие Greenplum® и ClickHouse®.

  • Как Open Source комьюнити помогает делать технологии и проекты на их базе лучше.

  • Как сделать социально-значимый проект с открытым кодом и помочь научному сообществу во всем мире.

Встреча была полезна всем, кто интересуется разработкой систем на базе Open Source технологий, архитекторам, ML-разработчикам, CDO, CTO, IT-директорам.

Докладчики

Программа

14:00

Начало регистрации

15:00

Вводное слово

15:05

Платформа YDB: год после выхода в Open Source и перспективы развития

Поговорим о том, как мы вышли в Open Source, как взаимодействуем с сообществом и контрибьюторами. Покажем роадмап развития платформы, а также поделимся результатами сравнения YDB с другими СУБД с открытым исходным кодом. Ещё поговорим о том, как высоконагруженные сервисы Яндекса, например Метрика, используют YDB.

15:35

YTsaurus: как устроена платформа обработки больших данных Яндекса

Расскажем про основные возможности YTsaurus и отличия от экосистемы Apache Hadoop®. Рассмотрим, как Яндекс Такси строит хранилище данных с YTsaurus.

16:05

Yandex Data Streams: как передавать 80/120 ГБ данных в секунду

Расскажем про корпоративную шину данных с открытым исходным кодом, зачем мы придумали этот сервис, и как устроена поставка данных в Яндексе. Как 5 инженеров управляют тысячами серверов с помощью Yandex Data Streams. Наш опыт может быть полезен компаниям, которые поддерживают большой парк оборудования и стремятся сократить усилия на его сопровождение.

16:35

Сбор данных о сервисах, которые используют Kafka в Ozon

Расскажем, зачем нам понадобилось знать, как клиенты используют Kafka, а также о том, как мы выбирали решение и почему решили форкнуть Kafka, чтобы добавить свой счётчик операций.

17:05

Использование Open Source технологий для резервирования данных клиентов

Расскажем, какие архитектуры резервирования данных мы используем в Yandex Cloud на основе Open Source технологий, и почему так важна парадигма loosely coupled. Покажем, как работаем с хранилищем, базами данных и сервисами очередей для решения бизнес-задач.

17:35

Дискуссия Open Source для решения реальных задач по обработке данных

В дискуссии примут участие руководители команд разработки Яндекса и других крупных технологических компаний, а также архитекторы продуктов безопасности.
Обсудим, зачем Яндекс выпускает продукты в открытый доступ, как Open Source решения используются для аналитических систем и продакшн-нагрузок, как сообщество помогает развивать продукт и на что обратить внимание при создании безопасных систем для работы с данными.

18:05

Перерыв

18:35

Как сохранить время ответа при пятикратном росте RPS: опыт Яндекс Игр в Yandex Cloud

Как бэкенд Яндекс Игр живёт в Yandex Cloud и использует управляемые сервисы PostgreSQL, Redis, YDB. Расскажем о процессе миграции в YDB и нашем опыте работы с ней, как мы храним огромные объёмы данных и обрабатываем тысячи запросов в секунду.

18:55

Невероятные идеи по развитию GreenPlum от инженеров Yandex Cloud

Расскажем, как мы сделали фиксы и мониторинговые фичи в GreenPlum, а также о нашей крупнейшей разработке — point-in-time recovery, которую мы принесли из мира Postgres и сделали доступной для всех пользователей GreenPlum. Поговорим про реализованные фичи, которые уже работают на стендах разработчиков, и поделимся планами.

19:15

Как Yandex Cloud развивает Open Source ClickHouse для пользователей платформы

Мы активно контрибьютим в развитие СУБД ClickHouse. Расскажем про сделанные фичи, поделимся идеями и планами на будущее.

19:35

Открытые данные: как Open Source помогает науке

Вы узнаете, как датасеты из открытого доступа помогают продвигать научные и социальные проекты с применением ML. На реальном примере с задачей по мониторингу озера Байкал покажем, почему правильно собранные данные важнее параметров модели их обработки.

19:55

Нетворкинг

Как добраться

Россия, Москва, улица Льва Толстого, 16, подъезд Экстрополис