Данные — это топливо, на котором работают современные компании. Производство, госуслуги, e-commerce, банки, маркетинг — везде нужны инженеры данных — специалисты, которые понимают, как собирать, хранить и превращать данные в полезный актив для бизнеса.
Курс подойдет продуктовым аналитикам, начинающим ML-инженерам и всем, кто хочет разобраться в современных data-платформах. Студенты применят современные инструменты для работы с данными и увидят, как они живут в больших системах.
Фича курса. Поработаешь с технологиями, которые используют в индустрии.
- S3 — распределённое хранилище данных.
- Kafka — система потоковой передачи сообщений.
- Apache Spark — кластерные вычисления.
- ClickHouse — аналитическая СУБД.
- Apache Airflow — оркестратор задач и потоков данных.
- Apache Iceberg — популярный файловый формат.
- Postgres — современная реляционная база данных для OLTP.
Пререквизиты:
Кореквизиты: нет.
Для каких потоков доступен: 2024–2026.
Лимит по количеству студентов: нет.
Курс состоит из девяти тематических блоков: