Данные — это топливо, на котором работают современные компании. Производство, госуслуги, e-commerce, банки, маркетинг — везде нужны инженеры данных — специалисты, которые понимают, как собирать, хранить и превращать данные в полезный актив для бизнеса.
Ты применишь современные инструменты для работы с данными и увидишь, как они живут в больших системах.
Фича курса. Поработаешь с технологиями, которые используют в индустрии:
- S3 — распределённое хранилище данных;
- Kafka — система потоковой передачи сообщений;
- Apache Spark — кластерные вычисления;
- ClickHouse — аналитическая СУБД;
- Apache Airflow — оркестратор задач и потоков данных;
- Apache Iceberg — популярный файловый формат;
- Postgres — современная реляционная база данных для OLTP.
Пререквизиты:
Кореквизиты: нет.
Курс состоит из девяти блоков.