<aside>
⭐ Курс разрабатывается в партнерстве с компанией ArenaData
</aside>
О чём курс
Обработка большого количества данных нужна везде: в управлении производством, государственных сервисах, бизнесе, онлайн-торговле. Данные нужно собирать, хранить и контролировать их достоверность.
На курсе студент будет загружать данные в распределённые системы хранения, обрабатывать их с помощью инструментов кластерных вычислений и строить потоки данных.
Этот курс подойдёт тем, кто хочет:
- научиться работать со стеком big data;
- разобраться, как получать обучающие выборки для моделей машинного обучения;
- научиться выстраивать потоки данных;
- самостоятельно построить витрину данных (data mart);
- узнать, как контролировать консистентность данных — например, чтобы ответить на вопрос «А почему метрика поменялась?»;
- построить карьеру ML-инженера или продуктового аналитика.
Академическая нагрузка
Пререквизиты
- Основы Python.
- Python для анализа данных.
- SQL и базы данных.
Команда курса
Untitled