Навык анализа данных с помощью python станет твоим карьерным преимуществом вне зависимости от выбранной профессии: продакт-менеджер, продуктовый аналитик или специалист по машинному обучению. Ты научишься анализировать и преобразовывать данные с помощью python, что позволит создавать отчётность, валидировать бизнес-гипотезы и рассчитывать продуктовые и финансовые метрики.
Фича курса. Задачи взяты из практики. Работать ты будешь на реальной учебной инфраструктуре:
А ещё с нуля создашь систему мониторинга метрик в онлайн-кинотеатре в рамках домашних заданий и сможешь положить этот проект в портфолио.
Ты научишься:
Курс состоит из 5 блоков. Ты познакомишься со средой разработки, научишься работать с библиотекой pandas, а ещё проводить когортный и факторный анализ. Также узнаешь, как пользоваться библиотекой NumPy, визуализировать данные с помощью библиотек Matplotlib и Seaborn. В конце курса разберёшься, какими бывают виды подключений и как их настраивать с помощью API.
Блок 1 | Введение и настройка среды разработки |
---|---|
Неделя 1. Онбординг | • Среда разработки: Jupyter Notebook, Google Colab, Culab |
• Командная строка | |
• Магические команды | |
• Маркдауны, заголовки и формулы | |
Блок 2 | pandas |
Неделя 2. pandas. Часть 1 | • Основные структуры данных: DataFrame, Series, импорт и экспорт файлов |
• Базовые методы отображения и описания датафрейма | |
• Фильтрация датафрейма: логические выражения, маски, работа с датами и строками | |
• Регулярные выражения для обработки строк | |
• Сортировка датафрейма | |
Неделя 3. pandas. Часть 2 | • Горизонтальное соединение таблиц |
• Вертикальное соединение таблиц | |
• Группировка: меры, измерения, агрегирующие функции | |
• Сводная таблица | |
Неделя 4. Факторный анализ | • Факторный анализ аддитивной и мультипликативной моделей |
• Факторный анализ смешанной модели | |
• Множественный факторный анализ на основании воронки | |
Неделя 5. Маппинг и лямбда-функции | • Операции маппинга и фильтра |
• Лямбда-функции | |
• Объединение функций и лямбда-функций | |
Неделя 6. Когортный анализ | • Когортно-винтажный анализ |
• Расчёт Retention и Churn | |
• Расчёт лайфтайма, LTR и LTV | |
• Метрики клиентской активности: MAU, WAU, DAU, Sticky Factors | |
Блок 3 | NumPy |
Неделя 7. Введение в NumPy | • Тип данных array |
• Операции с осями | |
• Математические функции | |
• Создание матриц и операции над ними | |
Неделя 8. Линейная алгебра в NumPy | • Работа с многомерными массивами |
• Расчёт определителя и инвертирование матрицы | |
• Работа с разложением Фурье и аннотацией Эйнштейна | |
Неделя 9. Прогнозирование с NumPy | • STL-разложение |
• Автокорреляционная функция | |
• Линейная регрессия | |
Блок 4 | Визуализация |
Неделя 10. Matplotlib | • Создание графиков и осей |
• Создание дашбордов и локализация графиков | |
• Управление элементами графика | |
• Новые виды визуализаций: гистограмма, круговая диаграмма, диаграмма рассеивания, боксплот | |
Неделя 11. Seaborn & Plotly | • Построение и контроль графиков в Seaborn: displot, jointlot |
• Построение catplot и его вариаций: boxplot, violin plot, etc. | |
• Построение интерактивных визуализаций с помощью Plotly | |
• Построение анимаций и 3D-визуализаций | |
Блок 5 | API and Virtual Machine |
Неделя 12. API-1 | • Форматы данных JSON, XML, HTML |
• Аутентификация и безопасность: ключи и токены | |
• Библиотека Requests и её методы | |
• Библиотека BeautifulSoup и её методы | |
Неделя 13. API-2 | • git |
• Cтандарт аутентификации API — OAuth | |
• Подключение к разным БД: SQLite, MySQL, PostgreSQL | |
• Работа с данными из БД |
Активность | Вес | Описание |
---|---|---|
Домашние задания | 80% | Семь связанных кейсов в рамках анализа бизнеса на примере онлайн-кинотеатра: |
• Ad Hoc запрос для нахождения причины просадки метрик, | ||
• обработка текстовых данных в витрине, | ||
• построение визуализированной отчётности по продуктовым метрикам, | ||
• настройка бота для отправки отчётов. | ||
За каждое домашнее задание можно получить максимум 10 баллов | ||
Проект | 20% | Все выполненные домашние задания, объединённые в единую систему сторителлинга с презентацией и защитой. |
За проект можно получить максимум 10 баллов |
Обман, плагиат и любые другие нарушения академической этики на программе недопустимы. В случае нарушений студенты могут быть отчислены с программы.