Навык анализа данных с помощью python станет твоим карьерным преимуществом вне зависимости от выбранной профессии: продакт-менеджер, продуктовый аналитик или специалист по машинному обучению. Ты научишься анализировать и преобразовывать данные с помощью python, что позволит создавать отчётность, валидировать бизнес-гипотезы и рассчитывать продуктовые и финансовые метрики.

Академическая нагрузка

Команда курса

Untitled

Фича курса

Фича курса. Задачи взяты из практики. Работать ты будешь на реальной учебной инфраструктуре:

А ещё с нуля создашь систему мониторинга метрик в онлайн-кинотеатре в рамках домашних заданий и сможешь положить этот проект в портфолио.

Результат курса

Ты научишься:

Тематический план

Курс состоит из 5 блоков. Ты познакомишься со средой разработки, научишься работать с библиотекой pandas, а ещё проводить когортный и факторный анализ. Также узнаешь, как пользоваться библиотекой NumPy, визуализировать данные с помощью библиотек Matplotlib и Seaborn. В конце курса разберёшься, какими бывают виды подключений и как их настраивать с помощью API.

Блок 1 Введение и настройка среды разработки
Неделя 1. Онбординг • Среда разработки: Jupyter Notebook, Google Colab, Culab
• Командная строка
• Магические команды
• Маркдауны, заголовки и формулы
Блок 2 pandas
Неделя 2. pandas. Часть 1 • Основные структуры данных: DataFrame, Series, импорт и экспорт файлов
• Базовые методы отображения и описания датафрейма
• Фильтрация датафрейма: логические выражения, маски, работа с датами и строками
• Регулярные выражения для обработки строк
• Сортировка датафрейма
Неделя 3. pandas. Часть 2 • Горизонтальное соединение таблиц
• Вертикальное соединение таблиц
• Группировка: меры, измерения, агрегирующие функции
• Сводная таблица
Неделя 4. Факторный анализ • Факторный анализ аддитивной и мультипликативной моделей
• Факторный анализ смешанной модели
• Множественный факторный анализ на основании воронки
Неделя 5. Маппинг и лямбда-функции • Операции маппинга и фильтра
• Лямбда-функции
• Объединение функций и лямбда-функций
Неделя 6. Когортный анализ • Когортно-винтажный анализ
• Расчёт Retention и Churn
• Расчёт лайфтайма, LTR и LTV
• Метрики клиентской активности: MAU, WAU, DAU, Sticky Factors
Блок 3 NumPy
Неделя 7. Введение в NumPy • Тип данных array
• Операции с осями
• Математические функции
• Создание матриц и операции над ними
Неделя 8. Линейная алгебра в NumPy • Работа с многомерными массивами
• Расчёт определителя и инвертирование матрицы
• Работа с разложением Фурье и аннотацией Эйнштейна
Неделя 9. Прогнозирование с NumPy • STL-разложение
• Автокорреляционная функция
• Линейная регрессия
Блок 4 Визуализация
Неделя 10. Matplotlib • Создание графиков и осей
• Создание дашбордов и локализация графиков
• Управление элементами графика
• Новые виды визуализаций: гистограмма, круговая диаграмма, диаграмма рассеивания, боксплот
Неделя 11. Seaborn & Plotly • Построение и контроль графиков в Seaborn: displot, jointlot
• Построение catplot и его вариаций: boxplot, violin plot, etc.
• Построение интерактивных визуализаций с помощью Plotly
• Построение анимаций и 3D-визуализаций
Блок 5 API and Virtual Machine
Неделя 12. API-1 • Форматы данных JSON, XML, HTML
• Аутентификация и безопасность: ключи и токены
• Библиотека Requests и её методы
• Библиотека BeautifulSoup и её методы
Неделя 13. API-2 • git
• Cтандарт аутентификации API — OAuth
• Подключение к разным БД: SQLite, MySQL, PostgreSQL
• Работа с данными из БД

Система оценивания

Активность Вес Описание
Домашние задания 80% Семь связанных кейсов в рамках анализа бизнеса на примере онлайн-кинотеатра:
• Ad Hoc запрос для нахождения причины просадки метрик,
• обработка текстовых данных в витрине,
• построение визуализированной отчётности по продуктовым метрикам,
• настройка бота для отправки отчётов.
За каждое домашнее задание можно получить максимум 10 баллов
Проект 20% Все выполненные домашние задания, объединённые в единую систему сторителлинга с презентацией и защитой.
За проект можно получить максимум 10 баллов

Политика академической честности

Обман, плагиат и любые другие нарушения академической этики на программе недопустимы. В случае нарушений студенты могут быть отчислены с программы.