Описание курса

Навык анализа данных с помощью python станет твоим карьерным преимуществом вне зависимости от выбранной профессии: продакт-менеджер, продуктовый аналитик или специалист по машинному обучению. Ты научишься анализировать и преобразовывать данные с помощью python, что позволит создавать отчётность, валидировать бизнес-гипотезы и рассчитывать продуктовые и финансовые метрики.

Фича курса. Задачи взяты из практики. Работать ты будешь на реальной учебной инфраструктуре:

А ещё с нуля создашь систему мониторинга метрик в онлайн-кинотеатре в рамках домашних заданий и сможешь положить этот проект в портфолио.

Пререквизиты

Академическая нагрузка

Команда курса

Untitled

Тематический план

Курс состоит из 5 блоков. Ты познакомишься со средой разработки, научишься работать с библиотекой pandas, а ещё проводить когортный и факторный анализ. Также узнаешь, как пользоваться библиотекой NumPy, визуализировать данные с помощью библиотек Matplotlib и Seaborn. В конце курса разберёшься, какими бывают виды подключений и как их настраивать с помощью API.

Блок 1 Введение и настройка среды разработки
Неделя 1. Онбординг ◦ Среда разработки: Jupyter Notebook, Google Colab, Culab
◦ Командная строка
◦ Магические команды
◦ Маркдауны, заголовки и формулы |

| Блок 2 | Pandas | | Неделя 2. pandas. Часть 1 | ◦ Основные структуры данных: DataFrame, Series, импорт и экспорт файлов ◦ Базовые методы отображения и описания датафрейма ◦ Фильтрация датафрейма: логические выражения, маски, работа с датами и строками ◦ Регулярные выражения для обработки строк ◦ Сортировка датафрейма | | Неделя 3. pandas. Часть 2 | ◦ Горизонтальное соединение таблиц ◦ Вертикальное соединение таблиц ◦ Группировка: меры, измерения, агрегирующие функции ◦ Сводная таблица | | Неделя 4. Факторный анализ | ◦ Факторный анализ аддитивной и мультипликативной моделей ◦ Факторный анализ смешанной модели ◦ Множественный факторный анализ на основании воронки | | Неделя 5. Маппинг и лямбда-функции | ◦ Операции маппинга и фильтра ◦ Лямбда-функции ◦ Объединение функций и лямбда-функций | | Неделя 6. Когортный анализ | ◦ Когортно-винтажный анализ ◦ Расчёт Retention и Churn ◦ Расчёт лайфтайма, LTR и LTV ◦ Метрики клиентской активности: MAU, WAU, DAU, Sticky Factors | | Блок 3 | NumPy | | Неделя 7. Введение в NumPy | ◦ Тип данных array ◦ Операции с осями ◦ Математические функции ◦ Создание матриц и операции над ними | | Неделя 8. Линейная алгебра в NumPy | ◦ Работа с многомерными массивами ◦ Расчёт определителя и инвертирование матрицы ◦ Работа с разложением Фурье и аннотацией Эйнштейна | | Неделя 9. Прогнозирование с NumPy | ◦ STL-разложение ◦ Автокорреляционная функция ◦ Линейная регрессия | | Блок 4 | Визуализация | | Неделя 10. Matplotlib | ◦ Создание графиков и осей ◦ Создание дашбордов и локализация графиков ◦ Управление элементами графика ◦ Новые виды визуализаций: гистограмма, круговая диаграмма, диаграмма рассеивания, боксплот | | Неделя 11. Seaborn & Plotly | ◦ Построение и контроль графиков в Seaborn: displot, jointlot ◦ Построение catplot и его вариаций: boxplot, violin plot, etc. ◦ Построение интерактивных визуализаций с помощью Plotly ◦ Построение анимаций и 3D-визуализаций | | Блок 5 | API and Virtual Machine | | Неделя 12. API-1 | ◦ API ◦ Форматы данных JSON, XML, HTML ◦ Аутентификация и безопасность: ключи и токены ◦ Библиотека Requests и её методы ◦ Библиотека BeautifulSoup и её методы | | Неделя 13. API-2 | ◦ git ◦ cron ◦ Cтандарт аутентификации API — OAuth ◦ Подключение к базе данных ◦ Работа с данными из БД |

Результаты

Ты научишься:

Система оценивания

Активность Вес Описание
Домашние задания 80% Семь связанных кейсов в рамках анализа бизнеса на примере онлайн-кинотеатра:
• Ad Hoc запрос для нахождения причины просадки метрик,
• обработка текстовых данных в витрине,
• построение визуализированной отчётности по продуктовым метрикам,
• настройка бота для отправки отчётов.
За каждое домашнее задание можно получить максимум 10 баллов
Проект 20% Все выполненные домашние задания, объединённые в единую систему сторителлинга с презентацией и защитой.
За проект можно получить максимум 10 баллов

Политика AI