О чём курс
Технологии компьютерного зрения применяются повсеместно: функция Face ID в телефоне, обработка КТ-снимков. Курс познакомит тебя с современными методами обработки изображений и видео. Ты научишься решать практические задачи, например, детектировать сотни объектов на изображениях, распознавать позу человека и извлекать информацию из текста на картинках.
Ещё ты узнаешь о современных моделях глубокого обучения, которые используются в компьютерном зрении, и разовьёшь навык декомпозиции сложных задач.
Фича курса. Курс ведут практикующие эксперты, которые много лет создают продукты на основе компьютерного зрения.
Условия поступления на курс
Пререквизиты: «Deep Learning».
Кореквизиты: нет.
Для каких потоков доступен: 2024–2028.
Лимит по количеству студентов: нет.
Академическая нагрузка
- 2 лекции в неделю.
- 1 семинар в неделю.
Команда курса
Untitled
Тематический план
Курс состоит из пяти блоков.
- В блоках 1–3 ты исследуешь базовые задачи компьютерного зрения:
- углубишь свои знания по темам классификации, сегментации и детекции;
- познакомишься с классической обработкой изображений, техниками эффективного обучения, трансформерными моделями и задачей Keypoint Detection.
- Блоки 4–5 посвящены более высокоуровневым задачам, которые не решить какой-то одной моделью, и более продвинутым подходам в CV. Мы разберём:
- как устроены алгоритмы распознавания лиц и текста;
- как реализовать трекинг множества объектов на видео;
- какие современные методы обучения без учителя используются в CV и зачем;
- из чего состоят и на что способны мультимодальные сети, а конкретно — Vision Language Models.
- Содержание курса