Научитесь создавать модели ML и обучать нейронные сети. Освоите анализ данных и в конце курса выберете одну из специализаций: обработку естественного языка или Computer Vision. Через 9 месяцев сможете трудоустроиться ML-инженером, параллельно продолжите проходить курс и дорастёте до уровня Middle.
- ★ 4,6 из 5 рейтинг курса на основе 14 267 оценок
- Курс-профессия из 3 уровней
- Трудоустройство через 9 месяцев
- Авторы курса дата-сайентисты из Сбера, Wrike, VISA
- Обновили курс в 2022 году
- Длительность: 12 месяцев
О профессии
Специалист по Machine Learning, или ML-инженер анализирует большие объёмы информации, создаёт модели для прогнозирования в бизнесе, медицине, промышленности. Задача ML-инженера — обучать нейросети, проектировать аналитические системы и рекомендательные сервисы на основе алгоритмов машинного обучения.
- более 2 000 вакансий для ML-инженеров доступно на hh.ru
- от 60 000 рублей зарплата после девяти месяцев обучения на платформе
- от 120 000 рублей зарплата после года обучения на платформе
Кому подойдёт этот курс
- Новичкам. С нуля освоите Python и SQL, научитесь собирать и анализировать данные. Получите необходимый минимум знаний по математике, теории вероятности и статистике. Решите задачи на основе реальных кейсов.
- Программистам. Подтянете математику, статистику, аналитическое и алгоритмическое мышление, научитесь выявлять потребности бизнеса. Получите опыт работы с моделями машинного обучения и будете решать задачи с данными с помощью Python. Пройдёте процесс от сбора данных до деплоя модели.
- Начинающим аналитикам. Научитесь выдвигать гипотезы и делать выводы на основе данных. Сможете писать эффективный код на Python, превращать сырые данные в полезную информацию, понимать математику и основы статистики, обучать машины и прогнозировать результаты. Отшлифуете знания, увеличите скорость работы и добьётесь повышения.
Чему вы научитесь
Инструменты
- Python: Универсальный язык программирования, на котором пишут серверную часть веб-приложений — бэкенд, программируют чат-ботов, автоматизируют рутину, проводят анализ данных и строят алгоритмы машинного обучения.
- numpy: Python-библиотека, с помощью которой вы сможете быстро производить сложные научные вычисления.
- pandas: Python-библиотека для анализа данных.
- scikit-learn: Python-библиотека для машинного обучения.
- Hadoop: Набор инструментов, которые используют для построения систем анализа больших данных.
- Hive: Программное хранилище данных для чтения, записи и управлением большими объёмами данных с помощью SQL.
- SQL: Язык программирования для работы с данными.
- GitLab: Система контроля версий, с помощью которой разработчики отслеживают изменения в коде и совместно работают над проектом
- Excel: Программа для работы с табличными данными, содержит инструменты для визуализации и анализа данных.
- PyCharm: Cреда разработки для Python и Django со встроенным анализатором кода, отладчиком и инструментами для запуска тестов.
- Jupyter Notebook: Веб-приложение, с помощью которого можно прямо в браузере производить математические вычисления и анализ данных.
- FastAPI: Инструмент для разработки API — программного интерфейса, с помощью которого приложения могут взаимодействовать между собой.
- Airflow: Программа для создания, мониторинга и оркестрации сценариев обработки данных.
Навыки
- Извлечение данных из различных источников (чтение из файлов, API, базы данных)
- Очистка и трансформация данных, их подготовка к анализу
- Умение проводить разведывательный анализ данных
- Визуализация данных с помощью Pandas, Matplotlib
- Feature Engineering: оценка значимости фичей, отбор признаков, методы уменьшения размерности
- Обучение моделей методами классического машинного обучения
- Построение алгоритмов для рекомендательных систем
- Построение ML-моделей для решения задач с помощью временными рядами
- Построение пайплайнов от сбора данных до получения результатов моделирования
- Решение задач моделирования с помощью нейросетевых подходов
- Умение работать с NLP/CV-задачами с помощью стандартных методов и DL
Проекты
- Предсказание оттока в соцсети для музыкантов
- Работа с данными сервиса аренды автомобилей
- Собственное исследование
Содержание курса
Первый уровень: базовая подготовка
Введение в Data Science
- Познакомитесь с основными направлениями Data Science, узнаете, какие задачи решают дата-аналитики, дата-инженеры и специалисты по машинному обучению.
- Пройдёте все этапы работы с данными. Научитесь выявлять проблемы, собирать бизнес-требования. Будете выгружать данные из различных источников, проводить разведочный анализ и готовить датасет к дальнейшему использованию. Обучите и внедрите готовую ML-модель, попробуете себя в роли продуктового и маркетингового аналитика. Узнаете, как формулировать и проверять гипотезы. Освоите базовые инструменты для работы: Python, SQL, Excel, Power Bi, Airflow.
Продвинутый уровень: погружение в Machine Learning и трудоустройство
Machine Learning. Junior
- Познакомитесь с алгоритмами машинного обучения для решения задач регрессии, классификации и кластеризации. Построите и обучите свою первую нейронную сеть. Научитесь подбирать параметры модели, оценивать качество и улучшать её, а также выводить результат в продакшн.
Трудоустройство с помощью Центра Карьеры
- Карьерный консультант поможет подготовиться к собеседованию в компании-партнёре. Разберёте частые вопросы и научитесь меньше переживать на интервью.
- Напишете сопроводительное письмо и грамотно оформите резюме.
- Будете готовы пройти собеседование — карьерный консультант организует встречу с работодателем.
- На интервью презентуете проекты, над которыми вы работали на курсе, а знания и навыки пригодятся для выполнения тестовых задач.
Экспертный уровень. Выбор специализации
Machine Learning. Advanced
- Освоите алгоритмы для построения рекомендательных систем и прогнозирования временных рядов. Научитесь применять ансамблевые методы, стекинг, бэггинг, бустинг. Сможете использовать лучшие практики обучения моделей, генерации дополнительных данных, мониторинга и пайплайна ML-разработки, а также Kaggle-соревнований.
Deep Learning
- Научитесь работать с нейросетями: подробно узнаете, как они устроены, как использовать предобученные модели, готовить и передавать данные в нейросеть, строить и тестировать архитектуры, настраивать параметры и обучать модели на GPU.
Специализация 1. Natural Language Processing
- Научитесь применять алгоритмы машинного обучения и нейронные сети для обработки естественного языка. Поработаете с языковыми моделями: Bert, Elmo и другими. Узнаете, как анализировать тональность текстов, классифицировать их, распознавать речь.
Специализация 2. Computer Vision
- С помощью алгоритмов машинного обучения и нейросетей будете распознавать объекты, лица и эмоции, классифицировать и сегментировать изображения. Научитесь применять и адаптировать готовые модели CV для своих целей.
Дополнительные курсы
- Основы математики для Data Science: Получите базовые знания по математике для работы с машинным обучением. Поймёте, что такое аппроксимация, интерполяция, функции, регрессии, матрицы и вектора. Научитесь работать с математическими сущностями в Python-библиотеке SymPy.
- Основы статистики и теории вероятностей: Поймёте принципы работы со случайными величинами и событиями. Познакомитесь с некоторыми видами распределений и статистическими тестами, которые пригодятся при составлении моделей и проверке гипотез.
- Основы статистики и теории вероятностей Advanced: Научитесь применять основные принципы статистики и теории вероятностей при работе с задачами Data Science. Поймете, как устроены алгоритмы машинного обучения, как в них применяются математическая статистика и теория вероятностей.
- Карьера разработчика: трудоустройство и развитие: Узнаете, как выбрать подходящую вакансию, подготовиться к собеседованию и вести переговоры с работодателем. Сможете быстрее получить должность, которая соответствует вашим ожиданиям и умениям.
- Система контроля версий Git: Научитесь версионировать изменения в коде, создавать и управлять репозиториями, ветками, разрешать конфликты версий. Узнаете полезные правила работы с Git.