Большие данные и машинное обучение для службы
квалифицированного заказчика
Краткосрочный курс повышения квалификации
О КУРСЕ
Программа «Большие данные и машинное обучение для службы квалифицированного заказчика» коротко и емко расскажет простыми словами о сложных вещах. Каким может быть ваш путь от сбора данных до получения реального профита от владения этими данными? Всегда ли стоит идти проторенным путем, «пропиаренным» в медиа, или имеет смысл внимательней взглянуть на собственные потребности и противоречия? Как конкретно решить ту или иную задачу – возможно, вы не единственный, перед кем она стояла? Что сейчас на переднем крае в области больших данных и машинного обучения (БД и МО) и что из этого будет полезным для Вас? Является ли цифровая трансформация осознанным выбором или данью моде, нужна ли она именно вам и именно сейчас?
Программа рассчитана на сотрудников предприятий, вовлеченных в силу должностных обязанностей или призвания в процесс принятия и реализации стратегических решений по цифровым преобразованиям в своей организации. Данный курс позволит им детальнее и четче представить возможный конечный облик бизнес-модели, или же процесс конкретной реализации уже принятых решений. Надеемся, что после освоенного материала станут очевиднее проблемы и противоречия, с которыми придется столкнуться, и методы их разрешения.
Слушатели, обладающие достаточным уровнем базовых знаний в области работы с большими данными и машинного обучения, получат компетенции и навыки для решения реальных проблем, возникающих при переходе от классической бизнес-модели к состоянию, когда цифровизация становится ее неотъемлемой частью.
Программа направлена на развитие у слушателей компетенций, описанных профессиональным стандартом «Специалист по большим данным» и проектом нового профессионального стандарта «Специалист по машинному обучению».
Программа повышения квалификации «Большие данные и машинное обучение для службы квалифицированного заказчика», подготовлена в Национальном центре когнитивных разработок Университета ИТМО – центре компетенции Национальной технологической инициативы по сквозной технологии «Технологии машинного обучения и когнитивные технологии».
Предусмотрена система скидок для сотрудников бюджетных организаций
Длительность программы
Программа рассчитана на 72 ак. ч.
Форма обучения — дистанционная.
Документ об образовании
После успешного обучения по данной программе выдается удостоверение о повышении квалификации установленного образца.
ПРОГРАММА КУРСА
ТЕМА 1
Как выбрать технологию работы с большими данными, и когда она действительно принесет пользу
- Определение и основные свойства больших данных. Когда данные становятся большими, кто и как их создает, и какие технологии для них нужны?
- Как правильно сформулировать прикладную задачу на больших данных: типовые ошибки при запросе предложений.
- Как правильно выбрать модели представления данных для конкретной области и почему технологии универсальные.
- Как правильно выбрать модели обработки данных, и как они зависят от возможностей ИТ-инфраструктуры компании?
- Плюсы и минусы распространенных рыночных решений в области больших данных: Apache НDFS, ClickHouse и Apache Spark.
- Практическое использование современных парадигм в задачах больших данных. Истории успеха: платформа машинного обучения для контрагентов крупных компаний, комплексная аналитика в силовых машинах, персональный ассистент автолюбителя и медсотрудника.
- Перспективные решения в области больших данных: что нужно учитывать в стратегических планах цифровой трансформации?
ТЕМА 2
Что может и что не может машинное обучение? Как не попасть в сеть иллюзий моделей на данных
- Основные термины машинного обучения. Феномен машинного обучения: что нужно, чтобы компьютер обучался решать задачи человека, и при каких условиях это действительно получится?
- Жизненный цикл машинного обучения: несколько простых шагов, чтобы обеспечить реальное внедрение разработки.
- Как выбрать модель и метод машинного обучения, или почему нейросеть не всегда хороша?
- Истории успеха: банковский скоринг, прогноз нефтедобычи и оценка наработки на отказ.
- Когда можно доверять результатам машинного обучения, и от чего зависит его качество?
- Как ускорить обучение моделей, если ваших данных недостаточно? Обучение переносом и синтетические данные.
ТЕМА 3
Неструктурированные данные в корпоративной практике: как использовать их эффективно, а не только эффектно
- Почему важно работать с неструктурированными данными компании (текст, изображения, видео)? Дополнительные эффекты и неизбежные проблемы.
- Формирование ценности неструктурированных данных: как извлечь, интерпретировать и применить новые знания?
- Как выбрать правильно модель обработки естественного языка (Natural Language Processing): типовые ошибки.
- Как быстро обучить тематическую языковую модель: создание ботов своими руками.
- Плюсы и минусы современных технологий для работы с неструктурированными данными: Spark, PyTorch, AirFlow.
- Истории успеха: токсичные посты сотрудников и оценка лояльности клиентов компании.
ТЕМА 4
Как противостоять старению и утере знаний в компании: автоматическое машинное обучение и генеративный дизайн
- Создание и актуализация корпоративных знаний с помощью технологий искусственного интеллекта: как научить модели на данных самостоятельно обновляться?
- Устаревание данных как угроза качеству моделей: как не потерять в точности и избежать систематических ошибок при прогнозировании.
- Готовность к неожиданностям: как сделать модель устойчивой к нестандартным изменениям данных.
- Как поддержать творческую активность специалиста за счет машинного интеллекта: генеративный дизайн.
- Истории успеха: адаптивная видеоаналитика, доходные кредиты и безопасные гавани.
ТЕМА 5
Машинное обучение без программиста: какие программные инструменты подходят для всех?
- Всегда ли нужен программист? Концепция no-code и low-code разработки приложений в области машинного обучения и обработки данных.
- Преимущества и недостатки современных инструментов работы с данными: функциональность, простота, гибкость, квалификация.
- Игра в разработку: визуальное программирование для задач машинного обучения.
- Робот вместо программиста. Утопия или реальность? Пределы автоматизации разработки приложений анализа данных.
- Истории успеха: цепочки поставок, маркетинг, финансы, розничная торговля, электронная коммерция.
ТЕМА 6
Как создавать цифровые двойники на основе машинного обучения: быстро и наглядно
- Как правильно выбрать класс цифрового двойника? Особенности цифровых двойников компаний.
- Кому и где нужны цифровые двойники? Стадии цифровой зрелости компании.
- Ядро цифрового двойника: модели, данные и их совместное использование.
- Как меняется стратегия развития компаний при использовании цифровых двойников: потоковое производство, нефтяная промышленность, транспорт, здравоохранение.
- Принятие решений на основе цифровых двойников: от аналитики - к прогнозированию на объективных данных.
- Формирование ценности цифрового двойника компании: оптимизация экономических показателей.
- Истории успеха: кадровое обеспечение крупного предприятия, производство топливных гранул, водоснабжение, «умный» город.
ТЕМА 7
Нормативная документация: еще одна ненужная бюрократия или компоненты “строительных лесов” для формирования коллектива единомышленников в БД и МО.
- Как выстроена иерархия нормативных документов? Но что опираться при разработке и применении продуктов на основе БД и МО и соответствующей документации?
- Терминологическая база: учимся говорить на одном профессиональном языке, когда речь идет о цифровых двойниках и ассистентах, системах поддержки принятия решений.
- Шаги выполнения НИР: что советуют документы?
- Цифровые объекты как результат интеллектуальной деятельности. Сертификация цифровых объектов.
СПИКЕРЫ
В случае возникновения вопросов, пожалуйста, обращайтесь по e-mail: nccr.edu@itmo.ru.
ЧТОБЫ ЗАПИСАТЬСЯ НА КУРС, ЗАПОЛНИТЕ, ПОЖАЛУЙСТА, ДАННУЮ ФОРМУ: