Научный вебинар «Машинное обучение для малых выборок»

По сложившейся традиции, в последний четверг апреля мы провели онлайн-семинар. В этот раз он был посвящен особенностям машинного обучения для малых выборок.

Как известно, качество решения задач машинного обучения обуславливается выбором базовых моделей, их гиперпараметрами и свойствами самой выборки. При этом если выбор моделей, их обучение и поиск оптимальных параметров находятся под контролем специалиста и определяются достаточно стандартным набором алгоритмов, то обоснованное преобразование обучающей выборки остается плохо формализуемым процессом, далеко не всегда гарантирующим улучшения при решении конечной задачи. Кроме того, ограниченность и случайный характер исходных данных порождают неопределенность в результатах применения моделей к новым данным. Данная ситуация усложняется многомерным характером самих данных, когда требования к их объему для качественного покрытия возможных сочетаний параметров многократно возрастают.

Как обойти эти сложности? В качестве варианта решения можно предложить генеративный подход к конструированию новых выборок достаточно большого размера, которые сохраняли бы все свойства исходной малой выборки, но при этом в ходе обучения на них позволяли бы получать модели с меньшим интервалом неопределенности. Однако при использовании данного подхода необходимо также контролировать переобученность генеративной модели и ее обобщающие свойства.

Подробней смотрите в видео:

Докладчик:

Плесовская Екатерина, инженер-исследователь из лаборатории «Интеллектуальные технологии принятия решений» НЦКР Университета ИТМО