Университет ИТМО

SMILE — платформа автоматизации построения моделей
технологических и бизнес-процессов на основе
сетевых структур и данных измерений

 

Платформа SMILE (Simple Machine Learning Editor) предоставляет разработчику инструменты моделирования технологических процессов и управленческих решений в условиях неопределенности и неполноты данных. Она реализует логику для создания цифровых двойников различных организационно-технических систем и может служить основой для разработки средств поддержки принятия решения для топ-менеджмента высокотехнологичных производств. Для использования платформы не требуется навыков программирования и установки дополнительного программного обеспечения, благодаря чему она доступна широкому кругу пользователей.

 

Преимущества платформы

— Ключевое отличие SMILE от подобных платформ на рынке — единое пространство для моделей различного типа: манипуляции данными, классической статистики и предметных моделей до машинного обучения (регрессии, классификации, кластеризации и пр.).
— Результаты моделирования можно гибко перебрасывать между проектами (в реализации).
— Результатом для пользователя может быть не только конечная модель в pipeline, но и любая промежуточная модель.
— При разработке модели сделан упор на оптимизацию гиперпараметров для сложных задач машинного обучения.
— На базе платформы возможно выполнение НИОКР.

 

В обновленную версию платформы были добавлены следующие пользовательские функции:

— Авторизация через Google. При этом если пользователь не был ранее авторизован в системе, для него автоматически создается личный кабинет.
— Предоставление прав на просмотр и редактирование проектов другим пользователям (sharing). Эта возможность позволяет поделиться созданным проектом с сообществом пользователей в целом или с конкретным пользователем.
— К проектам добавлены теги и реализован фильтр по ним для быстрого доступа к интересующим пользователя проектам.
— Выполнена языковая локализация. В верхнем правом меню можно выбрать русский или английский язык.
— Сделана подсветка узлов, которые были запущены. Это позволяет пользователю понять были ли узлы успешно запущены хотя бы один раз.
— Ребра, которые используются вместо узлов с данными, подсвечиваются особым образом, чтобы их можно было отличить от узлов-связей (без данных). В целом механизм ребер-данных позволяет сократить число блоков в вычислительном графе и сделать граф более компактным и читаемым.
— Добавлена возможность копирования проекта другого пользователя для дальнейшего редактирования и использования.
— Сделан общий доступ для файлов между всеми проектами пользователя. Это позволяет на загружать одни и те же данные заново в разные проекты.
— Реализована группировка по принципу модульности. Это обеспечивает эффективное переиспользование ранее созданных модулей.
— Добавлено запоминание позиций узлов вычислительного графа в базе данных. Это позволяет сохранить внешний вид графа между запусками.
— Добавлена кнопка "Запустить граф", которая запускает все узлы на исполнение. Пользователь сразу видит, корректно ли отработали все узлы графа.
— Добавлена кнопка для автоматической раскладки узлов графа, которая либо фиксирует положение узлов графа, либо запускает функцию, которая сама находит оптимальное положение для них.
— Важной новой функцией является обработка списка датафреймов в одном графе. Это позволяет обрабатывать сразу несколько массивов данных с общим списком полей, сравнивать массивы данных между собой и получать интервальные оценки в случае автоматическом генерации датафреймов. Данный подход также имитирует внутренний цикл обработки нескольких массивов данных в рамках единой процедуры обработки.
— Изменения свойств узлов и ребер было переделано на сокеты. Это позволяет реализовать возможность оперативного изменения графа и его свойств сразу у всех пользователей, у которых открыт граф.
— При чтении excel файла с набором страницы, разные страницы преобразуются в разные массивы данных. В ходе работы пользователь может выбрать любой из них.

 

В плане реализации новых математических методов машинного обучения в платформе были реализованы:

— Метод уменьшения размерности tsne (считается более продвинутым методом, чем метод главных компонент).
— Добавлены графики интервальных оценок boxplot, диаграмма размаха (“ящик с усами”) и гистограмм (см. рисунок 3в).
— Добавлена модель полносвязной нейронной сети (многослойный персептрон) для задач классификации и регрессии.
— Реализовано "проряжение" набора данных при отрисовке графиков, если данных очень много. Это позволяет получить графики с данными без существенных задержек в случае больших данных, которые необходимо визуализировать.
— Реализован метод bootstraping для интервального оценивания любых статистических параметров, включая точность оценивания моделей.
— Метод cross_val_score (оценка точности моделей с использование кросс-валидации) был добавлен для нескольких моделей, что позволяет сформировать компактный граф с оценкой качества сразу нескольких моделей для последующего выбора наилучшей из них.
— Добавлена возможность оценки точности моделей для обучающего массива данных (не только для тестового).

 

Ключевые возможности платформы

 

Перейти к платформе

 
Для доступа к платформе Вам нужен пароль.
Хотите его получить - напишите нам.
 

Руководство

Описание программы

Техническое описание

Описание применения

Описание применения финансовых сервисов

Публикации и РИД 

 

СОПУТСТВУЮЩИЕ СЕРВИСЫ:

FEDOT, фреймворк генеративного автоматического машинного обучения, позволяющий создавать сложные композитные модели.

БИБЛИОТЕКА ИНТЕРПРЕТИРУЕМОГО ИНТЕЛЛЕКТУАЛЬНОГО АНАЛИЗА ПРОЦЕССОВ, реализующая возможности анализа с алгоритмическими расширениями в части выделения циклов, автоматического регулирования сложности формируемых моделей процессов, интерпретации состояний и циклов, интеграции с моделями машинного обучения.

 

Email для обратной связи: svivanov@niuitmo.ru