Индивидуальный план NovaML позволяет автоматизировать процесс машинного обучения и выполняет весь спектр действий, производимых Data Scientists, за считанные минуты. Платформа NovaML доступна для персонального использования.
NovaML трансформирует науку о данных в удобный и простой инструмент
- Анализ и обработка данных. Можно загрузить необработанные данные с текстовыми, категориальными и числовыми переменными, пустыми ячейками, датами и экстремальными значениями. Переменные будут автоматически очищены и обработаны.
- Инжиниринг информативных признаков. Отбор информативных признаков производится экспериментальным путем с постоянной валидацией и учетом особенностей алгоритмов, используемых для предсказания целевой переменной.
- Автозаполнение пропущенных значений. Если данные содержат пропуски, Nova ML применит ML-алгоритмы для обучения на основе остальных известных данных и спрогнозирует пропущенные значения. Данный функционал доступен как отдельный сервис.
- Выбор и оптимизация модели. Экспериментальным путем проверяются разные типы моделей на базе простых линейных и трехбазисных алгоритмов. В результате такого анализа Nova ML выбирает наиболее подходящую модель.
- Интерпретация результатов. Nova ML проводит оценку значимости факторов на каждом этапе калибровки модели.
- Прогнозирование на новых данных. Надо переместить таблицу с новыми данными для предсказания прямо в окно браузера. Nova ML обработает тестовый набор данных и отправит прогнозные значения в папку «Загрузки» на вашем компьютере.
Основные преимущества:
- Легкость. Вместе с NovaML можно использовать все возможности машинного обучения, даже не имея навыки программирования. NovaML проведет через весь ML-процесс и сделает большую часть технической работы автоматически.
- Доступность. Работа с алгоритмами ML требует поддержки дорогостоящей инфраструктуры. NovaML использует необходимые вычислительные ресурсы по требованию и отключается от них после завершения расчетов.
- Скорость. На работу по подготовке и очистке данных, анализ и оптимизацию модели обычно уходят недели труда data-science специалистов. NovaML сделает все то же самое, но за пару минут, даже если идет работа с несколькими проектами одновременно.
- Качество. На одних и тех же данных качество моделей, полученных с помощью NovaML, превосходит результаты работы ML-инженеров на Kaggle. Несмотря на такой впечатляющий результат, команда не перестает работать над усовершенствованием NovaML.