«Сбер» анонсировал инструмент для обучения нейросетей
Molotilka будет скачивать новые данные и дообучать уже существующие языковые модели.

«Сбер» анонсировал инструмент Molotilka (ML Toolkit for Continuous Learning). Он нужен для непрерывного обучения фундаментальных нейросетевых моделей.
В инструменте реализована автоматизация постоянного дообучения. Фреймворк использует языковую модель ruGPT-3, которая обучалась специалистами из SberDevices на основе текстов из разных источников. Проблема нейросетей заключалась в том, что они обучались на прошлых знаниях и не владели актуальной информацией, а Molotilka это исправит.
Например, Molotilka может повторять заранее заданные действия: скачивать актуальные данные из новостных источников и создавать датасет для дообучения языковой модели. Таким образом, пользователи Cloud ML Space получили доступ к самой актуальной версии ruGPT-3 через API. Примеры использования доступны по ссылке.