Учёные из Tinkoff Research открыли алгоритм для обучения ИИ в 20 раз быстрее
Им удалось обнаружить недочёты в уже готовых исследованиях метода SAC-RND.

Учёные из лаборатории исследований искусственного интеллекта Tinkoff Research открыли алгоритм для обучения ИИ, который в 20 раз быстрее и на 10% качественнее аналогов.
Метод SAC-RND основан на обучении с подкреплением, что позволяет роботам адаптироваться к новым условиям и учиться методом проб и ошибок. При использовании RND (Random Network Distillation, случайные нейронные сети) задействованы две нейросети — случайная и основная, одна пытается предсказать поведение второй.
Ранее учёные пришли к выводу, что такой метод не способен классифицировать данные. В Tinkoff Research выяснили, что это произошло из-за неправильных размеров сетей — исследователи исправили глубины сетей и оказалось, что метод способен различать данные.
Результаты исследования признаны мировым научным сообществом и представлены на Международной конференции по машинному обучению в конце июля в Гонолулу (Гавайи).