Роскомнадзор рекомендовал хостингам ограничить работу робота OpenAI — он собирает данные для обучения GPT

Ведомство считает, что бот может собирать информацию о «критических уязвимостях ресурсов».

Роскомнадзор рекомендовал хостингам ограничить работу робота OpenAI — он собирает данные для обучения GPT

Ряд хостинг-провайдеров получили письмо от Главного радиочастотного центра (ГРЧЦ, подведомствен Роскомнадзору) с рекомендацией заблокировать доступ для поискового робота GPTBot компании OpenAI. С письмом ознакомилась газета «Коммерсантъ».

В сообщении для хостинг-провайдеров говорится о необходимости оценить риски сбора информации о «критических уязвимостях ресурсов» и «иной чувствительной информации, в том числе содержащей персональные данные». Если такие риски будут выявлены, хостинг-провайдерам следует заблокировать доступ GPTBot к опубликованным интернет-сайтам.

Если веб-ресурсы продолжат запрещать доступ для GPTBot и других AI-поисковых роботов в том же темпе, то разработчикам нейросетей придётся прибегать к другим методам сбора актуальных данных, считает менеджер продукта Qrator.AntiBot в Qrator Labs Георгий Тарасов.

«Например, к маскировке ботов под легитимных пользователей и покупку агрегированных данных у владельцев бот-ферм, а это уже входит в категорию нежелательных бот-атак»

GPTBot — поисковая программа (краулер), которая посещает и сканирует публичные веб-ресурсы. Информация используется для обучения больших языковых моделей семейства GPT. OpenAI предоставила владельцам сайтов инструкцию по блокировке доступа для GPTBot.