«Нейроэксперт» от «Яндекса». Тестируем сервис для работы с файлами и ссылками на базе YandexGPT

Сервис, который сильно упрощает работу с большими объёмами данных.

«Нейроэксперт» от «Яндекса». Тестируем сервис для работы с файлами и ссылками на базе YandexGPT

Знания чат-ботов черпают сведения о мире из базы знаний, на которых они обучались, и интернета. Но что если вам необходимо проанализировать собственные документы? Простой пример: у компании, в которую вы только что устроились, есть корпоративная база знаний. Ворошить кучу огромных документов в поиске ответа на простой вопрос — долго и муторно. 

Большинство современных нейросервисов способны открыть текстовый файл, проанализировать его и ответить на вопросы исходя из содержимого. Но для глубокого анализа большого объёма информации обычные чат-боты подходят слабо: нет удобного интерфейса для переключения между документами, зато есть жёсткое ограничение на объём информации. Например, бесплатный тариф ChatGPT позволяет загружать до трёх файлов в сутки. Плюс нет гарантий, что нейросеть не подмешает данные из собственной «памяти».

У Google есть сервис NotebookLM, который специально заточен под исследования на основе данных: загружаете в контекст тексты, таблицы, презентации, веб-ссылки и даже аудиозаписи — и спрашивайте что угодно. Но в России он не работает, и обойти региональное ограничение не так-то просто.

В апреле «Яндекс» представил бета-версию «Нейроэксперта». Он умеет искать и анализировать информацию из загруженных документов или ссылок на сайты. Например, можно передать «Нейроэксперту» ссылки на обзоры интересующих смартфонов и попросить выбрать лучший по конкретным критериям. 

Как устроен «Нейроэксперт»

Что внутри. Чтобы разобраться в разных представлениях информации — тексте, изображениях и даже аудиозаписях, — «Нейроэксперт» задействует несколько технологий:

  • VLM — визуально-языковая модель, которая способна понимать графики и диаграммы;
  • ASR — преобразует речь в аудиофайлах в текст;
  • OCR — технология оптического распознавания символов на изображениях.

Собственно ответ на вопрос пользователя формирует большая языковая модель YandexGPT 5 Pro — самая продвинутая на сегодняшний день нейросеть «Яндекса». При этом модель основывается только на информации из загруженных документов, не используя собственную «память» и другие внешние источники. Такие системы извлечения и генерации информации называют RAG (Retrieval Augmented Generation).

Как пользоваться. На главной странице «Нейроэксперта» находится список проектов. Сразу представлены несколько демо-проектов: например, база с загруженными спецификациями и обзорами китайских автомобилей — получился удобный помощник по выбору машины.

Загрузить в собственный проект можно документы в различных форматах: тексты (PDF, DOC, DOCX, MD, ODT, RTF), таблицы (XLS, XLSX), презентации (PPT, PPTX), изображения (JPEG, PNG, WEBP), аудио (MP3, OGG, AAC) и видео (MP4, MOV). А ещё «Нейроэксперт» учтёт данные из приложенных веб-ссылок. Даже если «скормить» сервису ссылку на YouTube-видео, алгоритм переведёт его в текст и тоже загрузит в контекст. Работает не только с YouTube, но и с «VK Видео», «Дзеном» и Rutube.

При создании проекта можно ввести промпт — например, указать, в каком тоне «Нейроэксперту» следует выдавать ответы. 

Внутри проекта есть две вкладки: «Документы» и «Чаты». В первой представлен список используемых источников, во второй — список диалогов. Чатов можно создать сколько угодно: это удобный способ разбивать вопросы по темам. Кроме того, чатами можно делиться при помощи уникальной ссылки.

Лимиты. В рамках бета-версии доступно создание до 10 проектов, в каждый из которых можно загрузить не более 25 документов. Ещё одно ограничение — до 100 запросов в месяц. Зато сервис работает полностью бесплатно. 

В будущем «Яндекс» планирует расширить возможности «Нейроэксперта» для бизнес-пользователей.

Тестируем «Нейроэксперта»

На первый взгляд может показаться, что «Нейроэксперт» пригодится в весьма специфических сценариях — вроде того, что описан в самом начале материала. Но это не так: продемонстрируем на пяти конкретных кейсах.

Сравнение товаров. Предположим, вы выбираете среди двух понравившихся вам смартфонов. Чтобы остановиться на конкретном варианте, обычно приходится тратить часы на изучение таблиц характеристик, текстовых и видеообзоров. 

Попробуем поручить эту задачу «Нейроэксперту». Сервис отвечает на вопросы в свободном формате и даже может составить сравнительную таблицу. Каждое утверждение сопровождается ссылкой на источник. 

Суммаризация информации из чата. Недавно наша редакция приняла двух новостных редакторов. Мы потратили много времени, чтобы обучить «новобранцев» нашим принципам оформления материалов. Чтобы упростить задачу на будущее, загрузим в «Нейроэксперта» историю рабочего чата.

Пожалуй, полноценную редакционную политику таким образом не составить. Но по крайней мере «Нейроэксперт» поможет выделить основные моменты.

Расшифровка созвона. Сервисы по расшифровке аудиозаписей нынче никого не удивляют. Но «Нейроэксперт» заодно способен ответить на вопросы: что обсудили в ходе разговора, кого назначили ответственным за конкретную задачу и так далее. 

После загрузки аудио «Нейроэксперт» сразу даёт краткое саммари и вполне подробно отвечает на вопросы, несмотря на не самое высокое качество голосовых сообщений.

Аналитика. У нас есть база анкет на позицию новостного редактора. Хотя мы уже набрали команду, попробуем узнать мнение «Нейроэксперта» насчёт кандидатов: каких претендентов выделит нейросеть с учётом указанного опыта и зарплатных ожиданий.

В этой задаче сервис не порадовал: предложенные кандидатуры нам едва ли подойдут. Хотя и обвинить «Нейроэксперт» ни в чём нельзя: поставленную задачу он выполнил. Возможно, стоило конкретизировать наши требования в промпте.

Подготовка к экзамену. Экзаменационные билеты обычно содержат десятки вопросов — и поиск ответов отнимает массу времени. Намного проще загрузить все лекции и учебные материалы в «Нейроэксперта».

Нейросеть корректно ответила на заданные вопросы, даже слегка упростив для понимания формулировки из исходных документов.

Что в итоге

В ходе тестирования я столкнулся с тем, что некоторые ответы «Нейроэксперта» неверно отформатированы: в тексте изредка встречаются фрагменты кода, которые должны были выглядеть как ссылка на источник. А иногда приходится менять формулировки вопросов: например, в задаче сравнения смартфонов «Нейроэксперт» не с первого раза обнаружил ёмкость аккумулятора одной из моделей, хотя она точно упоминалась в источниках. 

Но всё это можно списать на то, что сервис пока находится на этапе бета-тестирования. На мой взгляд, «Нейроэксперт» особенно пригодится студентам и специалистам, которые ежедневно оперируют большим объёмом информации: журналистам, юристам, программистам и так далее.