Яндекс расширил возможности ИИ-сервиса «Нейроэксперт»

Технологическая компания «Яндекс» провела масштабное обновление платформы «Нейроэксперт», запущенной в апреле 2025 года. Сервис ориентирован на глубокий анализ, сопоставление и систематизацию разноформатных данных. Главное отличие системы от классических генеративных чат-ботов — работа по технологии RAG (Retrieval Augmented Generation): ответы формируются строго на основе загруженных пользователем источников, что минимизирует риск фактологических ошибок (галлюцинаций).

Технологический стек и новые алгоритмы

Ядро платформы — большая языковая модель YandexGPT 5 Pro, дополненная тремя узкоспециализированными нейросетевыми модулями для точного извлечения информации:

  • Визуально-языковая модель (VLM): считывает контекст сложных графиков, схем и диаграмм в форматах PDF, DOCX и PPTX, соотнося визуальные кривые с текстовыми пояснениями.
  • Оптическое распознавание (OCR): извлекает текст из отсканированных документов и изображений, включая распознавание и вывод сложных математических формул.
  • Распознавание речи (ASR): автоматически транскрибирует загруженные аудиозаписи и видеоконтент (записи рабочих встреч, лекций), структурируя их в текстовый отчет.

С последним обновлением алгоритмы получили два архитектурных улучшения. Первое — режим промежуточных рассуждений (Chain-of-Thought). При решении многоуровневых задач ИИ пошагово фиксирует свои логические выводы перед выдачей итогового ответа, позволяя аналитикам верифицировать весь процесс. Второе — автономный парсинг веб-ресурсов. Система больше не ограничивается чтением одной страницы по прямой ссылке, а способна проиндексировать целый сайт или его раздел для сбора разрозненных упоминаний нужного объекта.

Организация данных и структура аудитории

Рабочее пространство «Нейроэксперта» организовано по принципу изолированных баз знаний, напоминающих папки в облачном хранилище. На этапе бета-тестирования в одну такую папку можно загрузить до 25 ссылок и файлов различных форматов. Интеграция платформы с экосистемой Яндекс 360 и виртуальным ассистентом Алиса Про позволила быстро масштабировать продукт.

Ежемесячная активная аудитория сервиса достигла 350 тысяч специалистов. Анализ сценариев использования показывает четкое распределение по профессиональным сферам:

  • Образование и наука (17,6%): составление конспектов, саммари лекций, поиск ответов по массиву научной литературы.
  • Юриспруденция (10,6%): сравнительный анализ договоров, поиск противоречий в многостраничных актах.
  • Финансы (7%): сопоставление квартальных отчетов, анализ числовых таблиц.
  • Исторические исследования (4,6%): систематизация архивных документов и сканов.
  • Маркетинг (4,2%) и HR-менеджмент (3,8%): обработка резюме, транскрибация глубинных интервью, формирование сводных отчетов по конкурентам.

Корпоративная безопасность и векторы развития

Особое внимание разработчики уделили разграничению прав доступа. Создатель базы знаний может оставить ее приватной, открыть доступ конкретным коллегам с правами «Редактор» или «Читатель» либо поделиться публичной ссылкой.

С учетом прогнозируемого роста российского рынка интеллектуальной обработки документов (до 50,3 млрд рублей к 2030 году), «Яндекс» развивает полноценное B2B-направление. Помимо базовой подписки, корпоративным клиентам предлагается локальное развертывание (on-premise) внутри защищенного контура компании для безопасной работы с коммерческой тайной.