Техническое задание: Разработка корпоративного чат-бота в Яндекс Мессенджере с интеграцией LLM
1. Общие сведения
Наименование проекта: Интеллектуальный помощник сотрудника
Платформа взаимодействия: Яндекс Мессенджер.
Инфраструктура: Yandex Cloud.
Цель: Автоматизация предоставления ответов сотрудникам на основе внутренних регламентов и инструкций компании с использованием технологий искусственного интеллекта.
2. Функциональные требования
2.1. Управление доступом (Закрытый контур)
Авторизация: Доступ к боту должен быть ограничен. Варианты реализации:
Проверка ID пользователя по белому списку (Whitelist).
Интеграция с корпоративным каталогом (Active Directory / Keycloak) через Yandex ID.
Ограничение: Бот не должен отвечать пользователям, не входящим в утвержденную группу.
2.2. Обработка запросов (AI-логика)
Интеграция с LLM: Использование модели YandexGPT API для генерации ответов.
Метод поиска (RAG): Для исключения галлюцинаций ИИ должен использовать базу знаний. При получении вопроса бот должен:
Найти релевантные фрагменты текста в загруженных регламентах.
Передать найденный контекст и вопрос пользователя в YandexGPT.
Сформировать ответ строго на основе предоставленных данных.
Хранение контекста: Бот должен поддерживать диалог (помнить историю последних 3-5 сообщений в рамках одной сессии).
2.3. База знаний
Источник данных: Файлы регламентов и инструкций (PDF, DOCX, TXT).
Механизм обновления: Возможность оперативного добавления/удаления документов из базы знаний без переписывания кода бота.
3. Технический стек (Yandex Cloud)
Yandex Cloud Functions: Для хостинга серверной логики бота (Serverless).
Yandex Object Storage: Для хранения исходных файлов регламентов.
Yandex SearchQueries / Vector Store: (Например, Managed Service for PostgreSQL с расширением pgvector) для векторного поиска по базе знаний.
Yandex GPT API: В качестве основной языковой модели.
Yandex Lockbox: Для безопасного хранения API-ключей и токенов.
4. Нефункциональные требования
Безопасность: Данные не должны уходить за пределы контура Yandex Cloud.
Отказоустойчивость: Время отклика бота не должно превышать 5-10 секунд.
Логирование: Сохранение истории запросов (без конфиденциальных данных) для аудита качества ответов ИИ.