Обзор решений на рынке: RAG, облачные платформы и KAG-система нового поколения. Возможности, стоимость, архитектура.
Подготовлено: Completo Март 2026 · Аналитический отчётВ любой компании со временем накапливается огромный объём информации: протоколы совещаний, презентации, отчёты, переписки, записи звонков, видеовстречи. Эта информация — ценный актив, но на практике она лежит мёртвым грузом.
По исследованиям McKinsey, сотрудники тратят до 20% рабочего времени на поиск информации внутри компании. Для команды из 20 человек это эквивалент 4 полных ставок, которые тратятся на то, чтобы найти то, что уже известно.
При этом значительная часть знаний существует только в неструктурированном виде: видеозаписи совещаний, PDF-документы, сканы, голосовые сообщения. Обычный поиск по файлам здесь бессилен.
Представьте, что у вас есть идеальный ассистент, который прочитал все документы компании, посмотрел все записи совещаний, помнит каждую цифру и каждую договорённость — и может за секунды найти любую информацию и ответить на вопрос со ссылкой на источник.
Это и есть ИИ база знаний. Технически она работает так:
| Задача | Без ИИ базы знаний | С ИИ базой знаний |
|---|---|---|
| Найти договорённость с клиентом | 30-60 мин: перебор файлов, писем, записей | 30 секунд: вопрос → ответ с цитатой из совещания |
| Проверить текст на ошибки | Ручная сверка с первоисточниками (если их найдут) | Автоматическая проверка: система подсвечивает расхождения с фактами |
| Протокол совещания | 1-2 часа ручной работы менеджера | Автоматическое извлечение решений, задач, KPI из видеозаписи |
| Onboarding нового сотрудника | Недели вхождения, «бегать спрашивать» | Задаёт вопросы системе — получает ответы с контекстом |
| Заметить противоречие | Обычно никто не замечает до конфликта | Система автоматически сигнализирует при загрузке нового документа |
На рынке существует два принципиально разных подхода к построению таких систем. Разберём каждый.
RAG (Retrieval-Augmented Generation) — наиболее распространённый подход на рынке. Если объяснять простыми словами: система разрезает все документы на небольшие кусочки, запоминает смысл каждого кусочка в виде числового кода, а при вопросе — находит наиболее похожие кусочки и показывает их ИИ-модели, чтобы та сформулировала ответ.
Схематично:
| Решение | Тип | LLM | Стоимость | Особенности |
|---|---|---|---|---|
| Yandex Cloud ML (YandexGPT + Search Index) |
Облако | YandexGPT 4 | от 30 000 ₽/мес (по токенам + хранение) |
Интеграция с Yandex Cloud, русский язык из коробки. Ограниченный RAG: только текст, нет графа знаний. |
| GigaChat API (Сбер) |
Облако | GigaChat Pro | от 20 000 ₽/мес (пакеты токенов) |
API для RAG. Хороший русский. Нет встроенной векторной базы — нужно дособирать самим. |
| MTS AI / Cotype | Облако | Собственные LLM | от 50 000 ₽/мес | Корпоративный RAG с интеграцией в экосистему МТС. Фокус на телеком. |
| LangChain + Qdrant (open-source) |
Open Source | Любая | Бесплатно (+ инфраструктура) |
Конструктор. Требует разработки, но максимально гибкий. Только RAG. |
| LlamaIndex (open-source) |
Open Source | Любая | Бесплатно (+ инфраструктура) |
Мощный фреймворк для RAG. Есть Knowledge Graph Index, но примитивный. |
| Dify / Flowise | Open Source | Любая | Бесплатно (self-hosted) |
No-code платформы для RAG. Быстрый старт, но ограниченная кастомизация. |
| KAG-система (разработка Completo) |
KAG | Любая (Qwen, Gemini, GPT) |
Индивидуально | Граф знаний + вектора + адаптивные агенты. Единственное KAG-решение на рынке РФ. |
| Проблема | Описание | Последствия |
|---|---|---|
| Нет структуры знаний | Документы хранятся как «мешок слов». Система не знает, что «ООО Ромашка» — это клиент, а «Иванов» — менеджер. | Невозможно задать вопрос «Все решения по клиенту X за март» — только полнотекстовый поиск. |
| Нет обнаружения противоречий | Если в документе от января написано «бюджет 1 млн», а в мартовском «бюджет 500 тыс» — RAG не заметит. | Ответы могут содержать устаревшую или противоречивую информацию. |
| Потеря контекста при нарезке | Таблица на 3 страницы будет разрезана на 6 чанков. Каждый чанк потеряет связь с заголовками столбцов. | Ответы по сложным PDF/таблицам часто неточные. |
| Нет работы с аудио/видео | Готовые RAG-решения не умеют транскрибировать, определять спикеров, извлекать события из совещаний. | Огромный пласт корпоративных знаний (записи встреч) остаётся за бортом. |
| Нет верификации контента | RAG может найти факты, но не может проверить текст на соответствие базе знаний. | Невозможно автоматически проверять маркетинговые материалы, статьи, отчёты. |
| Однонаправленный поиск | Только косинусное расстояние между вектором запроса и вектором чанка. | Если вопрос сформулирован не так, как написано в документе — ответ не найдётся. |
| Нет адаптивности | Фиксированный пайплайн: загрузил → нарезал → ответил. Нет quality gates. | Если качество входных данных низкое (шумная транскрипция) — качество ответов тоже. |
KAG (Knowledge Augmented Generation) — принципиально другой подход. Если RAG — это «умный поиск по тексту», то KAG — это «умный сотрудник, который прочитал все документы и понял, кто есть кто и что с чем связано».
Вместо того чтобы просто резать документы на кусочки, KAG извлекает из текста сущности (людей, компании, продукты, решения, цифры) и строит между ними связи — получается граф знаний. Это как интерактивная карта всей информации компании, где видно: кто принял решение, когда, на какой встрече, и как это повлияло на проект.
| Возможность | RAG | KAG (Completo) |
|---|---|---|
| Форматы документов | Текст, простые PDF | Текст, PDF (vision), видео, аудио, изображения, веб-страницы |
| Понимание структуры | ✗ Плоские чанки | ✓ Настраиваемая типизация сущностей + автоматические связи |
| Метод поиска | Только вектора | Вектора + граф + полнотекст (тройной) |
| Обнаружение противоречий | ✗ Нет | ✓ Автоматическое, с уровнями уверенности |
| Верификация контента | ✗ Нет | ✓ Светофорная система + инлайн-подсветка |
| Видео/аудио | ✗ Не поддерживается | ✓ Транскрипция + диаризация + распознавание лиц |
| Таймлайн событий | ✗ Нет | ✓ 6 категорий: решения, задачи, KPI, проблемы, обратная связь |
| Определение спикеров | ✗ Нет | ✓ Многофазный агент с face matching |
| Карточка клиента | ✗ Нет | ✓ Индексируется как приоритетный контекст |
| Адаптивная обработка | ✗ Фиксированный пайплайн | ✓ 4 агента с quality gates |
| Восстановление после сбоев | ✗ Ручная переиндексация | ✓ Автоматическое при старте воркера |
| Мультитенант | ◐ Уровень приложения | ✓ Изоляция на уровне namespace графа |
| Цепочка происхождения факта | ◐ Ссылка на чанк | ✓ Фрагмент → спикер → дата → совещание → цитата |
| Стоимость LLM-вызовов | 1 вызов на запрос | 1 вызов на операцию (оптимизировано) |
Объём корпоративных знаний — это не только текстовые документы. KAG-система обрабатывает все основные форматы:
| Формат | Метод обработки | Что извлекается | Сложности |
|---|---|---|---|
| Текст (.txt, .docx, .xlsx) |
Прямой парсинг с определением кодировки (UTF-8, Windows-1251) | Полный текст → классификация → сущности → граф | Минимальные. Самый надёжный формат. |
| PDF (в т.ч. сканы) |
Vision-модель (Gemini 2.5 Flash): рендеринг страниц → визуальный анализ | Таблицы, списки, диаграммы, мелкий шрифт, заголовки. Постраничная обработка. | Сложные многоколоночные PDF. Решается vision-подходом вместо текстового OCR. |
| Видео (.mp4, .webm, .mov) |
ffmpeg → Whisper (транскрипция) → диаризация → face matching | Полная транскрипция с разметкой спикеров, таймлайн событий, лица участников | Качество микрофона. Лимит: 2 часа / 2 ГБ. |
| Аудио (.mp3, .wav, .m4a) |
Whisper (gpt-4o-transcribe) → чанкинг по 10 мин | Транскрипция → те же пайплайны, что и для текста | Шумные записи. Решается через quality gates агентов. |
| Изображения (.jpg, .png) |
Vision-модель: визуальный анализ содержимого | Текст на изображениях, диаграммы, скриншоты | Низкое разрешение. Минимальный порог: 50 символов на страницу. |
| Веб-страницы | Playwright (JS-сайты) / aiohttp (статика), BFS-обход | Полный текст + навигационная структура | JS-heavy сайты. Решается автоопределением + headless браузер. |
Вход: Менеджер написал пост для соцсетей: «Наш продукт увеличивает конверсию на 40% за первый месяц».
Что делает система:
Результат: Красный — «Противоречие с данными совещания от 15.02.2026. Фактическое значение: рост конверсии 23% за 3 месяца. Источник: Иванов А., запись встречи с клиентом.»
Вход: Запись совещания с клиентом (47 минут, 3 участника).
Что делает система:
Результат:
Ситуация: Загружен новый протокол совещания, в котором написано: «Бюджет на рекламу — 1.5 млн/мес».
Что делает система:
Результат: Возможное противоречие — «Бюджет на рекламу: 1.5 млн (новый документ) vs 2 млн (протокол от 10.01). Разница: 500 тыс., давность: 80 дней». Менеджер подтверждает: бюджет был пересмотрен → система запоминает коррекцию.
Запрос: «Какие ключевые решения были приняты по проекту X за последний месяц?»
Что делает система:
Ответ: Структурированный список решений с датами, участниками и ссылками на первоисточники (запись совещания, документ, чат).
Ниже — сценарии, где ИИ база знаний решает реальные задачи компании-производителя с дилерской сетью, маркетингом и операторами.
Производитель загружает в систему: технические характеристики продукции, прайс-листы, условия гарантии, FAQ по рекламациям, маркетинговые материалы. Дилеры получают доступ к чат-боту, который мгновенно отвечает на вопросы клиентов — с точными цифрами и ссылками на первоисточник.
Результат: дилер не звонит менеджеру с вопросом «а какой у этой модели расход?» — он получает ответ за 10 секунд. Информация всегда актуальная: обновили прайс — база знаний обновилась автоматически.
Дилеры часто создают собственные рекламные материалы: листовки, посты, описания на сайтах. Система верификации автоматически проверяет их на соответствие актуальным характеристикам, ценам и позиционированию бренда.
Результат: маркетинг производителя загружает текст дилера → система подсвечивает: «Указана мощность 150 л.с., в актуальной спецификации — 145 л.с.» Ошибка не дойдёт до клиента.
Оператор получает звонок: «У меня модель X, и она не запускается при температуре ниже -20». Вместо того чтобы искать в толстом мануале, оператор задаёт вопрос базе знаний и за секунды получает: температурный диапазон эксплуатации, инструкцию по холодному пуску, список известных проблем по этой модели — с номерами сервисных бюллетеней.
Результат: среднее время обработки звонка сокращается с 8-10 минут до 2-3 минут. Новый оператор выходит на уровень опытного за дни, а не за месяцы.
Система автоматически извлекает из записей звонков и обращений: какие проблемы встречаются чаще всего, по каким моделям, в каких регионах. Строит таймлайн: «В марте резко выросло количество обращений по модели Y с жалобой на шум в двигателе».
Результат: производитель видит системную проблему до того, как она станет массовой рекламацией. Можно проактивно выпустить сервисный бюллетень.
Маркетолог написал статью для блога, пресс-релиз или описание для каталога. Перед публикацией текст проходит через систему верификации: она проверяет каждый факт — цены, характеристики, сравнения с конкурентами, цитаты — на соответствие базе знаний.
Результат: зелёный — всё корректно, можно публиковать. красный — «указана цена 2.5 млн, актуальная цена по прайсу от 01.03 — 2.8 млн». Ошибки отлавливаются до публикации.
Нужно написать описание продукта для сайта, подготовить сравнительную таблицу, сформировать ответ на запрос клиента. Система генерирует текст, опираясь строго на факты из базы знаний — с указанием источников. Нет «галлюцинаций» — каждое утверждение подкреплено документом.
Результат: копирайтер получает черновик с корректными данными, а не придумывает характеристики из головы. Время на подготовку материала сокращается в 3-5 раз.
В базу знаний загружаются материалы конкурентов: каталоги, прайс-листы, обзоры, статьи. Система строит граф: кто какие продукты выпускает, по каким ценам, с какими характеристиками. Можно задать вопрос: «Чем наша модель X отличается от аналога конкурента Y?» — и получить структурированное сравнение.
Результат: отдел продаж получает актуальные конкурентные карточки, а не устаревшие таблицы в Excel.
Видеозапись совещания загружается в систему. Автоматически: транскрипция, определение участников, извлечение решений, задач, обсуждённых KPI, проблем. Менеджеру не нужно писать follow-up — он уже сформирован.
Результат: решения не теряются. Через полгода можно найти: «Что мы договорились с дилером Z на встрече в марте?» — и получить точный ответ с цитатой из записи.
Техническая документация, маркетинговые материалы и данные с сайта часто расходятся: в каталоге одни характеристики, на сайте другие, в презентации третьи. Система автоматически обнаруживает такие расхождения при загрузке каждого нового документа.
Результат: единый источник правды. Противоречия видны сразу, а не когда клиент указал на ошибку.
| Сценарий | Экономия | Кто выигрывает |
|---|---|---|
| Ответы дилерам на вопросы по продукции | -80% времени менеджера | Отдел продаж, дилерская сеть |
| Верификация маркетинговых текстов | Минус 70-90% фактических ошибок | Маркетинг, PR |
| Обработка звонков в техподдержке | С 8 мин до 2-3 мин на звонок | Колл-центр, сервис |
| Протокол совещаний | 2-3 часа ручной работы на встречу | Менеджмент |
| Подготовка контента | В 3-5 раз быстрее с проверенными данными | Контент-команда |
| Onboarding новых сотрудников | Выход на продуктивность в 2-3 раза быстрее | HR, руководители |
| Обнаружение противоречий в документации | Автоматически, без ручной сверки | Все отделы |
Один из главных вопросов при внедрении ИИ базы знаний: где физически обрабатываются ваши документы? Есть два варианта — облако (данные обрабатываются на серверах провайдера) и собственный сервер (все данные остаются внутри компании).
Данные обрабатываются внешними LLM-провайдерами
Подходит для: стартапов, команд без чувствительных данных, MVP
Все данные и модели — на собственном сервере
Подходит для: банки, госсектор, компании с NDA, крупный бизнес
Для работы ИИ-моделей на собственном оборудовании нужен специальный сервер с видеокартами (GPU) — именно они выполняют вычисления для ИИ. Обычный офисный сервер не подойдёт. Ниже — примеры конфигураций под разные масштабы бизнеса.
По данным открытых источников и коммерческих предложений российских интеграторов (2025-2026):
| Тип проекта | Исполнитель | Стоимость | Срок |
|---|---|---|---|
| RAG-чатбот (MVP, только текст) | Фриланс / небольшая команда | 200 000 — 800 000 ₽ | 1-3 недели |
| RAG для отдела (Yandex Cloud + YandexGPT) | Партнёры Yandex Cloud | 500 000 — 2 млн ₽ | 2-6 недель |
| RAG на Cloud.ru (open-source модели) | Cloud.ru + интегратор | 300 000 — 1.5 млн ₽ | 2-4 недели |
| RAG для департамента (Just AI, Naumen и др.) | Средние AI-студии | 2 — 8 млн ₽ | 1-3 мес. |
| Enterprise RAG (Сбер Solutions, MTS AI Cotype) | Крупные интеграторы | 5 — 30 млн ₽ | 3-6 мес. |
| GigaChat для бизнеса (on-premise) | Сбер / партнёры | от 2 млн ₽/год (подписка) | 2-4 мес. |
KAG-платформа Completo — готовый продукт. Клиент не оплачивает разработку с нуля — он получает развёртывание существующей системы с настройкой под свою предметную область. Рекомендуемый путь: начать с пилота, оценить результат, затем масштабировать.
Проверка на реальных данных
После успешного пилота
Когда нужен полный контроль
Простое объяснение: токен — это единица текста для ИИ (примерно 1 слово = 1-2 токена). Один полноценный запрос к базе знаний потребляет примерно 2 000-5 000 токенов. То есть при цене 1 ₽ за 1 000 токенов один запрос стоит 2-5 ₽.
| Провайдер | Модель | Ввод (за 1K токенов) | Вывод (за 1K токенов) | Примечание |
|---|---|---|---|---|
| Yandex Cloud (AI Studio) | ||||
| Yandex | YandexGPT Lite | 0.13 ₽ | 0.13 ₽ | Быстрая, для простых задач |
| Yandex | YandexGPT Pro 5.1 | 0.54 ₽ | 0.54 ₽ | Основная для RAG |
| Yandex | Embeddings | 0.007 ₽ / 1K токенов | Векторизация текста | |
| Сбер (GigaChat 2) | ||||
| Сбер | GigaChat 2 Lite | 0.20 ₽ | 0.20 ₽ | Free tier: 1 млн токенов/мес |
| Сбер | GigaChat 2 Pro | 1.38 ₽ | 1.38 ₽ | Сбалансированная |
| Сбер | GigaChat 2 Max | 1.38 ₽ | 2.76 ₽ | Максимальное качество |
| Сбер | Embeddings | 0.04 ₽ / 1K токенов | Векторизация | |
| Cloud.ru (Evolution AI Factory) | ||||
| Cloud.ru | Qwen3-235B | 0.017 ₽ | 0.05 ₽ | Open-source модели на российской инфраструктуре |
| Cloud.ru | GLM-4.5 | 0.055 ₽ | 0.22 ₽ | Мощная reasoning-модель |
| Cloud.ru | Qwen3-Coder | 0.04 ₽ | 0.08 ₽ | Для кодогенерации и сложных задач |
| Статья расходов | RAG (облако) | KAG (облако) | KAG (on-premise) |
|---|---|---|---|
| LLM-провайдер (токены) | 3-15 тыс. ₽ | 5-20 тыс. ₽ | 0 ₽ (свои модели) |
| Инфраструктура (серверы) | 3-8 тыс. ₽ | 5-15 тыс. ₽ | 150-300 тыс. ₽ (аренда GPU или амортизация) |
| Техподдержка и обновления | 10-30 тыс. ₽ | 20-40 тыс. ₽ | 50-100 тыс. ₽ |
| Инженер (on-premise) | — | — | 100-200 тыс. ₽ (частичная занятость) |
| Итого в месяц | 15-50 тыс. ₽ | 30-75 тыс. ₽ | 300-600 тыс. ₽ |
RAG — это хорошая отправная точка. Он решает базовую задачу: «найти похожий текст и ответить». Для простой документации и FAQ — этого достаточно.
Но для серьёзной работы с корпоративными знаниями — когда нужно понимать структуру, обнаруживать противоречия, обрабатывать видео и сложные PDF, верифицировать контент и строить таймлайн событий — нужен KAG.
Почему KAG-платформа Completo — уникальное предложение:
Оптимальный следующий шаг — пилотный проект на реальных данных: загрузить 50-100 документов, настроить типизацию под предметную область и увидеть результат за 1-2 недели. Это позволит оценить качество на практике, а не в теории.