2025/03/26 15:50:01

ИИ-сыщик в действии. Для тех, кому нужен поиск и управление документами

В начале 2000-х годов крупные корпорации для управления документами активно внедряли мощные системы — SharePoint и Confluence. Конечно, за 20+ лет накопились миллионы документов. Но на практике, даже если SharePoint и Confluence индексируют их, то поисковая выдача становится перегруженной и медленной. О том, как решить проблемы управления процессом поиска корпоративной документации с помощью технологий искусственного интеллекта, рассказывает руководитель продуктового офиса компании ICL Services Валентина Кулагина.

Содержание

Почему поиск документов становится проблемным

На это действительно есть несколько причин:

1. Отсутствие единой структуры и дисциплины

  • Разные стандарты хранения: каждый отдел или сотрудник может по-своему называть и организовывать файлы. В итоге появляется хаос, и сложно понять, какой документ актуален, если старые версии не удаляются или не обновляются.
  • Нет единого подхода к тегированию: даже если внедрены теги, сотрудники используют их по-разному или вообще игнорируют.

2. Неидеальный поиск

  • SharePoint ориентирован на структурированное хранение, но его поиск не всегда интуитивен.
  • Confluence лучше подходит для работы с wiki-страницами, но плохо справляется с файлами (Word, PDF).
  • Проблемы с доступами: часто документы разбросаны по закрытым папкам, и поиск не всегда их видит.

3. Человеческий фактор

  • Люди забывают, где хранят документы, и даже не знают, какие инструменты доступны для их поиска.
  • Чем больше информации вокруг, тем больше мы упрощаем подход к памяти — помним не детали, а связи между объектами. Мозг работает иначе, он запоминает контекст или событие («это отчет, который мне присылал Иван»), а не точные формулировки.
  • Многие предпочитают отправить запрос коллеге, чем тратить время и искать самому.
  • Одни и те же файлы могут храниться в разных местах (локально или в облаке), с разными названиями и версиями.

Сейчас эти факторы усугубляются еще и тем, что данные генерируются огромными темпами. Много разных форматов и систем: человек работает не только с документами, но и с чатами, социальными сетями, почтой, корпоративными базами знаний. У многих наблюдается информационная перегрузка, поэтому люди больше полагаются на подсказки и поиск по смыслу, а не на запоминание точных формулировок в документах и сообщениях.

ГенИальная автоматизация

Именно в тот момент, когда мы тратим часы и дни на поиск нужных документов, мы все сходимся в желании внедрить умные поисковые системы с ИИ (так называемый AI-поиск). Конечно, здесь многие вспомнят Copilot для Microsoft 365 или Google AI Search — которые, будучи зарубежными разработками, не всегда оперативно решают задачи бизнеса.

Для таких нужд мы в ICL Services разработали собственный инструмент — Pro.ГенИИ, помощник в тех случаях, когда нужно решить нижеуказанные задачи с эффективностью на уровне западных моделей и в режиме «on premise».

Сегодня мы выделяем следующие функции робота:

  1. Интеллектуальный поиск: Pro.ГенИИ понимает, что именно ищет пользователь по контексту, даже если запрос неточный.
  2. Поиск внутри файлов: анализирует тексты в PDF, ТХТ, Word и анализирует изображения, а также взаимодействует с базами знаний Confluence, Яндекс Wiki, Eva Wiki.
  3. Автоматическая классификация: добавляет теги и группирует документы, классифицирует входящую корреспонденцию и обращения в ITSM-системах (Jira, Simple One), готовит релевантные ответы без участия человека. Если необходим дополнительный контроль, то подготовленные AI-ассистентом сообщения могут не отправляться без модерации человеком.
  4. Ранжирование по важности: учитывает, какие документы открываются чаще.
  5. Чат-диалог: можно задать вопрос AI-ассистенту Pro.ГенИИ обычным языком (например, «покажи договор с клиентом X») или доуточнить свой ранее введенный запрос.

Pro.ГенИИ соблюдает последовательность и логику запросов каждого пользователя, работает в многопользовательском режиме с высоким уровнем производительности и кибербезопасности. Области поиска могут настраиваться и работать изолированно с разными базами знаний и базами данных, например, в соответствии с уровнями доступа к конфиденциальной информации.

Как это применять на практике: 3 сценария работы

Представим, юрист крупной компании должен составить новый договор с клиентом, но ему нужно учитывать формулировки из ранее созданных договоров (у компании почти нет стандартных договоров). Раньше юрист пошел бы искать договоры вручную в корпоративной библиотеке шаблонов и документов (SharePoint, Confluence, в корпоративном файловом хранилище, на диске), тратя время на поиск, сравнение, копирование и верификацию.

Но, имея под рукой Pro.ГенИИ, юрист может выстроить свою работу по следующим сценариям.

Сценарий первый

Взаимодействие с Pro.ГенИИ инициирует запрос юриста. Вместо того, чтобы вручную искать документы, юрист пишет запрос в диалоговое окно поисковой системы, например: «Найди мне последние договоры с клиентами из ИТ-сектора, где была спецификация и пункты о гарантии качества и конфиденциальности».

В ответ на это AI-ассистент Pro.ГенИИ:

  • Ищет не по названию, а по смыслу внутри текстов всех договоров.
  • Определяет, какие документы относятся к ИТ, даже если это не указано в названии файла.
  • Анализирует все договоры и извлекает релевантные фрагменты, где упоминаются «спецификация», «гарантия качества» и «конфиденциальность».
  • Предлагает список найденных документов, ранжируя их по актуальности.

Далее робот проводит автоматический анализ документов, и юристу выводится список найденных договоров и абзацы документов где упоминаются «спецификация», «гарантия качества» и «конфиденциальность» с процентом релевантности.

Сценарий второй

Юрист может задать еще один запрос, применить уточняющее действие, например: «Сравни найденные договоры и покажи различия в формулировках о конфиденциальности»

Далее AI-ассистент Pro.ГенИИ:

  • Анализирует текст договоров и выделяет различия в формулировках. Например, в одном договоре пункт о конфиденциальности звучит жестче, а в другом мягче.
  • Показывает юристу сводку:
    В договоре A: «Конфиденциальность соблюдается в течение 5 лет».
    В договоре B: «Конфиденциальность бессрочная».
    В договоре C: «Конфиденциальность на 3 года, кроме публичных данных».

Это позволяет юристу быстро выбрать нужный вариант или скорректировать формулировку.

Сценарий третий

Юрист может попросить Pro.ГенИИ сгенерировать новый договор, например: «Создай черновик нового договора, используя наиболее строгие формулировки из предыдущих примеров».

AI-ассистент Pro.ГенИИ:

  • Собирает лучшие фрагменты из найденных договоров.
  • Создает структурированный черновик договора, адаптированный под текущий кейс.
  • Может добавить варианты формулировок, чтобы юрист выбрал подходящую.
  • Сразу проверяет на соответствие корпоративным стандартам.

Итоги работы с Pro.ГенИИ

На этапе финальной проверки юрист может внести правки, а затем попросить AI-ассистента Pro.ГенИИ: «Проверь договор на юридические риски и предложи улучшения».

AI-ассистент Pro.ГенИИ проанализирует текст и сравнивает с юридической практикой, выделит слабые места (например, пропущен пункт о форс-мажоре) и сам предложит доработки.

Выводы

Действительно, SharePoint и Confluence хороши для базового поиска. Они индексируют документы, страницы, метаданные, комментарии, поддерживают фильтрацию по тегам, типу файла, дате изменения — но всегда требуют точных формулировок и правильной структуры данных. Можно найти важные документы, но нельзя их интеллектуально обработать — например, объединить абзацы или найти документ с нужной юридической формулировкой.

Интеллектуальный поиск же, в том числе с применением Pro.ГенИИ, снимает нагрузку с пользователей, автоматически анализируя контент и предлагая более релевантные результаты. Именно поэтому AI-поиск и семантический анализ — по смыслу, а не по ключевым словам — являются наиболее востребованными для бизнеса, чем когда-либо.