- Цикл
- Встреча → Протокол → Согласование → Календарь → Контроль исполнения
- Стек
- Hermes Agent · Orchestrator · Arena · Bg-Review · MemPalace · Pseudonymizer
- ИБ
- Zero Trust · подтверждение человеком · локальная память
- Контур
- Любой корпоративный мессенджер · on-prem календарь · локальный STT
- Роль
- Архитектор · разработчик · интегратор
Что делает помощник руководителя
Руководитель проводит десятки переговоров и совещаний в неделю. Принятые обязательства теряются между мессенджерами, почтой и записями секретаря. Контроль исполнения держится на личной памяти и стикерах.
Ассистент закрывает этот разрыв — но не вместо секретариата, а как когнитивный усилитель. Секретарь и служба протокола получают готовые черновики; блок контроля — автоматически собранный список обязательств с зафиксированными сроками; руководитель — сводку, где принято решение и где есть риск его невыполнения.
- Договорённости не теряются — каждая зафиксирована, согласована и привязана к протоколу
- Сроки видно заранее — контрольные точки заведены в календарь до того, как срок сгорит
- Статус исполнения известен — ассистент сам опрашивает исполнителей и сверяет ответы
- Сотрудники работают как раньше — задачи приходят им в привычный мессенджер
Цикл «Встреча → Протокол → Согласование → Календарь → Контроль»
Архитектура — что под капотом
Ассистент не чат-бот, а многослойная система. Каждый слой решает свою задачу, и любой можно заменить под требования контура без ломки остальных. Технический специалист службы клиента увидит здесь привычную картину: от приёма данных через защитный периметр — к когнитивному ядру и внешним системам.
Что это означает в эксплуатации. Голос и черновые тексты не покидают защитный периметр без явного решения. Чувствительные данные обезличиваются до отправки в облачную модель; маскировка секретов в логах работает на каждом слое. Память — локальная, что делает ассистента работоспособным в изолированных контурах без выхода в интернет.
Заменяемость компонентов. Языковая модель, распознавание речи, календарь, мессенджер — это слои с чёткими интерфейсами. Замена одного из них (например, перевод на on-prem GPU вместо облачной модели) не требует переписывания всей системы.
Интеллектуальный routing моделей
Один и тот же ассистент обслуживает короткие справочные запросы, работу с кодом и архитектурные обсуждения с длинным контекстом. Запускать всё это через самую дорогую модель — расточительно; запускать через самую дешёвую — не вытянет сложные туры. Оркестратор моделей решает задачу маршрутизации перед каждым вызовом: классифицирует запрос по эвристикам (без ML) и направляет в один из трёх tier'ов.
| Tier | Модели | Назначение |
|---|---|---|
| LIGHT | glm-4.5-air | короткие ответы, search, повторы без tool calls |
| MEDIUM | glm-4.6 / 4.7 | код, работа с файлами, до 3 tool calls подряд |
| HEAVY | glm-5.1 | архитектура, контексты >80K, длинные цепочки tool calls |
Классификатор — эвристический, без ML. Решение принимается по размеру контекста, количеству tool calls в туре, наличию ключевых маркеров (код, длинные документы, многошаговые планы). Это даёт предсказуемость: при разборе инцидента видно, по какой именно эвристике запрос ушёл в heavy.
Эскалация и экономия квоты. При качественной ошибке (модель не справилась, отдала невалидный ответ, упёрлась в лимит контекста) задача проходит ordered escalation chain из 5 шагов — от повтора в том же tier с уточнённым промптом до подъёма на следующий tier. Каждый шаг изолирован: если ошибка повторилась — следующий шаг, иначе выход. На типичном распределении (70% light, 25% medium, 5% heavy) такая схема даёт ~47% экономии квоты по сравнению с запуском всех туров на heavy.
Учёт квоты — двухпороговый cap. На каждый tier ведётся счётчик расхода. При остатке 20% оркестратор переходит в режим предупреждения и старается не эскалировать без необходимости; при остатке 8% — hard cap, запросы остаются в более лёгком tier даже ценой повторов. Это исключает ситуацию «квота кончилась к 14:00, ассистент молчит до полуночи».
Наблюдаемость агентной системы
Когда ассистент работает в продакшене, нужны метрики уровня эксплуатации, а не «логи в консоли». Каждый вызов модели проходит через инструментированный gateway: модель, tier, исход, latency, токены — пишутся в локальную SQLite-таблицу. Это превращает поток обращений в наблюдаемый сигнал: видно, какая модель чем занимается, где растут задержки, какой tier приближается к лимиту.
| Слой телеметрии | Что фиксируется |
|---|---|
| model_arena_attempts | каждая попытка вызова: модель, tier, latency, prompt/completion tokens, исход |
| session_verdicts | парсинг финальных вердиктов тура (/done, /pause, /fail) из gateway |
| CLI | hermes arena stats — агрегаты по моделям и tier'ам; hermes arena digest — суточный отчёт |
| Cron-отчёт | ежедневный digest за 24ч с разбивкой по tier'ам и исходам |
State schema v12. Хранилище — расширение основной
SQLite-базы агента, не отдельная инфраструктура. Миграция
добавляет две таблицы (model_arena_attempts и
session_verdicts) и индексы по времени и tier'у.
Объём данных порядка 1–2 МБ в сутки на активного пользователя — без
ротации легко держится годами.
Самообучение и рефлексия
После каждого завершённого тура запускается фоновый процесс background review: отдельный daemon-thread с собственным forked-контекстом агента. Он не вмешивается в основной диалог, а ревьюит прошедший тур: что сработало, что нет, стоит ли обновить память или навыки. Если стоит — выполняет обновление через ограниченный набор инструментов.
- Tool whitelist. Background review имеет доступ только к memory- и skill-инструментам. Он не может отправить сообщение пользователю, дёрнуть внешний API, выполнить shell-команду. Минимизация blast radius — рефлексия не сломает основной поток.
- Fixed light model strategy. Background review всегда работает на light-модели и не наследует runtime платных моделей основного тура. Это предотвращает ситуацию «рефлексия съела квоту, которой не хватило основному диалогу».
- Журнал решений. Каждое решение пишется в
orchestrator.jsonl:bgreview_decision(что решено обновить и почему) +bgreview_usage(сколько токенов потрачено). Постфактум видно, на чём именно агент учится. - Не блокирует тур. Daemon стартует после возврата ответа пользователю — ожидание пользователя не растёт от рефлексии.
Речевой конвейер — как принимается голос
Самый чувствительный шаг цикла — приём голоса. Конвейер собран как авторский модуль на проверенных open-source компонентах и работает полностью локально: записи, дорожки и черновые транскрипции не попадают во внешние сервисы. Результат — не «запись встречи», а структурированный транскрипт: кто говорил, что именно говорил, с точностью до слова и секунды.
Три ступени
- Распознавание речи. Локальная модель, специально обученная на русской речи. На выходе — слова с таймкодами, уверенная работа с именами, корпоративной терминологией, номерами договоров. Это область, где универсальные модели часто сбоят на собственных именах и аббревиатурах.
- Разделение спикеров (диаризация). Модуль определяет, кто когда говорил. Количество спикеров — автоматически; при необходимости подсказывается оператором (мягкий диапазон, не жёсткая блокировка). Выход — размеченный таймлайн: «участник А — с 00:14 по 02:31, участник Б — следующий».
- Идентификация голосов. Каждый спикер сравнивается с локальной базой голосовых отпечатков. При совпадении выше порога «Speaker A» становится «Иванов И.И. (директор департамента)». База пополняется адаптивно: новый чистый образец усредняется с предыдущими — точность распознавания растёт с эксплуатацией.
Из чего собран конвейер
| Слой | Назначение |
|---|---|
| Распознавание речи (STT) | GigaAM — русский STT, локально, с word-level таймкодами |
| Диаризация | Pyannote.audio 3.1 — auto-detect числа спикеров, размеченный таймлайн |
| Идентификация голосов | Resemblyzer — voice embeddings + локальная база отпечатков |
| Обогащение и анализ | Языковая модель через шлюз приватности — саммари, форматирование, классификация типа встречи |
| Оркестрация пайплайна | Очередь задач (Celery + Redis) с прогрессом по WebSocket — длительные задания не блокируют интерфейс |
Классификация типа встречи
После транскрибации ассистент автоматически распознаёт тип встречи — собеседование, обсуждение условий сотрудничества, обсуждение текущих проектов, передача дел, структурированный разбор, аналитическая сессия. От типа выбирается шаблон последующего анализа: структура протокола, формулировка задач, требования к точности. Если тип не определён уверенно — пометка «требует уточнения у оператора».
Согласование протокола — детально
Самый чувствительный этап. Здесь стороны фиксируют обязательства, и от точности формулировок зависит контроль исполнения. Ассистент ведёт этот этап как фоновый помощник секретариата и службы контроля: собирает обсуждения сторон в привычных каналах, выверяет правки по транскрибации, передаёт спорные вопросы руководителю на решение — и публикует финальную версию только после явного одобрения.
- После встречи ассистент формирует черновик протокола из транскрибации: тезисы, решения, список задач с владельцами и сроками. Черновик уходит в первую очередь руководителю (или службе протокола / блоку контроля — по корпоративному регламенту) на проверку.
- В период согласования ассистент следит за обсуждениями в заранее согласованных каналах — групповой чат участников встречи, переписка по почте, реплики в мессенджере. Каждую содержательную правку он подхватывает автоматически, не дожидаясь, пока секретарь перенесёт её в систему.
- Каждую предложенную правку ассистент сверяет с фрагментом транскрибации, где обсуждался вопрос. Если правка соответствует сказанному на встрече — фиксируется в черновике. Если расходится с транскрибацией — выводится руководителю на решение с цитатой из записи.
- Если участник просит добавить пункт, которого не было, — ассистент не принимает решение сам. Передаёт руководителю: «Иванов просит добавить обязательство X — в транскрибации этого не было; включаем?». Решение остаётся за человеком.
- Когда консенсус достигнут — руководитель или служба контроля даёт команду «публикуем». Ассистент формирует финальную версию протокола и рассылает каждому участнику персональную ссылку на неё (детали — в следующей секции). Список задач уходит в систему контроля, контрольные точки — в календарь. История правок сохраняется: кто что попросил изменить, когда и какое решение принято.
- Если кто-то не отвечает в установленный срок (например, 2 рабочих дня) — ассистент напоминает; после второго пропуска эскалирует руководителю с пометкой «застряло на согласовании с N».
Персональный портал и фиксация согласия экспериментальный модуль
После того как руководитель или служба контроля одобрили финальную версию (см. предыдущую секцию), ассистент рассылает её участникам в письме. Внутри каждого письма — своя индивидуальная ссылка на страницу с финальным протоколом. Сам факт перехода по ссылке фиксируется как акт согласия участника с протоколом, выводами, задачами и сроками. Аналогично тому, как маркетинг отслеживает переходы клиента по UTM-меткам — но здесь отслеживается не клик по объявлению, а согласование документа.
- Публикация финальной версии. После команды «публикуем» ассистент собирает протокол по корпоративному шаблону в виде одностраничного документа: тезисы, решения, задачи с владельцами и сроками. Документ размещается на закрытом портале, индексация поисковиками отключена.
- Генерация индивидуальных ссылок. Под каждого участника генерируется своя уникальная ссылка-метка. Она привязана к участнику, версии документа и времени выдачи; ссылки разные у разных участников даже на один документ.
- Рассылка по почте. Письмо с финальной версией и индивидуальной ссылкой уходит каждому участнику. Внутри письма — текст протокола (чтобы было видно сразу) и приглашение перейти по ссылке для подтверждения ознакомления и согласия.
- Переход = согласие. Когда участник открывает свою ссылку, ассистент фиксирует в метаданных протокола запись: «Иванов И.И. ознакомился с версией 1.3 и согласен с протоколом, выводами и задачами — 22 мая 14:23». Никаких отдельных кнопок и форм нажимать не нужно — действие участника естественное.
- Сводный статус. В протоколе для каждого участника отображается результат: «согласовано» (с датой и временем) либо «ссылка не открывалась». История переходов сохраняется в журнале — для разбора в случае спорных ситуаций.
- Если участник не согласен, он сообщает об этом обычным способом — в общем чате обсуждения встречи, в почте или прямо руководителю. Ассистент подхватывает реплику по логике предыдущей секции (мониторинг каналов обсуждения), и согласование возвращается на этап редактирования; после следующей итерации публикуется новая финальная версия с новыми ссылками.
Зачем отдельный портал, а не только почта. Портал нужен для удобства участника. В почте протокол быстро тонет в цепочке обсуждений — реплики, цитаты, ответы, пересылки. Финальная версия неочевидна, можно случайно согласиться со старой редакцией. На портале участник видит только финальную версию документа на этот момент: одна страница, без переписки. Если за время согласования формулировки уточняются — ссылка всегда ведёт на актуальную версию, не на копию из почты.
Контроль исполнения — без напоминалок руководителю
Когда протокол подписан, ассистент держит обязательства под наблюдением. Сроки и промежуточные контрольные точки уже в календаре; до их наступления ассистент сам инициирует диалог:
- За оговорённый срок до контрольной точки (3 дня, день — настраивается) — задаёт исполнителю вопрос о статусе: «Как идёт задача X из протокола от 15 мая? Что нужно от руководителя?».
- Ответ исполнителя ассистент сверяет с формулировкой обязательства и оценивает: «исполнено», «в графике», «есть риск», «срок сорван». Обоснование сохраняет — на случай разбора.
- При риске или срыве — эскалирует руководителю с фактами: что было обещано, что ответил исполнитель, чем это грозит. Решение о реакции — за руководителем.
- Раз в неделю — сводка по всем активным обязательствам: сколько в графике, сколько с риском, сколько просрочено. Без поименного перечисления, если руководитель не попросит детализацию.
Задачи из мессенджера — отдельный поток
Не все задачи проходят через встречи. Часто руководитель назначает поручение прямо в чате — голосовым или текстом. Ассистент следит за каналами, где руководитель работает, и подхватывает поручения автоматически:
- Голосовое сообщение — расшифровывается локально.
- Текст с формулировкой задачи и адресатом — ассистент распознаёт намерение и оформляет: задача, исполнитель, срок (если назван), привязка к проекту/теме.
- Если срок не назван — уточняет у руководителя в личном диалоге, не беспокоя адресата.
- Подтверждённая задача попадает в тот же список контроля и календарь, что и задачи из протоколов встреч — единая воронка контроля.
Сотрудники продолжают работать в привычной среде. Ассистент — невидимый слой над коммуникацией, который превращает разговорный поток в управляемую систему обязательств.
Зрелость компонентов
Ассистент собран из компонентов разного уровня готовности: промышленные open-source решения, собственные авторские модули и интеграционные адаптеры под конкретный контур. Ниже — карта зрелости по ключевым блокам:
| Компонент | Реализация | Класс зрелости |
|---|---|---|
| Распознавание речи (русский) | GigaAM + Pyannote 3.1 + Resemblyzer — конвейер «STT → диаризация → идентификация» с базой голосовых отпечатков, локально | Авторский модуль на промышленных open-source компонентах |
| Извлечение задач из транскрибации | Каскад языковых моделей с приоритетом локальных; промпт-шаблон под протокол | Конфигурируемый модуль на проверенных моделях |
| Согласование протокола со сторонами | Бот в корпоративном мессенджере + кнопки подтверждения и правки | Интеграционный модуль под канал клиента |
| Календарь и контрольные точки | Адаптер к календарной системе клиента (Exchange, Google, иные) | Интеграционный адаптер |
| Контрольный диалог с исполнителями | Регулярный планировщик + языковая модель для оценки ответа | Авторский модуль |
| Модельный оркестратор | Эвристический классификатор + 3-tier routing (light/medium/heavy) + ordered escalation chain из 5 шагов + двухпороговый quota-tracker (warn 20% / hard 8%); 120 unit-тестов и golden set на 30 сценариев | Авторская разработка с покрытием тестами |
| Model Arena — телеметрия вызовов | SQLite-хранилище (attempts + verdicts) + CLI hermes arena stats / digest + ежедневный cron-отчёт за 24ч |
Enterprise-уровень наблюдаемости |
| Background Review — рефлексия агента | Daemon thread fork после каждого тура с whitelist memory/skill-инструментов; fixed light-model strategy; журнал решений в orchestrator.jsonl |
Авторский модуль самообучения |
| Семантическая память | Локальная векторная база + граф знаний; все эмбеддинги на CPU | Промышленная open-source реализация |
| Шлюз приватности перед облачной моделью | Собственный сервис обезличивания (псевдонимизация ФИО, контактов, ИНН, сумм) | Авторская разработка |
| Подтверждение человеком на критических действиях | Кнопки «Принять / Отклонить» в мессенджере для опасных операций | Стандартный паттерн агентных систем |
На демонстрации показывается работающая сборка этих компонентов на короткой реальной встрече — от аудио до сформированного протокола, заведённых контрольных точек и запланированной сверки статуса. Точный состав демонстрации согласовывается отдельно по условиям ИБ.
Информационная безопасность — входное условие
Голос и тексты деловых разговоров — чувствительный поток. Архитектура ассистента построена так, чтобы он мог пройти ревью корпоративной службы безопасности:
- Маршрутизация данных по уровню чувствительности — что обрабатывается локально, что отдаётся в защищённый внешний контур, что вообще не покидает периметр. Голос и черновые транскрипции — без внешних API.
- Псевдонимизация перед облачной моделью — собственный сервис обезличивает ФИО, контакты, ИНН, договоры, суммы. После ответа модели — обратное восстановление в безопасном контуре.
- Подтверждение человеком на критических действиях — отправка наружу, юридические формулировки, финансовые суммы — всегда явное «Принять» от руководителя или уполномоченного сотрудника.
- Локальная память — векторное хранилище и граф знаний оффлайн, без внешних API для эмбеддингов.
- Маскировка секретов в логах и ответах — встроенный движок редактирования автоматически распознаёт и заменяет на маркер вида
***API-ключи, токены доступа, пароли, JWT, приватные ключи и аналогичные секреты во всех артефактах ассистента (логи, ответы в чате, отчёты, отправляемые письма). Работает на каждом слое — служба безопасности получает чистые логи для аудита без риска утечки. - Аудит навыков — любой подключаемый компонент агента проходит ИБ-аудит по чек-листу до установки.
- Журналирование — структурированные логи в формате, совместимом с корпоративным SIEM (ELK, Splunk и аналогами).
Исследования и факт-чекинг
Помимо контроля встреч, ассистент работает как личный аналитик руководителя — собирает справочные материалы для подготовки решений и проверяет фактуру перед публичными выступлениями или подписанием документов.
- Брифинги перед встречами. Профиль контрагента: организационная структура, ключевые лица, история взаимодействия, последние новости из открытых источников, выписки из реестров, финансовое состояние из публичной отчётности. К каждому факту — ссылка на источник, чтобы можно было перепроверить.
- Поиск с подтверждёнными источниками. Запрос «что известно по теме X» возвращает не пересказ, а структурированную выжимку со ссылками. Без галлюцинаций — если данных недостаточно, ассистент честно говорит «по этому пункту источников не нашёл, нужно уточнение».
- Анализ конкурентов и рынка. По шаблону: профиль продукта, сегментация (корпоративный/массовый), ценовая модель, отличия. Файлы складываются в выделенный архив, чтобы вернуться через месяц без повторного сбора.
- Синтез из множества источников. Не один пересказ, а сопоставление — где источники сходятся, где расходятся, какие расхождения существенны. Это снимает риск принятия решения на одной точке зрения.
- Работа с документами. Поиск конкретных фактов в больших PDF-файлах, выделение цитат с указанием страницы, проверка цифр и формулировок на соответствие первоисточнику. Подсветка расхождений перед подписанием.
Курирование портфеля направлений
У руководителя в активной фазе одновременно — десятки направлений, проектов, поручений. Информация о статусе разбросана между почтой, протоколами встреч, мессенджером и отчётами от руководителей блоков. Ассистент собирает её в единую карту:
- Карта направлений. Список активных проектов и инициатив с фазой («подготовка», «реализация», «контроль», «приёмка»), ответственным лицом, ближайшей контрольной точкой.
- Сводный статус. По каждому направлению: где принято решение, где есть риск, где блокер от другой стороны. Видно сразу — без необходимости расспрашивать руководителей блоков по одному.
- Регулярные синхронизации. Раз в неделю (или с настраиваемой периодичностью) ассистент сам собирает статус от руководителей направлений по согласованной форме — короткое сообщение в мессенджере или почту. Ответы агрегируются в одностраничник.
- Подсветка блокеров. Кто кого ждёт, кто что не передал. Цепочки зависимостей видны явно, не приходится восстанавливать их в голове.
- Связь с протоколами. Каждое обязательство из встречи привязано к направлению или проекту. Если по теме провалов несколько — видно паттерн, а не отдельный инцидент.
Автоматизация рутины секретариата
Часть работы секретариата — это типовые операции, которые не требуют самостоятельного решения, но съедают время. Ассистент берёт их на себя в режиме «черновик готов — секретарь вычитал — отправили»:
- Стандартные письма. Приглашения на встречи, переносы, благодарности, ответы на типовые запросы — по корпоративным шаблонам, с подстановкой контекста.
- Рассылки по списку. Анонсы, поручения подразделениям, информация для контрагентов. Списки берутся из адресной книги, ассистент может фильтровать по подразделению или роли.
- Сбор подтверждений. «Кто подтвердил участие в совещании 22 мая» — собирается автоматически из ответов в почте и мессенджере, выводится в сводку.
- Черновики приказов и распоряжений. По шаблону организации, с подстановкой реквизитов из задач протокола. Без отправки — только на проверку профильным службам и подпись руководителя.
- Поиск контактов и истории. «Найди телефон финансового директора компании X» — ассистент ищет в корпоративной адресной книге и почтовом архиве, возвращает контакт с указанием последней переписки.
- Повестка следующих встреч. Перед очередной встречей ассистент готовит проект повестки на основе непроработанных пунктов прошлых встреч с теми же участниками.
Адаптация и навыки
Ключевое отличие от коробочных решений — ассистент не статичен. Он развивается вместе с регламентами организации и подстраивается под стиль конкретного руководителя.
Навыки — модульный рост возможностей
Когда появляется новая регулярная процедура (например: «каждую пятницу собирать сводку от блока строительного контроля и компоновать одностраничник»), эта процедура оформляется как навык — параметризованная инструкция, которую ассистент применяет автоматически.
- Новые навыки добавляются без перезапуска и без участия разработчика — это часть инструментария секретариата.
- Навыки переиспользуются: один и тот же шаблон («собрать статус от руководителей направлений и свести в одностраничник») работает и для направления строительства, и для направления цифровизации.
- Доступ к навыкам разграничивается ролями — секретарь видит навыки секретариата, служба контроля — свои, руководитель — все.
- История применения каждого навыка хранится — видно, что регламент применялся 8 пятниц подряд, а на 9-й сбойнул и почему.
Персонализация — изучение стиля и предпочтений
- Стиль писем и сообщений — после нескольких подтверждённых ответов от лица руководителя ассистент перенимает обороты, длину, степень формальности. Черновики становятся всё ближе к финальной версии.
- Личные предпочтения по работе. «По понедельникам не назначать встречи до 11:00», «материалы к совещанию присылать накануне до 18:00», «бриф по контрагенту — не более одной страницы». Эти правила запоминаются и применяются автоматически.
- Дневник важных событий. Что решал руководитель, какие договорённости фиксировал, какие коррекции делал в ответах ассистента. Через 2–3 месяца эксплуатации ассистент работает не как чат-бот, а как сотрудник, понимающий руководителя.
- Корректирующая обратная связь. Каждая правка в формулировках, каждое «не так, переформулируй» сохраняется в копилку правил — ассистент перестаёт ошибаться в той же точке.
Ожидаемые эффекты от внедрения
Точные количественные показатели возможны только после пилота в конкретном контуре — до измерений называть проценты было бы нечестно. Но качественные изменения, к которым приводит инструмент, очевидны и одинаковы для любой организации с активным потоком переговоров:
- Время от встречи до согласованного протокола сокращается с нескольких рабочих дней до часов — черновик готов сразу после встречи, согласование — в персональном портале или почте по кнопке.
- Доля «забытых» договорённостей снижается до нуля — все обязательства фиксируются, привязываются к календарю и попадают в общий список контроля.
- Просрочки видны заранее — за несколько дней до даты, а не постфактум. Появляется возможность вмешаться, а не «разбираться, почему сорвано».
- Загрузка секретариата перераспределяется — вместо механического написания протоколов и рассылки напоминаний — содержательная вычитка, верификация, работа с эскалациями.
- Юридическая значимость протоколов повышается за счёт фиксации согласия каждой стороны (нажатие на персональной странице с отметкой времени).
- Управленческий обзор смещается с «по поступившим письмам» на «по направлениям и обязательствам» — руководитель видит портфель целиком, а не последний оперативный пожар.
- Сводное информационное поле — все договорённости, контрольные точки и брифы лежат в одной системе, не разбросаны между почтой, мессенджером и блокнотом секретаря.
Что планируется измерить на пилоте. Среднее время «встреча → подписанный протокол», доля подтверждённых договорённостей в общем числе обязательств, доля задач, выполненных в срок, доля рутинных писем, отправленных без переписывания секретарём. Эти показатели сравниваются с состоянием «до» — по выборке из 1–2 месяцев работы организации до запуска ассистента.
Технологический стек
| Слой | Технология | Лицензия |
|---|---|---|
| Агентный фреймворк | Hermes Agent (Nous Research) | Открытый, MIT |
| Языковые модели | Локальные (Qwen3, Llama-3.3 на GPU) с возможностью каскада к облачным через шлюз приватности | Open-source / SaaS |
| Оркестратор моделей | Эвристический классификатор (без ML) + 3-tier routing (light/medium/heavy) + ordered escalation + двухпороговый quota-tracker (20% / 8%) | Собственная разработка |
| Телеметрия (Model Arena) | SQLite (model_arena_attempts + session_verdicts) + CLI hermes arena stats / digest + cron daily report | Open-source + собственная схема |
| Background Review | Daemon thread fork с whitelist memory/skill-инструментов и fixed light-model strategy; журнал в orchestrator.jsonl | Собственная разработка |
| Распознавание речи | GigaAM (русский STT, локально) + Pyannote.audio 3.1 (диаризация) + Resemblyzer (идентификация голосов); опциональный облачный резерв при необходимости | Open-source, локально |
| Векторная память | ChromaDB + ONNX-эмбеддинги (multilingual) | Open-source, локально |
| Календарь | Адаптер к календарной системе клиента: Exchange (EWS), Google Workspace, иные | OAuth / Service account |
| Мессенджер | Адаптер к каналу клиента: корпоративный мессенджер, VK Teams, Telegram-бот за периметром и другие | Bot API / Graph API |
| Шлюз приватности | Собственный сервис псевдонимизации (FastAPI + spaCy + морфология + регулярные правила) | Собственная разработка |
| Оркестрация задач | Встроенные планировщик и список задач агентного фреймворка; делегирование подзадач субагентам | Open-source |
| Развёртывание | Docker, docker-compose; опционально Kubernetes для горизонтального масштаба | Open-source |
Этапы внедрения
| Этап | Цель | Результат |
|---|---|---|
| Обследование (1 нед) | Карта мессенджеров, календарной системы, корпоративных регламентов ИБ; согласование контура развёртывания | Технический паспорт интеграции, утверждённый службой ИБ |
| Пилот первой функции (1–2 нед) | Распознавание речи, черновик протокола, рассылка участникам | Одна реальная встреча → согласованный протокол в почте |
| Календарь и контроль (1–2 нед) | Контрольные точки в календарной системе клиента; цикл контрольного диалога | Неделя эксплуатации: 5 встреч → автоматическая сверка статуса исполнителей |
| Полная интеграция и приёмка ИБ (1–2 нед) | Шлюз приватности, журналирование в SIEM, аудит, документация | Передача в эксплуатацию и регламент сопровождения |