← Кейсы

McCormick & IBM Research — платформа ONE

AI for Product Composition: ансамбль ML-алгоритмов, Generative Design и Distance Function на 40 годах рецептур и 500 000 формул. Сокращение цикла NPD в три раза.

  • ОтрасльПищевая промышленность (специи, ароматизаторы, продукты)
  • ПартнёрIBM Research — проприетарная технология AI for Product Composition
  • Объём данных>1 млрд точек данных, 500 000 формул, 40 лет сенсорных исследований
  • Команда20 лабораторий в 14 странах, >500 разработчиков продуктов
  • ПодходGenerative Design — генерация + фильтрация дискриминатором, обученным на предпочтениях
  • КонтекстЧасть долгосрочной стратегии цифровизации McCormick с 2013 года

Что делает платформа ONE

  • Предсказание замены — поиск альтернативного сырья (например, корица → душистый перец в определённых пропорциях).
  • Оптимизация дозировок — идеальные пропорции на исторических паттернах.
  • Прогноз успеха — оценка того, понравится ли вкус потребителю.
  • Distance Function — «функция расстояния» в пространстве вкусов для поиска уникальных сочетаний.

Данные и обучение

Источники: 40 лет проприетарных данных McCormick — формулы продуктов, свойства сырья, результаты потребительских тестов и продаж. Разметка строилась на связи химического состава ингредиентов с субъективным восприятием вкуса. Нейросети обрабатывали культурные предпочтения, географию и «настроение» целевой аудитории.

Инструменты

Графы знаний и рекомендательные системы: PyTorch Geometric, TensorFlow Recommenders. Подход — Generative Design: генерация новых комбинаций состава + фильтрация через модель-дискриминатор, обученную на предпочтениях пользователей.

Команда и масштаб

Развёртывание охватило глобальную сеть из 20 лабораторий в 14 странах и более 500 разработчиков продуктов с вспомогательным персоналом. Бюджет не раскрывался — проект — часть долгосрочной стратегии цифровизации с 2013 года.

Результаты и метрики

Сокращение цикла NPD

  • Итерации50–150 дегустаций и правок → в три раза быстрее.
  • R&D циклПо данным IBM — сокращение на 60–70% за счёт виртуального прототипирования.

Перенос на масла и антифризы — дорожная карта

  • I · Сбор данных3–6 мес: оцифровка 10–20 лет журналов варок и тестов.
  • II · Ядро QSPR6–9 мес: модели связь структура–свойство.
  • III · Обучение4 мес: сопоставление с полевыми испытаниями.
  • IV · Внедрение3 мес: запуск ИИ-ассистента в R&D лаборатории.

Смена парадигмы данных

В пищевом проекте ИИ сопоставлял химию с вкусом. В маслах — химия → физико-химические свойства (вязкость, температура вспышки, износ). Данные: историческая база рецептур, оцифрованные ASTM/ГОСТ + полевые тесты, TDS/MSDS присадок.

Архитектура нейросетей

GNN — прогноз вязкости и стабильности по структуре. GAN + RL — генерация молекул/сочетаний под заданные свойства. XGBoost / LightGBM — интерпретируемая оценка влияния добавок.

Методы обучения

Transfer Learning — старт от предобученных моделей (IBM RoboRXN) + дообучение. Distance Function для поиска «белых пятен» — рецептур, отличающихся от существующих. Виртуальное прототипирование — сокращение реальных варок в 2–3 раза.

Команда и бюджет

Минимум 5–7 человек: 2 Data Scientists (химия/материалы), 1 Data Engineer, 1 химик-технолог, 1 лаборант, менеджер проекта. Основные затраты — оцифровка данных и контрольные варки для проверки гипотез ИИ.

Источники

  1. IBM Newsroom — McCormick + IBM Research (Flavor Innovation)официальный
  2. IBM Research — AI Flavor (McCormick)технологии
  3. McCormick — пресс-релизыкомпания

Релевантность для проекта (Группа Синтез и аналоги)

Generative Design + Distance Function — рабочая парадигма для технической химии. Кейс показывает: исторические рецептуры и протоколы тестов — это не «отчёты», а актив для обучения. С чего начать — аудит данных. Если оцифрованных рецептур с результатами тестов меньше 1000, модель будет слабой; имеет смысл сначала нарастить объём или ограничить пилот одним классом масел / одним заводом.