McCormick & IBM Research — платформа ONE
AI for Product Composition: ансамбль ML-алгоритмов, Generative Design и Distance Function на 40 годах рецептур и 500 000 формул. Сокращение цикла NPD в три раза.
- ОтрасльПищевая промышленность (специи, ароматизаторы, продукты)
- ПартнёрIBM Research — проприетарная технология AI for Product Composition
- Объём данных>1 млрд точек данных, 500 000 формул, 40 лет сенсорных исследований
- Команда20 лабораторий в 14 странах, >500 разработчиков продуктов
- ПодходGenerative Design — генерация + фильтрация дискриминатором, обученным на предпочтениях
- КонтекстЧасть долгосрочной стратегии цифровизации McCormick с 2013 года
Что делает платформа ONE
- Предсказание замены — поиск альтернативного сырья (например, корица → душистый перец в определённых пропорциях).
- Оптимизация дозировок — идеальные пропорции на исторических паттернах.
- Прогноз успеха — оценка того, понравится ли вкус потребителю.
- Distance Function — «функция расстояния» в пространстве вкусов для поиска уникальных сочетаний.
Данные и обучение
Источники: 40 лет проприетарных данных McCormick — формулы продуктов, свойства сырья, результаты потребительских тестов и продаж. Разметка строилась на связи химического состава ингредиентов с субъективным восприятием вкуса. Нейросети обрабатывали культурные предпочтения, географию и «настроение» целевой аудитории.
Инструменты
Графы знаний и рекомендательные системы: PyTorch Geometric, TensorFlow Recommenders. Подход — Generative Design: генерация новых комбинаций состава + фильтрация через модель-дискриминатор, обученную на предпочтениях пользователей.
Команда и масштаб
Развёртывание охватило глобальную сеть из 20 лабораторий в 14 странах и более 500 разработчиков продуктов с вспомогательным персоналом. Бюджет не раскрывался — проект — часть долгосрочной стратегии цифровизации с 2013 года.
Результаты и метрики
Сокращение цикла NPD
- Итерации50–150 дегустаций и правок → в три раза быстрее.
- R&D циклПо данным IBM — сокращение на 60–70% за счёт виртуального прототипирования.
Перенос на масла и антифризы — дорожная карта
- I · Сбор данных3–6 мес: оцифровка 10–20 лет журналов варок и тестов.
- II · Ядро QSPR6–9 мес: модели связь структура–свойство.
- III · Обучение4 мес: сопоставление с полевыми испытаниями.
- IV · Внедрение3 мес: запуск ИИ-ассистента в R&D лаборатории.
Смена парадигмы данных
В пищевом проекте ИИ сопоставлял химию с вкусом. В маслах — химия → физико-химические свойства (вязкость, температура вспышки, износ). Данные: историческая база рецептур, оцифрованные ASTM/ГОСТ + полевые тесты, TDS/MSDS присадок.
Архитектура нейросетей
GNN — прогноз вязкости и стабильности по структуре. GAN + RL — генерация молекул/сочетаний под заданные свойства. XGBoost / LightGBM — интерпретируемая оценка влияния добавок.
Методы обучения
Transfer Learning — старт от предобученных моделей (IBM RoboRXN) + дообучение. Distance Function для поиска «белых пятен» — рецептур, отличающихся от существующих. Виртуальное прототипирование — сокращение реальных варок в 2–3 раза.
Команда и бюджет
Минимум 5–7 человек: 2 Data Scientists (химия/материалы), 1 Data Engineer, 1 химик-технолог, 1 лаборант, менеджер проекта. Основные затраты — оцифровка данных и контрольные варки для проверки гипотез ИИ.
Источники
- IBM Newsroom — McCormick + IBM Research (Flavor Innovation)официальный
- IBM Research — AI Flavor (McCormick)технологии
- McCormick — пресс-релизыкомпания
Релевантность для проекта (Группа Синтез и аналоги)
Generative Design + Distance Function — рабочая парадигма для технической химии. Кейс показывает: исторические рецептуры и протоколы тестов — это не «отчёты», а актив для обучения. С чего начать — аудит данных. Если оцифрованных рецептур с результатами тестов меньше 1000, модель будет слабой; имеет смысл сначала нарастить объём или ограничить пилот одним классом масел / одним заводом.