← Кейсы

NotCo — ИИ-платформа Giuseppe

Молекулярный подбор: ИИ заменяет животные молекулы растительными при сохранении вкуса и текстуры. Подход напрямую переносится на ГСМ, где критичны функциональные свойства (вязкость, термостабильность), а не органолептика.

  • ОтрасльПищевая промышленность — растительные альтернативы животных продуктов
  • МетодМолекулярный подбор (molecular matching) + Discernment Layer на оценках экспертов
  • ДанныеПроприетарная база тысяч растений: молекулярные профили, физико-химические свойства, функциональные характеристики
  • Инвестиции>$460 млн; оценка компании до $1,5 млрд (инвесторы — Bezos Expeditions и др.)
  • Цикл R&DСокращение с лет до месяцев
  • КомандаСмешанная — AI-инженеры, food scientists, химики и технологи; сотни сотрудников

Метод molecular matching

ИИ сопоставляет структуру целевого продукта (например, молока) с базой данных растений, чтобы найти комбинации, дающие ту же вязкость и стабильность. Алгоритмы минимизируют «расстояние» между химическими профилями оригинала и копии.

Discernment Layer

ИИ обучается на обратной связи от людей (эксперты по сенсорике, шеф-повара), которые оценивают прототипы. Замыкается цикл: молекулярное предсказание → человеческая оценка → корректировка модели.

Данные

Сочетание объективных химических данных (ГХ-МС, жидкостная хроматография) и субъективных оценок (вкус, запах, текстура), переведённых в цифровой вид.

Перенос на ГСМ

Вкус → трибология. Целевые параметры — индекс вязкости, температура вспышки, противоизносные свойства (пятно износа), антикоррозия. Молекулярный дизайн — цифровые двойники присадок и базовых масел; ИИ ищет синергию компонентов. Ускорение R&D — быстрый подбор пакетов под новые стандарты или замену дефицитных компонентов.

Архитектура «Giuseppe для ГСМ»

Ядро: хеминформатика

  • RDKitОсновная библиотека: дескрипторы и «отпечатки» молекул присадок и базовых масел.
  • DeepChemФреймворк глубокого обучения в химии; предобученные модели для растворимости, вязкости, токсичности.
  • SMILESТекстовое представление структуры молекул для подачи в нейросети.

Модели и алгоритмы

  • Chemprop (GCNN)Молекулы как графы — предсказание свойств новых присадок.
  • GP + Bayesian OptОптимизация составов: предложение → тест → обновление модели; минимум реальных варок.
  • XGBoost / RFРегрессия на табличных данных — индекс вязкости по составу.

Инженерный стек

  • PythonБазовый язык.
  • PyTorch / TFКастомные нейросетевые архитектуры.
  • MLflow / DVCВерсионирование моделей и данных (каждый эксперимент дорог).

Данные для ГСМ

  • FTIRИК-спектроскопия для идентификации и предсказания концентрации присадок (ZnDDP, MoDTC).
  • Трибологические логиЧетырёхшариковые машины трения: диаметр пятна износа, нагрузка сваривания.
  • PubChem / ChEMBLБазовые характеристики молекул-кандидатов.

MVP «Giuseppe для ГСМ» — 4–6 месяцев

1. Оцифровка данных

1 месяц.

  • LIMS-протоколы из PDF/Excel → единая БД (SQL/NoSQL).
  • Features: % базовых масел (I–V) и пакетов присадок (CAS) → вязкость (−35°C…100°C), NOACK, CCS, пятно износа, TBN.

2. Предиктивная модель

1,5 месяца.

  • Gradient Boosting (XGBoost/LightGBM) для табличных рецептур.
  • Физико-химические ограничения (уравнение Вальтера) в loss-функции; обучение на 10–15 базовых компонентах.

3. Генерация рецептур

1 месяц.

  • Инверсия: «Хочу 5W-30 с вязкостью X и ценой Y → дай состав».
  • Bayesian Optimization + cost-optimization; RDKit для проверки совместимости и исключения конфликтов.

4. Active Learning + UI

1 месяц.

  • Лабораторный тест 3–5 вариантов от ИИ; feedback loop с обновлением весов.
  • Dash/Streamlit-интерфейс: слайдеры параметров → список компонентов.

Команда и бюджет MVP

Минимальный состав

  • Data Scientist (ML/химия)1
  • Инженер данных1
  • Главный технолог (валидатор)1

Инструменты и бюджет

  • СтекPython (RDKit, Chemprop); CPU достаточно — GPU не обязательны.
  • Основные затратыОплата команды и контрольные лабораторные тесты, не инфраструктура.

Источники

  1. NotCo — официальный сайткомпания
  2. TechCrunch — NotCo Giuseppe Platformпресса
  3. RDKit — Open-Source Cheminformaticsбиблиотека
  4. DeepChem — Democratizing Deep Learning for Sciencesфреймворк
  5. Chemprop — GCNN for molecular property predictionбиблиотека

Релевантность для проекта

Самая лёгкая для старта парадигма: RDKit + Chemprop + Bayesian Optimization. MVP за 4–6 месяцев командой из 3 человек на CPU. Подходит для R&D-команд, у которых уже есть исторические рецептуры с результатами тестов и нужно быстро получить «умный калькулятор» для подбора компонентов под заданный допуск (API SP, ACEA C3, ГОСТ).