NotCo — ИИ-платформа Giuseppe
Молекулярный подбор: ИИ заменяет животные молекулы растительными при сохранении вкуса и текстуры. Подход напрямую переносится на ГСМ, где критичны функциональные свойства (вязкость, термостабильность), а не органолептика.
- ОтрасльПищевая промышленность — растительные альтернативы животных продуктов
- МетодМолекулярный подбор (molecular matching) + Discernment Layer на оценках экспертов
- ДанныеПроприетарная база тысяч растений: молекулярные профили, физико-химические свойства, функциональные характеристики
- Инвестиции>$460 млн; оценка компании до $1,5 млрд (инвесторы — Bezos Expeditions и др.)
- Цикл R&DСокращение с лет до месяцев
- КомандаСмешанная — AI-инженеры, food scientists, химики и технологи; сотни сотрудников
Метод molecular matching
ИИ сопоставляет структуру целевого продукта (например, молока) с базой данных растений, чтобы найти комбинации, дающие ту же вязкость и стабильность. Алгоритмы минимизируют «расстояние» между химическими профилями оригинала и копии.
Discernment Layer
ИИ обучается на обратной связи от людей (эксперты по сенсорике, шеф-повара), которые оценивают прототипы. Замыкается цикл: молекулярное предсказание → человеческая оценка → корректировка модели.
Данные
Сочетание объективных химических данных (ГХ-МС, жидкостная хроматография) и субъективных оценок (вкус, запах, текстура), переведённых в цифровой вид.
Перенос на ГСМ
Вкус → трибология. Целевые параметры — индекс вязкости, температура вспышки, противоизносные свойства (пятно износа), антикоррозия. Молекулярный дизайн — цифровые двойники присадок и базовых масел; ИИ ищет синергию компонентов. Ускорение R&D — быстрый подбор пакетов под новые стандарты или замену дефицитных компонентов.
Архитектура «Giuseppe для ГСМ»
Ядро: хеминформатика
- RDKitОсновная библиотека: дескрипторы и «отпечатки» молекул присадок и базовых масел.
- DeepChemФреймворк глубокого обучения в химии; предобученные модели для растворимости, вязкости, токсичности.
- SMILESТекстовое представление структуры молекул для подачи в нейросети.
Модели и алгоритмы
- Chemprop (GCNN)Молекулы как графы — предсказание свойств новых присадок.
- GP + Bayesian OptОптимизация составов: предложение → тест → обновление модели; минимум реальных варок.
- XGBoost / RFРегрессия на табличных данных — индекс вязкости по составу.
Инженерный стек
- PythonБазовый язык.
- PyTorch / TFКастомные нейросетевые архитектуры.
- MLflow / DVCВерсионирование моделей и данных (каждый эксперимент дорог).
Данные для ГСМ
- FTIRИК-спектроскопия для идентификации и предсказания концентрации присадок (ZnDDP, MoDTC).
- Трибологические логиЧетырёхшариковые машины трения: диаметр пятна износа, нагрузка сваривания.
- PubChem / ChEMBLБазовые характеристики молекул-кандидатов.
MVP «Giuseppe для ГСМ» — 4–6 месяцев
1. Оцифровка данных
- LIMS-протоколы из PDF/Excel → единая БД (SQL/NoSQL).
- Features: % базовых масел (I–V) и пакетов присадок (CAS) → вязкость (−35°C…100°C), NOACK, CCS, пятно износа, TBN.
2. Предиктивная модель
- Gradient Boosting (XGBoost/LightGBM) для табличных рецептур.
- Физико-химические ограничения (уравнение Вальтера) в loss-функции; обучение на 10–15 базовых компонентах.
3. Генерация рецептур
- Инверсия: «Хочу 5W-30 с вязкостью X и ценой Y → дай состав».
- Bayesian Optimization + cost-optimization; RDKit для проверки совместимости и исключения конфликтов.
4. Active Learning + UI
- Лабораторный тест 3–5 вариантов от ИИ; feedback loop с обновлением весов.
- Dash/Streamlit-интерфейс: слайдеры параметров → список компонентов.
Команда и бюджет MVP
Минимальный состав
- Data Scientist (ML/химия)1
- Инженер данных1
- Главный технолог (валидатор)1
Инструменты и бюджет
- СтекPython (RDKit, Chemprop); CPU достаточно — GPU не обязательны.
- Основные затратыОплата команды и контрольные лабораторные тесты, не инфраструктура.
Источники
Релевантность для проекта
Самая лёгкая для старта парадигма: RDKit + Chemprop + Bayesian Optimization. MVP за 4–6 месяцев командой из 3 человек на CPU. Подходит для R&D-команд, у которых уже есть исторические рецептуры с результатами тестов и нужно быстро получить «умный калькулятор» для подбора компонентов под заданный допуск (API SP, ACEA C3, ГОСТ).