Clear Sky Science · ru
Подход машинного обучения для прогнозирования осмотических коэффициентов и вывода коэффициентов активности в алкил‑аммониевых солях
Повседневные химикаты со скрытой сложностью
От смягчителей ткани и кондиционеров для волос до дезинфицирующих салфеток и ополаскивателей для рта — семейство соединений, называемых четвертичными аммониевыми солями (часто сокращённо «кваты»), незаметно обеспечивает работу многих привычных продуктов. Они помогают уничтожать микробы, смягчать ткань и ускорять промышленные реакции. Тем не менее предсказать, как именно эти соли поведут себя в воде, оказалось непросто, что ограничивает эффективность разработки более безопасных и экологичных составов. В этом исследовании показано, как современные методы машинного обучения могут обучаться на имеющихся измерениях, чтобы предсказывать такое поведение гибче и во многих случаях точнее, чем традиционные модели.

Почему эти соли важны
Кваты — это положительно заряженные молекулы с углеродно‑богатыми «хвостами». Такая необычная форма позволяет им выполнять сразу несколько функций: прилипать к жирным загрязнениям, удерживаться на поверхностях вроде ткани или волос и разрушать мембраны микробов, делая их мощными дезинфицирующими и поверхностно‑активными веществами. Их также используют в качестве фазопереносных катализаторов: они действуют как перевозчики, перенося реагирующие ионы из воды в подобные маслу растворители, куда те обычно не попадают. Это переносное действие, происходящее на границе между водой и маслом, может существенно ускорять химические реакции, применяемые при производстве фармацевтики, полимеров и тонких химикатов.
Почему трудно предсказать их поведение
Чтобы разработать новые кваты или настроить существующие, химикам нужно знать, как они ведут себя в растворе — насколько сильно взаимодействуют с водой и с другими растворёнными ионами. Две ключевые величины — осмотический коэффициент, который отражает, как соли влияют на склонность воды проходить через мембраны, и коэффициент активности, который показывает, насколько «эффективна» растворённая частица по сравнению с идеальным, полностью перемешанным раствором. Традиционно эти значения получают либо с помощью кропотливых экспериментов, либо с использованием сложных физических моделей, таких как Electrolyte‑NRTL и Extended UNIQUAC, которые требуют большого числа подгоняемых параметров и плохо обобщаются на новые молекулы.
Обучение компьютера «читать» молекулы
Исследователи пошли иным путём: они спросили, может ли компьютер выучить связь между структурой кватов и их осмотическим поведением напрямую из существующих данных. Они собрали 1654 измерения осмотических коэффициентов для 52 различных кватов из научной литературы. Каждая молекула была описана с помощью нотации SMILES — строкового представления, кодирующего такие признаки, как число атомов углерода и кислорода, наличие бензольных колец, разветвлённость и тип положительно заряженной аммониевой группы, а также сопутствующий отрицательный ион (например, хлорид, бромид или нитрат). Эти структурные дескрипторы вместе с концентрацией соли служили входными данными для нескольких алгоритмов контролируемого машинного обучения, реализованных на Python.
Поиск наиболее надёжного предиктора
Были обучены семь различных алгоритмов, включая линейную регрессию, деревья решений, случайный лес, опорные векторы, градиентный бустинг, k‑ближайших соседей и гауссовские процессы; 70% данных использовали для обучения, а оставшиеся 30% — для тестирования. Команда также применила более строгую схему валидации, при которой все данные по одной соли выносились из обучения, чтобы проверить, насколько хорошо модели экстраполируют на действительно невиданное соединение. Линейная регрессия работала плохо, упуская важные нелинейные закономерности. Методы на основе деревьев весьма хорошо подгоняли тренировочные данные, но выдавали слегка неровные предсказания и теряли точность на новых солях. Модель гауссовского процесса нашла наилучший баланс: она дала гладкие, физически разумные кривые осмотических коэффициентов и достигла средней абсолютной процентной ошибки примерно 5% в целом, превзойдя альтернативные подходы машинного обучения в самых жёстких тестах.

От осмотического поведения к полезным проектным величинам
После выбора лучшей модели её предсказанные осмотические коэффициенты были преобразованы в коэффициенты активности с помощью стандартных термодинамических соотношений. Сравнение этих коэффициентов активности с величинами, выведенными из экспериментов и из признанных физических моделей, показало, что подход на основе машинного обучения часто соответствует им или превосходит их для отдельных кватов. Хотя его средняя ошибка по всем веществам была немного выше, чем у некоторых специализированных моделей, у него было важное преимущество: поскольку он опирается на структурные дескрипторы, а не на подгонку для конкретной соли, его можно применять к новым кватам, которые никогда не измерялись в лаборатории, при условии что их структуры похожи на те, что в тренировочном наборе.
Что это значит для продуктов и процессов
Для неспециалиста главный вывод таков: компьютеры теперь могут «читать» компактные текстовые описания молекул и, исходя из закономерностей, обнаруженных в прошлых данных, с впечатляющей точностью предсказывать, как эти молекулы поведут себя в воде. Это открывает путь к более быстрому и дешёвому отбору новых кватов для дезинфектантов, чистящих средств, средств личной гигиены и промышленных катализаторов без исчерпывающих экспериментов для каждого кандидата. Текущая модель — лишь первый шаг, и авторы отмечают, что более богатые молекулярные отпечатки и новые алгоритмы могут ещё улучшить результаты. Тем не менее работа демонстрирует, как инструменты, основанные на данных, могут дополнять традиционную химию, помогая инженерам проектировать более эффективные и потенциально безопасные составы, исследуя химические варианты, которые было бы непрактично проверять по одному в лаборатории.
Цитирование: Chawuthai, R., Murathathunyaluk, S., Saengsuradech, S. et al. A machine learning approach for predicting osmotic coefficients and deriving activity coefficients in alkyl ammonium salts. Sci Rep 16, 5969 (2026). https://doi.org/10.1038/s41598-026-36758-x
Ключевые слова: четвертичные аммониевые соли, фазопереносная катализация, осмотические коэффициенты, коэффициенты активности, машинное обучение в химии