Clear Sky Science · pl
Modelowanie matematyczne i obliczanie indeksów NM‑wielomianowych do przewidywania właściwości fizykochemicznych
Dlaczego to ma znaczenie dla przyszłych leków
Projektowanie nowego leku przypomina nieco projektowanie samolotu: chcemy wiedzieć, jak będzie się zachowywał na długo przed jego rzeczywistą budową. W przypadku leków to zachowanie obejmuje m.in. łatwość parowania, mieszalność z wodą lub tłuszczami oraz sposób przemieszczania się w organizmie. W artykule pokazano, jak starannie skonstruowana matematyka może przewidzieć wiele z tych cech fizycznych i chemicznych jedynie na podstawie struktury leku, co potencjalnie oszczędza czas, koszty oraz próbę i błąd w odkrywaniu leków. 
Od cząsteczek do sieci
Autorzy traktują cząsteczki leków nie tylko jako zbiory atomów, lecz jako sieci. W tym ujęciu każdy atom to węzeł, a każde wiązanie chemiczne to krawędź łącząca dwa węzły. Taki opis wywodzi się z teorii grafów, działu matematyki badającego sieci wszelkiego rodzaju, od powiązań w mediach społecznościowych po sieci energetyczne. Chemicy od dekad korzystają z takich „grafów molekularnych”, ponieważ pewne liczbowe podsumowania tych grafów — zwane indeksami topologicznymi — często korelują z zachowaniem cząsteczek w rzeczywistości, np. z temperaturą wrzenia czy gęstością.
Dodanie szczegółów sąsiedztwa
Tradycyjne indeksy zwykle zwracają uwagę tylko na to, ile wiązań dotyka każdy atom. Zespół stojący za tym badaniem idzie dalej. Stosuje tzw. indeksy NM‑wielomianowe (neighborhood M‑polynomial), które nie ograniczają się do zliczania połączeń danego atomu, lecz także podsumowują, jak połączone są jego sąsiednie atomy. Bogatszy opis uchwyca subtelności, takie jak stopień rozgałęzienia cząsteczki, sposób złączania pierścieni oraz położenie atomów tlenu czy azotu w szkielecie. Te cechy wpływają z kolei na to, jak mocno cząsteczki przyciągają się wzajemnie, jak sztywne są oraz jak ich elektrony reagują na pola elektryczne — wszystko to składa się na kluczowe właściwości fizykochemiczne.
Testowanie pomysłu na rzeczywistych lekach przeciwnowotworowych
Aby ugruntować matematykę w rzeczywistości, autorzy najpierw obliczają indeksy NM‑wielomianowe dla dwóch dobrze znanych środków przeciwnowotworowych: mitoksantronu i doksorubicyny. Oba to złożone, wielopierścieniowe cząsteczki szeroko stosowane w chemioterapii. Przekształcając szczegółowe rysunki chemiczne w grafy molekularne, a potem w indeksy NM‑wielomianowe, autorzy pokazują, jak metoda systematycznie śledzi zmiany strukturalne w różnych „rozmiarach” tych cząsteczek. Proces zautomatyzowali programem w Pythonie, który przyjmuje łączność cząsteczki (w postaci macierzy sąsiedztwa) i natychmiast zwraca pełen zestaw indeksów, minimalizując błąd ludzki i przyspieszając obliczenia, które ręcznie byłyby żmudne. 
Uczenie maszynowe do czytania „odcisków palców” molekuł
Następnie badacze wychodzą poza te dwa leki i analizują szerszy zbiór 45 wielopierścieniowych leków, w tym powszechnie znane nazwy, takie jak paracetamol, ibuprofen oraz kilka nowoczesnych terapii celowanych. Dla każdego leku skompletowali dziewięć indeksów NM‑wielomianowych oraz dziewięć doświadczalnie zmierzonych właściwości: złożoność, temperaturę wrzenia, entalpię parowania, punkt zapłonu, refrakcyjną molową, polaryzowalność, napięcie powierzchniowe, molową objętość oraz współczynnik załamania światła. Potem trenowali kilka modeli regresyjnych w stylu uczenia maszynowego — liniowy, Ridge, Lasso i Elastic Net — aby nauczyć je, jak kombinacje indeksów przekładają się na każdą z właściwości. W całym procesie stosowali rygorystyczne zabezpieczenia statystyczne: usuwali redundantne wejścia, standaryzowali zmienne, wykonywali wielokrotne walidacje krzyżowe na 80% danych i testowali finalne modele na niezmienionych 20%.
Co wykazują liczby
Modele pokazują, że indeksy NM‑wielomianowe są szczególnie silne dla właściwości związanych z tym, jak cząsteczki się pakują i oddziałują. Dla temperatury wrzenia, entalpii parowania, punktu zapłonu, refrakcyjnej molowej, polaryzowalności i molowej objętości najlepsze modele osiągają bardzo wysokie współczynniki korelacji, co oznacza, że przewidywane wartości ściśle odwzorowują pomiary eksperymentalne. Metody regularizowane, takie jak Ridge i Elastic Net, zwykle wypadają najlepiej, co sugeruje, że delikatne ograniczanie modeli pomaga skupić się na najbardziej informatywnych aspektach indeksów. Mapa korelacji potwierdza, że kilka indeksów — zwłaszcza tych związanych z ogólną łącznością i „bogactwem sąsiedztwa” — jest silnie i konsekwentnie powiązanych z tymi właściwościami w badanej grupie 45 leków.
Ograniczenia i możliwości ulepszeń
Nie wszystkie właściwości współpracują. Współczynnik załamania światła, który opisuje, jak światło załamuje się przy przejściu do materiału, okazuje się oporny: modele ledwie przewyższają proste uśrednienia, a indeksy NM‑wielomianowe wykazują tylko słabe korelacje z tą cechą. Napięcie powierzchniowe jest umiarkowanie uchwycone, ale nie tak silnie jak inne cechy. Luki te sugerują, że niektóre zachowania zależą od cech wykraczających poza dwuwymiarową łączność, np. od kształtu trójwymiarowego lub subtelnych efektów elektronowych. Autorzy proponują, że przyszłe prace mogłyby łączyć indeksy NM‑wielomianowe z deskryptorami kwantowo‑chemicznymi lub 3D, by zniwelować tę różnicę.
Co to oznacza dla projektowania leków
Mówiąc prosto, badanie pokazuje, że zaawansowana, ale dobrze uporządkowana matematyka może zamienić statyczny szkic cząsteczki w zaskakująco dokładny predyktor jej zachowania w laboratorium. Dla wielu istotnych właściwości — jak łatwość wrzenia, wielkość czy skłonność elektronów do przesunięć — podejście NM‑wielomianowe w połączeniu z nowoczesnymi technikami regresji dorównuje lub przewyższa wcześniejsze metody używające prostszych indeksów lub mniejszych zbiorów danych. Choć nie jest jeszcze pełnym zastępstwem dla eksperymentów, oferuje projektantom leków szybsze narzędzie przesiewowe: obliczając te grafowe „odciski palców”, mogą wcześnie oszacować kluczowe właściwości fizykochemiczne, skoncentrować pracę laboratoryjną na najbardziej obiecujących kandydatach i efektywniej eksplorować przestrzeń chemiczną.
Cytowanie: Tawhari, Q.M., Naeem, M., Koam, A.N.A. et al. Mathematical Modeling and Computation of NM-Polynomial Indices for Physicochemical Properties Prediction. Sci Rep 16, 8136 (2026). https://doi.org/10.1038/s41598-026-39562-9
Słowa kluczowe: teoria grafów chemicznych, przewidywanie właściwości leków, topologia molekularna, uczenie maszynowe w chemii, deskryptory fizykochemiczne