Clear Sky Science · pl

Diagnozowanie błędów gramatycznych z użyciem grafowych sieci konwolucyjnych z integracją grafu wiedzy

· Powrót do spisu

Dlaczego inteligentniejsze narzędzia do sprawdzania gramatyki mają znaczenie

Każdy, kto widział, jak edytor tekstu podkreśla zdania, wie, że automatyczne korektory gramatyczne są dalekie od doskonałości. Często przegapiają subtelne błędy, a gdy sugerują zmianę, rzadko wyjaśniają dlaczego. W artykule przedstawiono nowy typ systemu diagnozowania gramatyki, zaprojektowany nie tylko do poprawiania błędów w angielskim piśmie, ale też do pokazywania rozumowania stojącego za tymi poprawkami — co czyni go bardziej użytecznym dla uczniów, nauczycieli i każdego, kto uczy się lub używa angielskiego jako języka obcego.

Figura 1
Figure 1.

Przekształcanie zdań w sieci

Większość obecnych narzędzi gramatycznych czyta tekst jako prostą linię słów. Autorzy twierdzą, że to podejście jest zbyt płytkie, ponieważ prawdziwe zdania mają strukturę: podmioty łączą się z orzeczeniami, zdania podrzędne tworzą spójne fragmenty, a znaczenie zależy od tego, kto w jakim stosunku do czego się odnosi. Ich system korzysta z techniki współczesnej sztucznej inteligencji zwanej grafową siecią konwolucyjną. Zamiast traktować zdanie jako płaski ciąg, zamienia każde zdanie w małą sieć, gdzie każde słowo jest węzłem, a krawędzie między węzłami odzwierciedlają relacje gramatyczne, takie jak „podmiot” czy „dopełnienie”. Model rozprowadza następnie informację przez tę sieć warstwa po warstwie, tak że reprezentacja każdego słowa kształtowana jest nie tylko przez jego sąsiadów, ale też przez słowa, z którymi łączy je relacja gramatyczna, nawet jeśli występują daleko od siebie w zdaniu.

Budowanie mapy wiedzy gramatycznej

Na wierzchu tej sieci zdaniowej badacze budują drugą strukturę: dużą wiedzo­wą graf gramatyczny. To coś w rodzaju starannie zorganizowanej mapy angielskiej gramatyki, złożonej z klasycznych podręczników, wytycznych egzaminacyjnych i materiałów edukacyjnych. Zawiera tysiące węzłów reprezentujących zagadnienia takie jak czasownikowe czasy, użycie rodzajników czy zgodność podmiotu z orzeczeniem, a także oddzielne węzły dla typowych rodzajów błędów, reguł diagnostycznych, strategii korekcyjnych i powiązań do materiałów ćwiczeniowych. Łącza kodują relacje typu „ta reguła wykrywa ten błąd” lub „ta strategia naprawia ten problem”. Eksperci sprawdzili i dopracowali te powiązania, dzięki czemu graf odzwierciedla sposób, w jaki nauczyciele rzeczywiście rozumują o problemach gramatycznych w klasie.

Pozwalanie danym i regułom współpracować

Gdy system analizuje nowe zdanie, najpierw buduje sieć zdaniową i uruchamia model grafowy, by wykryć, które słowa mogą być błędne i jaki to rodzaj błędu. Równocześnie odwołuje się do powiązanych wpisów w grafie wiedzy gramatycznej — na przykład reguł łączących wyraz wskazujący na czas przeszły, jak „yesterday”, z koniecznością użycia formy przeszłej czasownika. Model łączy to, czego „uczy się” z danych, z tym, co przechowane jest w tej mapie reguł. Strzałki w sieci uwydatniają, które połączenia i reguły miały największy wpływ, pozwalając systemowi prześledzić ścieżkę od konkretnego błędu do zasady, którą on narusza. W testach takie połączenie danych i reguł okazało się szczególnie skuteczne w wykrywaniu problemów strukturalnych, takich jak przeskoki czasów czy niezgodności podmiot–orzeczenie, które zależą od długodystansowych powiązań w zdaniu.

Figura 2
Figure 2.

Wystawienie systemu na próbę

Autorzy ocenili swoją metodę na powszechnie używanych zbiorach tekstów uczących się angielskiego, w tym CoNLL-2014, JFLEG i BEA-2019. Zbiory te zawierają eseje osób uczących się angielskiego, z oznaczeniami od ludzi wskazującymi, gdzie i w jaki sposób każde zdanie jest niepoprawne. W porównaniu z mocnymi istniejącymi systemami opartymi na modelach transformer, takich jak BERT, i wyspecjalizowanych taggerach jak GECToR, nowy system oparty na grafach osiągnął wyższe wartości F1 — standardową miarę równoważącą wykrywanie rzeczywistych błędów i unikanie fałszywych alarmów. Co ważne, dokonał tego przy znacznie mniejszej liczbie parametrów modelu, co sugeruje, że jawna struktura i wiedza gramatyczna mogą zastąpić surową wielkość modelu. Małe badanie w warunkach klasowych z studentami uniwersyteckimi dodatkowo zasugerowało, że wyjaśnienia oparte na grafie wiedzy pomagały uczniom poprawić umiejętność dostrzegania i rozumienia błędów, choć autorzy podkreślają, że potrzebne są większe i dłuższe badania.

Co to znaczy dla codziennych piszących

Mówiąc prosto, artykuł pokazuje, że korektory gramatyczne stają się dokładniejsze i bardziej edukacyjne, gdy „widzą” zdania jako sieci relacji i korzystają z uporządkowanej mapy reguł gramatycznych, zamiast polegać jedynie na dopasowywaniu wzorców. Proponowany system nie tylko oznacza, że coś jest nie tak, ale może także odwołać się do podstawowej reguły — na przykład „liczba mnoga w podmiocie wymaga liczby mnogiej orzeczenia” — i zasugerować ukierunkowaną poprawkę. Choć podejście nadal ma trudności z niuansami doboru słów, idiomami i bardzo hałaśliwymi zdaniami, stanowi krok w stronę narzędzi językowych, które zachowują się bardziej jak cierpliwy nauczyciel niż ostry czerwony długopis. Przy dalszym rozwoju podobne systemy oparte na grafach mogłyby wspierać uczących się wielu języków, łącząc siłę współczesnej sztucznej inteligencji z jawną, czytelną dla ludzi wiedzą gramatyczną.

Cytowanie: Zhang, J., Ma, Y. Grammar error diagnosis using graph convolutional networks with knowledge graph integration. Sci Rep 16, 10867 (2026). https://doi.org/10.1038/s41598-026-45622-x

Słowa kluczowe: korekta błędów gramatycznych, grafowe sieci neuronowe, grafy wiedzy, technologie nauki języków, przetwarzanie języka naturalnego