Clear Sky Science · pl

Generatywna sztuczna inteligencja w pisaniu naukowym: porównanie tytułów artykułów badawczych autorstwa ludzi i wygenerowanych przez ChatGPT

· Powrót do spisu

Dlaczego sposób formułowania tytułów prac naukowych ma znaczenie

Kiedy wyszukujesz badania medyczne w internecie, pierwszą rzeczą, którą widzisz, jest tytuł artykułu. W zaledwie kilku słowach musi on powiedzieć, o czym jest badanie i dlaczego jest istotne. W obliczu narzędzi generatywnej SI, takich jak ChatGPT, które pomagają badaczom w tworzeniu tekstu, to badanie stawia aktualne pytanie: czy SI rzeczywiście potrafi naśladować sposób, w jaki eksperci konstruują te kluczowe tytuły, i co można zyskać albo stracić, jeśli jej na to pozwolimy?

Badanie SI i ludzi obok siebie

Naukowcy zbudowali dwie starannie dopasowane kolekcje tytułów z zakresu medycyny ogólnej. Jedna zawierała 300 tytułów napisanych przez ludzi i opublikowanych w trzech z najbardziej wpływowych czasopism medycznych na świecie: The Lancet, JAMA i The BMJ. Druga zawierała 300 tytułów wygenerowanych przez ChatGPT, z których każdy oparto na abstrakcie tego samego artykułu. Taki projekt pozwolił autorom bezpośrednio porównać wybory ludzi i SI przy zachowaniu stałego materiału wyjściowego. Następnie zbadali tytuły za pomocą prostych zliczeń i testów statystycznych, skupiając się na długości tytułów, ich strukturze oraz rodzaju informacji, które wyróżniały.

Figure 1
Figure 1.

Na ile podobne są tytuły SI i ludzi?

Na pierwszy rzut oka tytuły ChatGPT wyglądały uderzająco podobnie do tych napisanych przez badaczy medycznych. Średnia długość była niemal identyczna — oba zbiory tytułów oscylowały wokół dwudziestu słów. Zarówno ludzie, jak i SI wyraźnie preferowali tytuły dwuczłonowe, podzielone na dwie jednostki, a niemal wszystkie przybierały formę zwartego wyrażenia rzeczownikowego zamiast pełnych zdań. Ten styl, od dawna ugruntowany w medycynie, pozwala autorom zawrzeć wiele szczegółów przy utrzymaniu prostej gramatyki. Bliskie dopasowanie pokazuje, że ChatGPT przyswoił te zwyczaje gatunkowe ze źródeł, na których był trenowany, i potrafi je odtwarzać z dużą dokładnością.

Ukryte różnice w stylu i skupieniu

Pod tą szeroką zgodnością jednak ujawniły się istotne różnice. ChatGPT jeszcze silniej polegał na tytułach dwuczłonowych niż autorzy ludzie, co sygnalizuje tendencję do faworyzowania wysoce informacyjnych, rozbudowanych formatów. Gdy autorzy przyjrzeli się temu, na co tytuły zwracały uwagę, okazało się, że zarówno ludzie, jak i SI w większości podkreślali metody badawcze, co odpowiada silnemu naciskowi medycyny na projekt badania i przejrzystość. Jednak SI proporcjonalnie częściej generowała tytuły skoncentrowane na źródłach danych i wyraźnych wynikach, a rzadziej takie, które po prostu stwierdzały temat lub łączyły metody z informacjami o zestawach danych w bardziej elastyczny sposób. Autorzy-ludzie natomiast stosowali nieco szerszy wachlarz strategii — czasem wybierając krótsze tytuły zawierające jedynie temat lub subtelne wariacje eksponujące konkretne aspekty badania.

Figure 2
Figure 2.

Co to oznacza dla pisania z pomocą SI

Te wzorce wskazują na dwie strony jakości w pisaniu wspomaganym przez SI. Z jednej strony bliskie dopasowanie między ChatGPT a praktykami ludzkimi sugeruje, że generatywna SI może być użytecznym narzędziem do szkicowania tytułów zgodnych z ustalonymi normami medycznymi, zwłaszcza dla studentów lub badaczy piszących w drugim języku. Z drugiej strony silne przyciąganie modelu do pewnych utartych wzorców — dwuczłonowych, rzeczownikowych, skoncentrowanych na metodach i często mocno związanych z danymi lub wynikami — grozi stopniowym ujednoliceniem tytułów. Jeśli autorzy będą nadmiernie polegać na sugestiach SI bez ich krytycznego poddania ocenie, różnorodność i kreatywność tytułów naukowych może stopniowo maleć, co subtelnie wpłynie na sposób prezentacji, odnajdywania i interpretowania badań.

Równoważenie pomocy maszyn z ludzkim osądem

Mówiąc prosto, badanie konkluduje, że ChatGPT bardzo dobrze naśladuje sposób, w jaki zwykle pisze się tytuły medyczne, ale nie jest tak dobry w elastycznym łamaniu lub rozciąganiu tych reguł w przemyślany sposób. Podąża za tłumem, zamiast przedefiniowywać schemat. Autorzy argumentują, że edukatorzy i badacze muszą rozwijać to, co nazywają krytyczną alfabetyzacją AI: nawyk traktowania tytułów generowanych przez SI jako szkiców do oceny i poprawy, a nie jako finalnych produktów do bezkrytycznego przyjęcia. Używana w ten sposób generatywna SI może pomagać autorom uczyć się i stosować konwencje dyscyplinarne, podczas gdy ludzki osąd zachowa niuanse, akcenty i od czasu do czasu twórczą pomysłowość, które utrzymują komunikację naukową żywą i przejrzystą.

Cytowanie: Ibrahim, S.K.M., Mahmoud, Z.A.Z. Generative AI in academic writing: a comparison of human-authored and ChatGPT-generated research article titles. Humanit Soc Sci Commun 13, 394 (2026). https://doi.org/10.1057/s41599-026-06956-z

Słowa kluczowe: generatywna SI, pisanie naukowe, badania medyczne, tytuły artykułów, ChatGPT