Clear Sky Science · pl
Analiza tematyczna z użyciem otwartoźródłowej generatywnej SI i uczenia maszynowego: nowa metoda induktywnego tworzenia kodeksu jakościowego
Dlaczego ma to znaczenie dla codziennych pytań
Kiedy ludzie wypełniają ankiety lub odpowiadają na pytania w wywiadach, zostawiają po sobie bogate opowieści o pracy, szkole, zdrowiu czy życiu w społeczności. Przeczytanie kilkudziesięciu takich odpowiedzi jest proste; zrozumienie tysięcy — już nie. Ten artykuł opisuje nowy sposób, w jaki badacze mogą użyć otwartoźródłowej sztucznej inteligencji do przeszukiwania ogromnych ilości pisemnych komentarzy i wyciągania głównych idei, przy jednoczesnym zachowaniu ludzkiej kontroli nad interpretacją. Celem jest umożliwienie starannego, niuansowego badania jakościowego na skalach zwykle zarezerwowanych dla analiz big-data.
Sprytniejszy sposób czytania tysięcy komentarzy
Autorzy koncentrują się na popularnym podejściu w naukach społecznych zwanym analizą tematyczną, w którym badacze czytają tekst i szukają powtarzających się wzorców lub „tematów” odpowiadających na ich pytania badawcze. Tradycyjnie oznacza to powolne kodowanie każdej odpowiedzi ręcznie i budowanie kodeksu — uporządkowanej listy tematów i podtematów. Proces ten sprawdza się przy kilkudziesięciu wywiadach, ale staje się przytłaczający, gdy mamy dziesiątki tysięcy otwartych odpowiedzi. Artykuł pyta: czy ogólnodostępne modele tekstowe i inne narzędzia otwartoźródłowe mogą pomóc w wczesnych, powtarzalnych etapach tej pracy, nie zastępując ludzkiego osądu?

Wprowadzenie do workflow GATOS
Aby odpowiedzieć na to pytanie, autorzy przedstawiają przepływ pracy Generative AI-enabled Theme Organization and Structuring, czyli GATOS. Workflow łączy kilka kroków. Najpierw otwartoźródłowy model językowy czyta poszczególne odpowiedzi i tworzy krótkie, skoncentrowane streszczenia tego, co każda osoba mówi. Następnie inne narzędzie przekształca te streszczenia w reprezentacje numeryczne, aby komputer mógł porównywać i grupować podobne pomysły. Streszczenia są grupowane w klastry, które prawdopodobnie odzwierciedlają wspólne tematy, takie jak troski związane z równowagą między pracą a życiem prywatnym czy frustracje spowodowane niejasną komunikacją.
Pozwolić SI sugerować, ale nie zalewać, nowych pomysłów
Najbardziej nowatorski krok następuje, gdy system zaczyna budować szkic kodeksu. Dla każdego klastra powiązanych streszczeń inny model generatywny analizuje idee w tym klastrze oraz kody już obecne w kodeksie. Następnie ocenia, czy potrzebny jest rzeczywiście nowy kod, czy wystarczą istniejące. Jeśli pojawi się nowy aspekt — na przykład „stabilne narzędzia do wideokonferencji” jako konkretny problem — model proponuje krótki etykietę i definicję, które są dodawane. Jeśli nie, wybiera ponowne użycie istniejących kodów. Ostateczny krok grupuje powiązane kody w szersze tematy, tworząc uporządkowaną mapę od surowych komentarzy do zorganizowanych wniosków. Przez cały czas kładzie się nacisk na unikanie zalewu niemal identycznych kodów przy jednoczesnym uchwyceniu subtelnych różnic w doświadczeniach ludzi.

Testowanie metody na realistycznych danych symulowanych
Ponieważ badania w rzeczywistym świecie rzadko mają znany „klucz odpowiedzi”, zespół przetestował GATOS, używając syntetycznych (generowanych komputerowo) danych, gdzie ukryte tematy były znane z góry. Stworzono trzy duże, realistyczne zbiory: informacje zwrotne od rówieśników dotyczące pracy zespołowej, poglądy na etyczną kulturę w miejscu pracy oraz opinie o powrocie do biura po pandemii COVID-19. Dla każdego zestawu danych najpierw zdefiniowano osiem tematów i kilka podtematów, a następnie użyto modelu językowego do wygenerowania setek realistycznych odpowiedzi od różnych person, takich jak członkowie związków, menedżerowie czy studenci. Po uruchomieniu GATOS nad tymi zbiorami dane zostały porównane przez recenzentów ludzkich z pierwotnymi, ukrytymi podtematami, aby sprawdzić, jak dobrze się pokrywają.
Jak dobrze to działało i jakie są kompromisy?
We wszystkich trzech przypadkach testowych workflow odtworzył większość oryginalnych podtematów dość dokładnie: zdecydowana większość miała przynajmniej jedno silne dopasowanie, a tylko niewielka garstka nie miała dobrego odpowiednika. Co ważne, w miarę jak system analizował więcej danych, proponował coraz mniej nowych kodów, co sugeruje, że uczył się ponownie wykorzystywać istniejące pomysły zamiast wymyślać nieskończone warianty. Autorzy argumentują, że takie otwartoźródłowe rozwiązanie uruchamiane lokalnie może złagodzić obawy dotyczące prywatności i ułatwić różnym zespołom badawczym replikację prac innych. Jednocześnie podkreślają, że dane syntetyczne są prostsze niż wiele sytuacji rzeczywistych, że workflow wciąż może tworzyć nakładające się kody oraz że potrzebni są ludzie — badacze — do dopracowania, interpretacji i oceny ostatecznego kodeksu.
Co to oznacza dla osób spoza środowiska naukowego
Dla czytelników spoza akademii wniosek jest taki, że otwartoźródłowa SI może pomóc naukom społecznym i innym badaczom wysłuchać znacznie większej liczby osób, nie sprowadzając ich wypowiedzi do prymitywnych liczb. Zamiast zastępować analityków, workflow GATOS działa jak bardzo szybki, bardzo zorganizowany asystent, który sugeruje wzorce i robocze etykiety, pozostawiając ludziom decyzję, co te wzorce naprawdę oznaczają. Jeśli kolejne badania potwierdzą te wyniki na danych z rzeczywistego świata, narzędzia takie jak GATOS mogłyby ułatwić opieranie polityki w miejscu pracy, programów edukacyjnych i decyzji publicznych na pełnym bogactwie tego, co ludzie rzeczywiście mówią, a nie tylko na pytaniach wielokrotnego wyboru.
Cytowanie: Katz, A., Fleming, G.C. & Main, J.B. Thematic analysis with open-source generative AI and machine learning: a new method for inductive qualitative codebook development. Humanit Soc Sci Commun 13, 209 (2026). https://doi.org/10.1057/s41599-026-06508-5
Słowa kluczowe: analiza danych jakościowych, analiza tematyczna, generatywna SI, otwartoźródłowe modele językowe, metody badań nauk społecznych