Clear Sky Science · he
בינה יוצרת בכתיבה אקדמית: השוואה בין כותרות מאמרים שנכתבו בידי בני אדם ואלה שנוצרו על ידי ChatGPT
מדוע הדרך שבה אנו כותבים כותרות למאמרים מדעיים חשובה
כשמחפשים מחקרים רפואיים ברשת, הדבר הראשון שרואים הוא כותרת המאמר. בכמה מילים בלבד היא צריכה להעביר על מה המחקר ולמה הוא משמעותי. כעת, כשכלים של בינה יוצרת כמו ChatGPT מסייעים לחוקרים לנסח טקסט, המחקר הזה שואל שאלה בזמן: האם הבינה יכולה באמת לחקות את האופן שבו מומחים מנוסחים כותרות כל כך חשובות, ומה עשוי להיאבד או להתווסף אם נניח לה לעשות זאת?
לימוד של בינה ובני אדם זה לצד זה
החוקרים בנו שתי אוספות מיושרות בקפידה של כותרות ברפואה כללית. האוסף הראשון כלל 300 כותרות שנכתבו בידי בני אדם ופורסמו בשלושת כתב העת הרפואיים המשפיעים בעולם: The Lancet, JAMA ו-The BMJ. האוסף השני כלל 300 כותרות שנוצרו על ידי ChatGPT, כל אחת בהתבסס על התקציר של אותו מאמר בדיוק. העיצוב הזה איפשר למחברים להשוות ישירות בין הבחירות של בני אדם ושל הבינה תוך שמירה על המחקר הבסיסי קבוע. לאחר מכן בחנו את הכותרות באמצעות ספירות פשוטות ובדיקות סטטיסטיות, עם דגש על אורך הכותרות, המבנה שלהן וסוג המידע שהן הדגישו.

כמה דומות כותרות הבינה לאלו של בני האדם?
מבחוץ, כותרות של ChatGPT נראו באופן מרשים כמו אלה שכתבו חוקרי רפואה. האורך הממוצע היה כמעט זהה, כאשר שני סטי הכותרות נצפו סביב עשרים מילים. גם בני האדם וגם הבינה העדיפו במידה רבה כותרות בחלקים מרובים המחולקות לשני יחידות, וכמעט כל אלה הופיעו כצורת צירופים שמניים דחוסים ולא כמשפטים שלמים. סגנון זה, מבוסס תקופה ארוכה ברפואה, מאפשר למחברים לדחוס הרבה פרטים תוך שמירה על פשטות תחבירית. ההתאמה ההדוקה מראה כי ChatGPT קלט את ההרגלים הז'אנריים האלה מהטקסטים שעליהם הוא אומן ויכול לשחזרם בדיוק ניכר.
הבדלים סמויים בסגנון ובמיקוד
מתחת לדמיון הרחב הזה, עם זאת, צצו הבדלים משמעותיים. ChatGPT הסתמך אף יותר על כותרות דו-חלקיות מאשר הכותבים האנושיים, מה שמצביע על נטייה להעדיף פורמטים מועשרים ומיידעים מאוד. כשבחנו מה הכותרות בחרו להבליט, גם בני האדם וגם הבינה הדגישו בעיקר שיטות מחקר, בהתאם להדגשה החזקה של הרפואה על עיצוב המחקר ושקיפות. יחד עם זאת, הבינה ייצרה באופן יחסי יותר כותרות שמרכזות את מקור הנתונים ותוצאות מפורשות, ופחות כותרות שאמירות פשוטות על הנושא או שמשלבות בין שיטות למידע על מערכי נתונים בצורה גמישה יותר. הכותבים האנושיים, לעומת זאת, השתמשו בתמהיל מעט רחב יותר של אסטרטגיות — לעתים בוחרים בכותרות קצרות שמתרכזות רק בנושא או בווריאציות עדינות שמעמידות בחזית היבטים מסוימים של המחקר.

מה משמעות הדבר לגבי כתיבה בעזרת בינה
הדפוסים האלה מצביעים על איכות דו-חוייתית בכתיבה בסיוע בינה. מצד אחד, ההתאמה ההדוקה בין ChatGPT לפרקטיקות האנושיות מרמזת שבינה יוצרת יכולה להיות כלי שימושי לנסח כותרות שעומדות בנורמות המקובלות ברפואה, במיוחד עבור סטודנטים או חוקרים שכותבים בשפה שנייה. מצד שני, המשיכה החזקה של המודל לדפוסים מוכרים — דו-חלקיות, נטייה לצורות שמניות, דגש על שיטות ולעתים קישור הדוק לנתונים או לתוצאות — עלולה להוביל ליצירת כותרות יותר פורמליות וחזרתיות עם הזמן. אם הכותבים יילכו עתה יותר מדי בעקבות הצעות הבינה בלי לשאול אותן, מגוון ויצירתיות הכותרות המדעיות עלולים להצטמצם בהדרגה, עם השפעות עדינות על האופן שבו מחקרים מוצגים, מתגלים ומפורשים.
לאזן בין עזרת המכונה לשיפוט האנושי
במילים פשוטות, המחקר מסיק כי ChatGPT טוב מאוד בחיקוי האופן שבו כותרות רפואיות נכתבות בדרך כלל, אך פחות טוב בלגמול או למתוח את הכללים האלה בצורה שקולה. הוא הולך עם הזרם במקום לשקול מחדש את התסריט. המחברים טוענים שמחנכים וחוקרים צריכים לפתח מה שהם מכנים ווניניות קריטית לבינה מלאכותית: ההרגל להתייחס לכותרות שנוצרו על ידי בינה כטיוטות שיש להעריך ולתקן, לא כמוצרים סופיים לקבל ללא הסתייגות. בשימוש כזה, בינה יוצרת יכולה לסייע לכותבים ללמוד ולשמוע על קונבנציות מקצועיות בעוד ששיפוט אנושי שומר על הדקויות, ההדגשות והיצירתיות המחודשת שמקנות לתקשורת המדעית חיות ובהירות.
ציטוט: Ibrahim, S.K.M., Mahmoud, Z.A.Z. Generative AI in academic writing: a comparison of human-authored and ChatGPT-generated research article titles. Humanit Soc Sci Commun 13, 394 (2026). https://doi.org/10.1057/s41599-026-06956-z
מילות מפתח: בינה יוצרת, כתיבה אקדמית, מחקר רפואי, כותרות מאמרים, ChatGPT