Clear Sky Science · he

השוואת צריכת אנרגיה ודיוק באינפראנס של סיווג טקסט

· חזרה לאינדקס

מדוע בינה צורכת־חשמל חשובה

מאחורי הקלעים של צ'אטבוטים וכלי מסמכים חכמים, מחשבים שורפים חשמל בשקט. ככל שהמודלים השפתיים הגדולים גדלים ונפוצים יותר, התיאבון שלהם לאנרגיה מעורר שאלות לגבי יעדי האקלים ותקציבי הציבור. המאמר הזה שואל שאלה פשוטה אך מרכזית: כאשר אנחנו משתמשים בבינה מלאכותית למיון ותיוג טקסט, האם באמת צריכים את המודלים הגדולים ביותר, או שכלים קטנים וקלים יכולים לבצע את העבודה באותו אופן תוך שימוש בהרבה פחות אנרגיה?

מיון תלונות מהעולם האמיתי

המחברים מבססים את המחקר על משימה מוחשית מהמינהל הציבורי הגרמני: עיבוד התנגדויות כתובות של אזרחים לגבי מיקום אחסון פסולת רדיואקטיבית ברמה גבוהה. מאות הצהרות קצרות נדרשו להיות מקובצות לקטגוריות כגון בעיות נתונים או דרישות אתר כדי שיועברו למומחים המתאימים. זו בעיית סיווג טקסט קלאסית שממשלות, חברות וארגונים מתמודדים איתה בכל פעם שהם ממיינים אימיילים, כרטיסי תמיכה או תגובות ציבוריות.

לצורך המחקר השתמשו החוקרים במערכת נתונים ציבורית ומנוקה של 378 הגשות מתוייגות. הם חילקו אותה לשני חצאים שווי‑גודל לאימון ולמבחן וחזרו על כל ניסוי עשר פעמים עם חלוקות אקראיות שונות כדי להימנע מתוצאות מקריות. אחר כך השוו מודלים מסורתיים של למידת מכונה — כמו רגרסיה לוגיסטית ו‑gradient boosting שהוזנו בתכונות טקסט פשוטות — לטווח רחב של מודלים שפתיים מודרניים, כולל דגמים פתוחים עדכניים ממשפחות Llama, Qwen, Phi, Jamba ו‑DeepSeek. כל המודלים השפתיים הגדולים נבדקו "כמו שהם" במצב זירו‑שוט: הם קיבלו הוראות למשימה ואת הטקסט, אך לא עברו אימון נוסף על הקטגוריות הספציפיות.

Figure 1
Figure 1.

מדידת חשמל, לא רק תשובות נכונות

רוב מאמרי הבינה מדגישים דיוק ולעתים רחוקות יותר גורמים אחרים. כאן החוקרים מודדים לא רק באיזו תדירות כל מודל מסווג את הטקסט נכון, אלא גם כמה אנרגיה הוא צורך בזמן הפעולה, וכמה זמן זה לוקח. הם מריצים את הניסויים שלהם על שלוש חוות מחשוב ביצועים גבוהים המצויידות בדורות שונים של כרטיסי NVIDIA. בעזרת הכלי CodeCarbon הם מעריכים את ההספק הנצרך על ידי המעבדים, כרטיסי המסך והזיכרון בשלב האינפראנס — הרגע בו המודלים משמשים לחיזוי. הם מתמקדים בתנאי "אתחול חם" שמדמים פריסות אמיתיות, שבהן המודל נותר טעון בזיכרון ומעבד מסמכים רבים ברצף.

ההגדרה הזו מאפשרת להם לחקור כמה שאלות פרקטיות: האם מודלים גדולים תמיד מדויקים יותר? האם הוספת GPUs מקצרת זמן בלי לחסוך אנרגיה? עד כמה בחירת החומרה משפיעה? והאם זמן ריצה פשוט — זמן הקיר שהמודל צריך — יכול לשמש כמדד גס לצריכת האנרגיה כאשר מדידות ישירות לא זמינות?

מודלים קטנים, חשבונות קטנים

הממצא המרכזי בולט: עבור מאגר הנתונים של פסולת רדיואקטיבית, מודל ליניארי מסורתי המבוסס על הטמעות משפטיות שנחושו מראש הוא גם המדויק ביותר וגם הרבה יותר יעיל אנרגטית מכל המודלים השפתיים הגדולים שנבחנו. אפילו המודלים המסורתיים הפשוטים יותר עקפו כמה מהמודלים הגדולים תוך צריכת אנרגיה זניחה. לעומת זאת, חלק מהמודלים הגדולים במיוחד, ובמיוחד אלה עם שלבי "הסקה" פנימיים נוספים, צורכים מאות עד אלפי פעמים יותר חשמל מבלי לספק תוצאות טובות יותר.

בהתבוננות על הגדרות חומרה שונות, כרטיס ה‑GPU שולט בצריכת האנרגיה כאשר מעורבים מודלים גדולים. הוספת עוד GPUs מאיצה את האינפראנס אך בדרך כלל לא מקצרת את צריכת האנרגיה הכוללת, ופיזור המודל על מספר צמתים מקשה אף יותר בגלל עלות התקשורת. כאשר החוקרים מבצעים בדיקות על מספר מאגרי נתונים מעבר למקרה הגרעיני — נושאי חדשות, ביקורות לקוחות, סנטימנט בסרטים ורגשות — הם מוצאים תמונה מעודנת יותר: במשימות מסוימות מודלים שפתיים גדולים משיגים דיוק גבוה יותר במידה ניכרת, אך שיפור זה לעתים קרובות מלווה בעלויות אנרגיה גבוהות. בכל הגדרה, צריכת האנרגיה עולה כמעט בקו ישר עם זמן הריצה, כלומר כמה זמן מודל לוקח מהווה מדד טוב לכמה כוח הוא צורך על אותה מכונה.

Figure 2
Figure 2.

ליבון בחירות בינה‑אקלימיות

מעבר למספרים, המאמר טוען שבינה ברת קיימא צריכה להישפט לפחות על שני צירים נפרדים: עד כמה היא מבצעת משימה ועד כמה משאבים היא צורכת. גדול אינו בהכרח טוב, והסתמכות כברירת מחדל על מודלים כלל‑מטרתיים ענקיים לסיווג שגרתי עלולה לגרום לפליטות מיותרות, עלויות תפעול גבוהות וזמני עיבוד ארוכים. המחברים ממליצים שארגונים יתחילו עם מודלים שקופים וקלי משקל כנקודות ייחוס, ויעברו למודלים שפתיים גדולים רק כאשר הם משפרים באופן מוכח את הדיוק, ולשקלל תמיד את הרווח הזה מול דרישות האנרגיה והחומרה.

מה משמעות הדבר למערכות יומיומיות

לקריאה הכללית, המסר ברור: כשהמערכת הממוחשבת מתייגת את האימייל שלך, מנתבת את תלונתך או מסווגת מסמך, מודל קטן שנבחר בקפידה עשוי לשרת אותך לא פחות טוב ממודל ענק — ובאותו הזמן להיות זול יותר, מהיר יותר ולא ידידותי פחות לכדור הארץ. על ידי הדגמת כך שצריכת האנרגיה יכולה להשתנות בשישה סדרי גודל עבור דיוק דומה, ושהמדידות הפשוטות של זמן ריצה יכולות להעריך את צורכי ההספק, המחקר מציע ערכת כלים מעשית להחלטות בינה‑מלאכותית מודעות‑אקלים בממשלה ומחוצה לה.

ציטוט: Zschache, J., Hartwig, T. Comparing energy consumption and accuracy in text classification inference. Sci Rep 16, 12717 (2026). https://doi.org/10.1038/s41598-026-45023-0

מילות מפתח: בינה מלאכותית חסכונית באנרגיה, סיווג טקסט, מודלים שפתיים גדולים, מחשוב בר קיימא, נתוני מינהל ציבורי