Clear Sky Science · he

POLAR-DETR: טרנספורמר לזיהוי בזמן אמת עם תשומת לב מקומית-גלובלית המותאם לעכירות וקיטוע לפתרון אוטומציה מלאה במעבדה

· חזרה לאינדקס

רובוטים חכמים יותר למעבדות רפואיות צפופות

מאחורי כל בדיקת דם נמצא קו ייצור עמוס שבו מדפי מבחנות נעים במהירות מול סורקים ורובוטים. ככל שבתי חולים עוברים לעבר מעבדות מֻאוטומטות לחלוטין, קווים אלה צריכים לזהות אלפי מבחנות דחוסות ודומות זו לזו בזמן אמת, גם כאשר הן חופפות או מסתירות זו את זו. מאמר זה מציג את POLAR-DETR, מערכת ראייה חדשה שנועדה לעזור לרובוטים במעבדה לראות באופן מהימן בעולמות העמוסים והצפופים הללו, ובכך לפתח בדיקות מהירות, בטוחות ומדויקות יותר.

מדוע זיהוי מבחנות קשה

מעבדות מודרניות משתמשות יותר ויותר במכונות להובלה ומיון דגימות, אך המרחב סביב קווי הייצור מוגבל. במקום מסוע ארוך, המעבדות פונות למערכות רובוטיות קומפקטיות התלויות במידה רבה במצלמות. מצלמות אלה צריכות לזהות כל מבחנה, מדף ונשא בסצנות שבהן האובייקטים קטנים, דחוסים ולעתים קרובות חלקית מוסתרים. גלאים מהירים פופולריים בתעשיות אחרות, כמו משפחת YOLO, מתחילים להיתקל בקשיים בתנאים אלה. הם נשענים על שלב החלטה נוסף לסינון תחזיות חופפות ועלולים להחמיץ אובייקטים זעירים או מוסתרים, מה שיוצר שגיאות שלא מקובלות בעבודה עם דגימות רפואיות.

מנוע ראייה חדש למעבדה

בהתבסס על התקדמויות אחרונות במודלים מבוססי טרנספורמר לראייה, המחברים עיצבו את POLAR-DETR במיוחד לקווי ייצור רפואיים. במקום שרשרת של צעדים מכוילים ידנית, הוא משתמש בעיצוב מקצה אל מקצה שהופך ישירות תמונות מצלמה למיקומי וסוגי מבחנות במעבר אחד, ובכך נמנע משלבי סינון נוספים. בלב המערכת נמצא מקודד תכונות חדש שמקדיש תשומת לב מיוחדת לאופן שבו האובייקטים קשורים במרחב ולאופן בו הם מסתירים זה את זה. על ידי עיצוב מחדש של האופן בו המודל סורק כל תמונה, המקודד מסייע לו למקד אזורים נכונים, לשמר פרטים עדינים של מבחנות קטנות ועדיין להבין את הסצנה הרחבה. זה עושה את המערכת יותר חסינה כאשר מבחנות חופפות, מצטופפות או משתנות בגודל.

Figure 1
Figure 1.

מיזוג פרטים ותמונה כוללת

כדי להבין סצנות צפופות, מערכת ראייה צריכה לאזן בין הפרטים הקטנים בקצוות המבחנות לבין הפריסה הכוללת של המדפים והנשאים. POLAR-DETR מתמודד עם זאת באמצעות שני מודולים משלימים למיזוג מידע. מודול אחד מקשר מידע על פני סקאלות ומיקומים מרובים, ומתייחס לקבוצות אזורי תמונה כיחסים גמישים ולא כרשתות פשוטות. זה עוזר למערכת לזהות, למשל, שקצה חלש של מבחנה סביר שיהיה שייך לקבוצת מבחנות שכנות ולא לרקע. מודול שני מפצל במפורש את העיבוד לסניף "מקומי" שמחדד מרקמים וגבולות, ולסניף "גלובלי" שעוקב אחרי דפוסים מרוחקים. התוצאות משני הסניפים משולבות מחדש, מה שמניב גבולות עצמים ברורים יותר ופחות בלבולים בין מבחנות לציוד הסובב אותן.

חיתוך הרשת כדי להשיג מהירות מציאותית

מודלים של ראייה בעלי דיוק גבוה יכולים להיות כבדים ואיטיים, מה שמייצר בעיה במכונות תעשייתיות שעשויות לפעול מסביב לשעון. המחברים מציגים אסטרטגיית חיתוך (pruning) שמנתחת עד כמה כל מסלול פנימי משפיע על פלט המודל. מסלולים שתורמים מעט מוסרים באופן מושכל, ולא באקראי או לפי כללי גודל פשוטים. החיתוך הסלקטיבי הזה מקטין את מספר הפרמטרים בכ־20% ואת החישוב בכמעט רבע, אך המודל למעשה נעשה מדויק יותר. על מערך נתוני קו הייצור הרפואי שלהם, POLAR-DETR משיג דיוק ממוצע של 70% בזמן ריצה של כ־68 פריימים לשנייה — מהיר מספיק לשימוש רובוטי בזמן אמת.

Figure 2
Figure 2.

בניית סביבת בדיקה ריאליסטית

כדי להעריך האם POLAR-DETR באמת עובד בפועל, הצוות הרכיב מערך נתונים חדש מקו ייצור רפואי פעיל. באמצעות מצלמות צרכניות בתנאי תאורה משתנים, הם צילמו אלפי תמונות ברזולוציה גבוהה של מדפים, נשאים וכמה סוגי מבחנות, כולל מקופלות, לא מקופלות וקטגוריות בדיקה שונות. מומחים תייגו יותר משמונים אלף פריטים בודדים. לאחר מכן הרחיבו את נתוני האימון עם סיבובים מבוקרים, חיתוכים, שינויים בבהירות, רעש סינתטי וצירופים במוזאיקה, המדמים שינויים מציאותיים בכיוון, תאורה ועומס. מערך נתונים זה לא רק מעמיד את המודל במבחן מול מבחנות צפופות, קטנות ומוסתרות, אלא גם מספק מבחן ציבורי לחוקרים אחרים שעובדים על אוטומציה במעבדות.

מה זה אומר עבור מעבדות עתידיות

במילים ברורות, POLAR-DETR הוא זוג עיניים חד יותר למעבדות מֻאוטומטות. על ידי עיצוב מחדש מדויק של הדרך שבה מערכת ראייה מפנה תשומת לב לסצנות צפופות ולאחר מכן דחיסתה למהירות, המחברים משיגים גם דיוק גבוה יותר וגם עלות חישובית נמוכה יותר מאשר גישות רבות קיימות. המערכת מזהה יותר מבחנות, עושה פחות טעויות ברקעים עמוסים, ומסוגלת לעמוד בקצב החומרה התעשייתית. ככל שמעבדות ימשיכו להתמלא באוטומציה, גישות כאלה יכולות להפוך את הטיפול במדגמים לאמינה וגמישה יותר, ובסופו של דבר לתרום לתוצאות בדיקה מהירות יותר ולזרימות עבודה רפואיות עמידות יותר.

ציטוט: Zu, Y., Li, S. & Zhang, L. POLAR-DETR: Polarized occlusion-aware local-global attention real-time detection transformer for total laboratory automation. Sci Rep 16, 11949 (2026). https://doi.org/10.1038/s41598-026-42038-5

מילות מפתח: אוטומציה במעבדה, זיהוי עצמים, קו ייצור רפואי, ראיית מחשב, דגמי טרנספורמר