Clear Sky Science · he

מאגר נתונים מרובת תוויות לסיווג סצנות חקלאיות וכפריות בסין מתמונות לוויין ברזולוציה מאוד גבוהה

· חזרה לאינדקס

מדוע מיפוי הכפרים מהחלל חשוב

בכל רחבי סין, הכפר משתנה במהירות: חממות חדשות צצות בשדות ישנים, תחנות סולאריות מתפשטות על מורדות הגבעות, וכבישים מקשרים כפרים שבעבר היו מבודדים. עם זאת, רוב המפות המבוססות לוויין עדיין מתייחסות לכל זה כקטגוריה אחידה ומשעממת כמו "חקלאות". מאמר זה מציג את China‑MAS‑50k, מאגר פתוח חדש שמאפשר למחשבים לראות את הכפר הסיני בפרטים רבים יותר, באמצעות תמונות לוויין חדה מאוד ותוויות מרובות לכל סצנה. הוא מציע בסיס טוב יותר למעקב אחר ייצור מזון, פיתוח כפרי ושינוי סביבתי בקנה מידה לאומי.

Figure 1
Figure 1.

לראות יותר מאובייקט אחד בבת אחת

מפות לוויין מסורתיות בדרך כלל מקצות רק תווית אחת לכל חתיכת תמונה—יער, עיר או אדמות חקלאיות, למשל. מקומות אמיתיים לעיתים רחוקות פשוטים כל כך: תמונה אווירית אחת עשויה להראות כפר, שדות מסביב, בריכה, כביש ומבנים מודרניים כמו פאנלים סולאריים או חממות עם כיסוי פלסטי בו זמנית. פרויקט China‑MAS‑50k מקבל את המורכבות הזו על ידי התייחסות לכל תמונה כערבוב של אלמנטים. במקום לכפות בחירה יחידה, הוא מאפשר הצמדת מספר תוויות לאותה תמונה, בהתאמה טובה יותר לאופן שבו אנשים בעצם רואים ומשתמשים בקרקע.

בניית תמונה מפורטת של הכפרים בסין

כדי לבנות את מאגר הנתונים התחילה הקבוצה בתמונות ברזולוציה מאוד גבוהה הזמינות חופשית מ‑Google Earth, בעיקר מתצפיות של לוויינים מסחריים מודרניים המסוגלים להראות פרטים בקוטר מעט מעל מטר. הם חיפשו רשת ברוחב 50 ק"מ על כל שטח סין כדי לפזר דגימה באופן שווה, ואז בחרו נקודות באזורים כפריים והורידו אריחי תמונה קטנים בגודל 512 על 512 פיקסלים בכל נקודה. תמונות עם עננות מרובה, שלג, טשטוש או משטח אחיד אחד סוננו החוצה, והשאירו 55,520 סצנות ברורות שנאספו בעיקר ב‑2023–2024. האריחים הללו מכסים את הנופים המגוונים של המדינה, אך צפיפותם גבוהה במיוחד באזורים המעובדים יותר מזרחה לקראת "קו הו" המפורסם, שם מרוכזים רוב תושבי סין ושדותיה.

להפוך פיקסלים לסוגי קרקע משמעותיים

החוקרים עיצבו מערכת תוויות בת 18 קטגוריות המותאמת לחיי כפר. היא כוללת משטחים טבעיים כגון אדמות חקלאיות, יערות, דשא, נהרות, אגמים או בריכות, קרקע חשופה וכבישים ומסילות רכבת, וכן תכונות מעשה ידי אדם כגון כפרים כפריים, מפעלים, מגרשי ספורט, פארקים, רבש"מים מפלסטיק, חממות, תחנות פוטו־וולטאיות (סולאריות), רשתות נגד אבק המשמשות באתרי בנייה וערימות פסולת מוצקה. מתויגים אנושיים פעלו לפי הנחיות ויזואליות מפורטות המתארות צבעים, מרקמים וצורות אופייניים—למשל צללי עצים שמעידים על יער, רצועות ארוכות ובהירות של חממות, לוחות כהים בסדרות מסודרות של תחנות סולאריות. באמצעות כלי סימון פתוח שלושה מומחים תייגו כל תמונה בכל הקטגוריות הנראות, ובדקו זה את עבודתו של זה כדי לתפוס טעויות. התוצאה היא 135,289 תוויות, מאורגנות כך שכל תמונה יכולה להיות משויכת בקלות לרשימה המלאה של סוגי הכיסוי הקרקעי שלה.

Figure 2
Figure 2.

לבחון עד כמה המכונות חכמות באמת

עם סמן חדש זה ביד, המחברים העריכו מגוון מודלים פופולריים של מחשב. אלה כללו שיטות קלאסיות של למידת מכונה המבוססות על עצי החלטה, ורשתות נוירונים עמוקות שתוכננו במקור למשימות כמו זיהוי תמונות. לכל המודלים הוזנו תמונות בשלוש תעלות צבע זהות והתבקשו לנבא אילו מה‑18 קטגוריות הופיעו בכל סצנה. בסך הכל, רשתות עמוקות מודרניות עלו על הגישות הישנות. ביניהן, מודל בשם ResNeXt‑101 סיפק את האיזון הטוב ביותר של מדדי דיוק, ותפס ברמה סבירה את האלמנטים הנפוצים כגון אדמות חקלאיות, יערות וכבישים. עם זאת, הוא התקשה עם תכונות נדירות יותר כמו רשתות נגד אבק, רבש"מים מפלסטיק ותחנות סולאריות, דבר שהראה כמה קשה לאלגוריתמים ללמוד מדוגמאות מוגבלות במאגר נתונים "בעל זנב ארוך" שבו מעט קטגוריות נפוצות ורבות אחרות נדירות.

מה משמעות הדבר לתובנות כפריות בעתיד

China‑MAS‑50k מציע יותר מאוסף גדול של תמונות לוויין יפות. זהו משאב פתוח ובדוק בקפידה המשקף את המגוון האמיתי של הנופים הכפריים בסין ואת ההתפלגות הלא אחידה של חקלאות מסורתית ומודרנית. על ידי מתן אפשרות לתוויות מרובות לכל תמונה, הוא יכול לתמוך במשימות מתקדמות כגון מיפוי בקרה חלשה, שבו מחשבים לומדים להקיף שדות, חממות או כבישים באמצעות תוויות ברמת הסצנה בלבד. הוא גם מספק ערכת מבחן ריאליסטית להתמודדות עם חוסר איזון בכיתות, צוואר בקבוק מרכזי ביישום בינה מלאכותית על נתונים אמיתיים ומבולגנים. במילים פשוטות, מאגר זה מקל על מדענים ומתכננים ללמד מחשבים מה באמת קורה על הקרקע בכפרים הסיניים, ולעקוב כיצד מקומות אלה משתנים לאורך הזמן.

ציטוט: Yuan, S., Feng, Q., Niu, B. et al. A multi-label dataset for China’s agricultural and rural scenes classification from VHR satellite imagery. Sci Data 13, 384 (2026). https://doi.org/10.1038/s41597-026-06800-8

מילות מפתח: חישה מרחוק, נופי כפר, מיפוי חקלאי, מאגרי נתונים מרובי תוויות, תמונות לוויין