אלגוריתם AI טוב רק כמו הנתונים שאתה מזין אותו.
זו לא אמירה נועזת ולא לא שגרתית. בינה מלאכותית הייתה יכולה להיראות מופרכת למדי לפני כמה עשורים, אבל הבינה המלאכותית ולמידת מכונה עברו כברת דרך מאוד ארוכה מאז.
ראייה ממוחשבת עוזרת למחשבים להבין ולפרש תוויות ותמונות. כאשר מאמנים את המחשב באמצעות מערכי נתוני התמונות הנכונים, הוא יכול לרכוש את היכולת לזהות, להבין ולזהות תווי פנים שונים, לזהות מחלות, לנהוג בכלי רכב אוטונומיים וגם להציל חיים באמצעות סריקת איברים רב-ממדית.
שוק ה-Computer Vision צפוי להגיע 144.46 מיליארד דולר עד 2028 מתוך צנוע 7.04 מיליארד דולר ב-2020, גדל ב CAGR של 45.64% בין 2021 ל-2028.
מערך הנתונים של התמונות שאתם מזינים ומאמן את משימות למידת המכונה והראייה הממוחשבת שלכם הוא קריטי להצלחת פרויקט הבינה המלאכותית שלכם. קשה למדי להשיג מערך נתונים איכותי. שימוש באוסף תמונות מגוון חיוני כדי להבטיח אימון מודלים חזק ולשקף טוב יותר את המורכבות של העולם האמיתי.
בהתאם למורכבות הפרויקט שלכם, קבלת מערכי נתונים אמינים ורלוונטיים למטרות ראייה ממוחשבת עשויה להימשך בין מספר ימים למספר שבועות. מגוון רחב של מערכי נתונים נחוץ כדי לכסות משימות ראייה ממוחשבת שונות ותרחישים מהעולם האמיתי. חוקרים מחפשים לעתים קרובות מערך נתונים משמעותי למטרות מחקר כדי להבטיח הערכה מקיפה של המודל ולתמוך במגוון רחב של יישומים.
כאן, אנו מספקים לך מגוון (מסווג לנוחותך) של מערכי נתונים של תמונות בקוד פתוח שתוכל להשתמש בו מיד.
משימות מערך נתונים של תמונות: סיווג, פילוח, זיהוי ועוד
מערכי נתונים של תמונות הם עמוד השדרה של ראיית המחשב המודרנית, ומפעילים מגוון רחב של משימות המאפשרות למכונות לפרש ולהבין מידע חזותי. בין אם אתם בונים מודל לרכבים אוטונומיים, מפתחים טכנולוגיית זיהוי פנים או עובדים על ניתוח תמונות רפואיות, מערך הנתונים הנכון של התמונות הוא כלי חיוני להצלחה.
סיווג תמונות היא אחת ממשימות הראייה הממוחשבת הבסיסיות ביותר. בתהליך זה, מודל לומד להקצות תווית לתמונה שלמה בהתבסס על תוכנה. לדוגמה, מערך נתונים של סיווג תמונות עשוי לעזור למודל להבחין בין תמונות של חתולים וכלבים, או לזהות סוגים שונים של צמחים. משימה זו חיונית ליישומים כמו תיוג אוטומטי של תמונות, אבחון מחלות מתמונות רפואיות ומדדי סיווג סצנות.
איתור אובייקטים לוקח את הדברים צעד קדימה לא רק על ידי זיהוי נוכחותם של אובייקטים בתוך תמונה אלא גם זיהוי מיקוםם באמצעות תיבות תוחמות. מערכי נתונים לזיהוי אובייקטים, כגון אלו המכילים תמונות עם הערות ותיבות תוחמות, חיוניים ליישומים כמו זיהוי הולכי רגל בכלי רכב אוטונומיים, מעקב אבטחה וניתוח קמעונאי. זיהוי אובייקטים הוא גם מרכיב מפתח בפיתוח אלגוריתמים חזקים של ראייה ממוחשבת עבור תרחישים בעולם האמיתי.
פילוח סמנטי כרוך בסיווג כל פיקסל בתמונה לקטגוריה ספציפית, המספקת הבנה מפורטת של הסצנה. פילוח טרימאפ ברמת הפיקסל הזה חשוב במיוחד במשימות כמו הדמיה רפואית, שבהן נדרש תיחום מדויק של איברים או גידולים, ובסביבות עירוניות לנהיגה אוטונומית, שבהן ההבחנה בין כבישים, מדרכות וכלי רכב היא קריטית.
מעבר למשימות הליבה הללו, מערכי נתונים של תמונות תומכים גם בפילוח מופעים (הבחנה בין אובייקטים בודדים מאותו מחלקה), כיתוב תמונות (יצירת טקסט תיאורי לתמונות) וזיהוי פנים (זיהוי או אימות פנים אנושיות בתמונות). כל אחת ממשימות ראייה ממוחשבת אלו מסתמכת על תמונות איכותיות ומבוארות כדי לאמן ולאמת מודלים של למידת מכונה.
על ידי מינוף מערכי נתונים מגוונים ומבוארים היטב של תמונות, מדעני נתונים ואנשי מקצוע בתחום למידת מכונה יכולים להתמודד עם מגוון אתגרי ראייה ממוחשבת, החל ממשימות זיהוי וסיווג תמונות ועד לבעיות פילוח וזיהוי מורכבות. מערך הנתונים הנכון לא רק מאיץ מחקר ופיתוח, אלא גם מבטיח שמערכות ראייה ממוחשבת יפעלו בצורה מדויקת ביישומים בעולם האמיתי.
רשימה מקיפה של מערכי נתונים כדי לאמן את מודל הראייה של המחשב שלך
כללי:
-
אימג'נט
ImageNet הוא מערך נתונים בשימוש נרחב, והוא מגיע עם 1.2 מיליון תמונות מדהימות המחולקות ל-1000 קטגוריות. מערך נתונים זה מאורגן לפי ההיררכיה של WorldNet ומסווג לשלושה חלקים - נתוני ההדרכה, תוויות התמונה ונתוני האימות.
-
קינטיקה 700
Kinetics 700 הוא מערך נתונים עצום באיכות גבוהה עם יותר מ-650,000 קליפים של 700 כיתות פעולה אנושית שונות. בכל אחת מהתובענות הייצוגיות יש כ-700 קטעי וידאו. לקליפים במערך הנתונים יש אינטראקציות בין אדם לאובייקט ובין אדם לאדם, שמתגלים כמועילים למדי בעת זיהוי פעולות אנושיות בסרטונים.
-
CIFAR-10
CIFAR 10 הוא אחד ממערכי הנתונים הגדולים ביותר של ראיית מחשב המתגאה ב-60000 תמונות צבעוניות בגודל 32 x 32 המייצגות עשר מחלקות שונות. בכל כיתה יש כ-6000 תמונות המשמשות לאימון אלגוריתמי ראייה ממוחשבת ולמידת מכונה.
-
סט נתונים של תמונות חיות מחמד של Oxford-IIIT
מערך תמונות חיית המחמד כולל 37 קטגוריות עם 200 תמונות לכל כיתה. תמונות אלה משתנות בקנה מידה, בתנוחה ובתאורה, ומלוות בהערות עבור גזע, החזר ROI ופילוח טרימפ ברמת הפיקסלים.
-
התמונות הפתוחות של גוגל
עם 9 מיליון כתובות URL מרשימים, זהו אחד ממערכי הנתונים הגדולים של התמונות ברשימה, המכיל מיליוני תמונות המסומנות על פני 6,000 קטגוריות.
-
תמונות צמחים
אוסף זה כולל מערכי נתונים מרובים של תמונות הכוללות מיליון תמונות מרשימות של צמחים, המכסים כ-1 מינים.
-
LSUN
LSUN הוא מערך נתונים של תמונות בקנה מידה גדול עם מיליוני תמונות מתויגות בקטגוריות שונות של סצנות ואובייקטים. מערך הנתונים כולל מערך בדיקות ייעודי להערכת מודל.
זיהוי פנים:

-
עם התווית פנים בטבע
עם התווית Faced in the Wild הוא מערך נתונים ענק המכיל יותר מ-13,230 תמונות של כמעט 5,750 אנשים שזוהו מהאינטרנט. מערך פרצופים זה נועד להקל על לימוד זיהוי פנים ללא הגבלה.
-
CASIA WebFace
CASIA Web face הוא מערך נתונים מעוצב היטב המסייע למידת מכונה ומחקר מדעי על זיהוי פנים ללא הגבלה. עם יותר מ-494,000 תמונות של כמעט 10,000 זהויות אמיתיות, הוא אידיאלי למשימות זיהוי ואימות פנים.
-
ערכת נתונים של UMD Faces
UMD מתמודד עם מערך נתונים בעל הערות טוב המכיל שני חלקים - תמונות סטילס ומסגרות וידאו. מערך הנתונים כולל יותר מ-367,800 הערות פנים ו-3.7 מיליון פריימים של סרטונים מוערים של נושאים.
-
זיהוי מסכות פנים
מערך נתונים זה כולל 853 תמונות המחולקות לשלוש מחלקות: "עם מסכה", "ללא מסיכה" ו"מסיכה לובשת באופן שגוי", יחד עם התיבות התוחמות שלהן בפורמט PASCAL VOC.
-
FERET
FERET (מסד נתונים של טכנולוגיות זיהוי פנים) הוא מערך תמונות מקיף המכיל למעלה מ-14,000 תמונות מוערות של פנים אנושיות.
זיהוי כתב יד:
-
מסד נתונים של MNIST
MNIST הוא מסד נתונים המכיל דוגמאות של ספרות בכתב יד מ-0 עד 9, ויש לו 60,000 ו-10,000 תמונות הדרכה ובדיקה. פורסם בשנת 1999, MNIST מקל על בדיקת מערכות עיבוד תמונה ב-Deep Learning.
-
ערכת נתונים של תווים מלאכותיים
ערכת נתונים מלאכותית היא, כפי שהשם מרמז, נתונים שנוצרו באופן מלאכותי המתארים את מבנה השפה האנגלית בעשר אותיות גדולות. זה מגיע עם יותר מ-6000 תמונות.
איתור אובייקט:
MS COCO
MS COCO או Common Objects in Context הוא מערך נתונים לזיהוי אובייקטים וכתוביות.
יש לו יותר מ-328,000 תמונות עם זיהוי נקודת מפתח, זיהוי ריבוי אובייקטים, כיתוב והערות מסכת פילוח. זה מגיע עם 80 קטגוריות אובייקטים וחמש כיתובים לכל תמונה.
LSUN
ל-LSUN, קיצור של Large-scale Scene Understanding, יש יותר ממיליון תמונות מתויגות ב-20 אובייקטים ו-10 קטגוריות סצינות. בחלק מהקטגוריות יש קרוב ל-300,000 תמונות, כאשר 300 תמונות מיועדות במיוחד לאימות ו-1000 תמונות לנתוני בדיקה.
חפצי בית
מערך הנתונים של אובייקטים ביתיים מכיל תמונות מוערות של אובייקטים אקראיים מרחבי הבית - מטבח, סלון וחדר רחצה. מערך הנתונים הזה כולל גם כמה סרטונים עם הערות ו-398 תמונות ללא הערות המיועדות לבדיקה.
גנום חזותי
Visual Genome הוא מאגר ידע חזותי מקיף עם למעלה מ-108,000 תמונות עם כיתוב. הוא מספק הערות נרחבות לאובייקטים, תכונות וקשרים, מה שהופך אותו בעל ערך לזיהוי אובייקטים, כיתוב תמונות ומשימות למידה רב-מודאליות.
כלי רכב:
מערך נתונים של נוף עירוני
Cityscape הוא מערך הנתונים שאליו ניתן ללכת כאשר מחפשים רצפי וידאו שונים שהוקלטו מסצנות רחוב של מספר ציטוטים. תמונות אלו צולמו לאורך זמן ובתנאי מזג אוויר ואור שונים. ההערות מיועדות ל-30 כיתות של תמונות המחולקות לשמונה קטגוריות שונות.
בארקלי דיפ דרייב
Barkley DeepDrive תוכנן במיוחד לאימון רכב אוטונומי, ויש לו יותר מ-100 אלף קטעי וידאו מוערים. זהו אחד מנתוני ההדרכה המועילים ביותר עבור כלי רכב אוטונומיים על ידי שינוי תנאי הדרך והנהיגה.
אדר
ל-Mapillary יש למעלה מ-750 מיליון סצנות רחוב ותמרורים ברחבי העולם, וזה שימושי מאוד באימון מודלים של תפיסה חזותית בלמידת מכונה ובאלגוריתמים של AI. זה מאפשר לך לפתח רכבים אוטונומיים הנותנים מענה לתנאי תאורה ומזג אוויר ונקודות מבט שונות.
הדמיה רפואית:
קוביד-19 פתח מערך נתונים של מחקר
מערך הנתונים המקורי הזה כולל כ-6500 פילוחי ריאה מצולעים פיקסלים לגבי צילומי חזה AP/PA. בנוסף, זמינות 517 תמונות של צילומי רנטגן של חולי Covid-19 עם תגים המכילים את השם, המיקום, פרטי הקבלה, התוצאה ועוד.
מסד נתונים של NIH של 100,000 צילומי חזה
מסד הנתונים של NIH הוא אחד ממערכי הנתונים הנרחבים ביותר הזמינים לציבור המכילים 100,000 תמונות רנטגן של החזה ונתונים קשורים שימושיים עבור קהילת המדע והמחקר. יש לו אפילו תמונות של חולים עם מצבי ריאות מתקדמים.
אטלס לפתולוגיה דיגיטלית
Atlas of Digital Pathology מציע מספר תמונות תיקון היסטופתולוגיות, יותר מ-17,000 בסך הכל, מקרוב ל-100 שקופיות מוערות של איברים שונים. מערך נתונים זה שימושי בפיתוח תוכנת ראייה ממוחשבת ותבניות זיהוי.
זיהוי סצינות:

זיהוי סצנה מקורה
זיהוי סצנות פנימיות הוא מערך נתונים מסווג מאוד עם כמעט 15620 תמונות של אובייקטים ותפאורה פנימית לשימוש בלמידת מכונה ואימון נתונים. זה מגיע עם למעלה מ-65 קטגוריות, ולכל קטגוריה יש מינימום של 100 תמונות.
xView
כאחד ממערכי הנתונים המוכרים ביותר הזמינים לציבור, xView מכיל טונות של תמונות תקורה מוערות מסצנות מורכבות וגדולות שונות. עם כ-60 מחלקות ויותר ממיליון מופעים של אובייקטים, המטרה של מערך נתונים זה היא לספק הקלה טובה יותר באסונות באמצעות תמונות לוויין.
מקומות
ל-Places, מערך נתונים שנתרם על ידי MIT, יש יותר מ-1.8 מיליון תמונות מ-365 קטגוריות שונות של סצנות. יש כ-50 תמונות בכל אחת מהקטגוריות הללו לאימות ו-900 תמונות לבדיקה. לימוד תכונות סצינות עמוקות ליצירת משימות זיהוי סצינות או זיהוי חזותי אפשרי.
מסד נתונים של SUN
מסד הנתונים SUN הוא כלי מקיף לקטגוריזציה של סצנות, הנמצא בשימוש נרחב בראייה ממוחשבת. הוא מכיל אלפי תמונות המשתרעות על פני מגוון רחב של סביבות פנים וחוץ, עם הערות מפורטות לכל סצנה. מסד הנתונים SUN מוכר בזכות כיסוי הסצנות השונות שלו ומשמש כבסיס סטנדרטי להערכת אלגוריתמים להבנת סצנות.
בידור:
ערכת נתונים של IMDB WIKI
IMDB - Wiki הוא אחד ממאגרי המידע הציבוריים הפופולריים ביותר של פרצופים המסומנים בצורה נאותה עם גיל, מין ושמות. יש לו גם כ-20 אלף פרצופים של מפורסמים ו-62 אלף מויקיפדיה.
סלבס פרצופים
Celeb Faces הוא מאגר מידע רחב היקף עם 200,000 תמונות מוערות של ידוענים. התמונות מגיעות עם וריאציות של רעשי רקע ותנוחה, מה שהופך אותן לבעלי ערך עבור מערכי מבחן אימון במשימות ראייה ממוחשבת. זה מועיל מאוד להשגת דיוק גבוה יותר בזיהוי פנים, עריכה, לוקליזציה של חלקי הפנים ועוד.
מערך נתונים של YouTube-8M
YouTube-8M הוא מערך נתונים גדול של סרטונים עם תוויות, המכיל מיליוני מזהי סרטוני YouTube עם הערות איכותיות שנוצרו על ידי מכונה של ישויות חזותיות. מערך נתונים זה נמצא בשימוש נרחב להבנה רחבת היקף של סרטונים ולאימון אלגוריתמים של ראייה, מכיוון שהוא מקשר תוכן וידאו למטא-דאטה דרך מזהי סרטוני YouTube, ומאפשר איסוף ורישום נתוני וידאו הניתנים להרחבה.
כעת, לאחר שיש לכם רשימה עצומה של מערכי נתונים של תמונות בקוד פתוח כדי להזין את מנגנון הבינה המלאכותית שלכם. התוצאה של מודלי הבינה המלאכותית ולמידת המכונה שלכם תלויה בעיקר באיכות מערכי הנתונים שאתם מזינים ומאמנים אותם עליהם. אם אתם רוצים שמודל הבינה המלאכותית שלכם יניבו תחזיות מדויקות, הוא זקוק למערכי נתונים איכותיים שמצטברים, מתויגים ומתויגים בצורה מושלמת. עבודה עם מערכי נתונים אלה היא דרך מצוינת לפתח ולשפר את כישורי למידת המכונה שלכם באמצעות פרויקטים מעשיים בעולם האמיתי. כדי להגביר את הצלחת מערכת הראייה הממוחשבת שלכם, עליכם להשתמש במאגרי נתונים איכותיים של תמונות הרלוונטיים לחזון הפרויקט שלכם.