השפעת הגיוון על נתוני האימון

נתוני אימון בינה מלאכותית מגוונים לכלולות וביטול הטיה

לבינה מלאכותית ולביג דאטה יש פוטנציאל למצוא פתרונות לבעיות גלובליות תוך מתן עדיפות לבעיות מקומיות ולשנות את העולם בדרכים עמוקות רבות. בינה מלאכותית מביאה פתרונות לכולם - ובכל המסגרות, מבתים ועד מקומות עבודה. מחשבי AI, עם למידת מכונה אימון, יכול לדמות התנהגות ושיחות אינטליגנטיות באופן אוטומטי אך מותאם אישית.

עם זאת, AI מתמודד עם בעיית הכללה ולעתים קרובות הוא מוטה. למרבה המזל, מתמקדים אתיקה של בינה מלאכותית יכול להכניס אפשרויות חדשות יותר במונחים של גיוון והכלה על ידי ביטול הטיה לא מודעת באמצעות נתוני אימון מגוונים.

חשיבות הגיוון בנתוני אימון בינה מלאכותית

Ai אימון מגוון נתונים הגיוון והאיכות של נתוני האימון קשורים זה לזה מכיוון שאחד משפיע על השני ומשפיע על התוצאה של פתרון הבינה המלאכותית. הצלחת פתרון הבינה המלאכותית תלויה ב נתונים מגוונים הוא מאומן על. גיוון הנתונים מונע מה-AI להתאים יתר על המידה - כלומר המודל רק מבצע או לומד מהנתונים המשמשים לאימון. עם התאמה יתר, מודל הבינה המלאכותית אינו יכול לספק תוצאות כאשר הוא נבדק על נתונים שלא נעשה בהם שימוש באימון.

המצב הנוכחי של אימון בינה מלאכותית נתונים

אי השוויון או היעדר הגיוון בנתונים יובילו לפתרונות בינה מלאכותית לא הוגנים, לא אתיים ולא כוללים שעלולים להעמיק את האפליה. אבל איך ולמה גיוון בנתונים קשור לפתרונות AI?

ייצוג לא שוויוני של כל המעמדות מוביל לזיהוי שגוי של פרצופים - מקרה חשוב אחד הוא Google Photos שסיווג זוג שחור כ'גורילות'. ומטה מנחה משתמש שצופה בסרטון של גברים שחורים אם המשתמש ירצה 'להמשיך לצפות בסרטונים של פרימטים'.

לדוגמה, סיווג לא מדויק או לא תקין של מיעוטים אתניים או גזעיים, במיוחד בצ'אטבוטים, עלול לגרום לדעות קדומות במערכות אימון בינה מלאכותית. על פי דו"ח 2019 על מערכות מפלות - מגדר, גזע, כוח בבינה מלאכותית, יותר מ-80% מהמורים לבינה מלאכותית הם גברים; חוקרות AI ב-FB מהוות רק 15% ו-10% בגוגל.

ההשפעה של נתוני אימון מגוונים על ביצועי בינה מלאכותית

השפעת הגיוון על נתוני האימון השארת קבוצות וקהילות ספציפיות מייצוג נתונים יכול להוביל לאלגוריתמים מוטים.

הטיית נתונים מוכנסת לעתים קרובות בטעות למערכות הנתונים - על ידי תת-דגימה של גזעים או קבוצות מסוימות. כאשר מערכות זיהוי פנים מאומנות על פנים מגוונות, זה עוזר לדגם לזהות תכונות ספציפיות, כגון מיקום איברי הפנים וריאציות צבע.

תוצאה נוספת של תדירות לא מאוזנת של תוויות היא שהמערכת עשויה להתייחס למיעוט כאנומליה כאשר היא מופעלת בלחץ לייצר פלט תוך זמן קצר.

בואו נדון היום בדרישת נתוני ההכשרה שלך ב- AI.

השגת גיוון בנתוני אימון בינה מלאכותית

מהצד השני, יצירת מערך נתונים מגוון הוא גם אתגר. המחסור המוחלט בנתונים על מעמדות מסוימים עלול להוביל לייצוג חסר. ניתן למתן את זה על ידי הפיכת צוותי מפתחי הבינה המלאכותית למגוונים יותר בהתייחס לכישורים, מוצא אתני, גזע, מגדר, משמעת ועוד. יתרה מזאת, הדרך האידיאלית לטפל בבעיות של גיוון נתונים ב-AI היא להתעמת איתו מלכתחילה במקום לנסות לתקן את מה שנעשה - להחדיר גיוון בשלב איסוף ואצור הנתונים.

ללא קשר להייפ סביב AI, זה עדיין תלוי בנתונים שנאספו, נבחרים ואומנים על ידי בני אדם. ההטיה המולדת בבני אדם תשתקף בנתונים שנאספו על ידם, וההטיה הלא מודעת הזו מתגנבת גם למודלים של ML. 

שלבים לאיסוף ואצירת נתוני הכשרה מגוונים

אימון הכללת מגוון נתונים

מגוון נתונים ניתן להשיג על ידי:

  • הוסף במחשבה עוד נתונים מכיתות מיוצגות בחסר וחשוף את המודלים שלך לנקודות נתונים מגוונות. 
  • על ידי איסוף נתונים ממקורות נתונים שונים. 
  • על ידי הגדלת נתונים או מניפולציה מלאכותית של מערכי נתונים כדי להגדיל/להכליל נקודות נתונים חדשות באופן מובהק מנקודות הנתונים המקוריות. 
  • בעת העסקת מועמדים לתהליך פיתוח בינה מלאכותית, הסר מהאפליקציה את כל המידע שאינו רלוונטי לעבודה. 
  • שיפור השקיפות והאחריות על ידי שיפור התיעוד של פיתוח והערכה של מודלים. 
  • הכנסת תקנות לבניית גיוון ו הכללה ב-AI מערכות מרמת הבסיס. ממשלות שונות פיתחו קווים מנחים כדי להבטיח גיוון ולהפחית הטיית בינה מלאכותית שיכולה לספק תוצאות לא הוגנות. 

[קרא גם: למידע נוסף על תהליך איסוף נתונים של אימון בינה מלאכותית ]

סיכום

נכון לעכשיו, רק כמה חברות טכנולוגיה גדולות ומרכזי למידה מעורבים באופן בלעדי בפיתוח פתרונות AI. מרחבי עילית אלו ספוגים בהדרה, אפליה והטיה. עם זאת, אלו הם המרחבים שבהם AI מפותחת, וההיגיון מאחורי מערכות בינה מלאכותיות מתקדמות אלה גדוש באותה הטיה, אפליה והדרה שנושאים על ידי הקבוצות המיוצגות בחסר. 

תוך כדי דיון על גיוון ואי-אפליה, חשוב להטיל ספק באנשים שהיא מועילה ובאלה שהיא פוגעת. עלינו גם לבחון את מי זה מעמיד בנחיתות - על ידי כפיית הרעיון של אדם 'נורמלי', בינה מלאכותית עלולה לסכן את 'אחרים'. 

דיון על הגיוון בנתוני AI מבלי להכיר ביחסי כוח, שוויון וצדק לא יראה את התמונה הגדולה יותר. כדי להבין היטב את היקף הגיוון בנתוני אימון בינה מלאכותית וכיצד בני אדם ובינה מלאכותית יכולים לצמצם יחד את המשבר הזה, לפנות למהנדסים ב-Shaip. יש לנו מהנדסי AI מגוונים שיכולים לספק נתונים דינמיים ומגוונים עבור פתרונות ה-AI שלך. 

שתף חברתי