תיאור מקרה על מודל זיהוי פנים

ערכת נתונים של וידאו נגד זיוף עבור דגמי AI לזיהוי הונאה

גלה כיצד שייפ סיפקה 25,000 מערכי וידאו באיכות גבוהה נגד זיוף הכוללים תרחישי תקיפה אמיתיים ושידור חוזר כדי להכשיר מודלים של AI לזיהוי הונאה.

איסוף נתוני וידאו נגד זיוף

סקירת הפרויקט

שייפ שיתפה פעולה עם חברת אבטחת בינה מלאכותית מובילה כדי לספק מערך וידאו באיכות גבוהה, מהמדף נגד זיוף, שנועד לשפר אימון מודלים של AI לזיהוי הונאה. מערך הנתונים כלל 25,000 סרטונים שלכדו תרחישי תקיפה אמיתיים והן חוזרים, מה שמבטיח נתוני אימון חזקים עבור מודלים נגד זיוף.

כל אחד המשתתפים 12,500 תרם שני סרטונים - אחד אמיתי ואחד מתקפה חוזרת - שהוקלט בשעה רזולוציה של 720p ומעלה עם קצב פריימים של 26 FPS ומעלה.

מטרת הפרויקט הייתה לספק מערכי נתונים אותנטיים ומגוונים זה יאפשר למודלים של AI להבחין ביעילות בין סרטונים ביומטריים אמיתיים למזויפים, ובכך להפחית את סיכוני ההונאה במערכות אימות ביומטריות.

איסוף נתוני וידאו נגד זיוף

סטטיסטיקות מפתח

25,000 סך כל הסרטונים (12,500 סרטונים אמיתיים, 12,500 הפעלה חוזרת של סרטוני תקיפה)

12,500 ייחודי
המשתתפים

5 קבוצות אתניות
מיוצג במערך הנתונים

אספקה ​​בשלבים: 4 קבוצות של 6,250 סרטונים כל אחד

מאפייני מטא-נתונים: 12 פרמטרים מרכזיים לשימושיות משופרת של מערך הנתונים

היקף ערכת נתונים ביומטרית נגד זיוף

אצור מערך נתונים: הפרויקט התמקד באספקת מערכי וידאו באיכות גבוהה נגד זיוף המורכבים מ סרטוני תקיפה אמיתיים והפעלה חוזרת. היבטים מרכזיים כללו:

  • המשתתפים 12,500 תורם שני סרטונים כל אחד (1 אמיתי, 1 מזויף).
  • גיוון במכשירי הקלטה כדי לשפר את יכולת הסתגלות המודל.
  • ייצוג אתני מאוזן כדי להבטיח הכללת מערך הנתונים.

איסוף מטא נתונים: כל סרטון היה מלווה ב 12 תכונות מטא נתונים כדי לשפר את השימושיות של מערך הנתונים.

אתגרי איסוף נתוני וידאו

ייצוג שווה

שמירה על הפצת נתונים מאוזנת מבחינה אתנית תוך רכישת סרטונים באיכות גבוהה.

בקרת איכות

הבטחה שכל משתתף תורם סרטון התקפה אמיתי אחד וסרטון חוזר אחד כדי לשמור על שלמות מערך הנתונים.

עקביות טכנית

הקפדה על הנחיות קפדניות עבור FPS (≥ 26), רזולוציה (≥ 720p), ודיוק חותמת זמן (+/- 0.5ms).

איך פתרנו את זה

שייפ סיפקה מערך נתונים מובנה ואיכותי שיעמוד בדרישות הפרויקט. הפתרון כלל:

אצור מערכי נתונים ובקרת איכות

  • 25,000 קטעי וידאו שנאספו על פני שלבי 4 כדי להבטיח זרימת נתונים יציבה ומובנית, תוך הימנעות צווארי בקבוק.
  • תהליך אימות קפדני כדי להבטיח עמידה ב FPS, רזולוציה ודיוק מטא נתונים. כל סרטון עבר בדיקות איכות מרובות לפני הקבלה הסופית.
  • תיוג מטא נתונים מקיף עם 12 תכונות:
  • מזהה/שם קובץ
  • סוג ההתקפה (אמיתי/שידור חוזר)
  • מזהה אדם
  • רזולוציה וידאו
  • משך הסרטון
  • מוצא אתני של הנבדק
  • מגדר הנושא
  • בין אם הסרטון מקורי או מזויף
  • שם מכשיר/דגם
  • אדם מדבר או לא
  • שעת התחלה של חותמת זמן
  • שעת סיום חותמת זמן
  • התפלגות קבוצות אתניות מאוזנת: מערך הנתונים אוצר בקפידה כדי לשמור על ייצוג אתני מאוזן. התפלגות כוללת אוכלוסיות היספאניות (33%), דרום אסיה (21%), קווקזיות (20%), אפריקניות (15%) ואוכלוסיות מזרח אסיה והמזרח התיכון (כל אחת מהן כוללת עד 6%).
  • אין ערכים כפולים כדי לשמור על ייחודיות מערך הנתונים ולמנוע הטיות באימון AI.
  • בחירת משתתפים מגוונת מבחינה אתנית ליצור מערך נתונים המשקף וריאציות משתמש בעולם האמיתי, לשפר את יכולת הסתגלות והגינות של מודל AI.
  • וריאציה של מכשיר הקלטה כללה מספר דגמי סמארטפונים, מצלמות ותנאי תאורה כדי לשפר את חוסנו של הדגם מול הגדרות סביבתיות שונות.

תוֹצָאָה

מערך הווידאו האיכותי והמגוון למניעת זיוף שסיפק Shaip אפשר ללקוח לאמן מודלים של בינה מלאכותית להבדיל במדויק בין סרטוני וידאו אמיתיים למזויפים בתרחישים שונים של אימות ביומטרי. מערך הנתונים תרם ל:

גילוי הונאה

ביצועי AI משופרים בזיהוי התקפות ביומטריות הונאה.

נתוני אימון מגוונים

חיזק את יכולתו של הדגם לזהות התקפות שידור חוזר על פני עדות שונות, מכשירים ותנאים סביבתיים שונים.

בקרת מערכות ותקשורת

מערך הנתונים משמש בסיס לשיפורים והרחבות עתידיים של מודלים נגד זיוף.

מערך הנתונים של שייפ סייע בשיפור המודלים שלנו נגד זיוף מונעי בינה מלאכותית. הגיוון, האיכות והמטא-נתונים המובנים סיפקו בסיס חזק לשיפור זיהוי הונאות במערכות אימות ביומטריות.

5 כוכבים זהובים