בניית מערך נתונים של תמונות פנים מחוץ לאיחוד האירופי/בריטניה עם גיוון בהתקדמות גיל
קורפוס תמונות פנים מופרד בזמן של 1,205 משתתפים לחיזוק ההגינות והחוסן של מודלים של ראייה ממוחשבת.
סקירת הפרויקט
חברת טכנולוגיה גלובלית שבונה בינה מלאכותית ממוקדת פנים עבור חוויות בטיחות, התאמה אישית וזהות, חיפשה מערך נתונים שאינו מהאיחוד האירופי/בריטניה עם תמונות מופרדות בזמן כדי להפחית הטיה ולשפר את חוסן המודלים על פני גיל, סביבה ואביזרים.
הלקוח שיתף פעולה עם שייפ כדי לאסוף, לאצור ולאמת קורפוס תמונות פנים גדול שבו כל משתתף תורם תמונות עדכניות וישנות יותר. המטרה הייתה לקודד התקדמות גיל טבעית תוך אכיפת מקור נוקשה שאינו מהאיחוד האירופי/בריטניה והשגת מכסות מגדר/גיל מאוזנות.
סטטיסטיקות מפתח
משתתף
1,205 (לא מהאיחוד האירופי/בריטניה בלבד, יחס מגדר 50/50 ±10–15%)
תמהיל גילאים
40% (10–29), 40% (30–49), 20% (50+) ±10–15% סובלנות
סיקור
דרום/דרום מזרח אסיה, צפון וצפון/מזרח אפריקה, סינגפור, דרום אמריקה
ציר זמן
שבועות 19
אתגרים
הגבלה גיאוגרפית
מקורות אך ורק מאוכלוסיות שאינן מהאיחוד האירופי/בריטניה תוך הימנעות מתמונות שמקורן בנסיעות מהאיחוד האירופי/בריטניה.
מכסות מאוזנות בקנה מידה גדול
מגיעים ל-1,205 משתתפים עם סבילות מגדריות וגילאים הדוק.
ראיות מופרדות בזמן
וידוא שכל תעודת זהות כוללת תמונות עדכניות ותמונות היסטוריות, בהתאם לקבוצות גיל.
איכות תפעולית
אכיפת מגבלות גודל מינימלי של תמונה/פנים, מגוון ושכפול מבלי להאט את התפוקה.
פתרון
1. פאנלים של מדינות ובקרות מקור
הקמנו תרמילי רכש ברמה הארצית ברחבי אזורי היעד ושותפים שהוכשרו בנושא כללי מקור (לא למדינות האיחוד האירופי/בריטניה בלבד). התמונות נבדקו לאיתור סיכוני מקור בנסיעות באמצעות רמזים למטא-דאטה (שנה, סמני מיקום) בנוסף לאימות מגישי הבדיקות, מה שמפחית דליפות מהאיחוד האירופי/בריטניה לפני בקרת איכות. זה משקף את הנוהג המוכח של שייפ לטעון מראש בדיקות סיכונים כדי להגן על התפוקה במורד הזרם.
2. עיצוב לכידת התקדמות גיל
במקום "לבקש 20 תמונות", עיצבנו זרימת הגשה בשני מסלולים אשר הובילה את המשתתפים ל:
- רצועה א' (עדכנית): תמונות מהשנתיים האחרונות;
- מסלול ב' (היסטורי): תמונות ישנות יותר התואמות לקבוצת הגיל של המשתתף בעת ההגשה (למשל, חלונות שנים 2–10/15/20).
הפורטל דחף את המשתמשים עם דוגמאות (פנימי/חיצוני, זוויות, אביזרים) כדי להגביר את הגיוון מבלי לפרט יותר מדי.
3. תזמור גיוון ומעקות בטיחות למכסות
A לוח מחוונים למכסה בזמן אמת הרשמות מנוטרות על ידי מין, טווח גיל וגיאוגרפיה, עצירת הצריכה לאחר ששכבה הגיעה לגבולות המתוכננים. זה מנע עיבוד מחדש בשלב מאוחר של המחזור ומשקף את הגישה הסטנדרטית של שייפ הרשמה מרובדת + נעילה השתמשו במערכי נתונים ביומטריים קודמים כדי לשמור על ייצוג מאוזן.
4. צינור איכות (אנושי בלולאה + בדיקות מקדימות אוטומטיות)
- שערים אוטומטיים: זיהוי פנים + ספי גודל מינימליים, בדיקות טשטוש/רעש בסיסיות, וקיבול באותו היום כדי לסמן כפילויות פוטנציאליות מוקדם.
- רמות אבטחת איכות אנושיות: בודקים ברמת התמונה מאומתים בלעדיות נושא (למשתתף ראשי בלבד), מגוון סצנות/זווית, ו אין פילטרים ליופימבקרי CQA ביצעו בדיקות נקודתיות של אצוות לפני קבלתן. אבטחת איכות רב-שכבתית משקף את תוכניות הנתונים הביומטריים שפורסמו על ידי שייפ.
5. תאימות והסכמה
הרשמה ≥20 שנה עם הסכמה חתומה; מתחת ל-20 מקרים התקבלו רק עם הסכמת האפוטרופוס. תיעדנו את נוכחות ההסכמה במטא-דאטה ויישמנו את רשימות הביקורת של הבודקים כדי זכאות + הסכמה שדות, תוך הבטחת יכולת ביקורת.
6. מטא-דאטה ומעקב אחר נתונים
הספקנו מטא-נתונים ברמת המשתתף והתמונה (קישורי זיהוי, נתונים דמוגרפיים, לאום/מגורים, שנת הצילום, תאריך הגשה וכו') ושמות שדות סטנדרטיים לפישוט תיוג והערכה במורד הזרםזה עוקב אחר הנוהג המומלץ של שייפ תיוג מטא-נתונים עשיר עבור מערכי נתונים ביומטריים.
7. אספקה בשלבים לסולם דה-סיכון
An תוכנית 8 קבוצות התחיל עם כיול של 10 משתתפים קבוצה, ולאחר מכן הגדלה מבוקרת. משוב הלקוח לאחר קבוצה 1 סיפק שינויים ברובריקה, ולאחר מכן הנפחים הוגדלו במנות צפויות כדי להגיע המשתתפים 1,205 בעוד ~19 שבועות.
היקף הפרויקט
| מֵמַד | מה שסיפקנו |
|---|---|
| אוכלוסיה | 1,205 משתתפים שאינם מהאיחוד האירופי/בריטניה עם טווחי מגדר וגיל מאוזנים. |
| תוֹכֶן | ≥20 תמונות למשתתף: תמונות עדכניות + תמונות היסטוריות לקידוד התקדמות גיל; סצנות, זוויות ואביזרים מגוונים. |
| פעולות איכותיות | בדיקות מקדימות אוטומטיות + בקרת איכות רב-שכבתית אנושית (בקרות כפילויות; בלעדיות נושא; דחיית סינון). |
| מענה לארועים | אימות מקור שאינו האיחוד האירופי/בריטניה; ניהול הסכמה ואימות זכאות. |
| מידע נוסף | מאפייני משתתף + תמונה לצורך עקיבות והערכת למידה במהרה. |
| מסירה | 8 קבוצות בשלבים, החל מכיול ולאחר מכן אספקה במצב יציב עד ליעד הסופי. |
התוצאה
- קורפוס מאוזן ומוכן לביקורת: מכסות דמוגרפיות עמדו במסגרת הסבילות; מקור שאינו מהאיחוד האירופי/בריטניה נאכף בכל התמונות לצורך הדרכה תואמת.
- שונות מוכנה למודל: תמונות מופרדות בזמן, סביבות/זוויות מגוונות וכיסוי אביזרים תומכים בבדיקות חוסן ובניתוח הטיה.
- חיזוי תפעולי: פריסת הכיול הראשונה + מעקות בטיחות למכסה צמצמו את העבודה החוזרת וקיצצו את לוח הזמנים ליעד המלא של 1,205 משתתפים.
- יעילות במורד הזרם: מטא-דאטה עשיר והיגיינת קבצים עקבית קיצרו את הדרך לבניית ביאורים וביצועי ביצועים, בהתאם לספרי ההפעלה של שייפ לנתוני מערך הנתונים הביומטריים.
שייפ הפך תקציר סט נתונים מורכב של תווי פנים מחוץ לאיחוד האירופי/בריטניה לקורפוס מאוזן ומוכן לביקורת. עיצוב התקדמות הגיל שלהם ואבטחת האיכות המדורגת סיפקו לצוות קורות החיים שלנו נתונים נקיים ומגוונים שיכולנו לסמוך עליהם - ללא סיכון לוח זמנים.