הַגדָרָה
נתונים סינתטיים הם מידע שנוצר באופן מלאכותי המחקה נתונים מהעולם האמיתי. ניתן ליצור אותם באמצעות סימולציות, GAN או שיטות יצירתיות אחרות.
מטרה
המטרה היא להגדיל או להחליף נתונים אמיתיים כאשר הם נדירים, רגישים או יקרים לאיסוף.
חשיבות
- מגן על הפרטיות על ידי הפחתת התלות במידע אישי.
- מאפשר אימון עבור מקרים נדירים או קשים.
- ייתכן שחסרים את מלוא המורכבות של נתונים מהעולם האמיתי.
- בשימוש גובר בבינה מלאכותית קריטית לבטיחות.
איך זה עובד
- הגדר את מאפייני הנתונים שיש לשכפל.
- השתמש בסימולציה או במודלים גנרטיביים כדי ליצור נתונים.
- אימות נתונים סינתטיים מול התפלגויות אמיתיות.
- השתמש בנתונים סינתטיים בצינורות אימון.
- עקוב אחר פערים בריאליזם.
דוגמאות (העולם האמיתי)
- Waymo: משתמש בסצנות נהיגה סינתטיות לאימון אוטונומי.
- NVIDIA Omniverse: מייצר נתונים תלת-ממדיים סינתטיים עבור רובוטיקה.
- שירותי בריאות: נתוני מטופלים סינתטיים למחקר.
מקורות / קריאה נוספת
- פרסום מיוחד של NIST על נתונים סינתטיים.
- גונקלבס ואחרים. "יצירה והערכה של נתונים סינתטיים". סקרי מחשוב ACM.
- כספת נתונים סינתטית (MIT).
- מהו מידע סינתטי בבינה מלאכותית