הַגדָרָה
הסרת זיהוי נתונים היא תהליך של הסרה או מיסוך של מידע אישי מזהה (PII) ממערכי נתונים כך שלא ניתן יהיה לזהות אנשים בקלות. הטכניקות כוללות אנונימיזציה ופסודנונימיזציה.
מטרה
המטרה היא להגן על הפרטיות תוך מתן אפשרות לשימוש בנתונים לניתוח, מחקר ואימון מודלים של בינה מלאכותית. הדבר מבטיח עמידה בחוקים כמו GDPR ו-HIPAA.
חשיבות
- מפחית את הסיכון להפרות פרטיות.
- נדרש לצורך עמידה בתקנות.
- מאזן בין תועלת נתונים לבין סודיות.
- זיהוי לא מלא עלול להוביל לסיכוני זיהוי חוזר.
איך זה עובד
- זיהוי אמצעי זיהוי אישיים (שמות, כתובות, נתונים ביומטריים).
- יש להשתמש בטכניקות כמו מיסוך, הכללה או הצפנה.
- ודא שהסיכון לזיהוי חוזר ממוזער.
- לתעד את תהליך הביקורת.
- אחסן ושתף נתונים לא מזוהים בצורה מאובטחת.
דוגמאות (העולם האמיתי)
- מערכי נתונים של שירותי בריאות הוסרו למטרות מחקר רפואי.
- iOS של אפל: מחיל פרטיות דיפרנציאלית עבור ניתוח נתונים של משתמשים.
- לשכת מפקד האוכלוסין של ארה"ב: משתמשת בשיטות להסרת זיהוי עבור נתוני אוכלוסייה.
מקורות / קריאה נוספת
- פרסום מיוחד 800-188 של NIST: ביטול זיהוי נתונים.
- ISO/IEC 20889: שיפור פרטיות והסרת זיהוי נתונים.
- הנחיות GDPR בנושא אנונימיזציה - המועצה האירופית להגנת מידע.
- פתרונות לזיהוי נתוני אנונימיזציה ונתונים