הַגדָרָה
נתונים לא מובנים הם מידע שאינו פועל לפי סכמה מוגדרת מראש, כגון טקסט חופשי, תמונות, וידאו או אודיו.
מטרה
המטרה היא ללכוד מידע מורכב מהעולם האמיתי, שלא ניתן לייצג בטבלאות מובנות.
חשיבות
- מייצג את רוב הנתונים שנוצרים כיום.
- מאפשר יישומי בינה מלאכותית מתקדמים בתחומי הראייה, הדיבור וה-NLP.
- קשה לעבד ולנתח ללא בינה מלאכותית.
- מעלה אתגרי אחסון וניהול.
איך זה עובד
- איסוף נתונים לא מובנים ממקורות (מדיה חברתית, מצלמות, חיישנים).
- אחסן בפורמטים כמו JSON, מולטימדיה או יומני רישום גולמיים.
- השתמשו במודלים של בינה מלאכותית כדי לחלץ משמעות.
- המרה לייצוגים מובנים במידת האפשר.
- שימוש בניתוח נתונים וקבלת החלטות במורד הזרם.
דוגמאות (העולם האמיתי)
- פוסטים ברשתות חברתיות המשמשים לניתוח מגמות.
- הדמיה רפואית לאבחון.
- יומני צ'אט של תמיכת לקוחות.
מקורות / קריאה נוספת
- מסגרת יכולת פעולה הדדית של ביג דאטה של NIST.
- תקני ביג דאטה ISO/IEC TR 20547.
- דו"ח היקום הדיגיטלי של EMC/IDC.
- נתונים מובנים ולא מובנים