הַגדָרָה
נתוני אימון צ'אטבוט מורכבים משיחות לדוגמה, כוונות ותגובות המשמשות לאימון מערכות בינה מלאכותית לשיחות. הם עשויים לכלול שאלות נפוצות, תמלולים וזרימות דיאלוג מתויגות.
מטרה
המטרה היא לספק דוגמאות שיעזרו לצ'אטבוטים להבין את קלט המשתמש וליצור תשובות מתאימות. זה מבטיח ביצועים אמינים בשיחות בעולם האמיתי.
חשיבות
- קובע את הדיוק והטבעיות של תגובות הצ'אטבוט.
- נתוני אימון באיכות ירודה גורמים לתשובות לא רלוונטיות או שגויות.
- יש לעדכן באופן שוטף כדי לשקף שפה ומגמות חדשות.
- עשויה להיות חפיפה עם מערכי נתונים של זיהוי כוונות ו-NLU.
איך זה עובד
- אסוף דיאלוגים, שאלות נפוצות ותמלילי תמיכה.
- תייג נתונים עם כוונות וישויות.
- פיצול לקבוצות אימון ותיקוף.
- אימון מודלים של צ'אטבוטים באמצעות למידה מפוקחת או כוונון עדין.
- בדיקת ביצועים באמצעות שאילתות של משתמשים מהעולם האמיתי.
דוגמאות (העולם האמיתי)
- Microsoft Bot Framework: אומן על נתוני צ'אט ספציפיים לדומיין.
- Google Dialogflow: משתמש בכוונות וישויות מוערות לצורך אימון.
- כוונון עדין של OpenAI ChatGPT: אומן על שיחות שנבחרו.
מקורות / קריאה נוספת
- בניית צ'אטבוטים - הרצאות סטנפורד CS224U.
- נתוני אימון בינה מלאכותית עבור צ'אטבוט
- אתגר מעקב אחר מצב הדיאלוג (DSTC) — מחקר של מיקרוסופט.
- מודלים של בינה מלאכותית לשיחה עם פרצוף מחבק - פרצוף מחבק.