ניתוח רגש וסנטימנט דיבור

הפעלת מוקדי טלפון חכמים יותר עם תובנות מונעות בינה מלאכותית

מינוף המומחיות של שייפ באיסוף נתוני אודיו והערות כדי לשפר את זיהוי הרגשות והרגשות בזמן אמת לשיפור שירות הלקוחות.

ניתוח רגש וסנטימנט דיבור

ניתוח רגש וסנטימנט דיבור אוטומטי

הלקוח שיתף פעולה עם שייפ לפיתוח מודל אוטומטי של ניתוח רגש וסנטימנט דיבור למוקדים טלפוניים. הפרויקט כלל איסוף והערות של 250 שעות של נתוני אודיו של מוקד טלפוני על פני ארבעה ניבים באנגלית - ארה"ב, בריטניה, אוסטרליה והודית. זה אפשר ללקוח לשפר את מודל הבינה המלאכותית שלו לזיהוי רגשות כמו שמח, ניטרלי וכועס, וסנטימנטים כמו לא מרוצה ומרוצה באינטראקציות עם לקוחות בזמן אמת.

הפרויקט התגבר על אתגרים כמו זיהוי סרקזם, אורכי אודיו משתנים ורמזים מילוליים עדינים של חוסר שביעות רצון, והספק תוצאות מדויקות וניתנות להרחבה.

ניתוח רגש וסנטימנט דיבור אוטומטי

סטטיסטיקות מפתח

נתוני אודיו של מוקד טלפוני שנאספו והוסרו על פני 4 ניבים באנגלית

250 שעות

מספר שפות

אנגלית בארה"ב, אנגלית בבריטניה, אנגלית אוסטרלית ואנגלית הודית

השתמש במקרים

ניתוח רגש וסנטימנט דיבור אוטומטי

היקף הפרויקט

אספו והערו 250 שעות של נתוני אודיו של מוקד טלפוני בארבעה דיאלקטים של אנגלית:

  • אנגלית אמריקאית (30%)
  • אנגלית בבריטניה (30%)
  • אנגלית אוסטרלית (20%)
  • אנגלית הודית (20%)

בהיקף

הפרויקט מורכב משלושה חלקים:

  • נתוני אודיו עם ישויות ספציפיות, כולל מטא נתונים.
  • קבצים מתומללים תואמים עם פירוט פילוח והחתמת זמן.
  • הערות רגשות וסנטימנטים:
    • רגש אודיו: שמח, ניטרלי, כועס
    • סנטימנט תמלול: מאוד לא מרוצה, לא מרוצה, ניטרלי, מרוצה, מרוצה במיוחד

אתגרים

מגוון דיאלקטים

להבטיח שנתוני האודיו מייצגים במדויק את הניבים שצוינו (ארה"ב, בריטניה, אוסטרליה והודית) יכולה להיות מאתגרת. אזורים שונים בתוך קטגוריות אלה עשויים להשתמש באוצר מילים, מבטאים והגייה מגוונים.

דרישת מומחיות

הערות אודיו ותעתיקים עבור רגשות וסנטימנטים דורשים מפרשים מאומנים המכירים את הניואנסים התרבותיים והדקויות הלשוניות של כל ניב.

מורכבות של רגשות ותחושות

רגש אודיו וסנטימנט לתמלול לא תמיד מתאימים. לדוגמה, אדם עשוי להישמע כועס אך למעשה להביע סיפוק. למשל, טיפול בשיחות סרקזם בביטויים סרקסטיים כמו "אוי, נפלא, עוד אדם שלא יכול לפתור את הבעיה שלי" צריך להיות מובא כראוי עבור רגש וסנטימנט.

איכות שמע

איכות הקלטות האודיו עשויה להשתנות, ולהשפיע על דיוק התמלול וזיהוי הרגשות. רעשי רקע, שיחות חופפות וציוד הקלטה משתנה יכולים להוות אתגרים משמעותיים.

לכידה מדויקת

חוסר שביעות רצון באמצעות סימנים מילוליים כמו נשיפות כבדות או סימנים אחרים של תסכול.

פתרון

תוך מינוף טכניקות מתקדמות של עיבוד שפה טבעית (NLP), יושמו הפתרונות הבאים:

איסוף נתונים

  • 250 שעות של נתוני אודיו מפוצלים למכסות ספציפיות לדיאלקט.
    • אנגלית אמריקאית (30% או 75 שעות)
    • אנגלית בבריטניה (30% או 75 שעות)
    • אנגלית אוסטרלית (20% או 50 שעות)
    • אנגלית הודית (20% או 50 שעות)
  • משתמשי מבטא מקומיים מארה"ב, בריטניה, אוסטרליה והודו.
  • דגימות דיבור המכילות גוונים משתנים, עם התמקדות מיוחדת במקרים שבהם רגש הקול כועס וסנטימנט הטקסט אינו מרוצה או מאוד לא מרוצה.

סיווג טקסט/ביאור

סיווג טקסט

  • ביאור של רגשות ותחושות על סמך קטגוריות ספציפיות:
    • רגש אודיו: שמח, ניטרלי, כועס.
    • סנטימנט תמלול: מאוד לא מרוצה, לא מרוצה, ניטרלי, מרוצה, מאוד מרוצה.
  • כל קטע שמע הכיל רק רגש ראשוני אחד.
  • קטעי עיכוב משתנים (מ-2 עד 30 שניות) הוחלו בתוך שיחות.
  • פורמט התמלול עקב אחר פלט JSON, כולל מידע על הרמקול השמאלי והימני, תגי סנטימנט וסנטימנט מקטע אחרון.

 

בקרת איכות

בקרת איכות
דיוק תמלול:

  • ודא ש-250 שעות אודיו נמסרו עם מינימום של:
    • דיוק של 90% שיעור שגיאות תמלול (TER).
    • דיוק של 95% שיעור זיהוי מילים (WER).

תהליך QA:

  • נערכו ביקורות סדירות של דגימות שנבחרו באקראי מתוך מערך הנתונים.
    • השתמש בכלים אוטומטיים למדידת TER ו-WER על פני מערך הנתונים.
    • סקירה ידנית של קטעים מסומנים הבטיחה עמידה בספי הדיוק.

התוצאה

נתוני האימון יתמכו בפיתוח של מודל אוטומטי לזיהוי רגשות וסנטימנטים, המספק:

  • זיהוי רגשות בזמן אמת באינטראקציות טלפוניות.
  • טיפול יעיל יותר במקרים מורכבים, כגון ציניות או חוסר שביעות רצון.
  • מדרגיות לפרויקטים עתידיים, התאמה בקלות לנפחי נתונים גדלים ולשפות נוספות.

תוצרים

  • 250 שעות של קובצי אודיו (בפורמט 8 קילו-הרץ PCM WAV, מונו)
  • קבצי תמלול (עם פילוח, תגי סנטימנט ומזהי דובר)
  • מטא נתונים (משך שמע, פרטי דובר וכו')

שיתוף הפעולה עם Shaip עבור פרויקט הנתונים הטלפוני שלנו היה רגע מרכזי בקידום פתרונות הבינה המלאכותית שלנו. הצוות שלהם אסף והביא הערות מומחיות ל-250 שעות של נתוני אודיו על פני ארבעה ניבים מרכזיים באנגלית - ארה"ב, בריטניה, אוסטרליה והודית - מה שמבטיח את האיכות והדיוק הגבוהים ביותר. תשומת הלב לניואנסים הלשוניים באזורים אלה שיפרה משמעותית את הדיוק של מודלים לזיהוי הדיבור שלנו. בנוסף, המומחיות של שייפ בטיפול בפרויקטים מורכבים של הערות נתונים, סייעה לנו לבנות מודלים אמינים ותואמים בקנה מידה.

5 כוכבים זהובים