מקרה מבחן: אוסף אמירות
סיפק יותר מ-7 מיליון אמירות לבניית עוזרים דיגיטליים רב-לשוניים ב-13 שפות
פיתרון של עולם אמיתי
נתונים המניעים שיחות גלובליות
הצורך באימון אמירה מתעורר מכיוון שלא כל הלקוחות משתמשים במילים או בביטויים המדויקים בזמן אינטראקציה או שואל שאלות לעוזרות הקוליות שלהם בפורמט תסריטאי. לכן יש לאמן יישומי קול ספציפיים על נתוני דיבור ספונטניים. למשל, "איפה נמצא בית החולים הקרוב ביותר?" "מצא בית חולים קרוב אליי" או "האם יש בית חולים בקרבת מקום?" כולם מציינים את אותה כוונת חיפוש אך מנוסחים בצורה שונה.
בעיה
כדי לבצע את מפת הדרכים של הדיבור הדיגיטלית של הלקוחות לשפות עולמיות, הצוות היה צריך לרכוש כמויות גדולות של נתוני אימון עבור מודל הבינה המלאכותית של זיהוי דיבור. הדרישות הקריטיות של הלקוח היו:
- רכישת כמויות גדולות של נתוני אימון (הנחיות אמירה של דובר יחיד באורך של לא יותר מ-3-30 שניות) עבור שירותי זיהוי דיבור ב-13 שפות גלובליות
- עבור כל שפה, הספק יפיק הודעות טקסט עבור הדוברים להקליט (אלא אם כן
אספקת הלקוח) ותמלל את האודיו שנוצר. - ספק נתוני אודיו ותמלול התבטאויות מוקלטות עם קבצי JSON מתאימים
המכיל את המטא נתונים עבור כל ההקלטות. - הבטח שילוב מגוון של דוברים לפי גיל, מגדר, השכלה ודיאלקט
- הבטח שילוב מגוון של סביבות הקלטה לפי מפרטים.
- כל הקלטת אודיו תהיה לפחות 16kHz אך רצוי 44kHz
"לאחר הערכה של ספקים רבים, הלקוח בחר ב-Shaip בגלל המומחיות שלהם בפרויקטים של AI לשיחות. התרשמנו מיכולת ביצוע הפרויקט של שייפ, מהמומחיות שלהם למקור, לתמלול ולמסור את ההתבטאויות הנדרשות מבלשנים מומחים ב-13 שפות תוך לוחות זמנים קפדניים ובאיכות הנדרשת".
פתרון
עם ההבנה העמוקה שלנו ב-AI בשיחות, עזרנו ללקוח לאסוף, לתמלל ולהערות את הנתונים עם צוות של בלשנים ומערים מומחים כדי להכשיר את חבילת הקול הרב-לשונית המופעלת על ידי בינה מלאכותית.
היקף העבודה של שייפ כלל, בין השאר, רכישת כמויות גדולות של נתוני אימון אודיו לזיהוי דיבור, תמלול הקלטות אודיו במספר שפות עבור כל השפות במפת הדרכים שלנו בשפות Tier 1 ו-Tier 2, ואספקה מתאימה. JSON קבצים המכילים את המטא נתונים. שייפ אסף התבטאויות של 3-30 שניות בקנה מידה תוך שמירה על רמות איכות רצויות הנדרשות להכשרת מודלים של ML לפרויקטים מורכבים.
- אודיו שנאסף, תעתיק והוסף: שעות 22,250
- שפות נתמכות: 13 (דנית, קוריאנית, ערבית סעודית, הולנדית, סינית יבשתית וטייוואן, צרפתית קנדית, ספרדית מקסיקנית, טורקית, הינדית, פולנית, יפנית, רוסית)
- מספר התבטאויות: 7M +
- ציר זמן: חודשים 7-8
תוך כדי איסוף אמירות אודיו בתדר 16 קילו-הרץ, הבטחנו שילוב בריא של רמקולים לפי גיל, מין, השכלה ודיאלקטים בסביבות הקלטה מגוונות.
המומחיות שלנו
משאבים מומלצים
מדריך לקונה
מדריך לקונה: בינה מלאכותית לשיחה
הצ'אטבוט שאיתו שוחחת פועל על מערכת AI מתקדמת לשיחות, מאומנת, נבדקת ונבנית באמצעות טונות של מערכי נתונים של זיהוי דיבור.
בלוג
מדינת AI 2021 לשיחה
האינפוגרפיקה של שיחה AI 2021 מדברת על מה זה AI שיחתי, האבולוציה שלו, הסוגים, שוק ה- AI המשוחח לפי אזור, מקרי שימוש, אתגרים וכו '.
בלוג
3 מכשולים להתפתחות AI מלאת שיחה
שייפ מתחיל את ההתפתחות של AI לשיחה ככלי למעורבות לקוחות בכך שהוא מציע את נתוני האודיו המסומנים הנחוצים ביותר מ- 50 שפות.
ספר לנו כיצד אנו יכולים לעזור ביוזמת ה- AI הבאה שלך.