מקרה מבחן: אוסף אמירות

סיפק יותר מ-7 מיליון אמירות לבניית עוזרים דיגיטליים רב-לשוניים ב-13 שפות

אוסף אמירות

פיתרון של עולם אמיתי

נתונים המניעים שיחות גלובליות

הצורך באימון אמירה מתעורר מכיוון שלא כל הלקוחות משתמשים במילים או בביטויים המדויקים בזמן אינטראקציה או שואל שאלות לעוזרות הקוליות שלהם בפורמט תסריטאי. לכן יש לאמן יישומי קול ספציפיים על נתוני דיבור ספונטניים. למשל, "איפה נמצא בית החולים הקרוב ביותר?" "מצא בית חולים קרוב אליי" או "האם יש בית חולים בקרבת מקום?" כולם מציינים את אותה כוונת חיפוש אך מנוסחים בצורה שונה.

אוסף אמירות 1

בעיה

כדי לבצע את מפת הדרכים של הדיבור הדיגיטלית של הלקוחות לשפות עולמיות, הצוות היה צריך לרכוש כמויות גדולות של נתוני אימון עבור מודל הבינה המלאכותית של זיהוי דיבור. הדרישות הקריטיות של הלקוח היו:

  • רכישת כמויות גדולות של נתוני אימון (הנחיות אמירה של דובר יחיד באורך של לא יותר מ-3-30 שניות) עבור שירותי זיהוי דיבור ב-13 שפות גלובליות
  • עבור כל שפה, הספק יפיק הודעות טקסט עבור הדוברים להקליט (אלא אם כן
    אספקת הלקוח) ותמלל את האודיו שנוצר.
  • ספק נתוני אודיו ותמלול התבטאויות מוקלטות עם קבצי JSON מתאימים
    המכיל את המטא נתונים עבור כל ההקלטות.
  • הבטח שילוב מגוון של דוברים לפי גיל, מגדר, השכלה ודיאלקט
  • הבטח שילוב מגוון של סביבות הקלטה לפי מפרטים.
  • כל הקלטת אודיו תהיה לפחות 16kHz אך רצוי 44kHz

האץ את ה- AI השיחתי שלך
פיתוח אפליקציות ב 100%

"לאחר הערכה של ספקים רבים, הלקוח בחר ב-Shaip בגלל המומחיות שלהם בפרויקטים של AI לשיחות. התרשמנו מיכולת ביצוע הפרויקט של שייפ, מהמומחיות שלהם למקור, לתמלול ולמסור את ההתבטאויות הנדרשות מבלשנים מומחים ב-13 שפות תוך לוחות זמנים קפדניים ובאיכות הנדרשת".

פתרון

עם ההבנה העמוקה שלנו ב-AI בשיחות, עזרנו ללקוח לאסוף, לתמלל ולהערות את הנתונים עם צוות של בלשנים ומערים מומחים כדי להכשיר את חבילת הקול הרב-לשונית המופעלת על ידי בינה מלאכותית.

היקף העבודה של שייפ כלל, בין השאר, רכישת כמויות גדולות של נתוני אימון אודיו לזיהוי דיבור, תמלול הקלטות אודיו במספר שפות עבור כל השפות במפת הדרכים שלנו בשפות Tier 1 ו-Tier 2, ואספקה ​​מתאימה. JSON קבצים המכילים את המטא נתונים. שייפ אסף התבטאויות של 3-30 שניות בקנה מידה תוך שמירה על רמות איכות רצויות הנדרשות להכשרת מודלים של ML לפרויקטים מורכבים.

  • אודיו שנאסף, תעתיק והוסף: שעות 22,250
  • שפות נתמכות: 13 (דנית, קוריאנית, ערבית סעודית, הולנדית, סינית יבשתית וטייוואן, צרפתית קנדית, ספרדית מקסיקנית, טורקית, הינדית, פולנית, יפנית, רוסית)
  • מספר התבטאויות: 7M +
  • ציר זמן: חודשים 7-8

חבילת קול רב לשונית המופעלת על ידי Ai

תוך כדי איסוף אמירות אודיו בתדר 16 קילו-הרץ, הבטחנו שילוב בריא של רמקולים לפי גיל, מין, השכלה ודיאלקטים בסביבות הקלטה מגוונות.

תוֹצָאָה

נתוני האודיו האיכותיים של בלשנים מומחים העצימו את הלקוח לאמן במדויק את מודל זיהוי הדיבור הרב לשוני שלו ב-13 שפות גלובליות ברמה 1 ו-2. עם מערכי אימון בסטנדרט הזהב, הלקוח יכול להציע סיוע דיגיטלי חכם וחזק לפתרון בעיות עתידיות בעולם האמיתי.

נתוני שמע אמירה באיכות גבוהה

המומחיות שלנו

שעות דיבור שנאספו
0 +
צוות אוספי נתונים קוליים
0
תואם PII
0 %
מספר מגניב
0 +
קבלה ודיוק נתונים
> 0
קהל לקוחות Fortune 500
0 +

ספר לנו כיצד אנו יכולים לעזור ביוזמת ה- AI הבאה שלך.