מקרה מבחן: אוסף אמירות

פיתרון של עולם אמיתי
נתונים המניעים שיחות גלובליות
הצורך באימון אמירה מתעורר מכיוון שלא כל הלקוחות משתמשים במילים או בביטויים המדויקים בזמן אינטראקציה או שואל שאלות לעוזרות הקוליות שלהם בפורמט תסריטאי. לכן יש לאמן יישומי קול ספציפיים על נתוני דיבור ספונטניים. למשל, "איפה נמצא בית החולים הקרוב ביותר?" "מצא בית חולים קרוב אליי" או "האם יש בית חולים בקרבת מקום?" כולם מציינים את אותה כוונת חיפוש אך מנוסחים בצורה שונה.

בעיה
כדי לבצע את מפת הדרכים של הדיבור הדיגיטלית של הלקוחות לשפות עולמיות, הצוות היה צריך לרכוש כמויות גדולות של נתוני אימון עבור מודל הבינה המלאכותית של זיהוי דיבור. הדרישות הקריטיות של הלקוח היו:
- רכישת כמויות גדולות של נתוני אימון (הנחיות אמירה של דובר יחיד באורך של לא יותר מ-3-30 שניות) עבור שירותי זיהוי דיבור ב-13 שפות גלובליות
- עבור כל שפה, הספק יפיק הודעות טקסט עבור הדוברים להקליט (אלא אם כן
אספקת הלקוח) ותמלל את האודיו שנוצר. - ספק נתוני אודיו ותמלול התבטאויות מוקלטות עם קבצי JSON מתאימים
המכיל את המטא נתונים עבור כל ההקלטות. - הבטח שילוב מגוון של דוברים לפי גיל, מגדר, השכלה ודיאלקט
- הבטח שילוב מגוון של סביבות הקלטה לפי מפרטים.
- כל הקלטת אודיו תהיה לפחות 16kHz אך רצוי 44kHz
האץ את פיתוח אפליקציית הבינה המלאכותית שלך ב-Conversational ב-100%
"לאחר הערכה של ספקים רבים, הלקוח בחר ב-Shaip בגלל המומחיות שלהם בפרויקטים של AI בדיבור. התרשמנו מיכולת ביצוע הפרויקט של שייפ, מהמומחיות שלהם למקור, לתמלול ולמסור את ההתבטאויות הנדרשות מבלשנים מומחים ב-13 שפות תוך לוחות זמנים קפדניים ובאיכות הנדרשת".
פתרון
עם ההבנה העמוקה שלנו ב-AI בשיחות, עזרנו ללקוח לאסוף, לתמלל ולהערות את הנתונים עם צוות של בלשנים ומערים מומחים כדי להכשיר את חבילת הקול הרב-לשונית המופעלת על ידי בינה מלאכותית.
היקף העבודה של שייפ כלל, בין השאר, רכישת כמויות גדולות של נתוני אימון אודיו לזיהוי דיבור, תמלול הקלטות אודיו במספר שפות עבור כל השפות במפת הדרכים שלנו בשפות Tier 1 ו-Tier 2, ואספקה מתאימה. JSON קבצים המכילים את המטא נתונים. שייפ אסף התבטאויות של 3-30 שניות בקנה מידה תוך שמירה על רמות איכות רצויות הנדרשות להכשרת מודלים של ML לפרויקטים מורכבים.
- אודיו שנאסף, תעתיק והוסף: שעות 22,250
- שפות נתמכות: 13 (דנית, קוריאנית, ערבית סעודית, הולנדית, סינית יבשתית וטייוואן, צרפתית קנדית, ספרדית מקסיקנית, טורקית, הינדית, פולנית, יפנית, רוסית)
- מספר התבטאויות: 7M +
- ציר זמן: חודשים 7-8
תוך כדי איסוף אמירות אודיו בתדר 16 קילו-הרץ, הבטחנו שילוב בריא של רמקולים לפי גיל, מין, השכלה ודיאלקטים בסביבות הקלטה מגוונות.
המומחיות שלנו
משאבים מומלצים
מדריך לקונה
מדריך לקונה: בינה מלאכותית לשיחה
הצ'אטבוט שאיתו שוחחת פועל על מערכת AI מתקדמת לשיחות, מאומנת, נבדקת ונבנית באמצעות טונות של מערכי נתונים של זיהוי דיבור.
בלוג
מדינת AI 2025 לשיחה
האינפוגרפיקה של שיחה AI 2025 מדברת על מה זה AI שיחתי, האבולוציה שלו, הסוגים, שוק ה- AI המשוחח לפי אזור, מקרי שימוש, אתגרים וכו '.
בלוג
איך סירי ואלכסה מבינות מה אתה אומר?
עוזרי קול עשויים להיות הקולות המגניבים האלה, בעיקר נשיים, שמגיבים לבקשות שלך למצוא את המסעדה הקרובה ביותר או את הדרך הקצרה ביותר לקניון.
ספר לנו כיצד אנו יכולים לעזור ביוזמת ה- AI הבאה שלך.