מקרה מבחן: אוסף אמירות

סיפק יותר מ-7 מיליון אמירות לבניית עוזרים דיגיטליים רב-לשוניים ב-13 שפות

פיתרון של עולם אמיתי

נתונים המניעים שיחות גלובליות

הצורך באימון אמירה מתעורר מכיוון שלא כל הלקוחות משתמשים במילים או בביטויים המדויקים בזמן אינטראקציה או שואל שאלות לעוזרות הקוליות שלהם בפורמט תסריטאי. לכן יש לאמן יישומי קול ספציפיים על נתוני דיבור ספונטניים. למשל, "איפה נמצא בית החולים הקרוב ביותר?" "מצא בית חולים קרוב אליי" או "האם יש בית חולים בקרבת מקום?" כולם מציינים את אותה כוונת חיפוש אך מנוסחים בצורה שונה.

בעיה

כדי לבצע את מפת הדרכים של הדיבור הדיגיטלית של הלקוחות לשפות עולמיות, הצוות היה צריך לרכוש כמויות גדולות של נתוני אימון עבור מודל הבינה המלאכותית של זיהוי דיבור. הדרישות הקריטיות של הלקוח היו:

רכישת כמויות גדולות של נתוני אימון (הנחיות אמירה של דובר יחיד באורך של לא יותר מ-3-30 שניות) עבור שירותי זיהוי דיבור ב-13 שפות גלובליות
עבור כל שפה, הספק יפיק הודעות טקסט עבור הדוברים להקליט (אלא אם כן
אספקת הלקוח) ותמלל את האודיו שנוצר.
ספק נתוני אודיו ותמלול התבטאויות מוקלטות עם קבצי JSON מתאימים
המכיל את המטא נתונים עבור כל ההקלטות.
הבטח שילוב מגוון של דוברים לפי גיל, מגדר, השכלה ודיאלקט
הבטח שילוב מגוון של סביבות הקלטה לפי מפרטים.
כל הקלטת אודיו תהיה לפחות 16kHz אך רצוי 44kHz

האץ את ה- AI השיחתי שלך
פיתוח אפליקציות ב 100%

"לאחר הערכה של ספקים רבים, הלקוח בחר ב-Shaip בגלל המומחיות שלהם בפרויקטים של AI לשיחות. התרשמנו מיכולת ביצוע הפרויקט של שייפ, מהמומחיות שלהם למקור, לתמלול ולמסור את ההתבטאויות הנדרשות מבלשנים מומחים ב-13 שפות תוך לוחות זמנים קפדניים ובאיכות הנדרשת".

פתרון

עם ההבנה העמוקה שלנו ב-AI בשיחות, עזרנו ללקוח לאסוף, לתמלל ולהערות את הנתונים עם צוות של בלשנים ומערים מומחים כדי להכשיר את חבילת הקול הרב-לשונית המופעלת על ידי בינה מלאכותית.

היקף העבודה של שייפ כלל, בין השאר, רכישת כמויות גדולות של נתוני אימון אודיו לזיהוי דיבור, תמלול הקלטות אודיו במספר שפות עבור כל השפות במפת הדרכים שלנו בשפות Tier 1 ו-Tier 2, ואספקה מתאימה. JSON קבצים המכילים את המטא נתונים. שייפ אסף התבטאויות של 3-30 שניות בקנה מידה תוך שמירה על רמות איכות רצויות הנדרשות להכשרת מודלים של ML לפרויקטים מורכבים.

אודיו שנאסף, תעתיק והוסף: שעות 22,250
שפות נתמכות: 13 (דנית, קוריאנית, ערבית סעודית, הולנדית, סינית יבשתית וטייוואן, צרפתית קנדית, ספרדית מקסיקנית, טורקית, הינדית, פולנית, יפנית, רוסית)
מספר התבטאויות: 7M +
ציר זמן: חודשים 7-8

תוך כדי איסוף אמירות אודיו בתדר 16 קילו-הרץ, הבטחנו שילוב בריא של רמקולים לפי גיל, מין, השכלה ודיאלקטים בסביבות הקלטה מגוונות.

תוֹצָאָה

נתוני האודיו האיכותיים של בלשנים מומחים העצימו את הלקוח לאמן במדויק את מודל זיהוי הדיבור הרב לשוני שלו ב-13 שפות גלובליות ברמה 1 ו-2. עם מערכי אימון בסטנדרט הזהב, הלקוח יכול להציע סיוע דיגיטלי חכם וחזק לפתרון בעיות עתידיות בעולם האמיתי.

המומחיות שלנו

שעות דיבור שנאספו

0 +

צוות אוספי נתונים קוליים

תואם PII

0 %

מספר מגניב

0 +

קבלה ודיוק נתונים

> 0

קהל לקוחות Fortune 500

0 +

משאבים מומלצים

מדריך לקונה

מדריך לקונה: בינה מלאכותית לשיחה

הצ'אטבוט שאיתו שוחחת פועל על מערכת AI מתקדמת לשיחות, מאומנת, נבדקת ונבנית באמצעות טונות של מערכי נתונים של זיהוי דיבור.

בלוג

מדינת AI 2021 לשיחה

האינפוגרפיקה של שיחה AI 2021 מדברת על מה זה AI שיחתי, האבולוציה שלו, הסוגים, שוק ה- AI המשוחח לפי אזור, מקרי שימוש, אתגרים וכו '.

בלוג

3 מכשולים להתפתחות AI מלאת שיחה

שייפ מתחיל את ההתפתחות של AI לשיחה ככלי למעורבות לקוחות בכך שהוא מציע את נתוני האודיו המסומנים הנחוצים ביותר מ- 50 שפות.

יצירת NLP קליני היא משימה קריטית שדורשת מומחיות עצומה בתחום לפתרון. אני יכול לראות בבירור שאתה מקדים את גוגל בכמה שנים בתחום זה. אני רוצה לעבוד איתך ולגדול אותך.

Google, Inc. מְנַהֵל

צוות ההנדסה שלי עבד עם הצוות של שייפ במשך שנתיים ומעלה במהלך פיתוח ממשקי ה- API לדיבור בתחום הבריאות. התרשמנו מהעבודה שנעשתה ב- NLP ספציפי לבריאות ומה הם מסוגלים להשיג באמצעות מערכי נתונים מורכבים.

Google, Inc. ראש הנדסה

ספר לנו כיצד אנו יכולים לעזור ביוזמת ה- AI הבאה שלך.

מקרה מבחן: אוסף אמירות

סיפק יותר מ-7 מיליון אמירות לבניית עוזרים דיגיטליים רב-לשוניים ב-13 שפות

פיתרון של עולם אמיתי

בעיה

פתרון

תוֹצָאָה

המומחיות שלנו

משאבים מומלצים

מדריך לקונה

מדריך לקונה: בינה מלאכותית לשיחה

בלוג

מדינת AI 2021 לשיחה

בלוג

3 מכשולים להתפתחות AI מלאת שיחה

שירותי נתונים AI

התמחות

התעשייה

מוצרים

חברה

משאבים

צור קשר

ספר לנו עוד עליך!

ספר לנו עוד עליך!

ספר לנו עוד עליך!

ספר לנו עוד עליך!

ספר לנו עוד עליך!

ספר לנו עוד עליך!