ביטוי מפתח/בקשות אוסף אודיו

תיאור מקרה: אוסף משפטי מפתח עבור מערכות מופעלות קול ברכב

אוסף משפטי מפתח

יש ביקוש הולך וגובר למערכות המופעלות קוליות ברכב בתעשיית הרכב, מה שמגדיר מחדש את האופן שבו אנו מתקשרים עם כלי הרכב הניידים שלנו.

תעשיית הרכב אימצה במהירות מערכות מופעלות קול, כאשר שחקנים גדולים כמו פורד, טסלה וב.מ.וו משלבים זיהוי קולי מתקדם בכלי הרכב שלהם. עד 2022, הוערך כי למעלה מ-50% מהמכוניות החדשות כללו יכולות זיהוי קולי. האינטגרציות הללו מטרתן לשפר את הבטיחות, ולאפשר לנהגים להפעיל פונקציות ניווט, בידור ותקשורת ללא הסחות דעת.

שווי השוק של זיהוי קולי במכוניות צפוי לעלות על מיליארד דולר עד 1, מה שמצביע על ביקוש הולך וגובר לאינטראקציות אינטליגנטיות ברכב ללא ידיים.

כלי רכב

מחקרים מראים שעד 2022, 73% מהנהגים ישתמשו בעוזרת קולית ברכב.

שוק מערכות הזיהוי הקולי לרכב הוערך ב-2.01 מיליארד דולר בשנת 2021, וצפוי להגיע ל-3.51 מיליארד דולר עד 2027, לרשום CAGR של כ-8.07%.

פיתרון של עולם אמיתי

נתונים המניעים מערכות מופעלות קול

מערכות המופעלות באמצעות קול במכוניות משפרות את הבטיחות והנוחות. הם מאפשרים לנהגים לגשת לניווט, לבצע שיחות, לשלוח הודעות טקסט ולשלוט במוזיקה מבלי להוריד את הידיים מההגה או את העיניים מהכביש. על ידי תגובה לפקודות מילוליות, מערכות אלו מפחיתות את הסחת הדעת, מקדמות ריבוי משימות ומבטיחות התמקדות מתמשכת בנהיגה. 

הלקוח הוא מוביל עולמי בתחום מודיעין שיחה שמציע פתרונות AI קולי המאפשרים לעסקים להציע חוויות שיחה מדהימות ללקוחותיהם. הם עבדו עם חברות רכב מובילות כדי להכשיר את המערכות המופעלות בקול שלהם עם ביטויי מפתח ממותגים והיו זקוקים למומחיות של שייפ באיסוף נתוני אודיו.

פתרון בעולם האמיתי
אתגרים

אתגרים

  • מקורות קהל: גייס יותר מ-2800 דוברי שפת אם בכל שפה ברחבי העולם.
  • איסוף נתונים: אבטח 200k+ הנחיות ב-12 שפות במסגרת זמן מוגדרת.
  • זיהוי הקשר וכוונות: כדי להבין נכון את בקשות המשתמשים, יש צורך להכשיר את המערכות על וריאציות שונות עבור אותו ביטוי מפתח.
  • טיפול ברעשי רקע: התייחס לרעשי רקע מהעולם האמיתי לדיוק מודל ML.
  • הפחתת הטיה: רכשו דוגמאות קול מקבוצות דמוגרפיה מגוונות כדי להבטיח הכלה.
  • מפרט אודיו: 16khz 16bit PCM, מונו, ערוץ יחיד, WAV; ללא עיבוד.
  • סביבת הקלטה: ההקלטות צריכות להיות עם שמע נקי ללא רעשי רקע או הפרעות. ביטויי מפתח שיש להקליט באמצעות דיבור רגיל.
  • בדיקת איכות:  כל הקלטות הדיבור יעברו הערכת איכות ואימות, רק הקלטות דיבור מאומתות יימסרו. אם שייפ לא תעמוד בתקני האיכות המוסכמים, שייפ תמסור מחדש נתונים ללא עלות נוספת

פתרון

שייפ עם המומחיות שלה בתחום ה-Conversational AI אפשרה ללקוח:

  • איסוף נתונים: 208 ביטויי מפתח/הנחיות למותג שנאספו ב-12 שפות גלובליות מ-2800 דוברים במסגרת הזמן שנקבעה
  • מבטאים ודיאלקטים מגוונים: מומחים מגויסים מכל העולם, הבקיאים במבטאים ובדיאלקטים הרצויים.
  • זיהוי הקשר וכוונות: כל דובר הוטל להקליט את ביטויי המפתח ב-20 וריאציות ברורות, מה שמאפשר למודלים של ML לתפוס במדויק את בקשות המשתמש במונחים של הקשר והכוונה.
  • טיפול ברעש רקע: כדי להבטיח איכות שמע טהורה, וידאנו שביטויי המפתח נלכדו בסביבה שלווה עם רמות רעש מתחת ל-40dB, ללא הפרעות רקע כמו טלוויזיה, רדיו, מוזיקה, דיבור או צלילי רחוב.
  • הפחתת הטיה: כדי למזער את ההטיה, עסקנו באנשים מאזורים מגוונים ושמרנו על ייצוג דמוגרפי מאוזן עם 50% גברים ו-50% נשים, המשתרעים על פני קבוצות גיל בין 18 ל-60 שנים.
  • הנחיות הקלטה: ביטויי המפתח נלכדו בדפוס דיבור עקבי ונורמלי, ללא כל וריאציות כגון קצב מהיר או איטי. שתיקה של 2 שניות בהתחלה ובסוף כדי להבטיח שאף חלק מהנאום לא נקטע בטעות.
  • פורמט הקלטה: השמע הוקלט ב-16kHz, 16-bit PCM במונו, תוך שימוש בערוץ בודד, ונשמר בפורמט קובץ WAV. האודיו נשאר לא מעובד, כלומר לא היה יישום של דחיסה, ריוורב או EQ.
  • איכות: כל הקלטת דיבור הייתה נתונה לבדיקות איכות קפדניות ולאימות. רק הקלטות שעברו הערכה זו נמסרו. כל קבצים שלא עמדו בתקני האיכות המוסכמים הוקלטו מחדש וסופקו ללא כל חיובים נוספים
פתרון
תוֹצָאָה

תוֹצָאָה

ביטוי המפתח של המותג האיכותי נתוני אודיו או הנחיות קוליות יאפשרו לחברות הרכב וללקוחותיהן:

  1. מיתוג וזהות: הנחיות קוליות עם ביטוי מותג ספציפי עוזר לחברות ליצור קשר ישיר ובלתי נשכח בין המשתמש למותג שמשפר את זכירת המותג.
  2. קלות שימוש: פקודות קוליות מקלות על הנהגים לקיים אינטראקציה עם רכבים מבלי להוריד את הידיים מההגה או את עיניהם מהכביש ובכך לשפר את הבטיחות בדרכים.
  3. פונקציונלי: פקודות קוליות הופכות את הגישה והשליטה לתכונות המכונית אינטואיטיביות יותר. בין אם זה ניווט, השמעת מדיה או בקרת אקלים.
  4. אינטגרציה עם מערכות אחרות: מערכות רבות המופעלות קול משולבות עם סמארטפונים, מכשירי בית חכם ומכשירי IoT אחרים. לדוגמה, משתמש יכול לבקש מהמכונית שלו להדליק את האורות בבית כשהם מתקרבים הביתה.
  5. יתרון תחרותי: הצעת מערכות מתקדמות המופעלות קול יכולה להיות נקודת מכירה ובידול. קונים מחפשים את הטכנולוגיה העדכנית ביותר כשהם שוקלים רכישת רכב חדש.
  6. הוכחה לעתיד: ככל שהטכנולוגיה מתפתחת וה-IoT משתלב יותר בחיי היומיום, מערכת הפעלה קולית חזקה מציבה את חברות הרכב להיות מותאמות יותר לטכנולוגיה העתידית.
  7. הזדמנויות הכנסה: הזדמנויות מונטיזציה נוספות, כלומר, מערכות קול מציעות המלצות או חוויות מסחר אלקטרוני משולבות (כמו הזמנת אוכל או מציאת שירותים בקרבת מקום) שיכולות לספק הכנסות לשותפים.
זהב-5 כוכבים

כשהתחלנו למצוא הנחיות קוליות למגזר הרכב, האתגרים היו רבים. לכידת המגוון בדיבור, מבטאים וטונים היה חיוני כדי לייצג את קהל הלקוחות העולמי של הלקוח שלנו. שייפ התבלט לא רק כספק, אלא כשותף אמיתי. המחויבות שלהם לאבטח מגוון רחב של קולות מאזורים שונים הייתה ראויה לשבח. הם עברו מעבר לאיסוף קולות בלבד; הם קלטו את הניואנסים של צרכי הפרויקט שלנו, והבטיחו הקלטות ברמה הגבוהה ביותר. עמידתם ללא רבב בתקני איסוף אודיו הראתה את המקצועיות והמסירות שלהם לפרויקט.

האץ את ה- AI השיחתי שלך
פיתוח אפליקציות ב 100%