שיחות בריאות סינתטיות עבור ASR

מתן אפשרות לפיתוח טכנולוגיה סביבתית באמצעות שיחות בריאות סינתטיות

טכנולוגיית אווירה

למעלה מ-2000 שעות של נתוני אודיו שנאספו ותומללו בסביבה קלינית

בתחום המתפתח במהירות של Conversational AI, אחד היישומים הבולטים הוא במגזר הבריאות, שבו נעשה שימוש בטכנולוגיה כדי לייעל את האינטראקציות בין ספק למטופל. הלקוח שלנו, שם מוביל בטכנולוגיית בריאות, פנה ל-Shaip עם דרישה לשפר את מודל זיהוי הדיבור האוטומטי (ASR) שלהם כדי להבין טוב יותר ולתמלל שיחות מרובות דוברים במסגרות קליניות. בשל תקנות הפרטיות, רכישת דיאלוגים בעולם האמיתי הייתה מאתגרת; לפיכך, הרעיון היה ליצור ולתמלל אינטראקציות סינתטיות אך מציאותיות בין ספקי שירותי בריאות ומטופלים.

תכולה

2,000 שעות, או בערך 12,000 ל 24,000 אינטראקציות סינתטיות בודדות של 10 משך הזמן הממוצע של דקות.

מַטָרָה

המטרה העיקרית שלנו הייתה לייצר כ-2,000 שעות של הקלטות אודיו, תרגום ל-12,000 עד 24,000 אינטראקציות סינתטיות מעוצבות בקפידה, המגלמות מגוון במגדר, גיל, מבטאים ותפקידים רפואיים. מערך נתונים מקיף ואותנטי זה, שנועד לחקות דיאלוגים קליניים בעולם האמיתי, נוצר תוך הקפדה קפדנית על תקנות הפרטיות כגון HIPAA. האינטראקציות הסינתטיות שימשו מערך נתונים עשיר, עזר בהכשרה ובחידוד מודל ה-ASR של הלקוח שלנו, והגביר באופן משמעותי את מיומנותו בטיפול בשיחות בעולם האמיתי בתוך מסגרות קליניות.

 

יעדים

אתגרים

התאמה לתקנות

הבטחת ציות לחוקי הפרטיות כגון HIPAA תוך יצירת אינטראקציות בריאות מציאותיות אך סינתטיות עשויה להיות מאתגרת.

תאימות לתקנות

אותנטיות וגיוון נתונים

יצירת אינטראקציות סינתטיות המחקות במדויק דיאלוגים קליניים בעולם האמיתי תוך שהיא מקיפה מגוון רחב של תרחישים, מבטאים, גילאים ותפקידים רפואיים דורשת גישה מדוקדקת וידע מעמיק בתחום.

אותנטיות וגיוון נתונים

בקרת איכות

השגת רמת דיוק גבוהה בתמלול, כגון 95% דיוק מילים (WER) ו-90% דיוק תגיות (TER), מחייבת תהליכי אבטחת איכות קפדניים.

יכולות טכניות

הבטחת התשתית הטכנית, לרבות פלטפורמות ההקלטה והתמלול, יכולה להתמודד עם נפח הנתונים ולשמור על איכות היא אתגר משמעותי.

גיוס משאבים והדרכה

גיוס אנשים עם רקע רפואי למשחק תפקידים, והבטחה שהם דבקים בתרחישים מציאותיים תוך שמירה על זרימת שיחה טבעית יכולה להיות מאתגרת למדי. בנוסף, הכשרת מתמללים להקפיד על הנחיות איכות מחמירות דורשת מאמץ ומומחיות ניכרים.

גישה/פתרון

אוסף אודיו ותמלול

  • יצירת תרחיש: פיתח תרחישים מציאותיים המשקפים מצבים נפוצים לא דחופים בהם נתקלים בפרקטיקות של רפואת משפחה למבוגרים, כגון יתר לחץ דם, סוכרת וטיפול בכאב.
  • משחק תפקידים: גייס אנשים עם רקע רפואי למשחק תפקידים כספקי שירותי בריאות ומטופלים, תוך הקפדה על התרחישים שסופקו והדמיית שיחות קליניות בעולם האמיתי.
  • הקלטה: השתמש באפליקציית Shaip Work Mobile ללכידת אודיו, הבטחת ייצוג מגוון מבחינת מגדר, גיל, מבטאים ורקע מקצועי בקרב המשתתפים.

אימות ותמלול

  • ביצוע סקריפטים לאימות כדי להבטיח את הדיוק והאיכות של קבצי האודיו.
  • התמלולים בוצעו על פלטפורמת Bhasha, תוך הקפדה על הנחיות ספציפיות שסופקו, והבטחת תמלול טקסט מילולי עם יומן מדויק.
  • מטא נתונים מוערים, כולל מזהה דובר, גיל, מגדר, שפת אם והכשרה/ניסיון רפואי, שהיו קריטיים למטרות ההדרכה של הלקוח.

בקרת איכות

  • בדיקות איכות מקיפות על ידי CQA ו-PMO הבטיחו יעד איכות תמלול של 95% דיוק מילים (WER) ו-90% דיוק תגים (TER).

מסירת נתונים

  • בנה את הנתונים בצורה ברורה ומאורגנת ומסר אותם בקבוצות, יחד עם הערות אצווה מפורטות וספריות תרבות.
  • ודא שכל הנתונים, כולל קובצי אודיו, תעתיקים ומטא נתונים, סומנו בצורה מדויקת ועוצבו בהתאם למפרט הלקוח.

משוב ואיטרציה

הקים לולאת משוב חזקה עם הלקוח כדי לזהות ליקויים כלשהם, תוך הבטחה שבוצעו תיקונים ומערך נתונים מלא ומדויק נמסר.

הישגי מפתח

  • איסוף ותמלול מוצלח של 2000 שעות של אינטראקציות בריאות סינתטיות.
  • תמלול מהיר ומדויק עם קצב דיוק יוצא דופן, תורם באופן משמעותי למטרה של הלקוח לשפר את מודל ה-ASR שלו.
  • הוכיח את יכולתו של שייפ בטיפול בפרויקטים רחבי היקף ומורכבים תוך התייחסות קפדנית לאיכות ודיוק.

תוֹצָאָה

הפרויקט שבוצע בקפידה בהנחיית שייפ הביא למערך נתונים עשיר שתרם באופן משמעותי לשיפור מודל ה-ASR של הלקוח. האינטראקציות הסינתטיות יצרו ייצוג ריאליסטי של דיאלוגים קליניים, וסייעו ללקוח להשיג שירות דיבור חזק ואמין יותר עבור סביבות בריאות. באמצעות גישה מובנית ומתואמת היטב, שייפ הבטיחה אספקה ​​מוצלחת של פרויקט מורכב במסגרת הזמן שנקבעה, וביצעה את המומחיות שלה בניהול פרויקטי AI בקנה מידה גדול בשיח בתחום הבריאות.

שיתוף הפעולה שלנו עם שייפ קידם באופן משמעותי את הפרויקט שלנו בתחום טכנולוגיית הסביבה ו-Conversational AI בתחום הבריאות. המומחיות שלהם ביצירה ותמלול של דיאלוגים בריאותיים סינתטיים סיפקה בסיס איתן, והציגה את הפוטנציאל של נתונים סינתטיים בהתגברות על אתגרים רגולטוריים. עם Shaip, ניווטנו את המכשולים הללו וכעת אנחנו צעד קרוב יותר למימוש החזון שלנו לגבי פתרונות בריאות אינטואיטיביים.

זהב-5 כוכבים

האץ את AI הבריאות שלך
פיתוח אפליקציות ב 100%