שירותי איסוף נתוני דיבור המהימנים ביותר עבור ה-AI שלך

התאמן את דגמי ה- NLP שלך, VAs, טיפוסי TTS ועוד עם נתוני שיחה איכותיים בעזרת שירותי איסוף נתוני האודיו והדיבור שלנו.

איסוף נתוני אודיו

גלה צינורות נתוני אודיו ללא צווארי בקבוק

לקוחות מוצגים

שירותי איסוף נתונים קוליים/שמע מקצועיים

כל נושא. כל תרחיש.

ב-Shaip, המומחיות שלנו טמונה ביצירת מערכי נתונים איכותיים של דיבור המיועדים לדרישות AI/ML מגוונות. אנו מציעים מגוון רחב של שפות ומתעדים בהגדרות מגוונות מה שהופך את מערכי הנתונים שלנו למקיפים וניתנים להתאמה. Oההתמקדות שלך היא בהזנת מודלים עם הנפח הגבוה ביותר של נתוני דיבור מותאמים אישית, בזמן הקטן ביותר האפשרי. איתנו על הסיפון, אתה יכול לצפות: 

אוסף דיבורים
  • אוצר נתוני אודיו / קול רב-לשוניים באיכות גבוהה כדי לשפר את הדיוק
  • הרמה הגבוהה ביותר האפשרית של ספציפיות תחום ל-tתרחיש מגוון התקנה
  •  קנה קנה מידה של מודל ה-ML שלך כך שיתאים לדמוגרפיה וענפים מגוונים
  • סביבות הקלטה: איכות סטודיו, כולל שמע צלול עם רעשי רקע מינימליים, & סביבות טבעיות, שבו הקלטות משלבות צלילי סביבה כדי לחקות מצבים בעולם האמיתי.

100 +

מדינות

55K +

נתוני שעות דיבור

250 +

פרויקטים

60 +

שפות (100+ דיאלקטים)

8 / 16 / 44 / 48 קילוהרץ

קצב דגימה

המומחיות שלנו

יישר נתוני אודיו לדגמי NLP חכמים יותר

Shaip מציעה שירותי איסוף נתוני דיבור/שמע מקצה לקצה בלמעלה מ -100 שפות כדי לאפשר לטכנולוגיות המותאמות לקול להתאים לקהל מגוון של קהלים ברחבי העולם. אנו יכולים לעבוד על פרויקטים בכל היקף וגודל; החל מרשיון מערכי אודיו קיימים מהמדף ועד ניהול איסוף נתוני אודיו מותאמים אישית ועד תמלול אודיו והערות. לא משנה כמה גדול פרויקט איסוף נתוני הדיבור שלך, אנו יכולים להתאים אישית את שירותי איסוף האודיו לצרכיך לבניית מערכי נתונים NLP באיכות גבוהה הממוקדים לניבים, צלילים ושפות. בחר מתוך מגוון רחב של מערכי נתוני דיבור ומשאבי איסוף נתוני אודיו, להגדרות חכמות המאפשרות קול.

נאום מונולוג

אוסף נאומי מונולוג

הוא מתמקד בעיבוד דיבור מדבר אחד. השתמש בהנחיות תסריטאיות כדי להזין קבצי אודיו חד-ערוציים, תוך הבטחת לכידה של דפוסי דיבור, צלילים וניואנסים ייחודיים לאותו אדם.

נאום דיאלוג

נאום דיאלוג
אוספים

אינטראקציה של שני אנשים, שכפול שיחות ודיאלוגים בעולם האמיתי עם חשיפה רב לשונית באמצעות קבצים דו-ערוציים ומשאבים מתומללים.

שיחות מרובי צדדים

קבוצה / מוטי-מסיבה
שיחות

דיונים מרובי אנשים, לכידת דינמיקה קבוצתית, חפיפות וטונים מגוונים כדי לאמן במדויק מודלים של דיבור.

אמירת שפה טבעית

אוסף אמירת שפות טבעיות

אמן את AIs לזהות ביטויים או להעיר מילים בעלות משמעויות דומות תוך שימוש בהתבטאויות מגוונות, עשירות ואותנטיות לעיבוד והבנה מתקדמים של שפה טבעית.

דיבור אקוסטי

נתונים אקוסטיים
אוספים

אנו יכולים להקליט באופן מקצועי נתוני אודיו באיכות אולפן בין אם זה מסעדות, משרדים או בתים או מסביבות ושפות שונות, תוך כיסוי טווח אקוסטי רחב יותר (מערכי נתונים מקיפים).

זיהוי דיבור אוטומטי

זיהוי דיבור אוטומטי (ASR)

שפר את הדיוק של מערכות זיהוי הדיבור האוטומטי (ASR) שלך על ידי גישה למערך נתונים מגוונים של דיבור/אודיו, ממגוון רחב של נתונים דמוגרפיים.

אמירת שפה טבעית

נתוני אימון דיבור/שמע רב לשוני

מקצועני השפה המיומנים שלנו, ברחבי העולם מציעים נתוני אודיו/דיבור רב לשוניים בשפות ובדיאלקטים שונים. מאמץ זה מטפח תקשורת גלובלית ומגשר על מחסומי שפה, ותורם לפתרונות AI מכילים ויעילים יותר.

עוזרים וירטואליים דיגיטליים

טקסט לדיבור
(TTS)

בנה מודל רב-לשוני של טקסט לדיבור (TTS) בעזרת כוח העבודה הגלובלי שלנו, שעוזר לך לאסוף נתוני דיבור ב-150+ שפות ודיאלקטים כדי לשפר את דגמי הבינה המלאכותית שלך מבקרה ברכב ועד צ'אט בוטים ופתרונות למידה עם נתוני אודיו איכותיים.

הקלטות מוקד טלפוני

מוקד טלפוני
הקלטות

חילופי דברים אמיתיים בין סוכנים ולקוחות, תמיכה בשפות רבות כגון ספרדית, גרמנית, אנגלית אמריקאית, בנגלית, יפנית, סינית והינדית.

סיפורי הצלחה

מערכי נתונים של AI לשיחה עם יותר מ-3 שעות של נתונים ב-8 שפות

בניסיון לבנות פלטפורמה רב לשונית לשפות הודיות, הלקוח שיתף פעולה עם Shaip כדי לאסוף, לפלח ולתמלל מערכי נתונים גדולים במספר שפות הודיות. זה יעזור לפתח מודלים יעילים של דיבור שיוכלו להניע את הפלטפורמה החדשה והחדשנית של הלקוח.

בעיה: למעלה מ-3,000 שעות של נתוני אודיו שנאספו ב-8 שפות הודיות, מפולחים ומתומללים לפיתוח זיהוי דיבור אוטומטי.

פתרון: סיפקנו איסוף נתונים, פילוח, תמלול ומסרנו קובצי JSON עם מטא נתונים. אספנו 3000 שעות של נתוני אודיו ב-8 שפות הודיות בקנה מידה עבור פרויקט טכנולוגיית הדיבור של הלקוח.

תיאור מקרה של איסוף נתוני דיבור

סיבות לבחור ב- Shaip כשותף שלך לאיסוף נתוני דיבור מהימן

אֲנָשִׁים

אֲנָשִׁים

צוותים ייעודיים ומאומנים:

  • 30,000+ משתפי פעולה ליצירת נתונים, תיוג ו- QA
  • צוות ניהול פרויקטים מוסמך
  • צוות פיתוח מוצרים מנוסה
  • צוות בריכת כישרון ואנשי ספינה
התַהֲלִיך

התַהֲלִיך

יעילות התהליך הגבוהה ביותר מובטחת באמצעות:

  • תהליך סיגמא שלב 6 חזק
  • צוות ייעודי של 6 חגורות סיגמא שחורות - בעלי תהליכים מרכזיים ועמידה באיכות
  • שיפור מתמשך ומשדר לולאה
פלטפורמה

פלטפורמה

הפלטפורמה המוגנת בפטנט מציעה יתרונות:

  • פלטפורמת קצה לקצה מבוססת אינטרנט
  • איכות ללא דופי
  • מהיר יותר TAT
  • משלוח חלק

ערכות דיבור / אודיו מהמדף

פרטיםערכת נתונים של שפהקצב דגימהסוג מערך נתוניםסך כל שעות השמעתיאור קצרתיאור מערך הנתוניםערוץ אודיופלטפורמת הקלטהWER (%)פורמט אודיופורמט תמלולהשתמש מקרהמספר הרמקוליםCTA
נאוםen_US_CC_8שפת עור אפרו-אמריקאיתשפת עור אפרו-אמריקאיתen_US8 kHzמרכז שירות211נתוני מוקד טלפוני אפרו-אמריקאישיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות,כפולשולחן העבודה5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה: 612, זכר: 1242, ולא ידוע: 12
נאוםen_US_MA_16שפת עור אפרו-אמריקאיתשפת עור אפרו-אמריקאיתen_US16 kHzמדיה אודיו154נתוני מדיה עממית אפרו-אמריקאיתקובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקותמונהמקורות אינטרנט5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה: 151, זכר: 150, ולא ידוע: 10
נאוםAfrikaans_GC_8אפריקאנסאפריקאנסaf_ZA8 kHzשיחה כללית368נתוני שיחה כללית באפריקנסשיחה טלפונית ללא תסריט בין שני אנשים. משוער. משך אודיו (טווח) - 15-60 דקות, אפריקנס המדוברת באפריקהכפולשולחן העבודה5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה: 502, זכר: 390, ולא ידוע: 2
נאוםאפריקאנס_MA_16אפריקאנסאפריקאנסaf_ZA16 kHzמדיה אודיו658קבצי מדיה באפריקהקובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקותמונהמקורות אינטרנט5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה: 750, זכר: 1278, ולא ידוע: 52
נאוםערבית_GC_8ערביערביar_AE8 kHzשיחה כללית292נתוני שיחות כלליות בערביתשיחה טלפונית ללא תסריט בין שני אנשים. משוער. משך שמע (טווח) - 15-60 דקות, ערבית ממדינות המפרץכפולשולחן העבודה5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה: 171, זכר: 534, ולא ידוע: 1
נאוםערבית_SM_48ערביערביar-SA48 kHzמונולוג תסריטאי1,947מונולוג בכתב ערביהקלטות של אמירה בודדת, הנוטות ליפול בטווח של 5 עד 30 שניותמונהMobile App5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה 838 זכר 1209 לא ידוע 78
נאוםAssamese_CC_8אסאמיתאסאמית (בצינור) as_INמרכז שירות60נתוני מרכז טלפוני אסאמי (בצינור).שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות,שולחן העבודה5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה
נאוםAssamese_GCאסאמיתאסאמית (בצינור) as_INשיחה כללית100נתוני שיחות כלליות אסאמי (בצינור).שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות,שולחן העבודה5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה
נאוםAssamese_MAאסאמיתאסאמית (בצינור) as_INמדיה אודיו40נתוני אודיו של מדיה אסאמית (בצינור).קובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקותמקורות אינטרנט5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה
נאוםבנגלית_CC_8בנגליתבנגלית (בצינור) bn_INמרכז שירות60נתוני מרכז טלפוני בנגלית (בצינור).שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות,שולחן העבודה5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה
נאוםBengali_GCבנגליתבנגלית (בצינור) bn_INשיחה כללית100בנגלית (בצינור) נתוני שיחה כללייםשיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות,שולחן העבודה5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה
נאוםבנגלית_MAבנגליתבנגלית (בצינור) bn_INמדיה אודיו40בנגלית (בצינור) נתוני אודיו של מדיהקובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקותמקורות אינטרנט5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה
נאוםBoston_CC_8בוסטון אנגליתבוסטון אנגליתen_US8 kHzמרכז שירות177נתוני מרכז השיחות של בוסטוןשיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות,כפולשולחן העבודה5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה: 605, זכר: 711, ולא ידוע: 0
נאוםBoston_GC_8בוסטון אנגליתבוסטון אנגליתen_US8 kHzשיחה כללית32נתוני השיחה הכללית של בוסטוןשיחה טלפונית ללא תסריט בין שני אנשים. משוער. משך אודיו (טווח) - 15-60 דקות, כפולשולחן העבודה5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה: 53, זכר: 83, ולא ידוע: 0
נאוםBoston_MA_16בוסטון אנגליתבוסטון אנגליתen_US16 kHzמדיה אודיו93נתוני אודיו של Boston Mediaקובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקותמונהמקורות אינטרנט5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה: 43, זכר: 181, ולא ידוע: 2
נאוםקנדי_SM_48צרפתית קנדיתצרפתית קנדיתfr-CA48 kHzמונולוג תסריטאי1,222צרפתית קנדיתהקלטות של אמירה בודדת, הנוטות ליפול בטווח של 5 עד 30 שניותמונהMobile App5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה 974 זכר 631 לא ידוע 1
נאוםסינית_CC_8אנגלית סיניתאנגלית סיניתen_US8 kHzמרכז שירות169נתוני מוקד טלפוני סינישיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות,כפולשולחן העבודה5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה: 1790, זכר: 523 ולא ידוע: 13
נאוםסינית_MA_16אנגלית סיניתאנגלית סיניתen_US16 kHzמדיה אודיו249נתוני אודיו של מדיה סיניתקובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקותמונהמקורות אינטרנט5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה: 126, זכר: 346 ולא ידוע: 6
נאוםסינית פשוטה_SM_48סיניתסיניתzh-CN48 kHzמונולוג תסריטאי2,762סיניתהקלטות של אמירה בודדת, הנוטות ליפול בטווח של 5 עד 30 שניותמונהMobile App5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה 1920 זכר 1535 לא ידוע 270
נאוםסינית מסורתית_SM_48סינית מסורתיתסינית מסורתיתzh-TW48 kHzמונולוג תסריטאי1,028סינית מסורתיתהקלטות של אמירה בודדת, הנוטות ליפול בטווח של 5 עד 30 שניותמונהMobile App5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה 1069 זכר 262 לא ידוע 3
נאוםDanish_GC_8דנידניda_DK8 kHzשיחה כללית372נתוני שיחה כללית דניתשיחה טלפונית ללא תסריט בין שני אנשים. משוער. משך אודיו (טווח) - 15-60 דקות, כפולשולחן העבודה5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה: 311, זכר: 417, לא ידוע: 0
נאוםדנית_MA_16דנידניda_DK16 kHzמדיה אודיו664נתוני אודיו של מדיה דניתקובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקותמונהמקורות אינטרנט5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה: 369, זכר: 864, לא ידוע: 27
נאוםדנית_SM_48דנידניda-DK48 kHzמונולוג תסריטאי2,579מונולוג בכתב דניהקלטות של אמירה בודדת, הנוטות ליפול בטווח של 5 עד 30 שניות, דנית מדנמרקמונהMobile App5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה 1551 זכר 1233 לא ידוע 42
נאוםאנגלית עמוקה דרום_CC_8דרום דרום עמוקדרום דרום עמוקen_US8 kHzמרכז שירות151מידע מוקד טלפוני בדרום עמוק באנגליתשיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות,כפולשולחן העבודה5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה 221 , זכר 1004 , לא ידוע 7
נאוםאנגלית עמוקה דרום_GC_8דרום דרום עמוקדרום דרום עמוקen_US8 kHzשיחה כללית56נתוני שיחה כללית בדרום עמוק באנגליתשיחה טלפונית ללא תסריט בין שני אנשים. משוער. משך אודיו (טווח) - 15-60 דקות, כפולשולחן העבודה5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה 99, גבר 31, לא ידוע 0
נאוםאנגלית עמוקה דרום_MA_16דרום דרום עמוקדרום דרום עמוקen_US16 kHzמדיה אודיו266נתוני אודיו באנגלית Deep South Mediaקובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקותמונהמקורות אינטרנט5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה 204, גבר 356, לא ידוע 21
נאוםגרמנית_CC_8גרמניתגרמניתדה-דה8 kHzמרכז שירות64נתוני מוקד טלפוני גרמני שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות,מונהשולחן העבודה. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה 478 זכר 1440 לא ידוע 0
נאוםגרמנית_IVR_8גרמניתגרמניתדה-דה8 kHz סיומת IVR200נתוני IVR גרמנייםאדם למכונה. זרימה מסוג IVR שבה יש הנחית TTS (למשל "איך אוכל לעזור לך") ואחריה תגובה אנושית ספונטניתמונהשולחן העבודה. Wav ‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה נקבה 10115 זכר 8750 לא ידוע 0
נאוםGujarati_CC_8גוג'ראטיתגוג'ראטי (בצינור) gu_INמרכז שירות60נתוני מוקד טלפוני של גוג'ראטי (בצינור).שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות,שולחן העבודה5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה
נאוםGujarati_GCגוג'ראטיתגוג'ראטי (בצינור) gu_INשיחה כללית100נתוני שיחות כלליות של גוג'ראטי (בצינור).שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות,שולחן העבודה5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה
נאוםGujarati_MAגוג'ראטיתגוג'ראטי (בצינור) gu_INמדיה אודיו40גוג'ראטי (בצינור) נתוני אודיו של מדיהקובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקותמקורות אינטרנט5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה
נאוםעברית_שיחה כללית_8עבריתעבריתhe_IL8 kHzשיחה כללית399נתוני שיחות כלליות בעבריתשיחה טלפונית ללא תסריט בין שני אנשים. משוער. משך שמע (טווח) - 15-60 דקות, עברית בישראלכפולשולחן העבודה5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה 414, זכר 399, לא ידוע 1
נאוםעברית_MA_16עבריתעבריתhe_IL16 kHzמדיה אודיו427נתוני אודיו של מדיה עבריתקובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקותמונהמקורות אינטרנט5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה 361, זכר 513, לא ידוע 13
נאוםהינדי_MA_16הינדיהינדיהיי_IN16 kHzמדיה אודיו219נתוני אודיו של מדיה הינדיקובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקותמונהמקורות אינטרנט5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה 83, זכר 309, לא ידוע 0
נאוםהינדי_SM_48הינדיהינדיהיי-אין48 kHzמונולוג תסריטאי2,867מונולוג תסריטאי הינדיהקלטות של אמירה בודדת, הנוטות ליפול בטווח של 5 עד 30 שניותמונהMobile App5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה 1977 זכר 1864 לא ידוע 147
נאוםHINGLISH_CC_8הינגלישהינגלישhg_IN8 kHzמרכז שירות208HINGLISH נתוני מוקד טלפונישיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות,כפולשולחן העבודה5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה 822, זכר 1262, לא ידוע 0
נאוםHINGLISH_MA_16הינגלישהינגלישhg_IN16 kHzמדיה אודיו216HINGLISH נתוני אודיו של מדיהקובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקותמונהמקורות אינטרנט5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה 75, גבר 380, לא ידוע 0
נאוםHispanic_CC_8אנגלית היספניתאנגלית היספניתen_US8 kHzמרכז שירות212נתוני מוקד טלפוני היספנייםשיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות,כפולשולחן העבודה5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה 822, זכר 1262, לא ידוע 0
נאוםHispanic_MA_16אנגלית היספניתאנגלית היספניתen_US16 kHzמדיה אודיו155אודיו היספני Call Mediaקובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקותמונהמקורות אינטרנט5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה 140, זכר 219, לא ידוע 5
נאוםאינדונזית_GC_8אינדונזיאינדונזיאני עשיתי8 kHzשיחה כללית496נתוני שיחה כללית באינדונזיהשיחה טלפונית ללא תסריט בין שני אנשים. משוער. משך שמע (טווח) - 15-60 דקות, בהאסה אינדונזיתכפולשולחן העבודה5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה 524, זכר 454, לא ידוע 2
נאוםאינדונזית_MA_16אינדונזיאינדונזיאני עשיתי16 kHzמדיה אודיו643נתוני אודיו של מדיה אינדונזיתקובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקותמונהמקורות אינטרנט5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה 746, זכר 1507, לא ידוע 129
נאוםIrish_GC_8איריאיריen_IE8 kHzשיחה כללית192נתוני השיחה הכללית של איריתשיחה טלפונית ללא תסריט בין שני אנשים. משוער. משך אודיו (טווח) - 15-60 דקות, כפולשולחן העבודה5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה 213 , זכר 153 , לא ידוע 0
נאוםיפני_SM_48יפנייפניja-JP48 kHzמונולוג תסריטאי2,335מונולוג בכתב יפניהקלטות של אמירה בודדת, הנוטות ליפול בטווח של 5 עד 30 שניותמונהMobile App5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה 1460 זכר 1221 לא ידוע 194
נאוםקנאדה_CC_8קנאדהקנאדה (בצינור) kn_INמרכז שירות60נתוני מרכז טלפוני של קנאדה (בצינור).שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות,שולחן העבודה5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה
נאוםKannada_GCקנאדהקנאדה (בצינור) kn_INשיחה כללית100קנאדה (בצינור) נתוני שיחה כללייםשיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות,שולחן העבודה5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה
נאוםקנאדה_MAקנאדהקנאדה (בצינור) kn_INמדיה אודיו40Kannada (In Pipeline) נתוני אודיו של מדיהקובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקותמקורות אינטרנט5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה
נאוםקוריאנית_CC_8קוריאניקוריאניko_KR8 kHzמרכז שירות107נתוני מוקד טלפוני קוריאנישיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות,כפולשולחן העבודה5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה 1086, זכר 210, לא ידוע 4
נאוםקוריאנית_MA_16קוריאניקוריאניko_KR16 kHzמדיה אודיו204נתוני אודיו של מדיה קוריאניתקובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקותמונהמקורות אינטרנט5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה 70 זכר 303, לא ידוע 25
נאוםקוריאני_SM_48קוריאניקוריאניko-KR48 kHzמונולוג תסריטאי1,955מונולוג כתב קוריאניהקלטות של אמירה בודדת, הנוטות ליפול בטווח של 5 עד 30 שניותמונהMobile App5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה 1195 זכר 1134 לא ידוע 122
נאוםמלאית_GC_8מלאיתמלאיתms_MY8 kHzשיחה כללית266נתוני שיחה כללית במלזיתשיחה טלפונית ללא תסריט בין שני אנשים. משוער. משך אודיו (טווח) - 15-60 דקות, מלאית במלזיהכפולשולחן העבודה5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה 316, זכר 176, לא ידוע 0
נאוםמלאית_MA_16מלאיתמלאיתms_MY16 kHzמדיה אודיו344נתוני אודיו של מדיה מלאיתקובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקותמונהמקורות אינטרנט5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה 236, גבר 626, לא ידוע 47
נאוםMalayalam_CC_8מליאלאםמלאיאלאם (בצינור) ml_INמרכז שירות60נתוני מרכז טלפוני של Malaylam (In Pipeline).שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות,שולחן העבודה5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה
נאוםMalayalam_GCמליאלאםמלאיאלאם (בצינור) ml_INשיחה כללית100מליאלם (בצינור) נתוני שיחה כללייםשיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות,שולחן העבודה5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה
נאוםMalayalam_MAמליאלאםמלאיאלאם (בצינור) ml_INמדיה אודיו40Malaayalam (In Pipeline) נתוני אודיו של מדיהקובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקותמקורות אינטרנט5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה
נאוםMarathi_CC_8מרתיMarathi (בצינור) mr_INמרכז שירות60נתוני Marathi (In Pipeline) Call-Centerשיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות,שולחן העבודה5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה
נאוםMarathi_GCמרתיMarathi (בצינור) mr_INשיחה כללית100נתוני שיחה כללית של Marathi (In Pipeline).שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות,שולחן העבודה5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה
נאוםMarathi_MAמרתיMarathi (בצינור) mr_INמדיה אודיו40Marathi (In Pipeline) נתוני אודיו של מדיהקובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקותמקורות אינטרנט5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה
נאוםמקסיקני_SM_48ספרדית (מקסיקו)ספרדית (מקסיקו)en-MX48 kHzמונולוג תסריטאי1,492מונולוג כתב ספרדי מקסיקניהקלטות של אמירה בודדת, הנוטות ליפול בטווח של 5 עד 30 שניותמונהMobile App5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה 1016 זכר 1069 לא ידוע 95
נאוםהולנד_SM_48הולנדיהולנדיnl-NL48 kHzמונולוג תסריטאי1,205מונולוג כתב הולנדיהקלטות של אמירה בודדת, הנוטות ליפול בטווח של 5 עד 30 שניותמונהMobile App5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה 1285 זכר 531 לא ידוע 3
נאוםניו יורק אנגלית_CC_8ניו יורק אנגליתניו יורק אנגליתen_US8 kHzמרכז שירות103נתוני מוקד טלפוני בניו יורק באנגליתשיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות,כפולשולחן העבודה5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה 610, זכר 532, לא ידוע 0
נאוםניו יורק אנגלית_GC_8ניו יורק אנגליתניו יורק אנגליתen_US8 kHzשיחה כללית107נתוני שיחה כללית באנגלית בניו יורקשיחה טלפונית ללא תסריט בין שני אנשים. משוער. משך אודיו (טווח) - 15-60 דקות, כפולשולחן העבודה5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה 118, זכר 114, לא ידוע 0
נאוםניו יורק אנגלית_MA_16ניו יורק אנגליתניו יורק אנגליתen_US16 kHzמדיה אודיו140נתוני אודיו של ניו יורק אנגליתקובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקותמונהמקורות אינטרנט5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה 66, זכר 230, לא ידוע 11
נאוםניו זילנד_GC_8ניו זילנד אנגלית ניו זילנד אנגלית en_NZ8 kHzשיחה כללית148נתוני שיחה כללית באנגלית בניו זילנדשיחה טלפונית ללא תסריט בין שני אנשים. משוער. משך אודיו (טווח) - 15-60 דקות, כפולשולחן העבודה5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה 167, זכר 121, לא ידוע 4
נאוםניו זילנד_MA_16ניו זילנד אנגלית ניו זילנד אנגלית en_NZ16 kHzמדיה אודיו400אודיו של ניו זילנד מדיה אנגליתקובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקותמונהמקורות אינטרנט5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה 367, זכר 678, לא ידוע 26
נאוםOriya_CC_8אוריהאוריה (בצינור) or_INמרכז שירות60אוריה (בצנרת) נתוני Call-Centerשיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות,שולחן העבודה5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה
נאוםOriya_GCאוריהאוריה (בצינור) or_INשיחה כללית100אוריה (בצינור) נתוני שיחה כללייםשיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות,שולחן העבודה5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה
נאוםOriya_MAאוריהאוריה (בצינור) or_INמדיה אודיו40Oriya (In Pipeline) נתוני אודיו של מדיהקובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקותמקורות אינטרנט5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה
נאוםפולנית_MA_16פולניפולניen_PL16 kHzמדיה אודיו269אודיו של מדיה פולניתקובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקותמונהמקורות אינטרנט5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה 173 זכר 354 לא ידוע 6
נאוםפולנית פולין_SM_48פולנית (פולין)פולנית (פולין)pl-pl48 kHzמונולוג תסריטאי1,482פולין פולין - מונולוג תסריטאיהקלטות של אמירה בודדת, הנוטות ליפול בטווח של 5 עד 30 שניותמונהMobile App5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה 1324 זכר 701 לא ידוע 24
נאוםפונג'בי_CC_8פונג'ביתפנג'בי (בצינור) פונג'ביתמרכז שירות60נתוני מרכז טלפוני של פונג'אבי (בצינור).שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות,שולחן העבודה5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה
נאוםפונג'בי_GCפונג'ביתפנג'בי (בצינור) פונג'ביתשיחה כללית100פונג'אבי (בצינור) נתוני שיחה כללייםשיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות,שולחן העבודה5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה
נאוםפונג'בי_MAפונג'ביתפנג'בי (בצינור) פונג'בית מדיה אודיו40פונג'אבי (בצינור) נתוני אודיו של מדיהקובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקותמקורות אינטרנט5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה
נאוםRussian_SM_48רוסירוסירו-רו48 kHzמונולוג תסריטאי2,398מונולוג בכתב רוסיהקלטות של אמירה בודדת, הנוטות ליפול בטווח של 5 עד 30 שניותמונהMobile App5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה 1689 זכר 1937 לא ידוע 214
נאוםScottish_GC_8סקוטי (מבטא אנגלי)סקוטי (מבטא אנגלי)en_AB8 kHzשיחה כללית292נתוני השיחה הכללית של סקוטלנדשיחה טלפונית ללא תסריט בין שני אנשים. משוער. משך אודיו (טווח) - 15-60 דקות, כפולשולחן העבודה5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה 285, זכר 260, לא ידוע 3
נאוםSingapore_CC_8סינגפור אנגליתסינגפור אנגליתen_SG8 kHzמרכז שירות218נתוני מרכז השיחות של סינגפורשיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות,כפולשולחן העבודה5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה 2139, זכר 884, לא ידוע 21
נאוםסינגפור_MA_16סינגפור אנגליתסינגפור אנגליתen_SG16 kHzמדיה אודיו247נתוני אודיו של סינגפור מדיהקובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקותמונהמקורות אינטרנט5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה 160, זכר 455, לא ידוע 37
נאוםאנגלית דרום אפריקאית_CC_8אנגלית דרום אפריקאיתאנגלית דרום אפריקאיתen_ZA8 kHzמרכז שירות261נתוני מרכז טלפון באנגלית דרום אפריקאיתשיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות,כפולשולחן העבודה5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה 1274 , זכר 935 , לא ידוע 1
נאוםאנגלית דרום אפריקאית_MA_16אנגלית דרום אפריקאיתאנגלית דרום אפריקאיתen_ZA16 kHzמדיה אודיו251נתוני אודיו של מדיה אנגלית דרום אפריקאיתקובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקותמונהמקורות אינטרנט5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה 235, זכר 432, לא ידוע 36
נאוםסוואהילית_CC_8סוואהיליתסוואהיליתsw_KE8 kHzמרכז שירות230נתוני מרכז טלפוני סוואהילישיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות,כפולשולחן העבודה5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה 611, זכר 833, לא ידוע 0
נאוםסוואהילית_MA_16סוואהיליתסוואהיליתsw_KE16 kHzמדיה אודיו265נתוני אודיו של מדיה סוואהיליתקובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקותמונהמקורות אינטרנט5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה 118, זכר 493, לא ידוע 25
נאוםSwedish_CC_8שבדישבדיsv_SE8 kHzמרכז שירות250נתוני מרכז טלפוני שוודישיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות,כפולשולחן העבודה5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה 1581, זכר 727, לא ידוע 2
נאוםשוודית_MA_16שבדישבדיsv_SE16 kHzמדיה אודיו278נתוני אודיו של מדיה שוודיתקובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקותמונהמקורות אינטרנט5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה 195, זכר 500, לא ידוע 21
נאוםTamil_CC_8טמיליתטמילית (בצינור) ta_INמרכז שירות60נתוני מרכז טלפוני טמילית (בצינור).שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות,שולחן העבודה5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה
נאוםTamil_GCטמיליתטמילית (בצינור) ta_INשיחה כללית100נתוני שיחה כללית טמילית (בצינור).שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות,שולחן העבודה5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה
נאוםTamil_MAטמילית טמילית (בצינור) ta_INמדיה אודיו40טמילית (בצינור) נתוני אודיו של מדיהקובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקותמקורות אינטרנט5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה
נאוםTelugu_GC_8טלוגוטלוגוte_IN8 kHzשיחה כללית553נתוני שיחה כללית של טלוגושיחה טלפונית ללא תסריט בין שני אנשים. משוער. משך אודיו (טווח) - 15-60 דקות, כפולשולחן העבודה5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה 574, זכר 564, לא ידוע 0
נאוםTelugu_MA_16טלוגוטלוגוte_IN16 kHzמדיה אודיו648נתוני אודיו של Telugu Mediaקובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקותמונהמקורות אינטרנט5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה 207, זכר 963, לא ידוע 2
נאוםTelugu_CC_8טלוגוטלוגו (בצינור) te_INמרכז שירות30נתוני Telugu (In Pipeline) Call-Centerשיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות,שולחן העבודה5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה
נאוםTelugu_GCטלוגוטלוגו (בצינור) te_INשיחה כללית50טלוגו (בצינור) נתוני שיחה כללייםשיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות,שולחן העבודה5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה
נאוםTelugu_MAטלוגוטלוגו (בצינור) te_INמדיה אודיו20Telugu (In Pipeline) נתוני אודיו של מדיהקובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקותמקורות אינטרנט5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה
נאוםThai_GC_8תאילנדיתאילנדיth_TH8 kHzשיחה כללית183שיחה כללית תאילנדיתשיחה טלפונית ללא תסריט בין שני אנשים. משוער. משך אודיו (טווח) - 15-60 דקות, רישום לא רשמי בשימוש בין חבריםכפולשולחן העבודה5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה 338, זכר 96, לא ידוע 8
נאוםThai_MA_8תאילנדיתאילנדיth_TH16 kHzמדיה אודיו173אודיו של מדיה תאילנדיתקובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקותמונהמקורות אינטרנט5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה 143, זכר 502, לא ידוע 26
נאוםטורקיה טורקיה_SM_48טורקיה טורקיתטורקיה טורקיתtr-TR48 kHzמונולוג תסריטאי2,027טורקיה טורקיתהקלטות של אמירה בודדת, הנוטות ליפול בטווח של 5 עד 30 שניותמונהMobile App5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה 1561 זכר 1241 לא ידוע 31
נאוםוייטנאמית_GC_8ויאטנמיתויאטנמיתvi_VN8 kHzשיחה כללית295נתוני שיחה כללית וייטנאמיתשיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות, צפון (למשל, האנוי), מרכז ודרום (למשל, הו צ'י מין סיטי).כפולשולחן העבודה5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה 400, גבר 380, אלמונים 2
נאוםוייטנאמית_MA_16ויאטנמיתויאטנמיתvi_VN16 kHzמדיה אודיו257נתוני אודיו של מדיה וייטנאמיתקובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקותמונהמקורות אינטרנט5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה 249, גבר 200, אלמונים 45
נאוםWelsh_GC_8וולשית (מבטא אנגלי)וולשית (מבטא אנגלי)en_WL8 kHzשיחה כללית278נתוני שיחה כללית בוולשיתשיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות,כפולשולחן העבודה5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה 270, זכר 324, לא ידוע 0
נאוםבריטניה אנגלית_WW_16אנגלית אנגליתאנגלית אנגליתen_uk16 kHzלהתעורר Wordרמקולים 200Wake Word באנגלית אנגליתאיסוף ביטויי מפתח של נתונים
  • רמקולים 200
  • 4 ביטויי מפתח ייחודיים לכל רמקול
  • 25-30 הקלטות חוזרות של ביטויי מפתח לכל ביטוי מפתח ייחודי
  • 25-30 קבצי שמע לכל ביטוי מפתח ייחודי
  • סה"כ 120 התבטאויות מוקלטות לכל דובר
ערוץ 1Mobile App5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהמין: 50% גברים, 50% נשים, +/- 10%.

שירותים מוצעים

איסוף נתוני שמע מומחה אינו מעשי על כל הסידורים עבור הגדרות AI מקיפות. ב- Shaip, אתה יכול אפילו לשקול את השירותים הבאים כדי להפוך את הדגמים לנפוצים בהרבה מהרגיל:

איסוף נתוני טקסט

איסוף נתוני טקסט
שירותים

הערך האמיתי של שירותי איסוף הנתונים הקוגניטיביים של Shaip הוא בכך שהוא נותן לארגונים את המפתח לפתוח מידע קריטי שנמצא בתוך נתונים לא מובנים.

איסוף נתוני תמונה

שירותי איסוף נתוני תמונה

וודא שמודל החזון הממוחשב שלך מזהה כל תמונה במדויק, כדי לאמן בצורה חלקה את דגמי AI מהדור הבא של העתיד

איסוף נתוני וידאו

שירותי איסוף נתוני וידאו

כעת התמקד בראיית מחשב יחד עם NLP לאימון המודלים שלך לזהות אובייקטים, אנשים, מרתיעים ואלמנטים חזותיים אחרים לשלמות.

שייפ צור קשר

רוצה לבנות מערך שמע משלך?

צור קשר עם המומחה הביתי שלנו לאיסוף נתוני דיבור כדי להקים מאגר אודיו המתאים ביותר לדרישתך

  • בהרשמה אני מסכים עם שייפ מדיניות הפרטיות ו תנאי שימוש באתר ולספק את הסכמתי לקבל תקשורת שיווקית B2B משאיפ.

איסוף נתוני דיבור עבור מודל ML מתייחס לתהליך של איסוף הקלטות אודיו של שפה מדוברת. אוסף זה מסייע באימון ושכלול אלגוריתמים של למידת מכונה, במיוחד אלו שבמרכזם הבנה ועיבוד של קולות אנושיים.

כאשר אתה שואף לאסוף נתוני אודיו עבור זיהוי דיבור אוטומטי (ASR), עליך להתחיל בהגדרת הצרכים הספציפיים של הפרויקט שלך, כולל השפה, המבטא וסוג הדיבור הרצויים. לאחר הגדרת פרמטרים אלה, ודא שאתה מקבל את כל ההרשאות הנדרשות כדי לכבד את פרטיות המשתמש. לאחר מכן, השתמש במכשירי הקלטה או בתוכנה מתאימים כדי ללכוד דגימות שמע ברורות. כל הקלטה צריכה להיות מוערת בקפידה עם התמלול שלה או מטא נתונים רלוונטיים אחרים ולאחסן באופן שיטתי לגישה ללא מאמץ.

מערך דיבור בלמידת מכונה הוא חיוני לאימון, בדיקה ואימות מודלים המותאמים לזהות, לתמלל או לפרש שפה מדוברת. מערכי נתונים כאלה סוללים את הדרך לאינספור יישומים, מעוזרים קוליים ושירותי תמלול ועד ביומטריה קולית.

לאיסוף נתונים מדויקים משפות ומדגשים מגוונים, שיתוף פעולה עם דוברי שפת אם ברקע הלשוני הרצוי חיוני. שאפו למדגם מגוון ומייצג שיכסה קשת רחבה של ניואנסים דמוגרפיים. השתמש בציוד הקלטה סטנדרטי בסביבות אחידות כדי להבטיח עקביות אודיו. וחשוב מכך, הערות לכל חלק נתונים עם תעתיקים ומטא נתונים מפורטים, המציינים את השפה והמבטא הספציפיים.