ערכות נתונים באיכות גבוהה של אודיו / דיבור / קול כדי לאמן את מודל הבינה המלאכותית שלך לשיחה 

ערכות נתונים קוליות / דיבור / אודיו מהמדף במספר שפות כדי להתחיל את דגמי זיהוי הדיבור האוטומטי (ASR) שלך

מערכי נתונים לדיבור

חבר את קטלוג נתוני האודיו שחסר לך היום

פרטיםערכת נתונים של שפהקצב דגימהסוג מערך נתוניםסך כל שעות השמעתיאור קצרתיאור מערך הנתוניםערוץ אודיופלטפורמת הקלטהWER (%)פורמט אודיופורמט תמלולהשתמש מקרהמספר הרמקוליםCTA
נאוםen_US_CC_8שפת עור אפרו-אמריקאיתשפת עור אפרו-אמריקאיתen_US8 kHzמרכז שירות211נתוני מוקד טלפוני אפרו-אמריקאישיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות,כפולשולחן העבודה5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה: 612, זכר: 1242, ולא ידוע: 12
נאוםen_US_MA_16שפת עור אפרו-אמריקאיתשפת עור אפרו-אמריקאיתen_US16 kHzמדיה אודיו154נתוני מדיה עממית אפרו-אמריקאיתקובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקותמונהמקורות אינטרנט5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה: 151, זכר: 150, ולא ידוע: 10
נאוםAfrikaans_GC_8אפריקאנסאפריקאנסaf_ZA8 kHzשיחה כללית368נתוני שיחה כללית באפריקנסשיחה טלפונית ללא תסריט בין שני אנשים. משוער. משך אודיו (טווח) - 15-60 דקות, אפריקנס המדוברת באפריקהכפולשולחן העבודה5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה: 502, זכר: 390, ולא ידוע: 2
נאוםאפריקאנס_MA_16אפריקאנסאפריקאנסaf_ZA16 kHzמדיה אודיו658קבצי מדיה באפריקהקובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקותמונהמקורות אינטרנט5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה: 750, זכר: 1278, ולא ידוע: 52
נאוםערבית_GC_8ערביערביar_AE8 kHzשיחה כללית292נתוני שיחות כלליות בערביתשיחה טלפונית ללא תסריט בין שני אנשים. משוער. משך שמע (טווח) - 15-60 דקות, ערבית ממדינות המפרץכפולשולחן העבודה5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה: 171, זכר: 534, ולא ידוע: 1
נאוםערבית_SM_48ערביערביar-SA48 kHzמונולוג תסריטאי1,947מונולוג בכתב ערביהקלטות של אמירה בודדת, הנוטות ליפול בטווח של 5 עד 30 שניותמונהMobile App5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה 838 זכר 1209 לא ידוע 78
נאוםAssamese_CC_8אסאמיתאסאמית (בצינור) as_INמרכז שירות60נתוני מרכז טלפוני אסאמי (בצינור).שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות,שולחן העבודה5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה
נאוםAssamese_GCאסאמיתאסאמית (בצינור) as_INשיחה כללית100נתוני שיחות כלליות אסאמי (בצינור).שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות,שולחן העבודה5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה
נאוםAssamese_MAאסאמיתאסאמית (בצינור) as_INמדיה אודיו40נתוני אודיו של מדיה אסאמית (בצינור).קובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקותמקורות אינטרנט5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה
נאוםבנגלית_CC_8בנגליתבנגלית (בצינור) bn_INמרכז שירות60נתוני מרכז טלפוני בנגלית (בצינור).שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות,שולחן העבודה5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה
נאוםBengali_GCבנגליתבנגלית (בצינור) bn_INשיחה כללית100בנגלית (בצינור) נתוני שיחה כללייםשיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות,שולחן העבודה5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה
נאוםבנגלית_MAבנגליתבנגלית (בצינור) bn_INמדיה אודיו40בנגלית (בצינור) נתוני אודיו של מדיהקובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקותמקורות אינטרנט5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה
נאוםBoston_CC_8בוסטון אנגליתבוסטון אנגליתen_US8 kHzמרכז שירות177נתוני מרכז השיחות של בוסטוןשיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות,כפולשולחן העבודה5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה: 605, זכר: 711, ולא ידוע: 0
נאוםBoston_GC_8בוסטון אנגליתבוסטון אנגליתen_US8 kHzשיחה כללית32נתוני השיחה הכללית של בוסטוןשיחה טלפונית ללא תסריט בין שני אנשים. משוער. משך אודיו (טווח) - 15-60 דקות, כפולשולחן העבודה5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה: 53, זכר: 83, ולא ידוע: 0
נאוםBoston_MA_16בוסטון אנגליתבוסטון אנגליתen_US16 kHzמדיה אודיו93נתוני אודיו של Boston Mediaקובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקותמונהמקורות אינטרנט5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה: 43, זכר: 181, ולא ידוע: 2
נאוםקנדי_SM_48צרפתית קנדיתצרפתית קנדיתfr-CA48 kHzמונולוג תסריטאי1,222צרפתית קנדיתהקלטות של אמירה בודדת, הנוטות ליפול בטווח של 5 עד 30 שניותמונהMobile App5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה 974 זכר 631 לא ידוע 1
נאוםסינית_CC_8אנגלית סיניתאנגלית סיניתen_US8 kHzמרכז שירות169נתוני מוקד טלפוני סינישיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות,כפולשולחן העבודה5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה: 1790, זכר: 523 ולא ידוע: 13
נאוםסינית_MA_16אנגלית סיניתאנגלית סיניתen_US16 kHzמדיה אודיו249נתוני אודיו של מדיה סיניתקובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקותמונהמקורות אינטרנט5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה: 126, זכר: 346 ולא ידוע: 6
נאוםסינית פשוטה_SM_48סיניתסיניתzh-CN48 kHzמונולוג תסריטאי2,762סיניתהקלטות של אמירה בודדת, הנוטות ליפול בטווח של 5 עד 30 שניותמונהMobile App5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה 1920 זכר 1535 לא ידוע 270
נאוםסינית מסורתית_SM_48סינית מסורתיתסינית מסורתיתzh-TW48 kHzמונולוג תסריטאי1,028סינית מסורתיתהקלטות של אמירה בודדת, הנוטות ליפול בטווח של 5 עד 30 שניותמונהMobile App5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה 1069 זכר 262 לא ידוע 3
נאוםDanish_GC_8דנידניda_DK8 kHzשיחה כללית372נתוני שיחה כללית דניתשיחה טלפונית ללא תסריט בין שני אנשים. משוער. משך אודיו (טווח) - 15-60 דקות, כפולשולחן העבודה5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה: 311, זכר: 417, לא ידוע: 0
נאוםדנית_MA_16דנידניda_DK16 kHzמדיה אודיו664נתוני אודיו של מדיה דניתקובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקותמונהמקורות אינטרנט5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה: 369, זכר: 864, לא ידוע: 27
נאוםדנית_SM_48דנידניda-DK48 kHzמונולוג תסריטאי2,579מונולוג בכתב דניהקלטות של אמירה בודדת, הנוטות ליפול בטווח של 5 עד 30 שניות, דנית מדנמרקמונהMobile App5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה 1551 זכר 1233 לא ידוע 42
נאוםאנגלית עמוקה דרום_CC_8דרום דרום עמוקדרום דרום עמוקen_US8 kHzמרכז שירות151מידע מוקד טלפוני בדרום עמוק באנגליתשיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות,כפולשולחן העבודה5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה 221 , זכר 1004 , לא ידוע 7
נאוםאנגלית עמוקה דרום_GC_8דרום דרום עמוקדרום דרום עמוקen_US8 kHzשיחה כללית56נתוני שיחה כללית בדרום עמוק באנגליתשיחה טלפונית ללא תסריט בין שני אנשים. משוער. משך אודיו (טווח) - 15-60 דקות, כפולשולחן העבודה5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה 99, גבר 31, לא ידוע 0
נאוםאנגלית עמוקה דרום_MA_16דרום דרום עמוקדרום דרום עמוקen_US16 kHzמדיה אודיו266נתוני אודיו באנגלית Deep South Mediaקובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקותמונהמקורות אינטרנט5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה 204, גבר 356, לא ידוע 21
נאוםגרמנית_CC_8גרמניתגרמניתדה-דה8 kHzמרכז שירות64נתוני מוקד טלפוני גרמני שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות,מונהשולחן העבודה. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה 478 זכר 1440 לא ידוע 0
נאוםגרמנית_IVR_8גרמניתגרמניתדה-דה8 kHz סיומת IVR200נתוני IVR גרמנייםאדם למכונה. זרימה מסוג IVR שבה יש הנחית TTS (למשל "איך אוכל לעזור לך") ואחריה תגובה אנושית ספונטניתמונהשולחן העבודה. Wav ‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה נקבה 10115 זכר 8750 לא ידוע 0
נאוםGujarati_CC_8גוג'ראטיתגוג'ראטי (בצינור) gu_INמרכז שירות60נתוני מוקד טלפוני של גוג'ראטי (בצינור).שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות,שולחן העבודה5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה
נאוםGujarati_GCגוג'ראטיתגוג'ראטי (בצינור) gu_INשיחה כללית100נתוני שיחות כלליות של גוג'ראטי (בצינור).שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות,שולחן העבודה5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה
נאוםGujarati_MAגוג'ראטיתגוג'ראטי (בצינור) gu_INמדיה אודיו40גוג'ראטי (בצינור) נתוני אודיו של מדיהקובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקותמקורות אינטרנט5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה
נאוםעברית_שיחה כללית_8עבריתעבריתhe_IL8 kHzשיחה כללית399נתוני שיחות כלליות בעבריתשיחה טלפונית ללא תסריט בין שני אנשים. משוער. משך שמע (טווח) - 15-60 דקות, עברית בישראלכפולשולחן העבודה5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה 414, זכר 399, לא ידוע 1
נאוםעברית_MA_16עבריתעבריתhe_IL16 kHzמדיה אודיו427נתוני אודיו של מדיה עבריתקובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקותמונהמקורות אינטרנט5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה 361, זכר 513, לא ידוע 13
נאוםהינדי_MA_16הינדיהינדיהיי_IN16 kHzמדיה אודיו219נתוני אודיו של מדיה הינדיקובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקותמונהמקורות אינטרנט5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה 83, זכר 309, לא ידוע 0
נאוםהינדי_SM_48הינדיהינדיהיי-אין48 kHzמונולוג תסריטאי2,867מונולוג תסריטאי הינדיהקלטות של אמירה בודדת, הנוטות ליפול בטווח של 5 עד 30 שניותמונהMobile App5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה 1977 זכר 1864 לא ידוע 147
נאוםHINGLISH_CC_8הינגלישהינגלישhg_IN8 kHzמרכז שירות208HINGLISH נתוני מוקד טלפונישיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות,כפולשולחן העבודה5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה 822, זכר 1262, לא ידוע 0
נאוםHINGLISH_MA_16הינגלישהינגלישhg_IN16 kHzמדיה אודיו216HINGLISH נתוני אודיו של מדיהקובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקותמונהמקורות אינטרנט5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה 75, גבר 380, לא ידוע 0
נאוםHispanic_CC_8אנגלית היספניתאנגלית היספניתen_US8 kHzמרכז שירות212נתוני מוקד טלפוני היספנייםשיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות,כפולשולחן העבודה5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה 822, זכר 1262, לא ידוע 0
נאוםHispanic_MA_16אנגלית היספניתאנגלית היספניתen_US16 kHzמדיה אודיו155אודיו היספני Call Mediaקובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקותמונהמקורות אינטרנט5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה 140, זכר 219, לא ידוע 5
נאוםאינדונזית_GC_8אינדונזיאינדונזיאני עשיתי8 kHzשיחה כללית496נתוני שיחה כללית באינדונזיהשיחה טלפונית ללא תסריט בין שני אנשים. משוער. משך שמע (טווח) - 15-60 דקות, בהאסה אינדונזיתכפולשולחן העבודה5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה 524, זכר 454, לא ידוע 2
נאוםאינדונזית_MA_16אינדונזיאינדונזיאני עשיתי16 kHzמדיה אודיו643נתוני אודיו של מדיה אינדונזיתקובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקותמונהמקורות אינטרנט5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה 746, זכר 1507, לא ידוע 129
נאוםIrish_GC_8איריאיריen_IE8 kHzשיחה כללית192נתוני השיחה הכללית של איריתשיחה טלפונית ללא תסריט בין שני אנשים. משוער. משך אודיו (טווח) - 15-60 דקות, כפולשולחן העבודה5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה 213 , זכר 153 , לא ידוע 0
נאוםיפני_SM_48יפנייפניja-JP48 kHzמונולוג תסריטאי2,335מונולוג בכתב יפניהקלטות של אמירה בודדת, הנוטות ליפול בטווח של 5 עד 30 שניותמונהMobile App5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה 1460 זכר 1221 לא ידוע 194
נאוםקנאדה_CC_8קנאדהקנאדה (בצינור) kn_INמרכז שירות60נתוני מרכז טלפוני של קנאדה (בצינור).שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות,שולחן העבודה5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה
נאוםKannada_GCקנאדהקנאדה (בצינור) kn_INשיחה כללית100קנאדה (בצינור) נתוני שיחה כללייםשיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות,שולחן העבודה5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה
נאוםקנאדה_MAקנאדהקנאדה (בצינור) kn_INמדיה אודיו40Kannada (In Pipeline) נתוני אודיו של מדיהקובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקותמקורות אינטרנט5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה
נאוםקוריאנית_CC_8קוריאניקוריאניko_KR8 kHzמרכז שירות107נתוני מוקד טלפוני קוריאנישיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות,כפולשולחן העבודה5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה 1086, זכר 210, לא ידוע 4
נאוםקוריאנית_MA_16קוריאניקוריאניko_KR16 kHzמדיה אודיו204נתוני אודיו של מדיה קוריאניתקובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקותמונהמקורות אינטרנט5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה 70 זכר 303, לא ידוע 25
נאוםקוריאני_SM_48קוריאניקוריאניko-KR48 kHzמונולוג תסריטאי1,955מונולוג כתב קוריאניהקלטות של אמירה בודדת, הנוטות ליפול בטווח של 5 עד 30 שניותמונהMobile App5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה 1195 זכר 1134 לא ידוע 122
נאוםמלאית_GC_8מלאיתמלאיתms_MY8 kHzשיחה כללית266נתוני שיחה כללית במלזיתשיחה טלפונית ללא תסריט בין שני אנשים. משוער. משך אודיו (טווח) - 15-60 דקות, מלאית במלזיהכפולשולחן העבודה5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה 316, זכר 176, לא ידוע 0
נאוםמלאית_MA_16מלאיתמלאיתms_MY16 kHzמדיה אודיו344נתוני אודיו של מדיה מלאיתקובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקותמונהמקורות אינטרנט5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה 236, גבר 626, לא ידוע 47
נאוםMalayalam_CC_8מליאלאםמלאיאלאם (בצינור) ml_INמרכז שירות60נתוני מרכז טלפוני של Malaylam (In Pipeline).שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות,שולחן העבודה5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה
נאוםMalayalam_GCמליאלאםמלאיאלאם (בצינור) ml_INשיחה כללית100מליאלם (בצינור) נתוני שיחה כללייםשיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות,שולחן העבודה5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה
נאוםMalayalam_MAמליאלאםמלאיאלאם (בצינור) ml_INמדיה אודיו40Malaayalam (In Pipeline) נתוני אודיו של מדיהקובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקותמקורות אינטרנט5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה
נאוםMarathi_CC_8מרתיMarathi (בצינור) mr_INמרכז שירות60נתוני Marathi (In Pipeline) Call-Centerשיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות,שולחן העבודה5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה
נאוםMarathi_GCמרתיMarathi (בצינור) mr_INשיחה כללית100נתוני שיחה כללית של Marathi (In Pipeline).שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות,שולחן העבודה5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה
נאוםMarathi_MAמרתיMarathi (בצינור) mr_INמדיה אודיו40Marathi (In Pipeline) נתוני אודיו של מדיהקובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקותמקורות אינטרנט5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה
נאוםמקסיקני_SM_48ספרדית (מקסיקו)ספרדית (מקסיקו)en-MX48 kHzמונולוג תסריטאי1,492מונולוג כתב ספרדי מקסיקניהקלטות של אמירה בודדת, הנוטות ליפול בטווח של 5 עד 30 שניותמונהMobile App5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה 1016 זכר 1069 לא ידוע 95
נאוםהולנד_SM_48הולנדיהולנדיnl-NL48 kHzמונולוג תסריטאי1,205מונולוג כתב הולנדיהקלטות של אמירה בודדת, הנוטות ליפול בטווח של 5 עד 30 שניותמונהMobile App5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה 1285 זכר 531 לא ידוע 3
נאוםניו יורק אנגלית_CC_8ניו יורק אנגליתניו יורק אנגליתen_US8 kHzמרכז שירות103נתוני מוקד טלפוני בניו יורק באנגליתשיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות,כפולשולחן העבודה5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה 610, זכר 532, לא ידוע 0
נאוםניו יורק אנגלית_GC_8ניו יורק אנגליתניו יורק אנגליתen_US8 kHzשיחה כללית107נתוני שיחה כללית באנגלית בניו יורקשיחה טלפונית ללא תסריט בין שני אנשים. משוער. משך אודיו (טווח) - 15-60 דקות, כפולשולחן העבודה5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה 118, זכר 114, לא ידוע 0
נאוםניו יורק אנגלית_MA_16ניו יורק אנגליתניו יורק אנגליתen_US16 kHzמדיה אודיו140נתוני אודיו של ניו יורק אנגליתקובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקותמונהמקורות אינטרנט5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה 66, זכר 230, לא ידוע 11
נאוםניו זילנד_GC_8ניו זילנד אנגלית ניו זילנד אנגלית en_NZ8 kHzשיחה כללית148נתוני שיחה כללית באנגלית בניו זילנדשיחה טלפונית ללא תסריט בין שני אנשים. משוער. משך אודיו (טווח) - 15-60 דקות, כפולשולחן העבודה5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה 167, זכר 121, לא ידוע 4
נאוםניו זילנד_MA_16ניו זילנד אנגלית ניו זילנד אנגלית en_NZ16 kHzמדיה אודיו400אודיו של ניו זילנד מדיה אנגליתקובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקותמונהמקורות אינטרנט5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה 367, זכר 678, לא ידוע 26
נאוםOriya_CC_8אוריהאוריה (בצינור) or_INמרכז שירות60אוריה (בצנרת) נתוני Call-Centerשיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות,שולחן העבודה5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה
נאוםOriya_GCאוריהאוריה (בצינור) or_INשיחה כללית100אוריה (בצינור) נתוני שיחה כללייםשיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות,שולחן העבודה5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה
נאוםOriya_MAאוריהאוריה (בצינור) or_INמדיה אודיו40Oriya (In Pipeline) נתוני אודיו של מדיהקובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקותמקורות אינטרנט5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה
נאוםפולנית_MA_16פולניפולניpl_PL16 kHzמדיה אודיו269אודיו של מדיה פולניתקובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקותמונהמקורות אינטרנט5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה 173 זכר 354 לא ידוע 6
נאוםפולנית פולין_SM_48פולנית (פולין)פולנית (פולין)pl-PL48 kHzמונולוג תסריטאי1,482פולין פולין - מונולוג תסריטאיהקלטות של אמירה בודדת, הנוטות ליפול בטווח של 5 עד 30 שניותמונהMobile App5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה 1324 זכר 701 לא ידוע 24
נאוםפונג'בי_CC_8פונג'ביתפנג'בי (בצינור) פונג'ביתמרכז שירות60נתוני מרכז טלפוני של פונג'אבי (בצינור).שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות,שולחן העבודה5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה
נאוםפונג'בי_GCפונג'ביתפנג'בי (בצינור) פונג'ביתשיחה כללית100פונג'אבי (בצינור) נתוני שיחה כללייםשיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות,שולחן העבודה5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה
נאוםפונג'בי_MAפונג'ביתפנג'בי (בצינור) פונג'בית מדיה אודיו40פונג'אבי (בצינור) נתוני אודיו של מדיהקובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקותמקורות אינטרנט5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה
נאוםRussian_SM_48רוסירוסירו-רו48 kHzמונולוג תסריטאי2,398מונולוג בכתב רוסיהקלטות של אמירה בודדת, הנוטות ליפול בטווח של 5 עד 30 שניותמונהMobile App5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה 1689 זכר 1937 לא ידוע 214
נאוםScottish_GC_8סקוטי (מבטא אנגלי)סקוטי (מבטא אנגלי)en_AB8 kHzשיחה כללית292נתוני השיחה הכללית של סקוטלנדשיחה טלפונית ללא תסריט בין שני אנשים. משוער. משך אודיו (טווח) - 15-60 דקות, כפולשולחן העבודה5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה 285, זכר 260, לא ידוע 3
נאוםSingapore_CC_8סינגפור אנגליתסינגפור אנגליתen_SG8 kHzמרכז שירות218נתוני מרכז השיחות של סינגפורשיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות,כפולשולחן העבודה5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה 2139, זכר 884, לא ידוע 21
נאוםסינגפור_MA_16סינגפור אנגליתסינגפור אנגליתen_SG16 kHzמדיה אודיו247נתוני אודיו של סינגפור מדיהקובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקותמונהמקורות אינטרנט5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה 160, זכר 455, לא ידוע 37
נאוםאנגלית דרום אפריקאית_CC_8אנגלית דרום אפריקאיתאנגלית דרום אפריקאיתen_ZA8 kHzמרכז שירות261נתוני מרכז טלפון באנגלית דרום אפריקאיתשיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות,כפולשולחן העבודה5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה 1274 , זכר 935 , לא ידוע 1
נאוםאנגלית דרום אפריקאית_MA_16אנגלית דרום אפריקאיתאנגלית דרום אפריקאיתen_ZA16 kHzמדיה אודיו251נתוני אודיו של מדיה אנגלית דרום אפריקאיתקובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקותמונהמקורות אינטרנט5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה 235, זכר 432, לא ידוע 36
נאוםסוואהילית_CC_8סוואהיליתסוואהיליתsw_KE8 kHzמרכז שירות230נתוני מרכז טלפוני סוואהילישיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות,כפולשולחן העבודה5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה 611, זכר 833, לא ידוע 0
נאוםסוואהילית_MA_16סוואהיליתסוואהיליתsw_KE16 kHzמדיה אודיו265נתוני אודיו של מדיה סוואהיליתקובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקותמונהמקורות אינטרנט5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה 118, זכר 493, לא ידוע 25
נאוםSwedish_CC_8שבדישבדיsv_SE8 kHzמרכז שירות250נתוני מרכז טלפוני שוודישיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות,כפולשולחן העבודה5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה 1581, זכר 727, לא ידוע 2
נאוםשוודית_MA_16שבדישבדיsv_SE16 kHzמדיה אודיו278נתוני אודיו של מדיה שוודיתקובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקותמונהמקורות אינטרנט5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה 195, זכר 500, לא ידוע 21
נאוםTamil_CC_8טמיליתטמילית (בצינור) ta_INמרכז שירות60נתוני מרכז טלפוני טמילית (בצינור).שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות,שולחן העבודה5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה
נאוםTamil_GCטמיליתטמילית (בצינור) ta_INשיחה כללית100נתוני שיחה כללית טמילית (בצינור).שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות,שולחן העבודה5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה
נאוםTamil_MAטמילית טמילית (בצינור) ta_INמדיה אודיו40טמילית (בצינור) נתוני אודיו של מדיהקובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקותמקורות אינטרנט5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה
נאוםTelugu_GC_8טלוגוטלוגוte_IN8 kHzשיחה כללית553נתוני שיחה כללית של טלוגושיחה טלפונית ללא תסריט בין שני אנשים. משוער. משך אודיו (טווח) - 15-60 דקות, כפולשולחן העבודה5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה 574, זכר 564, לא ידוע 0
נאוםTelugu_MA_16טלוגוטלוגוte_IN16 kHzמדיה אודיו648נתוני אודיו של Telugu Mediaקובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקותמונהמקורות אינטרנט5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה 207, זכר 963, לא ידוע 2
נאוםTelugu_CC_8טלוגוטלוגו (בצינור) te_INמרכז שירות30נתוני Telugu (In Pipeline) Call-Centerשיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות,שולחן העבודה5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה
נאוםTelugu_GCטלוגוטלוגו (בצינור) te_INשיחה כללית50טלוגו (בצינור) נתוני שיחה כללייםשיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות,שולחן העבודה5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה
נאוםTelugu_MAטלוגוטלוגו (בצינור) te_INמדיה אודיו20Telugu (In Pipeline) נתוני אודיו של מדיהקובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקותמקורות אינטרנט5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה
נאוםThai_GC_8תאילנדיתאילנדיth_TH8 kHzשיחה כללית183שיחה כללית תאילנדיתשיחה טלפונית ללא תסריט בין שני אנשים. משוער. משך אודיו (טווח) - 15-60 דקות, רישום לא רשמי בשימוש בין חבריםכפולשולחן העבודה5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה 338, זכר 96, לא ידוע 8
נאוםThai_MA_8תאילנדיתאילנדיth_TH16 kHzמדיה אודיו173אודיו של מדיה תאילנדיתקובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקותמונהמקורות אינטרנט5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה 143, זכר 502, לא ידוע 26
נאוםטורקיה טורקיה_SM_48טורקיה טורקיתטורקיה טורקיתtr-TR48 kHzמונולוג תסריטאי2,027טורקיה טורקיתהקלטות של אמירה בודדת, הנוטות ליפול בטווח של 5 עד 30 שניותמונהMobile App5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה 1561 זכר 1241 לא ידוע 31
נאוםוייטנאמית_GC_8ויאטנמיתויאטנמיתvi_VN8 kHzשיחה כללית295נתוני שיחה כללית וייטנאמיתשיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות, צפון (למשל, האנוי), מרכז ודרום (למשל, הו צ'י מין סיטי).כפולשולחן העבודה5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה 400, גבר 380, אלמונים 2
נאוםוייטנאמית_MA_16ויאטנמיתויאטנמיתvi_VN16 kHzמדיה אודיו257נתוני אודיו של מדיה וייטנאמיתקובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקותמונהמקורות אינטרנט5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה 249, גבר 200, אלמונים 45
נאוםWelsh_GC_8וולשית (מבטא אנגלי)וולשית (מבטא אנגלי)en_WL8 kHzשיחה כללית278נתוני שיחה כללית בוולשיתשיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות,כפולשולחן העבודה5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהנקבה 270, זכר 324, לא ידוע 0
נאוםבריטניה אנגלית_WW_16אנגלית אנגליתאנגלית אנגליתen_uk16 kHzלהתעורר Wordרמקולים 200Wake Word באנגלית אנגליתאיסוף ביטויי מפתח של נתונים
  • רמקולים 200
  • 4 ביטויי מפתח ייחודיים לכל רמקול
  • 25-30 הקלטות חוזרות של ביטויי מפתח לכל ביטוי מפתח ייחודי
  • 25-30 קבצי שמע לכל ביטוי מפתח ייחודי
  • סה"כ 120 התבטאויות מוקלטות לכל דובר
ערוץ 1Mobile App5.0. Wav‎.jsonASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפהמין: 50% גברים, 50% נשים, +/- 10%.

Ground Truth אודיו ונתוני דיבור כדי להאיץ את פיתוח הבינה המלאכותית שלך לשיחה

עם יותר מ-40 שעות של מערך נתונים/מערכי נתונים קוליים, Shaip יכול לעזור לך להתאים את מודלים של AI לשיחה עם מערכי נתונים באיכות גבוהה של דיבור. מערכי הנתונים של הקול בתקן הזהב נאספים במספר שפות ודיאלקטים, דמוגרפיה, תכונות דובר, סוגי דיאלוג, סביבות ותרחישים. אם אתה לא מוצא את מה שאתה מחפש? - Shaip יכול לעזור לך עם כל מערך נתונים קולי בכל מין, גיל, שפה או הגדרות.

מעטים ממערכי הנתונים של השפה שאנו תומכים בהם: יש לנו מערכי נתונים על כל השפות והדיאלקטים העיקריים. חלק מהשפות הפופולריות ביותר שלנו כוללות:

מערכי נתונים קוליים אפריקאיים

מערכי נתונים קוליים בערבית

מערכי נתונים קוליים קנדיים

מערכי נתונים קוליים סיניים

מערכי נתונים קוליים דניים

מערכי נתונים קוליים באנגלית

מערכי נתונים קוליים גרמניים

ערכות נתונים קוליות בעברית

מערכי נתונים קוליים באינדונזיה

מערכי נתונים של קול אירי

מערכי נתונים קוליים יפניים

ערכות נתונים קוליות קוריאניות

ערכות נתונים קוליות מקסיקניות

ערכות נתונים קוליות פולניות

ערכות נתונים של קול רוסי

מערכי נתונים קוליים סקוטי

ערכות נתונים קוליות ספרדית

מערכי נתונים קוליים שבדיים

מערכי נתונים של קול תאילנדי

ערכות נתונים קוליות טורקיות

מערכי נתונים קוליים וייטנאמיים

תיאור מערך הנתונים

שיחות מוקד טלפוני 8khz: שיחה טלפונית סינתטית ללא תסריט: "סוכן" ו"לקוח"

שיחות כלליות 8khz: שיחה טלפונית ללא תסריט בין 2 אנשים

מדיה ופודקאסטים 16khz: ראיונות אודיו/וידאו ברשות הרבים, פודקאסטים וכו' 1-5 אנשים

אמירה/מונולוג תסריטאי 16khz: הקלטה מבוססת על הנחיה 

שייפ צור קשר

לא מצאתם את מה שאתם מחפשים?

מערכי נתונים חדשים של אודיו ודיבור מהמדפים נאספים בכל סוגי הנתונים 

צור איתנו קשר עכשיו כדי להשתחרר מהדאגות שלך לאיסוף נתוני אודיו/דיבור

  • בהרשמה אני מסכים עם שייפ מדיניות הפרטיות ו תנאי שימוש באתר ולספק את הסכמתי לקבל תקשורת שיווקית B2B משאיפ.