ערכות נתונים באיכות גבוהה של אודיו / דיבור / קול כדי לאמן את מודל הבינה המלאכותית שלך לשיחה
ערכות נתונים קוליות / דיבור / אודיו מהמדף במספר שפות כדי להתחיל את דגמי זיהוי הדיבור האוטומטי (ASR) שלך
חבר את קטלוג נתוני האודיו שחסר לך היום
פרטים | מזהה קורפוס (ייחודי) | מילות מפתח | ערכת נתונים של שפה | קוד שפה | קצב דגימה | סוג מערך נתונים | סך כל שעות השמע | תיאור קצר | תיאור מערך הנתונים | ערוץ אודיו | פלטפורמת הקלטה | WER (%) | פורמט אודיו | פורמט תמלול | השתמש מקרה | מספר הרמקולים | CTA |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
en_US_CC_8 | שפת עור אפרו-אמריקאית | שפת עור אפרו-אמריקאית | en_US | 8 kHz | מרכז שירות | 211 | נתוני מוקד טלפוני אפרו-אמריקאי | שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות, | כפול | שולחן העבודה | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה: 612, זכר: 1242, ולא ידוע: 12 | צור קשר | |
en_US_MA_16 | שפת עור אפרו-אמריקאית | שפת עור אפרו-אמריקאית | en_US | 16 kHz | מדיה אודיו | 154 | נתוני מדיה עממית אפרו-אמריקאית | קובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקות | מונה | מקורות אינטרנט | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה: 151, זכר: 150, ולא ידוע: 10 | צור קשר | |
Afrikaans_GC_8 | אפריקאנס | אפריקאנס | af_ZA | 8 kHz | שיחה כללית | 368 | נתוני שיחה כללית באפריקנס | שיחה טלפונית ללא תסריט בין שני אנשים. משוער. משך אודיו (טווח) - 15-60 דקות, אפריקנס המדוברת באפריקה | כפול | שולחן העבודה | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה: 502, זכר: 390, ולא ידוע: 2 | צור קשר | |
אפריקאנס_MA_16 | אפריקאנס | אפריקאנס | af_ZA | 16 kHz | מדיה אודיו | 658 | קבצי מדיה באפריקה | קובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקות | מונה | מקורות אינטרנט | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה: 750, זכר: 1278, ולא ידוע: 52 | צור קשר | |
ערבית_GC_8 | ערבי | ערבי | ar_AE | 8 kHz | שיחה כללית | 292 | נתוני שיחות כלליות בערבית | שיחה טלפונית ללא תסריט בין שני אנשים. משוער. משך שמע (טווח) - 15-60 דקות, ערבית ממדינות המפרץ | כפול | שולחן העבודה | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה: 171, זכר: 534, ולא ידוע: 1 | צור קשר | |
ערבית_SM_48 | ערבי | ערבי | ar-SA | 48 kHz | מונולוג תסריטאי | 1,947 | מונולוג בכתב ערבי | הקלטות של אמירה בודדת, הנוטות ליפול בטווח של 5 עד 30 שניות | מונה | Mobile App | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה 838 זכר 1209 לא ידוע 78 | צור קשר | |
Assamese_CC_8 | אסאמית | אסאמית (בצינור) | as_IN | מרכז שירות | 60 | נתוני מרכז טלפוני אסאמי (בצינור). | שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות, | שולחן העבודה | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | צור קשר | ||||
Assamese_GC | אסאמית | אסאמית (בצינור) | as_IN | שיחה כללית | 100 | נתוני שיחות כלליות אסאמי (בצינור). | שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות, | שולחן העבודה | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | צור קשר | ||||
Assamese_MA | אסאמית | אסאמית (בצינור) | as_IN | מדיה אודיו | 40 | נתוני אודיו של מדיה אסאמית (בצינור). | קובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקות | מקורות אינטרנט | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | צור קשר | ||||
בנגלית_CC_8 | בנגלית | בנגלית (בצינור) | bn_IN | מרכז שירות | 60 | נתוני מרכז טלפוני בנגלית (בצינור). | שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות, | שולחן העבודה | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | צור קשר | ||||
Bengali_GC | בנגלית | בנגלית (בצינור) | bn_IN | שיחה כללית | 100 | בנגלית (בצינור) נתוני שיחה כלליים | שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות, | שולחן העבודה | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | צור קשר | ||||
בנגלית_MA | בנגלית | בנגלית (בצינור) | bn_IN | מדיה אודיו | 40 | בנגלית (בצינור) נתוני אודיו של מדיה | קובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקות | מקורות אינטרנט | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | צור קשר | ||||
Boston_CC_8 | בוסטון אנגלית | בוסטון אנגלית | en_US | 8 kHz | מרכז שירות | 177 | נתוני מרכז השיחות של בוסטון | שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות, | כפול | שולחן העבודה | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה: 605, זכר: 711, ולא ידוע: 0 | צור קשר | |
Boston_GC_8 | בוסטון אנגלית | בוסטון אנגלית | en_US | 8 kHz | שיחה כללית | 32 | נתוני השיחה הכללית של בוסטון | שיחה טלפונית ללא תסריט בין שני אנשים. משוער. משך אודיו (טווח) - 15-60 דקות, | כפול | שולחן העבודה | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה: 53, זכר: 83, ולא ידוע: 0 | צור קשר | |
Boston_MA_16 | בוסטון אנגלית | בוסטון אנגלית | en_US | 16 kHz | מדיה אודיו | 93 | נתוני אודיו של Boston Media | קובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקות | מונה | מקורות אינטרנט | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה: 43, זכר: 181, ולא ידוע: 2 | צור קשר | |
קנדי_SM_48 | צרפתית קנדית | צרפתית קנדית | fr-CA | 48 kHz | מונולוג תסריטאי | 1,222 | צרפתית קנדית | הקלטות של אמירה בודדת, הנוטות ליפול בטווח של 5 עד 30 שניות | מונה | Mobile App | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה 974 זכר 631 לא ידוע 1 | צור קשר | |
סינית_CC_8 | אנגלית סינית | אנגלית סינית | en_US | 8 kHz | מרכז שירות | 169 | נתוני מוקד טלפוני סיני | שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות, | כפול | שולחן העבודה | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה: 1790, זכר: 523 ולא ידוע: 13 | צור קשר | |
סינית_MA_16 | אנגלית סינית | אנגלית סינית | en_US | 16 kHz | מדיה אודיו | 249 | נתוני אודיו של מדיה סינית | קובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקות | מונה | מקורות אינטרנט | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה: 126, זכר: 346 ולא ידוע: 6 | צור קשר | |
סינית פשוטה_SM_48 | סינית | סינית | zh-CN | 48 kHz | מונולוג תסריטאי | 2,762 | סינית | הקלטות של אמירה בודדת, הנוטות ליפול בטווח של 5 עד 30 שניות | מונה | Mobile App | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה 1920 זכר 1535 לא ידוע 270 | צור קשר | |
סינית מסורתית_SM_48 | סינית מסורתית | סינית מסורתית | zh-TW | 48 kHz | מונולוג תסריטאי | 1,028 | סינית מסורתית | הקלטות של אמירה בודדת, הנוטות ליפול בטווח של 5 עד 30 שניות | מונה | Mobile App | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה 1069 זכר 262 לא ידוע 3 | צור קשר | |
Danish_GC_8 | דני | דני | da_DK | 8 kHz | שיחה כללית | 372 | נתוני שיחה כללית דנית | שיחה טלפונית ללא תסריט בין שני אנשים. משוער. משך אודיו (טווח) - 15-60 דקות, | כפול | שולחן העבודה | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה: 311, זכר: 417, לא ידוע: 0 | צור קשר | |
דנית_MA_16 | דני | דני | da_DK | 16 kHz | מדיה אודיו | 664 | נתוני אודיו של מדיה דנית | קובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקות | מונה | מקורות אינטרנט | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה: 369, זכר: 864, לא ידוע: 27 | צור קשר | |
דנית_SM_48 | דני | דני | da-DK | 48 kHz | מונולוג תסריטאי | 2,579 | מונולוג בכתב דני | הקלטות של אמירה בודדת, הנוטות ליפול בטווח של 5 עד 30 שניות, דנית מדנמרק | מונה | Mobile App | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה 1551 זכר 1233 לא ידוע 42 | צור קשר | |
אנגלית עמוקה דרום_CC_8 | דרום דרום עמוק | דרום דרום עמוק | en_US | 8 kHz | מרכז שירות | 151 | מידע מוקד טלפוני בדרום עמוק באנגלית | שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות, | כפול | שולחן העבודה | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה 221 , זכר 1004 , לא ידוע 7 | צור קשר | |
אנגלית עמוקה דרום_GC_8 | דרום דרום עמוק | דרום דרום עמוק | en_US | 8 kHz | שיחה כללית | 56 | נתוני שיחה כללית בדרום עמוק באנגלית | שיחה טלפונית ללא תסריט בין שני אנשים. משוער. משך אודיו (טווח) - 15-60 דקות, | כפול | שולחן העבודה | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה 99, גבר 31, לא ידוע 0 | צור קשר | |
אנגלית עמוקה דרום_MA_16 | דרום דרום עמוק | דרום דרום עמוק | en_US | 16 kHz | מדיה אודיו | 266 | נתוני אודיו באנגלית Deep South Media | קובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקות | מונה | מקורות אינטרנט | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה 204, גבר 356, לא ידוע 21 | צור קשר | |
גרמנית_CC_8 | גרמנית | גרמנית | דה-דה | 8 kHz | מרכז שירות | 64 | נתוני מוקד טלפוני גרמני | שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות, | מונה | שולחן העבודה | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה 478 זכר 1440 לא ידוע 0 | צור קשר | ||
גרמנית_IVR_8 | גרמנית | גרמנית | דה-דה | 8 kHz | סיומת IVR | 200 | נתוני IVR גרמניים | אדם למכונה. זרימה מסוג IVR שבה יש הנחית TTS (למשל "איך אוכל לעזור לך") ואחריה תגובה אנושית ספונטנית | מונה | שולחן העבודה | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה 10115 זכר 8750 לא ידוע 0 | צור קשר | ||
Gujarati_CC_8 | גוג'ראטית | גוג'ראטי (בצינור) | gu_IN | מרכז שירות | 60 | נתוני מוקד טלפוני של גוג'ראטי (בצינור). | שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות, | שולחן העבודה | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | צור קשר | ||||
Gujarati_GC | גוג'ראטית | גוג'ראטי (בצינור) | gu_IN | שיחה כללית | 100 | נתוני שיחות כלליות של גוג'ראטי (בצינור). | שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות, | שולחן העבודה | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | צור קשר | ||||
Gujarati_MA | גוג'ראטית | גוג'ראטי (בצינור) | gu_IN | מדיה אודיו | 40 | גוג'ראטי (בצינור) נתוני אודיו של מדיה | קובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקות | מקורות אינטרנט | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | צור קשר | ||||
עברית_שיחה כללית_8 | עברית | עברית | he_IL | 8 kHz | שיחה כללית | 399 | נתוני שיחות כלליות בעברית | שיחה טלפונית ללא תסריט בין שני אנשים. משוער. משך שמע (טווח) - 15-60 דקות, עברית בישראל | כפול | שולחן העבודה | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה 414, זכר 399, לא ידוע 1 | צור קשר | |
עברית_MA_16 | עברית | עברית | he_IL | 16 kHz | מדיה אודיו | 427 | נתוני אודיו של מדיה עברית | קובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקות | מונה | מקורות אינטרנט | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה 361, זכר 513, לא ידוע 13 | צור קשר | |
הינדי_MA_16 | הינדי | הינדי | היי_IN | 16 kHz | מדיה אודיו | 219 | נתוני אודיו של מדיה הינדי | קובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקות | מונה | מקורות אינטרנט | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה 83, זכר 309, לא ידוע 0 | צור קשר | |
הינדי_SM_48 | הינדי | הינדי | היי-אין | 48 kHz | מונולוג תסריטאי | 2,867 | מונולוג תסריטאי הינדי | הקלטות של אמירה בודדת, הנוטות ליפול בטווח של 5 עד 30 שניות | מונה | Mobile App | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה 1977 זכר 1864 לא ידוע 147 | צור קשר | |
HINGLISH_CC_8 | הינגליש | הינגליש | hg_IN | 8 kHz | מרכז שירות | 208 | HINGLISH נתוני מוקד טלפוני | שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות, | כפול | שולחן העבודה | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה 822, זכר 1262, לא ידוע 0 | צור קשר | |
HINGLISH_MA_16 | הינגליש | הינגליש | hg_IN | 16 kHz | מדיה אודיו | 216 | HINGLISH נתוני אודיו של מדיה | קובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקות | מונה | מקורות אינטרנט | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה 75, גבר 380, לא ידוע 0 | צור קשר | |
Hispanic_CC_8 | אנגלית היספנית | אנגלית היספנית | en_US | 8 kHz | מרכז שירות | 212 | נתוני מוקד טלפוני היספניים | שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות, | כפול | שולחן העבודה | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה 822, זכר 1262, לא ידוע 0 | צור קשר | |
Hispanic_MA_16 | אנגלית היספנית | אנגלית היספנית | en_US | 16 kHz | מדיה אודיו | 155 | אודיו היספני Call Media | קובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקות | מונה | מקורות אינטרנט | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה 140, זכר 219, לא ידוע 5 | צור קשר | |
אינדונזית_GC_8 | אינדונזי | אינדונזי | אני עשיתי | 8 kHz | שיחה כללית | 496 | נתוני שיחה כללית באינדונזיה | שיחה טלפונית ללא תסריט בין שני אנשים. משוער. משך שמע (טווח) - 15-60 דקות, בהאסה אינדונזית | כפול | שולחן העבודה | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה 524, זכר 454, לא ידוע 2 | צור קשר | |
אינדונזית_MA_16 | אינדונזי | אינדונזי | אני עשיתי | 16 kHz | מדיה אודיו | 643 | נתוני אודיו של מדיה אינדונזית | קובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקות | מונה | מקורות אינטרנט | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה 746, זכר 1507, לא ידוע 129 | צור קשר | |
Irish_GC_8 | אירי | אירי | en_IE | 8 kHz | שיחה כללית | 192 | נתוני השיחה הכללית של אירית | שיחה טלפונית ללא תסריט בין שני אנשים. משוער. משך אודיו (טווח) - 15-60 דקות, | כפול | שולחן העבודה | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה 213 , זכר 153 , לא ידוע 0 | צור קשר | |
יפני_SM_48 | יפני | יפני | ja-JP | 48 kHz | מונולוג תסריטאי | 2,335 | מונולוג בכתב יפני | הקלטות של אמירה בודדת, הנוטות ליפול בטווח של 5 עד 30 שניות | מונה | Mobile App | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה 1460 זכר 1221 לא ידוע 194 | צור קשר | |
קנאדה_CC_8 | קנאדה | קנאדה (בצינור) | kn_IN | מרכז שירות | 60 | נתוני מרכז טלפוני של קנאדה (בצינור). | שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות, | שולחן העבודה | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | צור קשר | ||||
Kannada_GC | קנאדה | קנאדה (בצינור) | kn_IN | שיחה כללית | 100 | קנאדה (בצינור) נתוני שיחה כלליים | שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות, | שולחן העבודה | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | צור קשר | ||||
קנאדה_MA | קנאדה | קנאדה (בצינור) | kn_IN | מדיה אודיו | 40 | Kannada (In Pipeline) נתוני אודיו של מדיה | קובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקות | מקורות אינטרנט | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | צור קשר | ||||
קוריאנית_CC_8 | קוריאני | קוריאני | ko_KR | 8 kHz | מרכז שירות | 107 | נתוני מוקד טלפוני קוריאני | שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות, | כפול | שולחן העבודה | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה 1086, זכר 210, לא ידוע 4 | צור קשר | |
קוריאנית_MA_16 | קוריאני | קוריאני | ko_KR | 16 kHz | מדיה אודיו | 204 | נתוני אודיו של מדיה קוריאנית | קובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקות | מונה | מקורות אינטרנט | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה 70 זכר 303, לא ידוע 25 | צור קשר | |
קוריאני_SM_48 | קוריאני | קוריאני | ko-KR | 48 kHz | מונולוג תסריטאי | 1,955 | מונולוג כתב קוריאני | הקלטות של אמירה בודדת, הנוטות ליפול בטווח של 5 עד 30 שניות | מונה | Mobile App | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה 1195 זכר 1134 לא ידוע 122 | צור קשר | |
מלאית_GC_8 | מלאית | מלאית | ms_MY | 8 kHz | שיחה כללית | 266 | נתוני שיחה כללית במלזית | שיחה טלפונית ללא תסריט בין שני אנשים. משוער. משך אודיו (טווח) - 15-60 דקות, מלאית במלזיה | כפול | שולחן העבודה | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה 316, זכר 176, לא ידוע 0 | צור קשר | |
מלאית_MA_16 | מלאית | מלאית | ms_MY | 16 kHz | מדיה אודיו | 344 | נתוני אודיו של מדיה מלאית | קובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקות | מונה | מקורות אינטרנט | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה 236, גבר 626, לא ידוע 47 | צור קשר | |
Malayalam_CC_8 | מליאלאם | מלאיאלאם (בצינור) | ml_IN | מרכז שירות | 60 | נתוני מרכז טלפוני של Malaylam (In Pipeline). | שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות, | שולחן העבודה | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | צור קשר | ||||
Malayalam_GC | מליאלאם | מלאיאלאם (בצינור) | ml_IN | שיחה כללית | 100 | מליאלם (בצינור) נתוני שיחה כלליים | שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות, | שולחן העבודה | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | צור קשר | ||||
Malayalam_MA | מליאלאם | מלאיאלאם (בצינור) | ml_IN | מדיה אודיו | 40 | Malaayalam (In Pipeline) נתוני אודיו של מדיה | קובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקות | מקורות אינטרנט | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | צור קשר | ||||
Marathi_CC_8 | מרתי | Marathi (בצינור) | mr_IN | מרכז שירות | 60 | נתוני Marathi (In Pipeline) Call-Center | שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות, | שולחן העבודה | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | צור קשר | ||||
Marathi_GC | מרתי | Marathi (בצינור) | mr_IN | שיחה כללית | 100 | נתוני שיחה כללית של Marathi (In Pipeline). | שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות, | שולחן העבודה | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | צור קשר | ||||
Marathi_MA | מרתי | Marathi (בצינור) | mr_IN | מדיה אודיו | 40 | Marathi (In Pipeline) נתוני אודיו של מדיה | קובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקות | מקורות אינטרנט | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | צור קשר | ||||
מקסיקני_SM_48 | ספרדית (מקסיקו) | ספרדית (מקסיקו) | en-MX | 48 kHz | מונולוג תסריטאי | 1,492 | מונולוג כתב ספרדי מקסיקני | הקלטות של אמירה בודדת, הנוטות ליפול בטווח של 5 עד 30 שניות | מונה | Mobile App | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה 1016 זכר 1069 לא ידוע 95 | צור קשר | |
הולנד_SM_48 | הולנדי | הולנדי | nl-NL | 48 kHz | מונולוג תסריטאי | 1,205 | מונולוג כתב הולנדי | הקלטות של אמירה בודדת, הנוטות ליפול בטווח של 5 עד 30 שניות | מונה | Mobile App | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה 1285 זכר 531 לא ידוע 3 | צור קשר | |
ניו יורק אנגלית_CC_8 | ניו יורק אנגלית | ניו יורק אנגלית | en_US | 8 kHz | מרכז שירות | 103 | נתוני מוקד טלפוני בניו יורק באנגלית | שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות, | כפול | שולחן העבודה | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה 610, זכר 532, לא ידוע 0 | צור קשר | |
ניו יורק אנגלית_GC_8 | ניו יורק אנגלית | ניו יורק אנגלית | en_US | 8 kHz | שיחה כללית | 107 | נתוני שיחה כללית באנגלית בניו יורק | שיחה טלפונית ללא תסריט בין שני אנשים. משוער. משך אודיו (טווח) - 15-60 דקות, | כפול | שולחן העבודה | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה 118, זכר 114, לא ידוע 0 | צור קשר | |
ניו יורק אנגלית_MA_16 | ניו יורק אנגלית | ניו יורק אנגלית | en_US | 16 kHz | מדיה אודיו | 140 | נתוני אודיו של ניו יורק אנגלית | קובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקות | מונה | מקורות אינטרנט | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה 66, זכר 230, לא ידוע 11 | צור קשר | |
ניו זילנד_GC_8 | ניו זילנד אנגלית | ניו זילנד אנגלית | en_NZ | 8 kHz | שיחה כללית | 148 | נתוני שיחה כללית באנגלית בניו זילנד | שיחה טלפונית ללא תסריט בין שני אנשים. משוער. משך אודיו (טווח) - 15-60 דקות, | כפול | שולחן העבודה | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה 167, זכר 121, לא ידוע 4 | צור קשר | |
ניו זילנד_MA_16 | ניו זילנד אנגלית | ניו זילנד אנגלית | en_NZ | 16 kHz | מדיה אודיו | 400 | אודיו של ניו זילנד מדיה אנגלית | קובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקות | מונה | מקורות אינטרנט | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה 367, זכר 678, לא ידוע 26 | צור קשר | |
Oriya_CC_8 | אוריה | אוריה (בצינור) | or_IN | מרכז שירות | 60 | אוריה (בצנרת) נתוני Call-Center | שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות, | שולחן העבודה | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | צור קשר | ||||
Oriya_GC | אוריה | אוריה (בצינור) | or_IN | שיחה כללית | 100 | אוריה (בצינור) נתוני שיחה כלליים | שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות, | שולחן העבודה | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | צור קשר | ||||
Oriya_MA | אוריה | אוריה (בצינור) | or_IN | מדיה אודיו | 40 | Oriya (In Pipeline) נתוני אודיו של מדיה | קובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקות | מקורות אינטרנט | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | צור קשר | ||||
פולנית_MA_16 | פולני | פולני | pl_PL | 16 kHz | מדיה אודיו | 269 | אודיו של מדיה פולנית | קובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקות | מונה | מקורות אינטרנט | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה 173 זכר 354 לא ידוע 6 | צור קשר | |
פולנית פולין_SM_48 | פולנית (פולין) | פולנית (פולין) | pl-PL | 48 kHz | מונולוג תסריטאי | 1,482 | פולין פולין - מונולוג תסריטאי | הקלטות של אמירה בודדת, הנוטות ליפול בטווח של 5 עד 30 שניות | מונה | Mobile App | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה 1324 זכר 701 לא ידוע 24 | צור קשר | |
פונג'בי_CC_8 | פונג'בית | פנג'בי (בצינור) | פונג'בית | מרכז שירות | 60 | נתוני מרכז טלפוני של פונג'אבי (בצינור). | שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות, | שולחן העבודה | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | צור קשר | ||||
פונג'בי_GC | פונג'בית | פנג'בי (בצינור) | פונג'בית | שיחה כללית | 100 | פונג'אבי (בצינור) נתוני שיחה כלליים | שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות, | שולחן העבודה | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | צור קשר | ||||
פונג'בי_MA | פונג'בית | פנג'בי (בצינור) | פונג'בית | מדיה אודיו | 40 | פונג'אבי (בצינור) נתוני אודיו של מדיה | קובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקות | מקורות אינטרנט | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | צור קשר | ||||
Russian_SM_48 | רוסי | רוסי | רו-רו | 48 kHz | מונולוג תסריטאי | 2,398 | מונולוג בכתב רוסי | הקלטות של אמירה בודדת, הנוטות ליפול בטווח של 5 עד 30 שניות | מונה | Mobile App | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה 1689 זכר 1937 לא ידוע 214 | צור קשר | |
Scottish_GC_8 | סקוטי (מבטא אנגלי) | סקוטי (מבטא אנגלי) | en_AB | 8 kHz | שיחה כללית | 292 | נתוני השיחה הכללית של סקוטלנד | שיחה טלפונית ללא תסריט בין שני אנשים. משוער. משך אודיו (טווח) - 15-60 דקות, | כפול | שולחן העבודה | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה 285, זכר 260, לא ידוע 3 | צור קשר | |
Singapore_CC_8 | סינגפור אנגלית | סינגפור אנגלית | en_SG | 8 kHz | מרכז שירות | 218 | נתוני מרכז השיחות של סינגפור | שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות, | כפול | שולחן העבודה | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה 2139, זכר 884, לא ידוע 21 | צור קשר | |
סינגפור_MA_16 | סינגפור אנגלית | סינגפור אנגלית | en_SG | 16 kHz | מדיה אודיו | 247 | נתוני אודיו של סינגפור מדיה | קובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקות | מונה | מקורות אינטרנט | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה 160, זכר 455, לא ידוע 37 | צור קשר | |
אנגלית דרום אפריקאית_CC_8 | אנגלית דרום אפריקאית | אנגלית דרום אפריקאית | en_ZA | 8 kHz | מרכז שירות | 261 | נתוני מרכז טלפון באנגלית דרום אפריקאית | שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות, | כפול | שולחן העבודה | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה 1274 , זכר 935 , לא ידוע 1 | צור קשר | |
אנגלית דרום אפריקאית_MA_16 | אנגלית דרום אפריקאית | אנגלית דרום אפריקאית | en_ZA | 16 kHz | מדיה אודיו | 251 | נתוני אודיו של מדיה אנגלית דרום אפריקאית | קובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקות | מונה | מקורות אינטרנט | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה 235, זכר 432, לא ידוע 36 | צור קשר | |
סוואהילית_CC_8 | סוואהילית | סוואהילית | sw_KE | 8 kHz | מרכז שירות | 230 | נתוני מרכז טלפוני סוואהילי | שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות, | כפול | שולחן העבודה | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה 611, זכר 833, לא ידוע 0 | צור קשר | |
סוואהילית_MA_16 | סוואהילית | סוואהילית | sw_KE | 16 kHz | מדיה אודיו | 265 | נתוני אודיו של מדיה סוואהילית | קובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקות | מונה | מקורות אינטרנט | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה 118, זכר 493, לא ידוע 25 | צור קשר | |
Swedish_CC_8 | שבדי | שבדי | sv_SE | 8 kHz | מרכז שירות | 250 | נתוני מרכז טלפוני שוודי | שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות, | כפול | שולחן העבודה | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה 1581, זכר 727, לא ידוע 2 | צור קשר | |
שוודית_MA_16 | שבדי | שבדי | sv_SE | 16 kHz | מדיה אודיו | 278 | נתוני אודיו של מדיה שוודית | קובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקות | מונה | מקורות אינטרנט | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה 195, זכר 500, לא ידוע 21 | צור קשר | |
Tamil_CC_8 | טמילית | טמילית (בצינור) | ta_IN | מרכז שירות | 60 | נתוני מרכז טלפוני טמילית (בצינור). | שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות, | שולחן העבודה | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | צור קשר | ||||
Tamil_GC | טמילית | טמילית (בצינור) | ta_IN | שיחה כללית | 100 | נתוני שיחה כללית טמילית (בצינור). | שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות, | שולחן העבודה | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | צור קשר | ||||
Tamil_MA | טמילית | טמילית (בצינור) | ta_IN | מדיה אודיו | 40 | טמילית (בצינור) נתוני אודיו של מדיה | קובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקות | מקורות אינטרנט | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | צור קשר | ||||
Telugu_GC_8 | טלוגו | טלוגו | te_IN | 8 kHz | שיחה כללית | 553 | נתוני שיחה כללית של טלוגו | שיחה טלפונית ללא תסריט בין שני אנשים. משוער. משך אודיו (טווח) - 15-60 דקות, | כפול | שולחן העבודה | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה 574, זכר 564, לא ידוע 0 | צור קשר | |
Telugu_MA_16 | טלוגו | טלוגו | te_IN | 16 kHz | מדיה אודיו | 648 | נתוני אודיו של Telugu Media | קובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקות | מונה | מקורות אינטרנט | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה 207, זכר 963, לא ידוע 2 | צור קשר | |
Telugu_CC_8 | טלוגו | טלוגו (בצינור) | te_IN | מרכז שירות | 30 | נתוני Telugu (In Pipeline) Call-Center | שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות, | שולחן העבודה | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | צור קשר | ||||
Telugu_GC | טלוגו | טלוגו (בצינור) | te_IN | שיחה כללית | 50 | טלוגו (בצינור) נתוני שיחה כלליים | שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות, | שולחן העבודה | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | צור קשר | ||||
Telugu_MA | טלוגו | טלוגו (בצינור) | te_IN | מדיה אודיו | 20 | Telugu (In Pipeline) נתוני אודיו של מדיה | קובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקות | מקורות אינטרנט | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | צור קשר | ||||
Thai_GC_8 | תאילנדי | תאילנדי | th_TH | 8 kHz | שיחה כללית | 183 | שיחה כללית תאילנדית | שיחה טלפונית ללא תסריט בין שני אנשים. משוער. משך אודיו (טווח) - 15-60 דקות, רישום לא רשמי בשימוש בין חברים | כפול | שולחן העבודה | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה 338, זכר 96, לא ידוע 8 | צור קשר | |
Thai_MA_8 | תאילנדי | תאילנדי | th_TH | 16 kHz | מדיה אודיו | 173 | אודיו של מדיה תאילנדית | קובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקות | מונה | מקורות אינטרנט | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה 143, זכר 502, לא ידוע 26 | צור קשר | |
טורקיה טורקיה_SM_48 | טורקיה טורקית | טורקיה טורקית | tr-TR | 48 kHz | מונולוג תסריטאי | 2,027 | טורקיה טורקית | הקלטות של אמירה בודדת, הנוטות ליפול בטווח של 5 עד 30 שניות | מונה | Mobile App | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה 1561 זכר 1241 לא ידוע 31 | צור קשר | |
וייטנאמית_GC_8 | ויאטנמית | ויאטנמית | vi_VN | 8 kHz | שיחה כללית | 295 | נתוני שיחה כללית וייטנאמית | שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות, צפון (למשל, האנוי), מרכז ודרום (למשל, הו צ'י מין סיטי). | כפול | שולחן העבודה | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה 400, גבר 380, אלמונים 2 | צור קשר | |
וייטנאמית_MA_16 | ויאטנמית | ויאטנמית | vi_VN | 16 kHz | מדיה אודיו | 257 | נתוני אודיו של מדיה וייטנאמית | קובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקות | מונה | מקורות אינטרנט | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה 249, גבר 200, אלמונים 45 | צור קשר | |
Welsh_GC_8 | וולשית (מבטא אנגלי) | וולשית (מבטא אנגלי) | en_WL | 8 kHz | שיחה כללית | 278 | נתוני שיחה כללית בוולשית | שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות, | כפול | שולחן העבודה | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה 270, זכר 324, לא ידוע 0 | צור קשר | |
בריטניה אנגלית_WW_16 | אנגלית אנגלית | אנגלית אנגלית | en_uk | 16 kHz | להתעורר Word | רמקולים 200 | Wake Word באנגלית אנגלית | איסוף ביטויי מפתח של נתונים
| ערוץ 1 | Mobile App | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | מין: 50% גברים, 50% נשים, +/- 10%. | צור קשר |
Ground Truth אודיו ונתוני דיבור כדי להאיץ את פיתוח הבינה המלאכותית שלך לשיחה
עם יותר מ-40 שעות של מערך נתונים/מערכי נתונים קוליים, Shaip יכול לעזור לך להתאים את מודלים של AI לשיחה עם מערכי נתונים באיכות גבוהה של דיבור. מערכי הנתונים של הקול בתקן הזהב נאספים במספר שפות ודיאלקטים, דמוגרפיה, תכונות דובר, סוגי דיאלוג, סביבות ותרחישים. אם אתה לא מוצא את מה שאתה מחפש? - Shaip יכול לעזור לך עם כל מערך נתונים קולי בכל מין, גיל, שפה או הגדרות.
מעטים ממערכי הנתונים של השפה שאנו תומכים בהם: יש לנו מערכי נתונים על כל השפות והדיאלקטים העיקריים. חלק מהשפות הפופולריות ביותר שלנו כוללות:
מערכי נתונים קוליים אפריקאיים
מערכי נתונים קוליים בערבית
מערכי נתונים קוליים קנדיים
מערכי נתונים קוליים סיניים
מערכי נתונים קוליים דניים
מערכי נתונים קוליים באנגלית
מערכי נתונים קוליים גרמניים
ערכות נתונים קוליות בעברית
מערכי נתונים קוליים באינדונזיה
מערכי נתונים של קול אירי
מערכי נתונים קוליים יפניים
ערכות נתונים קוליות קוריאניות
ערכות נתונים קוליות מקסיקניות
ערכות נתונים קוליות פולניות
ערכות נתונים של קול רוסי
מערכי נתונים קוליים סקוטי
ערכות נתונים קוליות ספרדית
מערכי נתונים קוליים שבדיים
מערכי נתונים של קול תאילנדי
ערכות נתונים קוליות טורקיות
מערכי נתונים קוליים וייטנאמיים
תיאור מערך הנתונים
שיחות מוקד טלפוני 8khz: שיחה טלפונית סינתטית ללא תסריט: "סוכן" ו"לקוח"
שיחות כלליות 8khz: שיחה טלפונית ללא תסריט בין 2 אנשים
מדיה ופודקאסטים 16khz: ראיונות אודיו/וידאו ברשות הרבים, פודקאסטים וכו' 1-5 אנשים
אמירה/מונולוג תסריטאי 16khz: הקלטה מבוססת על הנחיה
לא מצאתם את מה שאתם מחפשים?
מערכי נתונים חדשים של אודיו ודיבור מהמדפים נאספים בכל סוגי הנתונים
צור איתנו קשר עכשיו כדי להשתחרר מהדאגות שלך לאיסוף נתוני אודיו/דיבור