שירותי איסוף נתוני דיבור המהימנים ביותר עבור ה-AI שלך

התאמן את דגמי ה- NLP שלך, VAs, טיפוסי TTS ועוד עם נתוני שיחה איכותיים בעזרת שירותי איסוף נתוני האודיו והדיבור שלנו.

גלה צינורות נתוני אודיו ללא צווארי בקבוק

לקוחות מוצגים

הַבָּא

שירותי איסוף נתונים קוליים/שמע מקצועיים

כל נושא. כל תרחיש.

ב-Shaip, המומחיות שלנו טמונה ביצירת מערכי נתונים איכותיים של דיבור המיועדים לדרישות AI/ML מגוונות. אנו מציעים מגוון רחב של שפות ומתעדים בהגדרות מגוונות מה שהופך את מערכי הנתונים שלנו למקיפים וניתנים להתאמה. Oההתמקדות שלך היא בהזנת מודלים עם הנפח הגבוה ביותר של נתוני דיבור מותאמים אישית, בזמן הקטן ביותר האפשרי. איתנו על הסיפון, אתה יכול לצפות:

אוצר נתוני אודיו / קול רב-לשוניים באיכות גבוהה כדי לשפר את הדיוק
הרמה הגבוהה ביותר האפשרית של ספציפיות תחום ל-tתרחיש מגוון התקנה

קנה קנה מידה של מודל ה-ML שלך כך שיתאים לדמוגרפיה וענפים מגוונים
סביבות הקלטה: איכות סטודיו, כולל שמע צלול עם רעשי רקע מינימליים, & סביבות טבעיות, שבו הקלטות משלבות צלילי סביבה כדי לחקות מצבים בעולם האמיתי.

100 +

מדינות

55K +

נתוני שעות דיבור

250 +

פרויקטים

60 +

שפות (100+ דיאלקטים)

8 / 16 / 44 / 48 קילוהרץ

קצב דגימה

המומחיות שלנו

יישר נתוני אודיו לדגמי NLP חכמים יותר

Shaip מציעה שירותי איסוף נתוני דיבור/שמע מקצה לקצה בלמעלה מ -100 שפות כדי לאפשר לטכנולוגיות המותאמות לקול להתאים לקהל מגוון של קהלים ברחבי העולם. אנו יכולים לעבוד על פרויקטים בכל היקף וגודל; החל מרשיון מערכי אודיו קיימים מהמדף ועד ניהול איסוף נתוני אודיו מותאמים אישית ועד תמלול אודיו והערות. לא משנה כמה גדול פרויקט איסוף נתוני הדיבור שלך, אנו יכולים להתאים אישית את שירותי איסוף האודיו לצרכיך לבניית מערכי נתונים NLP באיכות גבוהה הממוקדים לניבים, צלילים ושפות. בחר מתוך מגוון רחב של מערכי נתוני דיבור ומשאבי איסוף נתוני אודיו, להגדרות חכמות המאפשרות קול.

סיפורי הצלחה

מערכי נתונים של AI לשיחה עם יותר מ-3 שעות של נתונים ב-8 שפות

בניסיון לבנות פלטפורמה רב לשונית לשפות הודיות, הלקוח שיתף פעולה עם Shaip כדי לאסוף, לפלח ולתמלל מערכי נתונים גדולים במספר שפות הודיות. זה יעזור לפתח מודלים יעילים של דיבור שיוכלו להניע את הפלטפורמה החדשה והחדשנית של הלקוח.

בעיה: למעלה מ-3,000 שעות של נתוני אודיו שנאספו ב-8 שפות הודיות, מפולחים ומתומללים לפיתוח זיהוי דיבור אוטומטי.

פתרון: סיפקנו איסוף נתונים, פילוח, תמלול ומסרנו קובצי JSON עם מטא נתונים. אספנו 3000 שעות של נתוני אודיו ב-8 שפות הודיות בקנה מידה עבור פרויקט טכנולוגיית הדיבור של הלקוח.

סיבות לבחור ב- Shaip כשותף שלך לאיסוף נתוני דיבור מהימן

אֲנָשִׁים

צוותים ייעודיים ומאומנים:

30,000+ משתפי פעולה ליצירת נתונים, תיוג ו- QA
צוות ניהול פרויקטים מוסמך
צוות פיתוח מוצרים מנוסה
צוות בריכת כישרון ואנשי ספינה

התַהֲלִיך

יעילות התהליך הגבוהה ביותר מובטחת באמצעות:

תהליך סיגמא שלב 6 חזק
צוות ייעודי של 6 חגורות סיגמא שחורות - בעלי תהליכים מרכזיים ועמידה באיכות
שיפור מתמשך ומשדר לולאה

פלטפורמה

הפלטפורמה המוגנת בפטנט מציעה יתרונות:

פלטפורמת קצה לקצה מבוססת אינטרנט
איכות ללא דופי
מהיר יותר TAT
משלוח חלק

אֲנָשִׁים

צוותים ייעודיים ומאומנים:

30,000+ משתפי פעולה ליצירת נתונים, תיוג ו- QA
צוות ניהול פרויקטים מוסמך
צוות פיתוח מוצרים מנוסה
צוות בריכת כישרון ואנשי ספינה

התַהֲלִיך

יעילות התהליך הגבוהה ביותר מובטחת באמצעות:

תהליך סיגמא שלב 6 חזק
צוות ייעודי של 6 חגורות סיגמא שחורות - בעלי תהליכים מרכזיים ועמידה באיכות
שיפור מתמשך ומשדר לולאה

פלטפורמה

הפלטפורמה המוגנת בפטנט מציעה יתרונות:

פלטפורמת קצה לקצה מבוססת אינטרנט
איכות ללא דופי
מהיר יותר TAT
משלוח חלק

ערכות דיבור / אודיו מהמדף

מזהה קורפוס (ייחודי)	מילות מפתח	ערכת נתונים של שפה	קוד שפה	קצב דגימה	סוג מערך נתונים	סך כל שעות השמע	תיאור קצר	תיאור מערך הנתונים	ערוץ אודיו	פלטפורמת הקלטה	WER (%)	פורמט אודיו	פורמט תמלול	השתמש מקרה	מספר הרמקולים	CTA
en_US_CC_8	שפת עור אפרו-אמריקאית	שפת עור אפרו-אמריקאית	en_US	8 kHz	מרכז שירות	211	נתוני מוקד טלפוני אפרו-אמריקאי	שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות,	כפול	שולחן העבודה	5.0	. Wav	‎.json	ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה	נקבה: 612, זכר: 1242, ולא ידוע: 12	צרו קשר
en_US_MA_16	שפת עור אפרו-אמריקאית	שפת עור אפרו-אמריקאית	en_US	16 kHz	מדיה אודיו	154	נתוני מדיה עממית אפרו-אמריקאית	קובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקות	מונה	מקורות אינטרנט	5.0	. Wav	‎.json	ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה	נקבה: 151, זכר: 150, ולא ידוע: 10	צרו קשר
Afrikaans_GC_8	אפריקאנס	אפריקאנס	af_ZA	8 kHz	שיחה כללית	368	נתוני שיחה כללית באפריקנס	שיחה טלפונית ללא תסריט בין שני אנשים. משוער. משך אודיו (טווח) - 15-60 דקות, אפריקנס המדוברת באפריקה	כפול	שולחן העבודה	5.0	. Wav	‎.json	ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה	נקבה: 502, זכר: 390, ולא ידוע: 2	צרו קשר
אפריקאנס_MA_16	אפריקאנס	אפריקאנס	af_ZA	16 kHz	מדיה אודיו	658	קבצי מדיה באפריקה	קובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקות	מונה	מקורות אינטרנט	5.0	. Wav	‎.json	ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה	נקבה: 750, זכר: 1278, ולא ידוע: 52	צרו קשר
ערבית_GC_8	ערבי	ערבי	ar_AE	8 kHz	שיחה כללית	292	נתוני שיחות כלליות בערבית	שיחה טלפונית ללא תסריט בין שני אנשים. משוער. משך שמע (טווח) - 15-60 דקות, ערבית ממדינות המפרץ	כפול	שולחן העבודה	5.0	. Wav	‎.json	ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה	נקבה: 171, זכר: 534, ולא ידוע: 1	צרו קשר
ערבית_SM_48	ערבי	ערבי	ar-SA	48 kHz	מונולוג תסריטאי	1,947	מונולוג בכתב ערבי	הקלטות של אמירה בודדת, הנוטות ליפול בטווח של 5 עד 30 שניות	מונה	Mobile App	5.0	. Wav	‎.json	ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה	נקבה 838 זכר 1209 לא ידוע 78	צרו קשר
Assamese_CC_8	אסאמית	אסאמית (בצינור)	as_IN		מרכז שירות	60	נתוני מרכז טלפוני אסאמי (בצינור).	שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות,		שולחן העבודה	5.0	. Wav	‎.json	ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה		צרו קשר
Assamese_GC	אסאמית	אסאמית (בצינור)	as_IN		שיחה כללית	100	נתוני שיחות כלליות אסאמי (בצינור).	שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות,		שולחן העבודה	5.0	. Wav	‎.json	ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה		צרו קשר
Assamese_MA	אסאמית	אסאמית (בצינור)	as_IN		מדיה אודיו	40	נתוני אודיו של מדיה אסאמית (בצינור).	קובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקות		מקורות אינטרנט	5.0	. Wav	‎.json	ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה		צרו קשר
בנגלית_CC_8	בנגלית	בנגלית (בצינור)	bn_IN		מרכז שירות	60	נתוני מרכז טלפוני בנגלית (בצינור).	שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות,		שולחן העבודה	5.0	. Wav	‎.json	ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה		צרו קשר
Bengali_GC	בנגלית	בנגלית (בצינור)	bn_IN		שיחה כללית	100	בנגלית (בצינור) נתוני שיחה כלליים	שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות,		שולחן העבודה	5.0	. Wav	‎.json	ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה		צרו קשר
בנגלית_MA	בנגלית	בנגלית (בצינור)	bn_IN		מדיה אודיו	40	בנגלית (בצינור) נתוני אודיו של מדיה	קובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקות		מקורות אינטרנט	5.0	. Wav	‎.json	ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה		צרו קשר
Boston_CC_8	בוסטון אנגלית	בוסטון אנגלית	en_US	8 kHz	מרכז שירות	177	נתוני מרכז השיחות של בוסטון	שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות,	כפול	שולחן העבודה	5.0	. Wav	‎.json	ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה	נקבה: 605, זכר: 711, ולא ידוע: 0	צרו קשר
Boston_GC_8	בוסטון אנגלית	בוסטון אנגלית	en_US	8 kHz	שיחה כללית	32	נתוני השיחה הכללית של בוסטון	שיחה טלפונית ללא תסריט בין שני אנשים. משוער. משך אודיו (טווח) - 15-60 דקות,	כפול	שולחן העבודה	5.0	. Wav	‎.json	ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה	נקבה: 53, זכר: 83, ולא ידוע: 0	צרו קשר
Boston_MA_16	בוסטון אנגלית	בוסטון אנגלית	en_US	16 kHz	מדיה אודיו	93	נתוני אודיו של Boston Media	קובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקות	מונה	מקורות אינטרנט	5.0	. Wav	‎.json	ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה	נקבה: 43, זכר: 181, ולא ידוע: 2	צרו קשר
קנדי_SM_48	צרפתית קנדית	צרפתית קנדית	fr-CA	48 kHz	מונולוג תסריטאי	1,222	צרפתית קנדית	הקלטות של אמירה בודדת, הנוטות ליפול בטווח של 5 עד 30 שניות	מונה	Mobile App	5.0	. Wav	‎.json	ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה	נקבה 974 זכר 631 לא ידוע 1	צרו קשר
סינית_CC_8	אנגלית סינית	אנגלית סינית	en_US	8 kHz	מרכז שירות	169	נתוני מוקד טלפוני סיני	שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות,	כפול	שולחן העבודה	5.0	. Wav	‎.json	ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה	נקבה: 1790, זכר: 523 ולא ידוע: 13	צרו קשר
סינית_MA_16	אנגלית סינית	אנגלית סינית	en_US	16 kHz	מדיה אודיו	249	נתוני אודיו של מדיה סינית	קובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקות	מונה	מקורות אינטרנט	5.0	. Wav	‎.json	ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה	נקבה: 126, זכר: 346 ולא ידוע: 6	צרו קשר
סינית פשוטה_SM_48	סינית	סינית	zh-CN	48 kHz	מונולוג תסריטאי	2,762	סינית	הקלטות של אמירה בודדת, הנוטות ליפול בטווח של 5 עד 30 שניות	מונה	Mobile App	5.0	. Wav	‎.json	ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה	נקבה 1920 זכר 1535 לא ידוע 270	צרו קשר
סינית מסורתית_SM_48	סינית מסורתית	סינית מסורתית	zh-TW	48 kHz	מונולוג תסריטאי	1,028	סינית מסורתית	הקלטות של אמירה בודדת, הנוטות ליפול בטווח של 5 עד 30 שניות	מונה	Mobile App	5.0	. Wav	‎.json	ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה	נקבה 1069 זכר 262 לא ידוע 3	צרו קשר
Danish_GC_8	דני	דני	da_DK	8 kHz	שיחה כללית	372	נתוני שיחה כללית דנית	שיחה טלפונית ללא תסריט בין שני אנשים. משוער. משך אודיו (טווח) - 15-60 דקות,	כפול	שולחן העבודה	5.0	. Wav	‎.json	ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה	נקבה: 311, זכר: 417, לא ידוע: 0	צרו קשר
דנית_MA_16	דני	דני	da_DK	16 kHz	מדיה אודיו	664	נתוני אודיו של מדיה דנית	קובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקות	מונה	מקורות אינטרנט	5.0	. Wav	‎.json	ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה	נקבה: 369, זכר: 864, לא ידוע: 27	צרו קשר
דנית_SM_48	דני	דני	da-DK	48 kHz	מונולוג תסריטאי	2,579	מונולוג בכתב דני	הקלטות של אמירה בודדת, הנוטות ליפול בטווח של 5 עד 30 שניות, דנית מדנמרק	מונה	Mobile App	5.0	. Wav	‎.json	ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה	נקבה 1551 זכר 1233 לא ידוע 42	צרו קשר
אנגלית עמוקה דרום_CC_8	דרום דרום עמוק	דרום דרום עמוק	en_US	8 kHz	מרכז שירות	151	מידע מוקד טלפוני בדרום עמוק באנגלית	שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות,	כפול	שולחן העבודה	5.0	. Wav	‎.json	ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה	נקבה 221 , זכר 1004 , לא ידוע 7	צרו קשר
אנגלית עמוקה דרום_GC_8	דרום דרום עמוק	דרום דרום עמוק	en_US	8 kHz	שיחה כללית	56	נתוני שיחה כללית בדרום עמוק באנגלית	שיחה טלפונית ללא תסריט בין שני אנשים. משוער. משך אודיו (טווח) - 15-60 דקות,	כפול	שולחן העבודה	5.0	. Wav	‎.json	ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה	נקבה 99, גבר 31, לא ידוע 0	צרו קשר
אנגלית עמוקה דרום_MA_16	דרום דרום עמוק	דרום דרום עמוק	en_US	16 kHz	מדיה אודיו	266	נתוני אודיו באנגלית Deep South Media	קובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקות	מונה	מקורות אינטרנט	5.0	. Wav	‎.json	ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה	נקבה 204, גבר 356, לא ידוע 21	צרו קשר
גרמנית_CC_8	גרמנית	גרמנית	דה-דה	8 kHz	מרכז שירות	64	נתוני מוקד טלפוני גרמני	שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות,	מונה	שולחן העבודה		. Wav	‎.json	ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה	נקבה 478 זכר 1440 לא ידוע 0	צרו קשר
גרמנית_IVR_8	גרמנית	גרמנית	דה-דה	8 kHz	סיומת IVR	200	נתוני IVR גרמניים	אדם למכונה. זרימה מסוג IVR שבה יש הנחית TTS (למשל "איך אוכל לעזור לך") ואחריה תגובה אנושית ספונטנית	מונה	שולחן העבודה		. Wav	‎.json	ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה	נקבה 10115 זכר 8750 לא ידוע 0	צרו קשר
Gujarati_CC_8	גוג'ראטית	גוג'ראטי (בצינור)	gu_IN		מרכז שירות	60	נתוני מוקד טלפוני של גוג'ראטי (בצינור).	שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות,		שולחן העבודה	5.0	. Wav	‎.json	ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה		צרו קשר
Gujarati_GC	גוג'ראטית	גוג'ראטי (בצינור)	gu_IN		שיחה כללית	100	נתוני שיחות כלליות של גוג'ראטי (בצינור).	שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות,		שולחן העבודה	5.0	. Wav	‎.json	ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה		צרו קשר
Gujarati_MA	גוג'ראטית	גוג'ראטי (בצינור)	gu_IN		מדיה אודיו	40	גוג'ראטי (בצינור) נתוני אודיו של מדיה	קובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקות		מקורות אינטרנט	5.0	. Wav	‎.json	ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה		צרו קשר
עברית_שיחה כללית_8	עברית	עברית	he_IL	8 kHz	שיחה כללית	399	נתוני שיחות כלליות בעברית	שיחה טלפונית ללא תסריט בין שני אנשים. משוער. משך שמע (טווח) - 15-60 דקות, עברית בישראל	כפול	שולחן העבודה	5.0	. Wav	‎.json	ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה	נקבה 414, זכר 399, לא ידוע 1	צרו קשר
עברית_MA_16	עברית	עברית	he_IL	16 kHz	מדיה אודיו	427	נתוני אודיו של מדיה עברית	קובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקות	מונה	מקורות אינטרנט	5.0	. Wav	‎.json	ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה	נקבה 361, זכר 513, לא ידוע 13	צרו קשר
הינדי_MA_16	הינדי	הינדי	היי_IN	16 kHz	מדיה אודיו	219	נתוני אודיו של מדיה הינדי	קובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקות	מונה	מקורות אינטרנט	5.0	. Wav	‎.json	ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה	נקבה 83, זכר 309, לא ידוע 0	צרו קשר
הינדי_SM_48	הינדי	הינדי	היי-אין	48 kHz	מונולוג תסריטאי	2,867	מונולוג תסריטאי הינדי	הקלטות של אמירה בודדת, הנוטות ליפול בטווח של 5 עד 30 שניות	מונה	Mobile App	5.0	. Wav	‎.json	ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה	נקבה 1977 זכר 1864 לא ידוע 147	צרו קשר
HINGLISH_CC_8	הינגליש	הינגליש	hg_IN	8 kHz	מרכז שירות	208	HINGLISH נתוני מוקד טלפוני	שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות,	כפול	שולחן העבודה	5.0	. Wav	‎.json	ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה	נקבה 822, זכר 1262, לא ידוע 0	צרו קשר
HINGLISH_MA_16	הינגליש	הינגליש	hg_IN	16 kHz	מדיה אודיו	216	HINGLISH נתוני אודיו של מדיה	קובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקות	מונה	מקורות אינטרנט	5.0	. Wav	‎.json	ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה	נקבה 75, גבר 380, לא ידוע 0	צרו קשר
Hispanic_CC_8	אנגלית היספנית	אנגלית היספנית	en_US	8 kHz	מרכז שירות	212	נתוני מוקד טלפוני היספניים	שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות,	כפול	שולחן העבודה	5.0	. Wav	‎.json	ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה	נקבה 822, זכר 1262, לא ידוע 0	צרו קשר
Hispanic_MA_16	אנגלית היספנית	אנגלית היספנית	en_US	16 kHz	מדיה אודיו	155	אודיו היספני Call Media	קובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקות	מונה	מקורות אינטרנט	5.0	. Wav	‎.json	ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה	נקבה 140, זכר 219, לא ידוע 5	צרו קשר
אינדונזית_GC_8	אינדונזי	אינדונזי	אני עשיתי	8 kHz	שיחה כללית	496	נתוני שיחה כללית באינדונזיה	שיחה טלפונית ללא תסריט בין שני אנשים. משוער. משך שמע (טווח) - 15-60 דקות, בהאסה אינדונזית	כפול	שולחן העבודה	5.0	. Wav	‎.json	ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה	נקבה 524, זכר 454, לא ידוע 2	צרו קשר
אינדונזית_MA_16	אינדונזי	אינדונזי	אני עשיתי	16 kHz	מדיה אודיו	643	נתוני אודיו של מדיה אינדונזית	קובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקות	מונה	מקורות אינטרנט	5.0	. Wav	‎.json	ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה	נקבה 746, זכר 1507, לא ידוע 129	צרו קשר
Irish_GC_8	אירי	אירי	en_IE	8 kHz	שיחה כללית	192	נתוני השיחה הכללית של אירית	שיחה טלפונית ללא תסריט בין שני אנשים. משוער. משך אודיו (טווח) - 15-60 דקות,	כפול	שולחן העבודה	5.0	. Wav	‎.json	ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה	נקבה 213 , זכר 153 , לא ידוע 0	צרו קשר
יפני_SM_48	יפני	יפני	ja-JP	48 kHz	מונולוג תסריטאי	2,335	מונולוג בכתב יפני	הקלטות של אמירה בודדת, הנוטות ליפול בטווח של 5 עד 30 שניות	מונה	Mobile App	5.0	. Wav	‎.json	ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה	נקבה 1460 זכר 1221 לא ידוע 194	צרו קשר
קנאדה_CC_8	קנאדה	קנאדה (בצינור)	kn_IN		מרכז שירות	60	נתוני מרכז טלפוני של קנאדה (בצינור).	שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות,		שולחן העבודה	5.0	. Wav	‎.json	ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה		צרו קשר
Kannada_GC	קנאדה	קנאדה (בצינור)	kn_IN		שיחה כללית	100	קנאדה (בצינור) נתוני שיחה כלליים	שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות,		שולחן העבודה	5.0	. Wav	‎.json	ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה		צרו קשר
קנאדה_MA	קנאדה	קנאדה (בצינור)	kn_IN		מדיה אודיו	40	Kannada (In Pipeline) נתוני אודיו של מדיה	קובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקות		מקורות אינטרנט	5.0	. Wav	‎.json	ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה		צרו קשר
קוריאנית_CC_8	קוריאני	קוריאני	ko_KR	8 kHz	מרכז שירות	107	נתוני מוקד טלפוני קוריאני	שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות,	כפול	שולחן העבודה	5.0	. Wav	‎.json	ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה	נקבה 1086, זכר 210, לא ידוע 4	צרו קשר
קוריאנית_MA_16	קוריאני	קוריאני	ko_KR	16 kHz	מדיה אודיו	204	נתוני אודיו של מדיה קוריאנית	קובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקות	מונה	מקורות אינטרנט	5.0	. Wav	‎.json	ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה	נקבה 70 זכר 303, לא ידוע 25	צרו קשר
קוריאני_SM_48	קוריאני	קוריאני	ko-KR	48 kHz	מונולוג תסריטאי	1,955	מונולוג כתב קוריאני	הקלטות של אמירה בודדת, הנוטות ליפול בטווח של 5 עד 30 שניות	מונה	Mobile App	5.0	. Wav	‎.json	ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה	נקבה 1195 זכר 1134 לא ידוע 122	צרו קשר
מלאית_GC_8	מלאית	מלאית	ms_MY	8 kHz	שיחה כללית	266	נתוני שיחה כללית במלזית	שיחה טלפונית ללא תסריט בין שני אנשים. משוער. משך אודיו (טווח) - 15-60 דקות, מלאית במלזיה	כפול	שולחן העבודה	5.0	. Wav	‎.json	ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה	נקבה 316, זכר 176, לא ידוע 0	צרו קשר
מלאית_MA_16	מלאית	מלאית	ms_MY	16 kHz	מדיה אודיו	344	נתוני אודיו של מדיה מלאית	קובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקות	מונה	מקורות אינטרנט	5.0	. Wav	‎.json	ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה	נקבה 236, גבר 626, לא ידוע 47	צרו קשר
Malayalam_CC_8	מליאלאם	מלאיאלאם (בצינור)	ml_IN		מרכז שירות	60	נתוני מרכז טלפוני של Malaylam (In Pipeline).	שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות,		שולחן העבודה	5.0	. Wav	‎.json	ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה		צרו קשר
Malayalam_GC	מליאלאם	מלאיאלאם (בצינור)	ml_IN		שיחה כללית	100	מליאלם (בצינור) נתוני שיחה כלליים	שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות,		שולחן העבודה	5.0	. Wav	‎.json	ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה		צרו קשר
Malayalam_MA	מליאלאם	מלאיאלאם (בצינור)	ml_IN		מדיה אודיו	40	Malaayalam (In Pipeline) נתוני אודיו של מדיה	קובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקות		מקורות אינטרנט	5.0	. Wav	‎.json	ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה		צרו קשר
Marathi_CC_8	מרתי	Marathi (בצינור)	mr_IN		מרכז שירות	60	נתוני Marathi (In Pipeline) Call-Center	שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות,		שולחן העבודה	5.0	. Wav	‎.json	ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה		צרו קשר
Marathi_GC	מרתי	Marathi (בצינור)	mr_IN		שיחה כללית	100	נתוני שיחה כללית של Marathi (In Pipeline).	שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות,		שולחן העבודה	5.0	. Wav	‎.json	ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה		צרו קשר
Marathi_MA	מרתי	Marathi (בצינור)	mr_IN		מדיה אודיו	40	Marathi (In Pipeline) נתוני אודיו של מדיה	קובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקות		מקורות אינטרנט	5.0	. Wav	‎.json	ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה		צרו קשר
מקסיקני_SM_48	ספרדית (מקסיקו)	ספרדית (מקסיקו)	en-MX	48 kHz	מונולוג תסריטאי	1,492	מונולוג כתב ספרדי מקסיקני	הקלטות של אמירה בודדת, הנוטות ליפול בטווח של 5 עד 30 שניות	מונה	Mobile App	5.0	. Wav	‎.json	ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה	נקבה 1016 זכר 1069 לא ידוע 95	צרו קשר
הולנד_SM_48	הולנדי	הולנדי	nl-NL	48 kHz	מונולוג תסריטאי	1,205	מונולוג כתב הולנדי	הקלטות של אמירה בודדת, הנוטות ליפול בטווח של 5 עד 30 שניות	מונה	Mobile App	5.0	. Wav	‎.json	ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה	נקבה 1285 זכר 531 לא ידוע 3	צרו קשר
ניו יורק אנגלית_CC_8	ניו יורק אנגלית	ניו יורק אנגלית	en_US	8 kHz	מרכז שירות	103	נתוני מוקד טלפוני בניו יורק באנגלית	שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות,	כפול	שולחן העבודה	5.0	. Wav	‎.json	ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה	נקבה 610, זכר 532, לא ידוע 0	צרו קשר
ניו יורק אנגלית_GC_8	ניו יורק אנגלית	ניו יורק אנגלית	en_US	8 kHz	שיחה כללית	107	נתוני שיחה כללית באנגלית בניו יורק	שיחה טלפונית ללא תסריט בין שני אנשים. משוער. משך אודיו (טווח) - 15-60 דקות,	כפול	שולחן העבודה	5.0	. Wav	‎.json	ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה	נקבה 118, זכר 114, לא ידוע 0	צרו קשר
ניו יורק אנגלית_MA_16	ניו יורק אנגלית	ניו יורק אנגלית	en_US	16 kHz	מדיה אודיו	140	נתוני אודיו של ניו יורק אנגלית	קובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקות	מונה	מקורות אינטרנט	5.0	. Wav	‎.json	ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה	נקבה 66, זכר 230, לא ידוע 11	צרו קשר
ניו זילנד_GC_8	ניו זילנד אנגלית	ניו זילנד אנגלית	en_NZ	8 kHz	שיחה כללית	148	נתוני שיחה כללית באנגלית בניו זילנד	שיחה טלפונית ללא תסריט בין שני אנשים. משוער. משך אודיו (טווח) - 15-60 דקות,	כפול	שולחן העבודה	5.0	. Wav	‎.json	ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה	נקבה 167, זכר 121, לא ידוע 4	צרו קשר
ניו זילנד_MA_16	ניו זילנד אנגלית	ניו זילנד אנגלית	en_NZ	16 kHz	מדיה אודיו	400	אודיו של ניו זילנד מדיה אנגלית	קובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקות	מונה	מקורות אינטרנט	5.0	. Wav	‎.json	ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה	נקבה 367, זכר 678, לא ידוע 26	צרו קשר
Oriya_CC_8	אוריה	אוריה (בצינור)	or_IN		מרכז שירות	60	אוריה (בצנרת) נתוני Call-Center	שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות,		שולחן העבודה	5.0	. Wav	‎.json	ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה		צרו קשר
Oriya_GC	אוריה	אוריה (בצינור)	or_IN		שיחה כללית	100	אוריה (בצינור) נתוני שיחה כלליים	שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות,		שולחן העבודה	5.0	. Wav	‎.json	ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה		צרו קשר
Oriya_MA	אוריה	אוריה (בצינור)	or_IN		מדיה אודיו	40	Oriya (In Pipeline) נתוני אודיו של מדיה	קובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקות		מקורות אינטרנט	5.0	. Wav	‎.json	ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה		צרו קשר
פולנית_MA_16	פולני	פולני	en_PL	16 kHz	מדיה אודיו	269	אודיו של מדיה פולנית	קובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקות	מונה	מקורות אינטרנט	5.0	. Wav	‎.json	ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה	נקבה 173 זכר 354 לא ידוע 6	צרו קשר
פולנית פולין_SM_48	פולנית (פולין)	פולנית (פולין)	pl-pl	48 kHz	מונולוג תסריטאי	1,482	פולין פולין - מונולוג תסריטאי	הקלטות של אמירה בודדת, הנוטות ליפול בטווח של 5 עד 30 שניות	מונה	Mobile App	5.0	. Wav	‎.json	ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה	נקבה 1324 זכר 701 לא ידוע 24	צרו קשר
פונג'בי_CC_8	פונג'בית	פנג'בי (בצינור)	פונג'בית		מרכז שירות	60	נתוני מרכז טלפוני של פונג'אבי (בצינור).	שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות,		שולחן העבודה	5.0	. Wav	‎.json	ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה		צרו קשר
פונג'בי_GC	פונג'בית	פנג'בי (בצינור)	פונג'בית		שיחה כללית	100	פונג'אבי (בצינור) נתוני שיחה כלליים	שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות,		שולחן העבודה	5.0	. Wav	‎.json	ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה		צרו קשר
פונג'בי_MA	פונג'בית	פנג'בי (בצינור)	פונג'בית		מדיה אודיו	40	פונג'אבי (בצינור) נתוני אודיו של מדיה	קובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקות		מקורות אינטרנט	5.0	. Wav	‎.json	ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה		צרו קשר
Russian_SM_48	רוסי	רוסי	רו-רו	48 kHz	מונולוג תסריטאי	2,398	מונולוג בכתב רוסי	הקלטות של אמירה בודדת, הנוטות ליפול בטווח של 5 עד 30 שניות	מונה	Mobile App	5.0	. Wav	‎.json	ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה	נקבה 1689 זכר 1937 לא ידוע 214	צרו קשר
Scottish_GC_8	סקוטי (מבטא אנגלי)	סקוטי (מבטא אנגלי)	en_AB	8 kHz	שיחה כללית	292	נתוני השיחה הכללית של סקוטלנד	שיחה טלפונית ללא תסריט בין שני אנשים. משוער. משך אודיו (טווח) - 15-60 דקות,	כפול	שולחן העבודה	5.0	. Wav	‎.json	ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה	נקבה 285, זכר 260, לא ידוע 3	צרו קשר
Singapore_CC_8	סינגפור אנגלית	סינגפור אנגלית	en_SG	8 kHz	מרכז שירות	218	נתוני מרכז השיחות של סינגפור	שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות,	כפול	שולחן העבודה	5.0	. Wav	‎.json	ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה	נקבה 2139, זכר 884, לא ידוע 21	צרו קשר
סינגפור_MA_16	סינגפור אנגלית	סינגפור אנגלית	en_SG	16 kHz	מדיה אודיו	247	נתוני אודיו של סינגפור מדיה	קובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקות	מונה	מקורות אינטרנט	5.0	. Wav	‎.json	ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה	נקבה 160, זכר 455, לא ידוע 37	צרו קשר
אנגלית דרום אפריקאית_CC_8	אנגלית דרום אפריקאית	אנגלית דרום אפריקאית	en_ZA	8 kHz	מרכז שירות	261	נתוני מרכז טלפון באנגלית דרום אפריקאית	שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות,	כפול	שולחן העבודה	5.0	. Wav	‎.json	ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה	נקבה 1274 , זכר 935 , לא ידוע 1	צרו קשר
אנגלית דרום אפריקאית_MA_16	אנגלית דרום אפריקאית	אנגלית דרום אפריקאית	en_ZA	16 kHz	מדיה אודיו	251	נתוני אודיו של מדיה אנגלית דרום אפריקאית	קובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקות	מונה	מקורות אינטרנט	5.0	. Wav	‎.json	ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה	נקבה 235, זכר 432, לא ידוע 36	צרו קשר
סוואהילית_CC_8	סוואהילית	סוואהילית	sw_KE	8 kHz	מרכז שירות	230	נתוני מרכז טלפוני סוואהילי	שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות,	כפול	שולחן העבודה	5.0	. Wav	‎.json	ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה	נקבה 611, זכר 833, לא ידוע 0	צרו קשר
סוואהילית_MA_16	סוואהילית	סוואהילית	sw_KE	16 kHz	מדיה אודיו	265	נתוני אודיו של מדיה סוואהילית	קובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקות	מונה	מקורות אינטרנט	5.0	. Wav	‎.json	ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה	נקבה 118, זכר 493, לא ידוע 25	צרו קשר
Swedish_CC_8	שבדי	שבדי	sv_SE	8 kHz	מרכז שירות	250	נתוני מרכז טלפוני שוודי	שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות,	כפול	שולחן העבודה	5.0	. Wav	‎.json	ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה	נקבה 1581, זכר 727, לא ידוע 2	צרו קשר
שוודית_MA_16	שבדי	שבדי	sv_SE	16 kHz	מדיה אודיו	278	נתוני אודיו של מדיה שוודית	קובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקות	מונה	מקורות אינטרנט	5.0	. Wav	‎.json	ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה	נקבה 195, זכר 500, לא ידוע 21	צרו קשר
Tamil_CC_8	טמילית	טמילית (בצינור)	ta_IN		מרכז שירות	60	נתוני מרכז טלפוני טמילית (בצינור).	שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות,		שולחן העבודה	5.0	. Wav	‎.json	ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה		צרו קשר
Tamil_GC	טמילית	טמילית (בצינור)	ta_IN		שיחה כללית	100	נתוני שיחה כללית טמילית (בצינור).	שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות,		שולחן העבודה	5.0	. Wav	‎.json	ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה		צרו קשר
Tamil_MA	טמילית	טמילית (בצינור)	ta_IN		מדיה אודיו	40	טמילית (בצינור) נתוני אודיו של מדיה	קובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקות		מקורות אינטרנט	5.0	. Wav	‎.json	ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה		צרו קשר
Telugu_GC_8	טלוגו	טלוגו	te_IN	8 kHz	שיחה כללית	553	נתוני שיחה כללית של טלוגו	שיחה טלפונית ללא תסריט בין שני אנשים. משוער. משך אודיו (טווח) - 15-60 דקות,	כפול	שולחן העבודה	5.0	. Wav	‎.json	ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה	נקבה 574, זכר 564, לא ידוע 0	צרו קשר
Telugu_MA_16	טלוגו	טלוגו	te_IN	16 kHz	מדיה אודיו	648	נתוני אודיו של Telugu Media	קובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקות	מונה	מקורות אינטרנט	5.0	. Wav	‎.json	ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה	נקבה 207, זכר 963, לא ידוע 2	צרו קשר
Telugu_CC_8	טלוגו	טלוגו (בצינור)	te_IN		מרכז שירות	30	נתוני Telugu (In Pipeline) Call-Center	שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות,		שולחן העבודה	5.0	. Wav	‎.json	ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה		צרו קשר
Telugu_GC	טלוגו	טלוגו (בצינור)	te_IN		שיחה כללית	50	טלוגו (בצינור) נתוני שיחה כלליים	שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות,		שולחן העבודה	5.0	. Wav	‎.json	ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה		צרו קשר
Telugu_MA	טלוגו	טלוגו (בצינור)	te_IN		מדיה אודיו	20	Telugu (In Pipeline) נתוני אודיו של מדיה	קובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקות		מקורות אינטרנט	5.0	. Wav	‎.json	ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה		צרו קשר
Thai_GC_8	תאילנדי	תאילנדי	th_TH	8 kHz	שיחה כללית	183	שיחה כללית תאילנדית	שיחה טלפונית ללא תסריט בין שני אנשים. משוער. משך אודיו (טווח) - 15-60 דקות, רישום לא רשמי בשימוש בין חברים	כפול	שולחן העבודה	5.0	. Wav	‎.json	ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה	נקבה 338, זכר 96, לא ידוע 8	צרו קשר
Thai_MA_8	תאילנדי	תאילנדי	th_TH	16 kHz	מדיה אודיו	173	אודיו של מדיה תאילנדית	קובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקות	מונה	מקורות אינטרנט	5.0	. Wav	‎.json	ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה	נקבה 143, זכר 502, לא ידוע 26	צרו קשר
טורקיה טורקיה_SM_48	טורקיה טורקית	טורקיה טורקית	tr-TR	48 kHz	מונולוג תסריטאי	2,027	טורקיה טורקית	הקלטות של אמירה בודדת, הנוטות ליפול בטווח של 5 עד 30 שניות	מונה	Mobile App	5.0	. Wav	‎.json	ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה	נקבה 1561 זכר 1241 לא ידוע 31	צרו קשר
וייטנאמית_GC_8	ויאטנמית	ויאטנמית	vi_VN	8 kHz	שיחה כללית	295	נתוני שיחה כללית וייטנאמית	שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות, צפון (למשל, האנוי), מרכז ודרום (למשל, הו צ'י מין סיטי).	כפול	שולחן העבודה	5.0	. Wav	‎.json	ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה	נקבה 400, גבר 380, אלמונים 2	צרו קשר
וייטנאמית_MA_16	ויאטנמית	ויאטנמית	vi_VN	16 kHz	מדיה אודיו	257	נתוני אודיו של מדיה וייטנאמית	קובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקות	מונה	מקורות אינטרנט	5.0	. Wav	‎.json	ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה	נקבה 249, גבר 200, אלמונים 45	צרו קשר
Welsh_GC_8	וולשית (מבטא אנגלי)	וולשית (מבטא אנגלי)	en_WL	8 kHz	שיחה כללית	278	נתוני שיחה כללית בוולשית	שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות,	כפול	שולחן העבודה	5.0	. Wav	‎.json	ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה	נקבה 270, זכר 324, לא ידוע 0	צרו קשר
בריטניה אנגלית_WW_16	אנגלית אנגלית	אנגלית אנגלית	en_uk	16 kHz	להתעורר Word	רמקולים 200	Wake Word באנגלית אנגלית	איסוף ביטויי מפתח של נתונים רמקולים 200 4 ביטויי מפתח ייחודיים לכל רמקול 25-30 הקלטות חוזרות של ביטויי מפתח לכל ביטוי מפתח ייחודי 25-30 קבצי שמע לכל ביטוי מפתח ייחודי סה"כ 120 התבטאויות מוקלטות לכל דובר	ערוץ 1	Mobile App	5.0	. Wav	‎.json	ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה	מין: 50% גברים, 50% נשים, +/- 10%.	צרו קשר

שירותים מוצעים

איסוף נתוני שמע מומחה אינו מעשי על כל הסידורים עבור הגדרות AI מקיפות. ב- Shaip, אתה יכול אפילו לשקול את השירותים הבאים כדי להפוך את הדגמים לנפוצים בהרבה מהרגיל:

משאבים מומלצים

הצעה

ביאור אודיו עבור AI חכם

שירותי הערות אודיו היו הצד החזק של שייפ מאז תחילת הדרך. פתח, אימון ושפר AI לשיחה, צ'טבוטים ומנועי זיהוי דיבור עם שירותי הערות האודיו החדישים שלנו.

מדריך לקונה

מדריך לקונים: מדריך מלא ל-Conversational AI

הצ'אטבוט שאיתו שוחחת פועל על מערכת AI מתקדמת לשיחות, מאומנת, נבדקת ונבנית באמצעות טונות של מערכי נתונים של זיהוי דיבור.

קטלוג נתונים

קטלוג נתוני דיבור ורישוי מהמדף

יש מגוון רחב של יישומים נפוצים לנתוני דיבור בפרויקטים של AI. אנו מציעים לך כמויות אדירות של נתונים באיכות גבוהה המוכנים לזיהוי הקולי שלך.

רוצה לבנות מערך שמע משלך?

צור קשר עם המומחה הביתי שלנו לאיסוף נתוני דיבור כדי להקים מאגר אודיו המתאים ביותר לדרישתך

שם פרטי*
שם משפחה*
כתובת אימייל*
טלפון*
חברה*
מדינה*
מדינה
תגובות*
בהרשמה אני מסכים עם שייפ מדיניות הפרטיות ו תנאי שימוש באתר ולספק את הסכמתי לקבל תקשורת שיווקית B2B משאיפ.
CAPTCHA

שאלות נפוצות (FAQ)

1. מהו איסוף נתוני דיבור?

איסוף נתוני דיבור עבור מודל ML מתייחס לתהליך של איסוף הקלטות אודיו של שפה מדוברת. אוסף זה מסייע באימון ושכלול אלגוריתמים של למידת מכונה, במיוחד אלו שבמרכזם הבנה ועיבוד של קולות אנושיים.

2. כיצד לאסוף נתוני אודיו עבור ASR (זיהוי דיבור אוטומטי)?

כאשר אתה שואף לאסוף נתוני אודיו עבור זיהוי דיבור אוטומטי (ASR), עליך להתחיל בהגדרת הצרכים הספציפיים של הפרויקט שלך, כולל השפה, המבטא וסוג הדיבור הרצויים. לאחר הגדרת פרמטרים אלה, ודא שאתה מקבל את כל ההרשאות הנדרשות כדי לכבד את פרטיות המשתמש. לאחר מכן, השתמש במכשירי הקלטה או בתוכנה מתאימים כדי ללכוד דגימות שמע ברורות. כל הקלטה צריכה להיות מוערת בקפידה עם התמלול שלה או מטא נתונים רלוונטיים אחרים ולאחסן באופן שיטתי לגישה ללא מאמץ.

3. שימוש בערכת נתונים של דיבור ללמידת מכונה

מערך דיבור בלמידת מכונה הוא חיוני לאימון, בדיקה ואימות מודלים המותאמים לזהות, לתמלל או לפרש שפה מדוברת. מערכי נתונים כאלה סוללים את הדרך לאינספור יישומים, מעוזרים קוליים ושירותי תמלול ועד ביומטריה קולית.

4. כיצד לאסוף נתונים מדויקים ממספר שפות ומבטאים

לאיסוף נתונים מדויקים משפות ומדגשים מגוונים, שיתוף פעולה עם דוברי שפת אם ברקע הלשוני הרצוי חיוני. שאפו למדגם מגוון ומייצג שיכסה קשת רחבה של ניואנסים דמוגרפיים. השתמש בציוד הקלטה סטנדרטי בסביבות אחידות כדי להבטיח עקביות אודיו. וחשוב מכך, הערות לכל חלק נתונים עם תעתיקים ומטא נתונים מפורטים, המציינים את השפה והמבטא הספציפיים.

שירותי איסוף נתוני דיבור המהימנים ביותר עבור ה-AI שלך

גלה צינורות נתוני אודיו ללא צווארי בקבוק

לקוחות מוצגים

שירותי איסוף נתונים קוליים/שמע מקצועיים

כל נושא. כל תרחיש.

100 +

55K +

250 +

60 +

8 / 16 / 44 / 48 קילוהרץ

המומחיות שלנו

יישר נתוני אודיו לדגמי NLP חכמים יותר

אוסף נאומי מונולוג

נאום דיאלוג אוספים

קבוצה / מוטי-מסיבה שיחות

אוסף אמירת שפות טבעיות

נתונים אקוסטיים אוספים

זיהוי דיבור אוטומטי (ASR)

נתוני אימון דיבור/שמע רב לשוני

טקסט לדיבור (TTS)

מוקד טלפוני הקלטות

סיפורי הצלחה

סיבות לבחור ב- Shaip כשותף שלך לאיסוף נתוני דיבור מהימן

אֲנָשִׁים

התַהֲלִיך

פלטפורמה

אֲנָשִׁים

התַהֲלִיך

פלטפורמה

ערכות דיבור / אודיו מהמדף

שירותים מוצעים

איסוף נתוני טקסט שירותים

שירותי איסוף נתוני תמונה

שירותי איסוף נתוני וידאו

משאבים מומלצים

הצעה

ביאור אודיו עבור AI חכם

מדריך לקונה

מדריך לקונים: מדריך מלא ל-Conversational AI

קטלוג נתונים

קטלוג נתוני דיבור ורישוי מהמדף

רוצה לבנות מערך שמע משלך?

שאלות נפוצות (FAQ)

שירותי נתונים AI

התמחות

התעשייה

מוצרים

חברה

משאבים

צור קשר

נאום דיאלוג
אוספים

קבוצה / מוטי-מסיבה
שיחות

נתונים אקוסטיים
אוספים

טקסט לדיבור
(TTS)

מוקד טלפוני
הקלטות

איסוף נתוני טקסט
שירותים