שירותי איסוף נתוני דיבור המהימנים ביותר עבור ה-AI שלך
התאמן את דגמי ה- NLP שלך, VAs, טיפוסי TTS ועוד עם נתוני שיחה איכותיים בעזרת שירותי איסוף נתוני האודיו והדיבור שלנו.
גלה צינורות נתוני אודיו ללא צווארי בקבוק.
לקוחות מוצגים
מדוע יש צורך במערך נתונים של הדרכת דיבור לעיבוד שפות טבעיות?
האם שמתם לב שהטלפון החכם שלכם VA, כלומר סירי, ביקסבי, או כל דבר אחר, מתקשר? הדרך שבה הם עונים על כל שאלה ומנתחים ומציגים תוצאות בהתאם לדרישות שלך!
ובכן, ככל שה-VAs האלה מסקרנים אותנו, המשאבים והתכניות החכמים האלה צריכים להיות מאומנים בהדרגה כדי להיות מסוגלים להגיב, בצורה מדויקת. זו הסיבה שבגללה כדאי לך לשקול מיקור חוץ של דיבור/אודיו ואיסוף נתוני קול לחברות איסוף נתונים מיוחדות, עם מומחיות מקצועית מאמתת.
השקעה באיסוף נתוני אודיו מכינה את ה-NLP כביכול שלך כדי לתת מענה לקהל רב לשוני. לא רק זה, איסוף נתוני דיבור עבור NLP, כפי וכאשר הוא מטופל על ידי מומחה, אפילו לוקח בחשבון איסוף בשטח, ניתוח סמנטי ותעתוק אודיו. עם פתרונות מקצועיים לאיסוף נתוני דיבור, אתה יכול:
- רכשו מערכי נתונים באיכות גבוהה של אודיו כדי לשפר את הדיוק
- כוון להגדרת תרחישים מגוונים
- אסוף נתוני אימון רב -לשוניים
- קנה קנה מידה של מודל ה-ML שלך כך שיתאים לדמוגרפיה וענפים מגוונים
שירותי איסוף נתונים אודיו / קול מקצועיים ל- NLP
כל נושא. כל תרחיש.
מערכות NLP אינטליגנטיות הן הכל מלבד כלליות. בהתאם לפונקציונליות של התוכנית, ייתכן שתצטרך להתמקד בשירותי נתוני שמע מרחביים ורב -לשוניים, אותם ניתן להציע רק על ידי חברות איסוף נתוני קול/אודיו נחשבות. כאן נכנס שייפ לתוכנית העניינים כספק שירותי חיבור נתונים אמין ביותר המתגאה לבצע את ההשקעה הכבדה עבור ה- AI החכם שלך כביכול.
ב- Shaip, ההתמקדות העיקרית שלנו היא להאכיל מודלים עם הנפח הגבוה ביותר האפשרי של דוגמאות דיבור מותאמות אישית, בזמן הפחות אפשרי. איתנו על הסיפון, אתה יכול לצפות ל:
- אוסף נתוני אודיו / קול עבור NLP
- תוכניות בהתאמה אישית המגיבות בהתאם למקרי שימוש ספציפיים
- הכנת כריית נתונים אודיו מוכנה
- עיבוד נתונים ספציפי ואוטומטי
- הרמה הגבוהה ביותר האפשרית של ספציפיות הדומיין
- זמן מהיר יותר לשוק עם דגמי AI מואצים
המומחיות שלנו
יישר נתוני שמע כדי להכין דגמי NLP חכמים
Shaip מציעה שירותי איסוף נתוני דיבור/שמע מקצה לקצה בלמעלה מ -100 שפות כדי לאפשר לטכנולוגיות המותאמות לקול להתאים לקהל מגוון של קהלים ברחבי העולם. אנו יכולים לעבוד על פרויקטים בכל היקף וגודל; החל מרשיון מערכי אודיו קיימים מהמדף ועד ניהול איסוף נתוני אודיו מותאמים אישית ועד תמלול אודיו והערות. לא משנה כמה גדול פרויקט איסוף נתוני הדיבור שלך, אנו יכולים להתאים אישית את שירותי איסוף האודיו לצרכיך לבניית מערכי נתונים NLP באיכות גבוהה הממוקדים לניבים, צלילים ושפות. בחר מתוך מגוון רחב של מערכי נתוני דיבור ומשאבי איסוף נתוני אודיו, להגדרות חכמות המאפשרות קול.
אוסף נאומי מונולוג
לטפל בדרישות מבוססות דיבור הנוגעות לרמקול עצמאי עבור טיפוסי הטקסט למהירות שלך ודרישות ספציפיות לתמלול בעזרת הזנה מיידית של סקריפטים, באמצעות קבצים של ערוץ יחיד.
נאום דיאלוג
אוספים
הגדר עוזרים וירטואליים אינטליגנטיים, צ'ט בוטים ספציפיים למהירות ומודלים לזיהוי דיבור אוטומטי עם חשיפה רב לשונית באמצעות קבצים דו-ערציים ומשאבים מתומללים.
נתונים אקוסטיים
אוספים
אנו יכולים להקליט מקצועית נתוני שמע באיכות אולפן, בין אם מדובר במסעדות, משרדים או בתים או מסביבות ושפות שונות, באמצעות רשת משתפי הפעולה העולמית שלנו, תוך כיסוי מגוון אקוסטי רחב יותר.
אוסף אמירת שפות טבעיות
הכשיר הגדרות מסחריות חכמות לזיהוי ביטויי לקוח שונים בעלי משמעות דומה, כדי להפוך את ה- AI לאוטונומי יותר בזמן.
דיגיטלי / וירטואלי
עוזרים
התמקד בבניית העוזר הווירטואלי הקרוב שלך על ידי אימון מודלים עם סייגים של דיבור אנושי, חשיפה רב לשונית, ניתוח הקשרי ו- NLU.
זיהוי דיבור אוטומטי (ASR)
שפר את הדיוק של מערכות זיהוי הדיבור האוטומטי (ASR) שלך על ידי גישה למערך נתונים מגוונים של דיבור/אודיו, ממגוון רחב של נתונים דמוגרפיים.
נתוני אימון דיבור/שמע רב לשוני
מקצועני השפה המיומנים שלנו ברחבי העולם, מציעים נתוני אימון אודיו/דיבור רב לשוני במספר שפות וניבים, כולל ערבית, דנית, סינית, אפריקאנס, סינגפור, ניו זילנד, עברית, אינדונזית, אירית, קוריאנית, מלאית, פולנית, סקוטית, שוודית , צרפתית, גרמנית, וייטנאמית, תאילנדית, איטלקית, ספרדית ועוד.
טקסט לדיבור
(TTS)
כדי להציע חווית משתמש טובה יותר עם TTS, פיתוח מערכת שתישמע טבעית הוא קריטי. בנה מודל רב-לשוני של טקסט לדיבור (TTS) בעזרת כוח העבודה הגלובלי שלנו, שעוזר לך לאסוף נתוני דיבור ב-150+ שפות ודיאלקטים כדי לשפר את דגמי הבינה המלאכותית שלך מבקרה ברכב ועד צ'אט בוטים ופתרונות למידה עם נתוני אודיו איכותיים.
סיבות לבחור ב- Shaip כשותף שלך לאיסוף נתוני דיבור מהימן
אֲנָשִׁים
צוותים ייעודיים ומאומנים:
- 30,000+ משתפי פעולה ליצירת נתונים, תיוג ו- QA
- צוות ניהול פרויקטים מוסמך
- צוות פיתוח מוצרים מנוסה
- צוות בריכת כישרון ואנשי ספינה
התַהֲלִיך
יעילות התהליך הגבוהה ביותר מובטחת באמצעות:
- תהליך סיגמא שלב 6 חזק
- צוות ייעודי של 6 חגורות סיגמא שחורות - בעלי תהליכים מרכזיים ועמידה באיכות
- שיפור מתמשך ומשדר לולאה
פלטפורמה
הפלטפורמה המוגנת בפטנט מציעה יתרונות:
- פלטפורמת קצה לקצה מבוססת אינטרנט
- איכות ללא דופי
- מהיר יותר TAT
- משלוח חלק
אֲנָשִׁים
צוותים ייעודיים ומאומנים:
- 30,000+ משתפי פעולה ליצירת נתונים, תיוג ו- QA
- צוות ניהול פרויקטים מוסמך
- צוות פיתוח מוצרים מנוסה
- צוות בריכת כישרון ואנשי ספינה
התַהֲלִיך
יעילות התהליך הגבוהה ביותר מובטחת באמצעות:
- תהליך סיגמא שלב 6 חזק
- צוות ייעודי של 6 חגורות סיגמא שחורות - בעלי תהליכים מרכזיים ועמידה באיכות
- שיפור מתמשך ומשדר לולאה
פלטפורמה
הפלטפורמה המוגנת בפטנט מציעה יתרונות:
- פלטפורמת קצה לקצה מבוססת אינטרנט
- איכות ללא דופי
- מהיר יותר TAT
- משלוח חלק
שפה: ערכות נתונים של אודיו שנאספו
ערכות דיבור / אודיו מהמדף
פרטים | מזהה קורפוס (ייחודי) | מילות מפתח | ערכת נתונים של שפה | קוד שפה | קצב דגימה | סוג מערך נתונים | סך כל שעות השמע | תיאור קצר | תיאור מערך הנתונים | ערוץ אודיו | פלטפורמת הקלטה | WER (%) | פורמט אודיו | פורמט תמלול | השתמש מקרה | מספר הרמקולים | CTA |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
en_US_CC_8 | שפת עור אפרו-אמריקאית | שפת עור אפרו-אמריקאית | en_US | 8 kHz | מרכז שירות | 211 | נתוני מוקד טלפוני אפרו-אמריקאי | שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות, | כפול | שולחן העבודה | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה: 612, זכר: 1242, ולא ידוע: 12 | צרו קשר | |
en_US_MA_16 | שפת עור אפרו-אמריקאית | שפת עור אפרו-אמריקאית | en_US | 16 kHz | מדיה אודיו | 154 | נתוני מדיה עממית אפרו-אמריקאית | קובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקות | מונה | מקורות אינטרנט | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה: 151, זכר: 150, ולא ידוע: 10 | צרו קשר | |
Afrikaans_GC_8 | אפריקאנס | אפריקאנס | af_ZA | 8 kHz | שיחה כללית | 368 | נתוני שיחה כללית באפריקנס | שיחה טלפונית ללא תסריט בין שני אנשים. משוער. משך אודיו (טווח) - 15-60 דקות, אפריקנס המדוברת באפריקה | כפול | שולחן העבודה | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה: 502, זכר: 390, ולא ידוע: 2 | צרו קשר | |
אפריקאנס_MA_16 | אפריקאנס | אפריקאנס | af_ZA | 16 kHz | מדיה אודיו | 658 | קבצי מדיה באפריקה | קובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקות | מונה | מקורות אינטרנט | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה: 750, זכר: 1278, ולא ידוע: 52 | צרו קשר | |
ערבית_GC_8 | ערבי | ערבי | ar_AE | 8 kHz | שיחה כללית | 292 | נתוני שיחות כלליות בערבית | שיחה טלפונית ללא תסריט בין שני אנשים. משוער. משך שמע (טווח) - 15-60 דקות, ערבית ממדינות המפרץ | כפול | שולחן העבודה | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה: 171, זכר: 534, ולא ידוע: 1 | צרו קשר | |
ערבית_SM_48 | ערבי | ערבי | ar-SA | 48 kHz | מונולוג תסריטאי | 1,947 | מונולוג בכתב ערבי | הקלטות של אמירה בודדת, הנוטות ליפול בטווח של 5 עד 30 שניות | מונה | Mobile App | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה 838 זכר 1209 לא ידוע 78 | צרו קשר | |
Assamese_CC_8 | אסאמית | אסאמית (בצינור) | as_IN | מרכז שירות | 60 | נתוני מרכז טלפוני אסאמי (בצינור). | שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות, | שולחן העבודה | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | צרו קשר | ||||
Assamese_GC | אסאמית | אסאמית (בצינור) | as_IN | שיחה כללית | 100 | נתוני שיחות כלליות אסאמי (בצינור). | שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות, | שולחן העבודה | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | צרו קשר | ||||
Assamese_MA | אסאמית | אסאמית (בצינור) | as_IN | מדיה אודיו | 40 | נתוני אודיו של מדיה אסאמית (בצינור). | קובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקות | מקורות אינטרנט | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | צרו קשר | ||||
בנגלית_CC_8 | בנגלית | בנגלית (בצינור) | bn_IN | מרכז שירות | 60 | נתוני מרכז טלפוני בנגלית (בצינור). | שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות, | שולחן העבודה | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | צרו קשר | ||||
Bengali_GC | בנגלית | בנגלית (בצינור) | bn_IN | שיחה כללית | 100 | בנגלית (בצינור) נתוני שיחה כלליים | שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות, | שולחן העבודה | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | צרו קשר | ||||
בנגלית_MA | בנגלית | בנגלית (בצינור) | bn_IN | מדיה אודיו | 40 | בנגלית (בצינור) נתוני אודיו של מדיה | קובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקות | מקורות אינטרנט | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | צרו קשר | ||||
Boston_CC_8 | בוסטון אנגלית | בוסטון אנגלית | en_US | 8 kHz | מרכז שירות | 177 | נתוני מרכז השיחות של בוסטון | שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות, | כפול | שולחן העבודה | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה: 605, זכר: 711, ולא ידוע: 0 | צרו קשר | |
Boston_GC_8 | בוסטון אנגלית | בוסטון אנגלית | en_US | 8 kHz | שיחה כללית | 32 | נתוני השיחה הכללית של בוסטון | שיחה טלפונית ללא תסריט בין שני אנשים. משוער. משך אודיו (טווח) - 15-60 דקות, | כפול | שולחן העבודה | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה: 53, זכר: 83, ולא ידוע: 0 | צרו קשר | |
Boston_MA_16 | בוסטון אנגלית | בוסטון אנגלית | en_US | 16 kHz | מדיה אודיו | 93 | נתוני אודיו של Boston Media | קובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקות | מונה | מקורות אינטרנט | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה: 43, זכר: 181, ולא ידוע: 2 | צרו קשר | |
קנדי_SM_48 | צרפתית קנדית | צרפתית קנדית | fr-CA | 48 kHz | מונולוג תסריטאי | 1,222 | צרפתית קנדית | הקלטות של אמירה בודדת, הנוטות ליפול בטווח של 5 עד 30 שניות | מונה | Mobile App | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה 974 זכר 631 לא ידוע 1 | צרו קשר | |
סינית_CC_8 | אנגלית סינית | אנגלית סינית | en_US | 8 kHz | מרכז שירות | 169 | נתוני מוקד טלפוני סיני | שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות, | כפול | שולחן העבודה | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה: 1790, זכר: 523 ולא ידוע: 13 | צרו קשר | |
סינית_MA_16 | אנגלית סינית | אנגלית סינית | en_US | 16 kHz | מדיה אודיו | 249 | נתוני אודיו של מדיה סינית | קובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקות | מונה | מקורות אינטרנט | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה: 126, זכר: 346 ולא ידוע: 6 | צרו קשר | |
סינית פשוטה_SM_48 | סינית | סינית | zh-CN | 48 kHz | מונולוג תסריטאי | 2,762 | סינית | הקלטות של אמירה בודדת, הנוטות ליפול בטווח של 5 עד 30 שניות | מונה | Mobile App | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה 1920 זכר 1535 לא ידוע 270 | צרו קשר | |
סינית מסורתית_SM_48 | סינית מסורתית | סינית מסורתית | zh-TW | 48 kHz | מונולוג תסריטאי | 1,028 | סינית מסורתית | הקלטות של אמירה בודדת, הנוטות ליפול בטווח של 5 עד 30 שניות | מונה | Mobile App | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה 1069 זכר 262 לא ידוע 3 | צרו קשר | |
Danish_GC_8 | דני | דני | da_DK | 8 kHz | שיחה כללית | 372 | נתוני שיחה כללית דנית | שיחה טלפונית ללא תסריט בין שני אנשים. משוער. משך אודיו (טווח) - 15-60 דקות, | כפול | שולחן העבודה | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה: 311, זכר: 417, לא ידוע: 0 | צרו קשר | |
דנית_MA_16 | דני | דני | da_DK | 16 kHz | מדיה אודיו | 664 | נתוני אודיו של מדיה דנית | קובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקות | מונה | מקורות אינטרנט | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה: 369, זכר: 864, לא ידוע: 27 | צרו קשר | |
דנית_SM_48 | דני | דני | da-DK | 48 kHz | מונולוג תסריטאי | 2,579 | מונולוג בכתב דני | הקלטות של אמירה בודדת, הנוטות ליפול בטווח של 5 עד 30 שניות, דנית מדנמרק | מונה | Mobile App | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה 1551 זכר 1233 לא ידוע 42 | צרו קשר | |
אנגלית עמוקה דרום_CC_8 | דרום דרום עמוק | דרום דרום עמוק | en_US | 8 kHz | מרכז שירות | 151 | מידע מוקד טלפוני בדרום עמוק באנגלית | שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות, | כפול | שולחן העבודה | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה 221 , זכר 1004 , לא ידוע 7 | צרו קשר | |
אנגלית עמוקה דרום_GC_8 | דרום דרום עמוק | דרום דרום עמוק | en_US | 8 kHz | שיחה כללית | 56 | נתוני שיחה כללית בדרום עמוק באנגלית | שיחה טלפונית ללא תסריט בין שני אנשים. משוער. משך אודיו (טווח) - 15-60 דקות, | כפול | שולחן העבודה | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה 99, גבר 31, לא ידוע 0 | צרו קשר | |
אנגלית עמוקה דרום_MA_16 | דרום דרום עמוק | דרום דרום עמוק | en_US | 16 kHz | מדיה אודיו | 266 | נתוני אודיו באנגלית Deep South Media | קובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקות | מונה | מקורות אינטרנט | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה 204, גבר 356, לא ידוע 21 | צרו קשר | |
גרמנית_CC_8 | גרמנית | גרמנית | דה-דה | 8 kHz | מרכז שירות | 64 | נתוני מוקד טלפוני גרמני | שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות, | מונה | שולחן העבודה | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה 478 זכר 1440 לא ידוע 0 | צרו קשר | ||
גרמנית_IVR_8 | גרמנית | גרמנית | דה-דה | 8 kHz | סיומת IVR | 200 | נתוני IVR גרמניים | אדם למכונה. זרימה מסוג IVR שבה יש הנחית TTS (למשל "איך אוכל לעזור לך") ואחריה תגובה אנושית ספונטנית | מונה | שולחן העבודה | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה 10115 זכר 8750 לא ידוע 0 | צרו קשר | ||
Gujarati_CC_8 | גוג'ראטית | גוג'ראטי (בצינור) | gu_IN | מרכז שירות | 60 | נתוני מוקד טלפוני של גוג'ראטי (בצינור). | שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות, | שולחן העבודה | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | צרו קשר | ||||
Gujarati_GC | גוג'ראטית | גוג'ראטי (בצינור) | gu_IN | שיחה כללית | 100 | נתוני שיחות כלליות של גוג'ראטי (בצינור). | שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות, | שולחן העבודה | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | צרו קשר | ||||
Gujarati_MA | גוג'ראטית | גוג'ראטי (בצינור) | gu_IN | מדיה אודיו | 40 | גוג'ראטי (בצינור) נתוני אודיו של מדיה | קובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקות | מקורות אינטרנט | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | צרו קשר | ||||
עברית_שיחה כללית_8 | עברית | עברית | he_IL | 8 kHz | שיחה כללית | 399 | נתוני שיחות כלליות בעברית | שיחה טלפונית ללא תסריט בין שני אנשים. משוער. משך שמע (טווח) - 15-60 דקות, עברית בישראל | כפול | שולחן העבודה | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה 414, זכר 399, לא ידוע 1 | צרו קשר | |
עברית_MA_16 | עברית | עברית | he_IL | 16 kHz | מדיה אודיו | 427 | נתוני אודיו של מדיה עברית | קובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקות | מונה | מקורות אינטרנט | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה 361, זכר 513, לא ידוע 13 | צרו קשר | |
הינדי_MA_16 | הינדי | הינדי | היי_IN | 16 kHz | מדיה אודיו | 219 | נתוני אודיו של מדיה הינדי | קובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקות | מונה | מקורות אינטרנט | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה 83, זכר 309, לא ידוע 0 | צרו קשר | |
הינדי_SM_48 | הינדי | הינדי | היי-אין | 48 kHz | מונולוג תסריטאי | 2,867 | מונולוג תסריטאי הינדי | הקלטות של אמירה בודדת, הנוטות ליפול בטווח של 5 עד 30 שניות | מונה | Mobile App | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה 1977 זכר 1864 לא ידוע 147 | צרו קשר | |
HINGLISH_CC_8 | הינגליש | הינגליש | hg_IN | 8 kHz | מרכז שירות | 208 | HINGLISH נתוני מוקד טלפוני | שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות, | כפול | שולחן העבודה | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה 822, זכר 1262, לא ידוע 0 | צרו קשר | |
HINGLISH_MA_16 | הינגליש | הינגליש | hg_IN | 16 kHz | מדיה אודיו | 216 | HINGLISH נתוני אודיו של מדיה | קובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקות | מונה | מקורות אינטרנט | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה 75, גבר 380, לא ידוע 0 | צרו קשר | |
Hispanic_CC_8 | אנגלית היספנית | אנגלית היספנית | en_US | 8 kHz | מרכז שירות | 212 | נתוני מוקד טלפוני היספניים | שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות, | כפול | שולחן העבודה | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה 822, זכר 1262, לא ידוע 0 | צרו קשר | |
Hispanic_MA_16 | אנגלית היספנית | אנגלית היספנית | en_US | 16 kHz | מדיה אודיו | 155 | אודיו היספני Call Media | קובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקות | מונה | מקורות אינטרנט | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה 140, זכר 219, לא ידוע 5 | צרו קשר | |
אינדונזית_GC_8 | אינדונזי | אינדונזי | אני עשיתי | 8 kHz | שיחה כללית | 496 | נתוני שיחה כללית באינדונזיה | שיחה טלפונית ללא תסריט בין שני אנשים. משוער. משך שמע (טווח) - 15-60 דקות, בהאסה אינדונזית | כפול | שולחן העבודה | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה 524, זכר 454, לא ידוע 2 | צרו קשר | |
אינדונזית_MA_16 | אינדונזי | אינדונזי | אני עשיתי | 16 kHz | מדיה אודיו | 643 | נתוני אודיו של מדיה אינדונזית | קובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקות | מונה | מקורות אינטרנט | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה 746, זכר 1507, לא ידוע 129 | צרו קשר | |
Irish_GC_8 | אירי | אירי | en_IE | 8 kHz | שיחה כללית | 192 | נתוני השיחה הכללית של אירית | שיחה טלפונית ללא תסריט בין שני אנשים. משוער. משך אודיו (טווח) - 15-60 דקות, | כפול | שולחן העבודה | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה 213 , זכר 153 , לא ידוע 0 | צרו קשר | |
יפני_SM_48 | יפני | יפני | ja-JP | 48 kHz | מונולוג תסריטאי | 2,335 | מונולוג בכתב יפני | הקלטות של אמירה בודדת, הנוטות ליפול בטווח של 5 עד 30 שניות | מונה | Mobile App | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה 1460 זכר 1221 לא ידוע 194 | צרו קשר | |
קנאדה_CC_8 | קנאדה | קנאדה (בצינור) | kn_IN | מרכז שירות | 60 | נתוני מרכז טלפוני של קנאדה (בצינור). | שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות, | שולחן העבודה | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | צרו קשר | ||||
Kannada_GC | קנאדה | קנאדה (בצינור) | kn_IN | שיחה כללית | 100 | קנאדה (בצינור) נתוני שיחה כלליים | שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות, | שולחן העבודה | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | צרו קשר | ||||
קנאדה_MA | קנאדה | קנאדה (בצינור) | kn_IN | מדיה אודיו | 40 | Kannada (In Pipeline) נתוני אודיו של מדיה | קובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקות | מקורות אינטרנט | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | צרו קשר | ||||
קוריאנית_CC_8 | קוריאני | קוריאני | ko_KR | 8 kHz | מרכז שירות | 107 | נתוני מוקד טלפוני קוריאני | שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות, | כפול | שולחן העבודה | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה 1086, זכר 210, לא ידוע 4 | צרו קשר | |
קוריאנית_MA_16 | קוריאני | קוריאני | ko_KR | 16 kHz | מדיה אודיו | 204 | נתוני אודיו של מדיה קוריאנית | קובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקות | מונה | מקורות אינטרנט | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה 70 זכר 303, לא ידוע 25 | צרו קשר | |
קוריאני_SM_48 | קוריאני | קוריאני | ko-KR | 48 kHz | מונולוג תסריטאי | 1,955 | מונולוג כתב קוריאני | הקלטות של אמירה בודדת, הנוטות ליפול בטווח של 5 עד 30 שניות | מונה | Mobile App | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה 1195 זכר 1134 לא ידוע 122 | צרו קשר | |
מלאית_GC_8 | מלאית | מלאית | ms_MY | 8 kHz | שיחה כללית | 266 | נתוני שיחה כללית במלזית | שיחה טלפונית ללא תסריט בין שני אנשים. משוער. משך אודיו (טווח) - 15-60 דקות, מלאית במלזיה | כפול | שולחן העבודה | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה 316, זכר 176, לא ידוע 0 | צרו קשר | |
מלאית_MA_16 | מלאית | מלאית | ms_MY | 16 kHz | מדיה אודיו | 344 | נתוני אודיו של מדיה מלאית | קובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקות | מונה | מקורות אינטרנט | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה 236, גבר 626, לא ידוע 47 | צרו קשר | |
Malayalam_CC_8 | מליאלאם | מלאיאלאם (בצינור) | ml_IN | מרכז שירות | 60 | נתוני מרכז טלפוני של Malaylam (In Pipeline). | שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות, | שולחן העבודה | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | צרו קשר | ||||
Malayalam_GC | מליאלאם | מלאיאלאם (בצינור) | ml_IN | שיחה כללית | 100 | מליאלם (בצינור) נתוני שיחה כלליים | שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות, | שולחן העבודה | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | צרו קשר | ||||
Malayalam_MA | מליאלאם | מלאיאלאם (בצינור) | ml_IN | מדיה אודיו | 40 | Malaayalam (In Pipeline) נתוני אודיו של מדיה | קובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקות | מקורות אינטרנט | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | צרו קשר | ||||
Marathi_CC_8 | מרתי | Marathi (בצינור) | mr_IN | מרכז שירות | 60 | נתוני Marathi (In Pipeline) Call-Center | שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות, | שולחן העבודה | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | צרו קשר | ||||
Marathi_GC | מרתי | Marathi (בצינור) | mr_IN | שיחה כללית | 100 | נתוני שיחה כללית של Marathi (In Pipeline). | שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות, | שולחן העבודה | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | צרו קשר | ||||
Marathi_MA | מרתי | Marathi (בצינור) | mr_IN | מדיה אודיו | 40 | Marathi (In Pipeline) נתוני אודיו של מדיה | קובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקות | מקורות אינטרנט | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | צרו קשר | ||||
מקסיקני_SM_48 | ספרדית (מקסיקו) | ספרדית (מקסיקו) | en-MX | 48 kHz | מונולוג תסריטאי | 1,492 | מונולוג כתב ספרדי מקסיקני | הקלטות של אמירה בודדת, הנוטות ליפול בטווח של 5 עד 30 שניות | מונה | Mobile App | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה 1016 זכר 1069 לא ידוע 95 | צרו קשר | |
הולנד_SM_48 | הולנדי | הולנדי | nl-NL | 48 kHz | מונולוג תסריטאי | 1,205 | מונולוג כתב הולנדי | הקלטות של אמירה בודדת, הנוטות ליפול בטווח של 5 עד 30 שניות | מונה | Mobile App | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה 1285 זכר 531 לא ידוע 3 | צרו קשר | |
ניו יורק אנגלית_CC_8 | ניו יורק אנגלית | ניו יורק אנגלית | en_US | 8 kHz | מרכז שירות | 103 | נתוני מוקד טלפוני בניו יורק באנגלית | שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות, | כפול | שולחן העבודה | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה 610, זכר 532, לא ידוע 0 | צרו קשר | |
ניו יורק אנגלית_GC_8 | ניו יורק אנגלית | ניו יורק אנגלית | en_US | 8 kHz | שיחה כללית | 107 | נתוני שיחה כללית באנגלית בניו יורק | שיחה טלפונית ללא תסריט בין שני אנשים. משוער. משך אודיו (טווח) - 15-60 דקות, | כפול | שולחן העבודה | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה 118, זכר 114, לא ידוע 0 | צרו קשר | |
ניו יורק אנגלית_MA_16 | ניו יורק אנגלית | ניו יורק אנגלית | en_US | 16 kHz | מדיה אודיו | 140 | נתוני אודיו של ניו יורק אנגלית | קובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקות | מונה | מקורות אינטרנט | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה 66, זכר 230, לא ידוע 11 | צרו קשר | |
ניו זילנד_GC_8 | ניו זילנד אנגלית | ניו זילנד אנגלית | en_NZ | 8 kHz | שיחה כללית | 148 | נתוני שיחה כללית באנגלית בניו זילנד | שיחה טלפונית ללא תסריט בין שני אנשים. משוער. משך אודיו (טווח) - 15-60 דקות, | כפול | שולחן העבודה | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה 167, זכר 121, לא ידוע 4 | צרו קשר | |
ניו זילנד_MA_16 | ניו זילנד אנגלית | ניו זילנד אנגלית | en_NZ | 16 kHz | מדיה אודיו | 400 | אודיו של ניו זילנד מדיה אנגלית | קובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקות | מונה | מקורות אינטרנט | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה 367, זכר 678, לא ידוע 26 | צרו קשר | |
Oriya_CC_8 | אוריה | אוריה (בצינור) | or_IN | מרכז שירות | 60 | אוריה (בצנרת) נתוני Call-Center | שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות, | שולחן העבודה | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | צרו קשר | ||||
Oriya_GC | אוריה | אוריה (בצינור) | or_IN | שיחה כללית | 100 | אוריה (בצינור) נתוני שיחה כלליים | שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות, | שולחן העבודה | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | צרו קשר | ||||
Oriya_MA | אוריה | אוריה (בצינור) | or_IN | מדיה אודיו | 40 | Oriya (In Pipeline) נתוני אודיו של מדיה | קובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקות | מקורות אינטרנט | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | צרו קשר | ||||
פולנית_MA_16 | פולני | פולני | en_PL | 16 kHz | מדיה אודיו | 269 | אודיו של מדיה פולנית | קובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקות | מונה | מקורות אינטרנט | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה 173 זכר 354 לא ידוע 6 | צרו קשר | |
פולנית פולין_SM_48 | פולנית (פולין) | פולנית (פולין) | pl-pl | 48 kHz | מונולוג תסריטאי | 1,482 | פולין פולין - מונולוג תסריטאי | הקלטות של אמירה בודדת, הנוטות ליפול בטווח של 5 עד 30 שניות | מונה | Mobile App | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה 1324 זכר 701 לא ידוע 24 | צרו קשר | |
פונג'בי_CC_8 | פונג'בית | פנג'בי (בצינור) | פונג'בית | מרכז שירות | 60 | נתוני מרכז טלפוני של פונג'אבי (בצינור). | שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות, | שולחן העבודה | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | צרו קשר | ||||
פונג'בי_GC | פונג'בית | פנג'בי (בצינור) | פונג'בית | שיחה כללית | 100 | פונג'אבי (בצינור) נתוני שיחה כלליים | שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות, | שולחן העבודה | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | צרו קשר | ||||
פונג'בי_MA | פונג'בית | פנג'בי (בצינור) | פונג'בית | מדיה אודיו | 40 | פונג'אבי (בצינור) נתוני אודיו של מדיה | קובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקות | מקורות אינטרנט | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | צרו קשר | ||||
Russian_SM_48 | רוסי | רוסי | רו-רו | 48 kHz | מונולוג תסריטאי | 2,398 | מונולוג בכתב רוסי | הקלטות של אמירה בודדת, הנוטות ליפול בטווח של 5 עד 30 שניות | מונה | Mobile App | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה 1689 זכר 1937 לא ידוע 214 | צרו קשר | |
Scottish_GC_8 | סקוטי (מבטא אנגלי) | סקוטי (מבטא אנגלי) | en_AB | 8 kHz | שיחה כללית | 292 | נתוני השיחה הכללית של סקוטלנד | שיחה טלפונית ללא תסריט בין שני אנשים. משוער. משך אודיו (טווח) - 15-60 דקות, | כפול | שולחן העבודה | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה 285, זכר 260, לא ידוע 3 | צרו קשר | |
Singapore_CC_8 | סינגפור אנגלית | סינגפור אנגלית | en_SG | 8 kHz | מרכז שירות | 218 | נתוני מרכז השיחות של סינגפור | שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות, | כפול | שולחן העבודה | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה 2139, זכר 884, לא ידוע 21 | צרו קשר | |
סינגפור_MA_16 | סינגפור אנגלית | סינגפור אנגלית | en_SG | 16 kHz | מדיה אודיו | 247 | נתוני אודיו של סינגפור מדיה | קובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקות | מונה | מקורות אינטרנט | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה 160, זכר 455, לא ידוע 37 | צרו קשר | |
אנגלית דרום אפריקאית_CC_8 | אנגלית דרום אפריקאית | אנגלית דרום אפריקאית | en_ZA | 8 kHz | מרכז שירות | 261 | נתוני מרכז טלפון באנגלית דרום אפריקאית | שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות, | כפול | שולחן העבודה | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה 1274 , זכר 935 , לא ידוע 1 | צרו קשר | |
אנגלית דרום אפריקאית_MA_16 | אנגלית דרום אפריקאית | אנגלית דרום אפריקאית | en_ZA | 16 kHz | מדיה אודיו | 251 | נתוני אודיו של מדיה אנגלית דרום אפריקאית | קובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקות | מונה | מקורות אינטרנט | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה 235, זכר 432, לא ידוע 36 | צרו קשר | |
סוואהילית_CC_8 | סוואהילית | סוואהילית | sw_KE | 8 kHz | מרכז שירות | 230 | נתוני מרכז טלפוני סוואהילי | שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות, | כפול | שולחן העבודה | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה 611, זכר 833, לא ידוע 0 | צרו קשר | |
סוואהילית_MA_16 | סוואהילית | סוואהילית | sw_KE | 16 kHz | מדיה אודיו | 265 | נתוני אודיו של מדיה סוואהילית | קובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקות | מונה | מקורות אינטרנט | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה 118, זכר 493, לא ידוע 25 | צרו קשר | |
Swedish_CC_8 | שבדי | שבדי | sv_SE | 8 kHz | מרכז שירות | 250 | נתוני מרכז טלפוני שוודי | שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות, | כפול | שולחן העבודה | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה 1581, זכר 727, לא ידוע 2 | צרו קשר | |
שוודית_MA_16 | שבדי | שבדי | sv_SE | 16 kHz | מדיה אודיו | 278 | נתוני אודיו של מדיה שוודית | קובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקות | מונה | מקורות אינטרנט | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה 195, זכר 500, לא ידוע 21 | צרו קשר | |
Tamil_CC_8 | טמילית | טמילית (בצינור) | ta_IN | מרכז שירות | 60 | נתוני מרכז טלפוני טמילית (בצינור). | שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות, | שולחן העבודה | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | צרו קשר | ||||
Tamil_GC | טמילית | טמילית (בצינור) | ta_IN | שיחה כללית | 100 | נתוני שיחה כללית טמילית (בצינור). | שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות, | שולחן העבודה | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | צרו קשר | ||||
Tamil_MA | טמילית | טמילית (בצינור) | ta_IN | מדיה אודיו | 40 | טמילית (בצינור) נתוני אודיו של מדיה | קובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקות | מקורות אינטרנט | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | צרו קשר | ||||
Telugu_GC_8 | טלוגו | טלוגו | te_IN | 8 kHz | שיחה כללית | 553 | נתוני שיחה כללית של טלוגו | שיחה טלפונית ללא תסריט בין שני אנשים. משוער. משך אודיו (טווח) - 15-60 דקות, | כפול | שולחן העבודה | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה 574, זכר 564, לא ידוע 0 | צרו קשר | |
Telugu_MA_16 | טלוגו | טלוגו | te_IN | 16 kHz | מדיה אודיו | 648 | נתוני אודיו של Telugu Media | קובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקות | מונה | מקורות אינטרנט | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה 207, זכר 963, לא ידוע 2 | צרו קשר | |
Telugu_CC_8 | טלוגו | טלוגו (בצינור) | te_IN | מרכז שירות | 30 | נתוני Telugu (In Pipeline) Call-Center | שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות, | שולחן העבודה | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | צרו קשר | ||||
Telugu_GC | טלוגו | טלוגו (בצינור) | te_IN | שיחה כללית | 50 | טלוגו (בצינור) נתוני שיחה כלליים | שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות, | שולחן העבודה | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | צרו קשר | ||||
Telugu_MA | טלוגו | טלוגו (בצינור) | te_IN | מדיה אודיו | 20 | Telugu (In Pipeline) נתוני אודיו של מדיה | קובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקות | מקורות אינטרנט | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | צרו קשר | ||||
Thai_GC_8 | תאילנדי | תאילנדי | th_TH | 8 kHz | שיחה כללית | 183 | שיחה כללית תאילנדית | שיחה טלפונית ללא תסריט בין שני אנשים. משוער. משך אודיו (טווח) - 15-60 דקות, רישום לא רשמי בשימוש בין חברים | כפול | שולחן העבודה | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה 338, זכר 96, לא ידוע 8 | צרו קשר | |
Thai_MA_8 | תאילנדי | תאילנדי | th_TH | 16 kHz | מדיה אודיו | 173 | אודיו של מדיה תאילנדית | קובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקות | מונה | מקורות אינטרנט | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה 143, זכר 502, לא ידוע 26 | צרו קשר | |
טורקיה טורקיה_SM_48 | טורקיה טורקית | טורקיה טורקית | tr-TR | 48 kHz | מונולוג תסריטאי | 2,027 | טורקיה טורקית | הקלטות של אמירה בודדת, הנוטות ליפול בטווח של 5 עד 30 שניות | מונה | Mobile App | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה 1561 זכר 1241 לא ידוע 31 | צרו קשר | |
וייטנאמית_GC_8 | ויאטנמית | ויאטנמית | vi_VN | 8 kHz | שיחה כללית | 295 | נתוני שיחה כללית וייטנאמית | שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות, צפון (למשל, האנוי), מרכז ודרום (למשל, הו צ'י מין סיטי). | כפול | שולחן העבודה | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה 400, גבר 380, אלמונים 2 | צרו קשר | |
וייטנאמית_MA_16 | ויאטנמית | ויאטנמית | vi_VN | 16 kHz | מדיה אודיו | 257 | נתוני אודיו של מדיה וייטנאמית | קובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקות | מונה | מקורות אינטרנט | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה 249, גבר 200, אלמונים 45 | צרו קשר | |
Welsh_GC_8 | וולשית (מבטא אנגלי) | וולשית (מבטא אנגלי) | en_WL | 8 kHz | שיחה כללית | 278 | נתוני שיחה כללית בוולשית | שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות, | כפול | שולחן העבודה | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | נקבה 270, זכר 324, לא ידוע 0 | צרו קשר | |
בריטניה אנגלית_WW_16 | אנגלית אנגלית | אנגלית אנגלית | en_uk | 16 kHz | להתעורר Word | רמקולים 200 | Wake Word באנגלית אנגלית | איסוף ביטויי מפתח של נתונים
| ערוץ 1 | Mobile App | 5.0 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | מין: 50% גברים, 50% נשים, +/- 10%. | צרו קשר |
שירותים מוצעים
איסוף נתוני שמע מומחה אינו מעשי על כל הסידורים עבור הגדרות AI מקיפות. ב- Shaip, אתה יכול אפילו לשקול את השירותים הבאים כדי להפוך את הדגמים לנפוצים בהרבה מהרגיל:
איסוף נתוני טקסט
שירותים
הערך האמיתי של שירותי איסוף הנתונים הקוגניטיביים של Shaip הוא בכך שהוא נותן לארגונים את המפתח לפתוח מידע קריטי שנמצא בתוך נתונים לא מובנים.
שירותי איסוף נתוני תמונה
וודא שמודל החזון הממוחשב שלך מזהה כל תמונה במדויק, כדי לאמן בצורה חלקה את דגמי AI מהדור הבא של העתיד
שירותי איסוף נתוני וידאו
כעת התמקד בראיית מחשב יחד עם NLP לאימון המודלים שלך לזהות אובייקטים, אנשים, מרתיעים ואלמנטים חזותיים אחרים לשלמות.
משאבים מומלצים
הצעה
ביאור אודיו עבור AI חכם
שירותי הערות אודיו היו הצד החזק של שייפ מאז תחילת הדרך. פתח, אימון ושפר AI לשיחה, צ'טבוטים ומנועי זיהוי דיבור עם שירותי הערות האודיו החדישים שלנו.
מדריך לקונה
מדריך לקונים: מדריך מלא ל-Conversational AI
הצ'אטבוט שאיתו שוחחת פועל על מערכת AI מתקדמת לשיחות, מאומנת, נבדקת ונבנית באמצעות טונות של מערכי נתונים של זיהוי דיבור.
קטלוג נתונים
קטלוג נתוני דיבור ורישוי מהמדף
יש מגוון רחב של יישומים נפוצים לנתוני דיבור בפרויקטים של AI. אנו מציעים לך כמויות אדירות של נתונים באיכות גבוהה המוכנים לזיהוי הקולי שלך.
רוצה לבנות מערך שמע משלך?
צור קשר עם המומחה הביתי שלנו לאיסוף נתוני דיבור כדי להקים מאגר אודיו המתאים ביותר לדרישתך
שאלות נפוצות (FAQ)
איסוף נתוני דיבור עבור מודל ML מתייחס לתהליך של איסוף הקלטות אודיו של שפה מדוברת. אוסף זה מסייע באימון ושכלול אלגוריתמים של למידת מכונה, במיוחד אלו שבמרכזם הבנה ועיבוד של קולות אנושיים.
כאשר אתה שואף לאסוף נתוני אודיו עבור זיהוי דיבור אוטומטי (ASR), עליך להתחיל בהגדרת הצרכים הספציפיים של הפרויקט שלך, כולל השפה, המבטא וסוג הדיבור הרצויים. לאחר הגדרת פרמטרים אלה, ודא שאתה מקבל את כל ההרשאות הנדרשות כדי לכבד את פרטיות המשתמש. לאחר מכן, השתמש במכשירי הקלטה או בתוכנה מתאימים כדי ללכוד דגימות שמע ברורות. כל הקלטה צריכה להיות מוערת בקפידה עם התמלול שלה או מטא נתונים רלוונטיים אחרים ולאחסן באופן שיטתי לגישה ללא מאמץ.
מערך דיבור בלמידת מכונה הוא חיוני לאימון, בדיקה ואימות מודלים המותאמים לזהות, לתמלל או לפרש שפה מדוברת. מערכי נתונים כאלה סוללים את הדרך לאינספור יישומים, מעוזרים קוליים ושירותי תמלול ועד ביומטריה קולית.
לאיסוף נתונים מדויקים משפות ומדגשים מגוונים, שיתוף פעולה עם דוברי שפת אם ברקע הלשוני הרצוי חיוני. שאפו למדגם מגוון ומייצג שיכסה קשת רחבה של ניואנסים דמוגרפיים. השתמש בציוד הקלטה סטנדרטי בסביבות אחידות כדי להבטיח עקביות אודיו. וחשוב מכך, הערות לכל חלק נתונים עם תעתיקים ומטא נתונים מפורטים, המציינים את השפה והמבטא הספציפיים.