ערכת נתונים הינדי
हिंदी डेटासेट
מערך נתונים איכותי בהינדית של מוקדי שירות טלפוני, שיחות כלליות ופודקאסטים עבור מודלים של בינה מלאכותית ו-ASR
סקירה כללית
כותרת (שפה)
מערך נתונים של שפה הינדית
סוגי מערכי נתונים
מוקד שירות לקוחות, שיחה כללית, מדיה (פודקאסט), מונולוג מתוסרט
מדינה
הודו
תיאור
שיחות טלפוניות ללא תסריט בין שני אנשים זמינות באורכים של 15 עד 60 דקות, יחד עם קבצי אודיו או וידאו ברשות הציבור הניתנים לרישוי כגון ראיונות ופודקאסטים עם 1 עד 5 משתתפים באותו טווח. בנוסף, הקלטות של אמירה בודדת נמשכות בדרך כלל 5 עד 30 שניות, ונתוני מונולוגים מתסריטים זמינים גם כן.
השתמש מקרה
ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה
פרטי מערך נתונים
| סוג מערך נתונים | קצב דגימה | דוברים | ערוץ | סה"כ שעות | מספר כולל של רמקולים |
|---|---|---|---|---|---|
| מוקד טלפוני | 8 kHz | רמקולים 2 | כפול | 70:45:51 | על בקשה |
| מוקד טלפוני | 8 kHz | רמקולים 2 | מונה | 20,000:00:00 | על בקשה |
| מוקד טלפוני | 16 kHz | רמקולים 2 | מונה | 29:17:20 | 261 |
| מוקד טלפוני | 16 kHz | רמקולים 2 | כפול | 400:27:10 | 1200 |
| שיחה כללית | 8 kHz | רמקולים 2 | כפול | 47:48:40 | 224 |
| נתוני מדיה | 16 kHz | רמקולים מרובים | מונה | 227:57:43 | 438 |
| מונולוג תסריטאי | 48 kHz | רמקול יחיד | מונה | 2,866:00:00 | 3,988 |
| מונולוג תסריטאי | 24 kHz | רמקול יחיד | מונה | 29,000:00:00 | על בקשה |
לקוחות מוצגים
העצמת צוותים לבנות מוצרי AI מובילים בעולם.
לא מצאתם את מה שאתם מחפשים?
מערכי נתונים חדשים מהמדף נאספים בכל סוגי הנתונים
צור איתנו קשר עכשיו כדי להשתחרר מהדאגות שלך לאיסוף נתוני אודיו/דיבור