מערך נתונים טמילי
தமிழ் தரவுத்தொகுப்பு
שחררו את העוצמה של מערכי נתוני דיבור בטמילית עבור ASR, TTS ובינה מלאכותית של שיחות. Shaip מציעה מערכי נתוני אודיו טמילית פרימיום לאימון מודלי שפה חכמים יותר.
סקירה כללית
כותרת (שפה)
מערך נתונים של השפה הטמילית
סוגי מערכי נתונים
מרכז שירות, שיחה כללית, נתוני מדיה, מונולוג מתוסרט
מדינה
הודו
תיאור
מערך נתונים זה כולל שיחות סינתטיות לא מתוסרטות בין סוכן ללקוח (5-15 דקות), שיחות טלפוניות טבעיות בין אדם לאדם (15-60 דקות) ונתוני מדיה עם תמלולים, המציעים נתוני דיבור מגוונים לאימון והערכת טכנולוגיות דיבור ושפה.
השתמש מקרה
ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה
פרטי מערך נתונים
| סוג מערך נתונים | קצב דגימה | דוברים | ערוץ | סה"כ שעות | מספר כולל של רמקולים |
|---|---|---|---|---|---|
| מוקד טלפוני | 8 kHz | רמקולים 2 | כפול | 124:23:52 | 484 |
| מוקד טלפוני | 16 kHz | רמקולים 2 | מונה | 199:44:21 | 1,986 |
| שיחה כללית | 8 kHz | רמקולים 2 | כפול | 101:42:05 | 440 |
| שיחה כללית | 48 kHz | רמקולים 2 | מונה | 80:21:16 | 141 |
| נתוני מדיה | 16 kHz | רמקולים מרובים | מונה | 43:07:01 | 32 |
| מונולוג תסריטאי | 24 kHz | רמקול יחיד | מונה | 500:00:00 | על בקשה |
לקוחות מוצגים
העצמת צוותים לבנות מוצרי AI מובילים בעולם.
לא מצאתם את מה שאתם מחפשים?
מערכי נתונים חדשים מהמדף נאספים בכל סוגי הנתונים
צור איתנו קשר עכשיו כדי להשתחרר מהדאגות שלך לאיסוף נתוני אודיו/דיבור