מערך נתונים טמילי

தமிழ் தரவுத்தொகுப்பு

שחררו את העוצמה של מערכי נתוני דיבור בטמילית עבור ASR, TTS ובינה מלאכותית של שיחות. Shaip מציעה מערכי נתוני אודיו טמילית פרימיום לאימון מודלי שפה חכמים יותר.

סקירה כללית

כותרת (שפה)

מערך נתונים של השפה הטמילית

סוגי מערכי נתונים

מרכז שירות, שיחה כללית, נתוני מדיה, מונולוג מתוסרט

מדינה

הודו

תיאור

מערך נתונים זה כולל שיחות סינתטיות לא מתוסרטות בין סוכן ללקוח (5-15 דקות), שיחות טלפוניות טבעיות בין אדם לאדם (15-60 דקות) ונתוני מדיה עם תמלולים, המציעים נתוני דיבור מגוונים לאימון והערכת טכנולוגיות דיבור ושפה.

השתמש מקרה

ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה

פרטי מערך נתונים

סוג מערך נתונים קצב דגימה דוברים ערוץ סה"כ שעות מספר כולל של רמקולים
מוקד טלפוני 8 kHz רמקולים 2 כפול 124:23:52 484
מוקד טלפוני 16 kHz רמקולים 2 מונה 199:44:21 1,986
שיחה כללית 8 kHz רמקולים 2 כפול 101:42:05 440
שיחה כללית 48 kHz רמקולים 2 מונה 80:21:16 141
נתוני מדיה 16 kHz רמקולים מרובים מונה 43:07:01 32
מונולוג תסריטאי 24 kHz רמקול יחיד מונה 500:00:00 על בקשה

לקוחות מוצגים

העצמת צוותים לבנות מוצרי AI מובילים בעולם.

אמזון בעברית
Google
מיקרוסופט
צור קשר עם שייפ

לא מצאתם את מה שאתם מחפשים?

מערכי נתונים חדשים מהמדף נאספים בכל סוגי הנתונים

צור איתנו קשר עכשיו כדי להשתחרר מהדאגות שלך לאיסוף נתוני אודיו/דיבור

  • שדה זה נועד למטרות אימות יש להשאיר ללא שינוי.
  • בהרשמה אני מסכים עם שייפ מדיניות פרטיות ו תנאי שימוש באתר ולספק את הסכמתי לקבל תקשורת שיווקית B2B משאיפ.