ערכת נתונים הינדי

हिंदी डेटासेट

מערך נתונים איכותי בהינדית של מוקדי שירות טלפוני, שיחות כלליות ופודקאסטים עבור מודלים של בינה מלאכותית ו-ASR

סקירה כללית

כותרת (שפה)

מערך נתונים של שפה הינדית

סוגי מערכי נתונים

מוקד שירות לקוחות, שיחה כללית, מדיה (פודקאסט), מונולוג מתוסרט

מדינה

הודו

תיאור

שיחות טלפוניות ללא תסריט בין שני אנשים זמינות באורכים של 15 עד 60 דקות, יחד עם קבצי אודיו או וידאו ברשות הציבור הניתנים לרישוי כגון ראיונות ופודקאסטים עם 1 עד 5 משתתפים באותו טווח. בנוסף, הקלטות של אמירה בודדת נמשכות בדרך כלל 5 עד 30 שניות, ונתוני מונולוגים מתסריטים זמינים גם כן.

השתמש מקרה

ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה

פרטי מערך נתונים

סוג מערך נתונים קצב דגימה דוברים ערוץ סה"כ שעות מספר כולל של רמקולים
מוקד טלפוני 8 kHz רמקולים 2 כפול 70:45:51 על בקשה
מוקד טלפוני 8 kHz רמקולים 2 מונה 20,000:00:00 על בקשה
מוקד טלפוני 16 kHz רמקולים 2 מונה 29:17:20 261
מוקד טלפוני 16 kHz רמקולים 2 כפול 400:27:10 1200
שיחה כללית 8 kHz רמקולים 2 כפול 47:48:40 224
נתוני מדיה 16 kHz רמקולים מרובים מונה 227:57:43 438
מונולוג תסריטאי 48 kHz רמקול יחיד מונה 2,866:00:00 3,988
מונולוג תסריטאי 24 kHz רמקול יחיד מונה 29,000:00:00 על בקשה

לקוחות מוצגים

העצמת צוותים לבנות מוצרי AI מובילים בעולם.

אמזון בעברית
Google
מיקרוסופט
שייפ פנה אלינו

לא מצאתם את מה שאתם מחפשים?

מערכי נתונים חדשים מהמדף נאספים בכל סוגי הנתונים

צור איתנו קשר עכשיו כדי להשתחרר מהדאגות שלך לאיסוף נתוני אודיו/דיבור

  • שדה זה נועד למטרות אימות יש להשאיר ללא שינוי.
  • בהרשמה אני מסכים עם שייפ מדיניות פרטיות ו תנאי שימוש באתר ולספק את הסכמתי לקבל תקשורת שיווקית B2B משאיפ.