מערך נתונים טמילי
தமிழ் தரவுத்தொகுப்பு
סקירה כללית
כותרת
טמילית ערכת נתונים של שפה
סוג מערך נתונים
מרכז שירות
תיאור
שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות.
השתמש מקרה
ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה
פרטי מערך נתונים
סה"כ שעות
60
קצב דגימה
8 קילוהרץ
ערוץ אודיו
כפול
פלטפורמת הקלטה
שולחן העבודה
פורמט אודיו
. Wav
פורמט תמלול
.json
WER (%)
5
נתונים דמוגרפיים של מערך נתונים
מדינה
הודו
שפה
טמילית
מין
זכר: 102, נקבה: 442 ולא ידוע: 0
מספר הרמקולים
544
גיל
18-50
סקירה כללית
כותרת
טמילית ערכת נתונים של שפה
סוג מערך נתונים
שיחה כללית
תיאור
שיחה טלפונית סינטטית ללא תסריט בין "סוכן" ל"לקוח", כ. משך אודיו (טווח) 5-15 דקות.
השתמש מקרה
ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה
פרטי מערך נתונים
סה"כ שעות
100
קצב דגימה
8 קילוהרץ
ערוץ אודיו
כפול
פלטפורמת הקלטה
שולחן העבודה
פורמט אודיו
. Wav
פורמט תמלול
.json
WER (%)
5
נתונים דמוגרפיים של מערך נתונים
מדינה
הודו
שפה
טמילית
מין
זכר: 158, נקבה: 282 ולא ידוע: 0
מספר הרמקולים
440
גיל
18-50
סקירה כללית
כותרת
טמילית ערכת נתונים של שפה
סוג מערך נתונים
מדיה אודיו
תיאור
קובצי אודיו/וידאו ברשות הציבור הניתנים לרישיון כגון ראיונות, פודקאסטים וכו' - 1 עד 5 אנשים. משוער. משך אודיו (טווח) 15-60 דקות.
השתמש מקרה
ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה
פרטי מערך נתונים
סה"כ שעות
40
קצב דגימה
16 קילוהרץ
ערוץ אודיו
מונה
פלטפורמת הקלטה
מקורות אינטרנט
פורמט אודיו
. Wav
פורמט תמלול
.json
WER (%)
5
נתונים דמוגרפיים של מערך נתונים
מדינה
הודו
שפה
טמילית
מין
זכר: 28, נקבה: 4 ולא ידוע: 0
מספר הרמקולים
32
גיל
18-50
לקוחות מוצגים
העצמת צוותים לבנות מוצרי AI מובילים בעולם.

לא מצאתם את מה שאתם מחפשים?
מערכי נתונים חדשים מהמדף נאספים בכל סוגי הנתונים
צור איתנו קשר עכשיו כדי להשתחרר מהדאגות שלך לאיסוף נתוני אודיו/דיבור