עכשיו קבל 50% הנחה* ב-Conversational AI Off-the-Shelf Datasets
מערך נתונים של דיבור ואודיו עבור צ'אט בוטים, עוזרי קול, מכשירים התומכים בדיבור.
*הצעה לתקופה מוגבלת
מהימן על ידי מנהיגי התעשייה
פרטים | מילות מפתח | ערכת נתונים של שפה מהמדף | שיחות מוקד טלפוני 8khz* | שיחות כלליות 8khz* | מדיה ופודקאסטים 16khz* | אמירה/ מונולוג תסריטאי 16khz* | נפח כולל בשעות | דיאלקטים מכוסים | פורמט אודיו | פורמט תמלול טקסט | השתמש מקרה | מָקוֹר | CTA |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
אפריקאנס | ערכת נתונים אודיו אפריקאנס | 600 | 900 | 1500 | אפריקנס המדוברת באפריקה | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | שייפ | צרו קשר צרו קשר | |||
ערבי | ערכת נתונים של אודיו ערבית | 800 | 1500 | 2300 | ערבית ממדינות המפרץ | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | שייפ | צרו קשר צרו קשר | |||
סִינִית | ערכת נתונים של אודיו סינית | 2000 | 2000 | סינים מסין | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | שייפ | צרו קשר צרו קשר | ||||
דני | ערכת אודיו דנית | 400 | 600 | 2000 | 3000 | דנית מדנמרק | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | שייפ | צרו קשר צרו קשר | ||
הולנדי | ערכת נתונים אודיו הולנדית | 2000 | 2000 | הולנדית מהולנד | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | שייפ | צרו קשר צרו קשר | ||||
אנגלית - AAVE Accent | אנגלית - ערכת נתונים אודיו של AAVE (African American Urnacular English). | 500 | 500 | 1000 | המגוון העממי (המכונה לפעמים AAVE, המדובר בדרך כלל על ידי הרוב המכריע של האפרו-אמריקאים הפועלים והבינוניים) והמגוון הסטנדרטי יותר (המדובר בדרך כלל על ידי אפרו-אמריקאים ממעמד הביניים במצבים פורמליים וציבוריים) אך עם דגש חזק יותר בלשון העם. | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | שייפ | צרו קשר צרו קשר | |||
אנגלית - מבטא בוסטון/ניו יורק | ערכת נתונים באנגלית - בוסטון/ניו יורק | 225 | 225 | 350 | 800 | זהו אוסף של כמה מבטאים אזוריים המדוברים בערים בוסטון, ניו יורק ופילדלפיה ובסביבתה. המבטאים הללו עשויים להישמע דומים לא-מקומיים, אך שונים ממבטאים אמריקאים אחרים. למרות אוצר מילים מקומי השונה מחלקים אחרים בעולם דובר האנגלית, מבטאים אלה מובנים הדדית עם אנגלית המדוברת במקומות אחרים. | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | שייפ | צרו קשר צרו קשר | ||
אנגלית - מבטא סיני | ערכת נתונים של אודיו בהדגשה סינית - אנגלית | 150 | 300 | 450 | דוברים שמדברים סינית כשפתם הראשונה ואשר עברו/הגרו לארצות הברית כבני נוער/בוגרים ולמדו אנגלית כשפתם השנייה. | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | שייפ | צרו קשר צרו קשר | |||
אנגלית - מבטא דרום עמוק | ערכת נתונים באנגלית - דרום עמוקה | 275 | 275 | 450 | 1000 | דוברים מ-(i) טקסס; (ii) צפון קרוליינה, דרום קרולינה, ג'ורג'יה; (iii) ניו אורלינס; (iv) פלורידה פננדל; (v) טנסי, ארקנסו, מישיגן. | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | שייפ | צרו קשר צרו קשר | ||
אנגלית - מבטא היספני | ערכת נתונים באנגלית - היספני מבטא | 400 | 400 | 800 | אנגלית היספאנית מתייחסת לזנים של אנגלית אמריקאית המדוברת על ידי אמריקאים היספנים בעלי מורשת לאומית מגוונת. הדגש העיקרי היה על אמריקאים מקסיקנים, דוברים ממוצא לאומי שונה (למשל מקסיקו, פורטו ריקו, הרפובליקה הדומיניקנית, אקוודור, קובה וכו') וגם מאזורים שונים (למשל קליפורניה, ניו יורק, פלורידה). הדוברים שנכללו היו הדוברים ספרדית כשפה ראשונה וכן דוברים ממוצא היספני הדוברים ספרדית יש שפת מורשת. | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | שייפ | צרו קשר צרו קשר | |||
אנגלית - מבטא ניו זילנדי | ערכת נתונים אודיו מאנגלית - ניו זילנד | 250 | 750 | 1000 | רמקולים בשני האיים, כולל שילוב של רמקולים צעירים יותר (בני 40 ומעלה) ורמקולים מבוגרים יותר (מגיל 40) בפרופורציות שוות. | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | שייפ | צרו קשר צרו קשר | |||
אנגלית - מבטא סינגפורי | ערכת נתונים אודיו אנגלית - סינגפור | 400 | 600 | 1000 | גם אנגלית סינגפורית סטנדרטית וגם אנגלית סינגפורית רגילה. סינגפורים מרקע אתני שונה (למשל סיני, מלאי, הודי וכו') וברמות השכלה שונות. | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | שייפ | צרו קשר צרו קשר | |||
אנגלית - מבטא דרום אפריקה | ערכת אודיו אנגלית - דרום אפריקה | 400 | 600 | 1000 | נציגים ממעמדות סוציו-אקונומיים ומרקעים אתנולוגיים שונים (למשל דרום אפריקאים מרקע אירופאי, אפריקאי, הודי או מעורב). | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | שייפ | צרו קשר צרו קשר | |||
אנגלית - מבטא אירי | ערכת נתונים שמע באנגלית - אירית | 500 | 500 | אנגלית מדוברת באירלנד | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | שייפ | צרו קשר צרו קשר | ||||
אנגלית - מבטא סקוטי | ערכת נתונים באנגלית - סקוטי | 800 | 800 | אנגלית מדוברת על ידי סקוטי | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | שייפ | צרו קשר צרו קשר | ||||
אנגלית - מבטא וולשי | ערכת נתונים באנגלית - וולשית אודיו | 800 | 800 | אנגלית וולשית | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | שייפ | צרו קשר צרו קשר | ||||
צרפתי קנדי | ערכת אודיו קנדית צרפתית | 1000 | 1000 | צרפתית קנדית | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | שייפ | צרו קשר צרו קשר | ||||
עברית | ערכת נתונים אודיו בעברית | 750 | 750 | 1500 | עברית בישראל | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | שייפ | צרו קשר צרו קשר | |||
אינדונזי | ערכת נתונים של אודיו אינדונזית | 1000 | 1000 | 2000 | בהאסה אינדונזית | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | שייפ | צרו קשר צרו קשר | |||
יפני | ערכת נתונים אודיו יפנית | 2000 | 2000 | יפני מיפן | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | שייפ | צרו קשר צרו קשר | ||||
קוריאני | ערכת נתונים של אודיו קוריאנית | 100 | 200 | 1500 | 1800 | רמקולים התפשטו ברחבי דרום קוריאה. | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | שייפ | צרו קשר צרו קשר | ||
מלאית | ערכת נתונים של אודיו מלאית | 500 | 500 | 1000 | מלאית במלזיה | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | שייפ | צרו קשר צרו קשר | |||
ספרדית מקסיקנית | ערכת נתונים אודיו ספרדית מקסיקנית | 1250 | 1250 | מקסיקני ממקסיקו | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | שייפ | צרו קשר צרו קשר | ||||
פולני | ערכת נתונים אודיו פולנית | 250 | 2000 | 2250 | פולני מפולין | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | שייפ | צרו קשר צרו קשר | |||
רוסי | מערך נתונים של אודיו רוסי | 2000 | 2000 | רוסי מרוסיה | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | שייפ | צרו קשר צרו קשר | ||||
סוואהילית | ערכת נתונים של אודיו סוואהילי | 350 | 650 | 1000 | סוואהילי דרום אפריקאי וקניה | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | שייפ | צרו קשר צרו קשר | |||
שבדי | ערכת נתונים אודיו שוודית | 350 | 650 | 1000 | שוודית בשוודיה | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | שייפ | צרו קשר צרו קשר | |||
סינית טייוואן | מערך נתונים של אודיו סינית בטייוואן | 1000 | 1000 | סיני מטייוואן | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | שייפ | צרו קשר צרו קשר | ||||
תאילנדי | ערכת נתונים של אודיו תאילנדית | 350 | 450 | 800 | פנקס לא רשמי המשמש בין חברים, | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | שייפ | צרו קשר צרו קשר | |||
תורכי | ערכת נתונים אודיו טורקית | 2000 | 2000 | טורקית מטורקיה | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | שייפ | צרו קשר צרו קשר | ||||
ויאטנמית | ערכת נתונים אודיו וייטנאמית | 600 | 400 | 1000 | צפון (למשל האנוי), מרכז ודרום (למשל הו צ'י מין סיטי). | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | שייפ | צרו קשר צרו קשר | |||
הינדי | ערכת נתונים של אודיו הינדי | 800 | 2000 | 2800 | הינדי בהודו במיוחד באזורי צפון, מזרח ומערב | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | שייפ | צרו קשר צרו קשר | |||
הינגליש | ערכת נתונים באנגלית הודית | 300 | 500 | 800 | נאסף מערים הודיות עירוניות שהן מוקדים פיננסיים של המדינה בשל הזדמנויות כלכליות גדלות. מקומות כאלה יכולים להיות נוידה, דלהי, דהראדון, צ'אנדיגאר, מומבאי, קולקטה, בנגלור, פונה, צ'נאי, היידרבאד וכו'. | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | שייפ | צרו קשר צרו קשר | |||
אנגלית | ערכת נתונים באנגלית | 700 | 700 | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | שייפ | צרו קשר צרו קשר | |||||
קנאדה | ערכת נתונים של שמע קנאדה | 60 | 100 | 40 | 200 | קנאדה מקרנטקה, הודו | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | שייפ | צרו קשר צרו קשר | ||
מליאלאם | ערכת נתונים של אודיו של מליאלם | 60 | 100 | 40 | 200 | מלאיאלם מקראלה, לקשאדוויפ ופודוצ'רי | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | שייפ | צרו קשר צרו קשר | ||
אוריה | אוריה אודיו סט נתונים | 60 | 100 | 40 | 200 | אוריה מחלקים של אודישה, מערב בנגל, ג'הרקאנד וצ'אטיסגר | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | שייפ | צרו קשר צרו קשר | ||
פונג'בית | ערכת נתונים של אודיו של פנג'אבי | 60 | 100 | 40 | 200 | פנג'בי מפונג'אב, הודו | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | שייפ | צרו קשר צרו קשר | ||
טמילית | ערכת נתונים אודיו טמילית | 60 | 100 | 240 | 400 | טמילית מטמיל נאדו, הודו | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | שייפ | צרו קשר צרו קשר | ||
טלוגו | ערכת נתונים של טלוגו אודיו | 100 | 950 | 950 | 2000 | טלוגו מאנדרה פראדש, הודו | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | שייפ | צרו קשר צרו קשר | ||
בנגלית | ערכת נתונים של אודיו בנגלית | 60 | 100 | 40 | 200 | בנגלית ממערב בנגל, הודו | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | שייפ | צרו קשר צרו קשר | ||
גוג'ראטית | מערך נתונים של אודיו גוג'ראטי | 60 | 100 | 40 | 200 | גוג'ראטי מגוג'ראט, הודו | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | שייפ | צרו קשר צרו קשר | ||
מרתי | מערך נתונים של אודיו מראטי | 60 | 100 | 40 | 200 | מראטי מהראשטרה, הודו | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | שייפ | צרו קשר צרו קשר | ||
אסאמית | מערך נתונים של אודיו אסאמי | 60 | 100 | 40 | 200 | אסאמים מאסאם, הודו | . Wav | .json | ASR, עוזר וירטואלי, צ'טבוט, בינה מלאכותית לשיחה, ניתוח דיבור, TTS, מודל שפה | שייפ | צרו קשר צרו קשר |
מומחיות עמוקה בתחום ה- AI השיחתי
AI לשיחה או צ'טבוטים או עוזרים וירטואליים/דיגיטליים הם חכמים רק כמו הטכנולוגיה והנתונים שמאחוריהם. ב-Shaip, אנו מציעים לך מערך רחב של מערך השמע המגוון עבור עיבוד שפה טבעית (NLP) המחקה שיחות עם אנשים אמיתיים המאפשר לך להחיות את ה-AI שלך. עם ההבנה העמוקה שלנו, אנו עוזרים לך לבנות ולמקם מודלים של דיבור התומכים בבינה מלאכותית, בדיוק רב עם מערכי נתונים עשירים ומובנים במספר שפות מכל רחבי העולם. אנו מציעים שירותי איסוף אודיו רב-לשוני, תמלול אודיו והערות אודיו בהתבסס על הדרישה שלך, תוך התאמה אישית מלאה של הכוונה, ההתבטאויות וההפצה הדמוגרפית הרצויה.
אוסף נאומים בתסריט
אוסף דיבור ספונטני
תמלול נתוני שמע
תיוג והערות נתונים
Shaip מאפשר לך לאמן במדויק את פלטפורמת ה-Conversational AI שלך כך שתוכל:
- דבר, הוסף טקסט וצ'אט בצורה חלקה במספר ערוצים.
- למדו מאינטראקציות קיימות בצורה של צ'אט, תמלול קולי, עסקאות וכו' והצעו ושוחחו, בהתבסס על למידה אלו.
- להבין את הכוונה מאחורי הדיבור האנושי ולהסיר עמימות בהבנת השפה האנושית.
- צור איתך אינטראקציה על בסיס אחד על אחד וניתן לאמן אותך לזהות משתמשים ולזכור שיחות קודמות.
מובילה עולמית בנתוני אימון לשיחות AI
שעות של נתוני שמע במאה ומעלה שפות - מקורות, תמלול והערות
רישוי נתוני דיבור
20k + שעות של נתוני דיבור ב 40+ שפות וניבים המכסים מגוון של 55+ נושאים מתחומים שונים כלומר, מוקד טלפוני, דיונים, שיחות כלליות, נאומים, פודקאסטים וכו '.
איסוף נתוני דיבור
אסוף נתוני שמע ודיבור (מונולוג, שיחה של 2 אנשים, צ'אט אנושי-בוט) בלמעלה מ -100 שפות מרחבי העולם, המותאמים אישית לדרישת ה- AI שלך.
תמלול נתוני דיבור
תמלול שמע או הערת שמע חסכונית באמצעות כוח אדם חזק של 30,000 משתפי פעולה עם TAT מובטח, דיוק וחיסכון
היתרון של שאיפ
קנה מידה
אנו יכולים לאתר, לשנות את קנה המידה ולהעביר נתוני שמע מכל רחבי העולם במספר שפות ודיאלקטים על פי דרישותיך.
נסיון בתחום
יש לנו את המומחיות הנכונה בנוגע לאיסוף נתונים, תמלול וביאור מדויק ובלתי משוחד.
רשת
רשת של יותר מ -30,000 תורמים מוסמכים, שניתן להקצות להם במהירות משימות לאיסוף נתונים לבניית מודל הכשרה של AI ושירותי הגדלה.
טכנולוגיה
יש לנו פלטפורמה מבוססת AI לחלוטין עם כלים ותהליכים קנייניים למינוף ניהול זרימת העבודה 24 * 7 מסביב לשעון.
זריזות
אנו מסתגלים לשינויים בדרישות הלקוחות במהירות רבה ומסייעים בזירוז פיתוח AI עם נתוני דיבור איכותיים פי 5-10 מהמתחרים.
אבטחה
אנו נותנים חשיבות עליונה לאבטחת נתונים ולפרטיות, ומוסמכים גם לטפל בנתונים רגישים המפוקחים ביותר.
מה אנחנו עושים הכי טוב
נתוני הדרכה
קבל את הנתונים המסומנים באיכות הגבוהה ביותר בשבריר מהזמן. זה תקן זהב, אמין ומוכן לאמן את דגמי הבינה המלאכותית וה-ML שלך כדי להגיע לרמות הביצועים הגבוהות ביותר.
איסוף נתונים, תיוג והערות
עם Shaip אתה מקבל 15+ שנים של מומחיות מוכחת באיסוף, תמלול וביאור נתונים איכותיים. עם כוח העבודה הגלובלי שלנו, אנו יכולים לאסוף נתונים מכל העולם, ולאחר מכן לספק שירותי תיוג והערות בכמות המושלמת של רמת מיומנות ומומחיות הנדרשת לנתונים שלך.
קטלוגים ורישוי נתונים
עם המלאי העצום שלנו של מיליוני מערכי נתונים אתה יכול לאסוף ולארגן לפי הצורך. לאחר מכן נוכל לתת רישיון לנתוני האיכות האלה עבור דרישות השימוש הספציפיות שלך ב-AI ו-ML. בנוסף, הנתונים האלה זמינים בחלק מהעלות אם הייתם יוצרים אותם בעצמכם.
רוצה לבנות מערך נתונים משלך?
צור איתנו קשר עכשיו כדי ללמוד כיצד אנו יכולים לאסוף מערך נתונים מותאם אישית עבור פתרון ה-AI הייחודי שלך.