ערכת נתונים ערבית ותאילנדית ווייטנאמית והינדית ואנגלית וסינית
תיבה תוחמת+טקסט
מקרה שימוש: OCR
פוּרמָט: תמונה
לספור: 150k
ביאור: יש
תיאור: ערכת נתונים ערבית ותאילנדית ווייטנאמית והינדית ואנגלית וסינית
ערכת נתונים של טקסט בערבית
תיבה תוחמת+טקסט
מקרה שימוש: OCR
פוּרמָט: תמונה
לספור: 1k
ביאור: יש
תיאור: מערך הנתונים של הטקסט הערבי מכיל אוסף של דוגמאות טקסט שנכתבו בערבית. הוא כולל צורות שונות של תוכן, כגון מאמרי חדשות, פוסטים במדיה חברתית, ספרות ודיאלוג, המשתרעים על נושאים וסגנונות כתיבה שונים. מערך נתונים זה משמש למשימות כגון עיבוד שפה טבעית (NLP), סיווג טקסט, ניתוח סנטימנטים ותרגום מכונה ביישומי שפה ערבית.
מערך נתונים בשפות סינית ואנגלית וטיבטית ואויגורית
תיבה תוחמת+טקסט
מקרה שימוש: OCR
פוּרמָט: תמונה
לספור: 38k
ביאור: יש
תיאור: מערך נתונים בשפות סינית ואנגלית וטיבטית ואויגורית
ערכת נתונים של תפריט סינית ואנגלית
תיבה תוחמת+טקסט
מקרה שימוש: OCR
פוּרמָט: תמונה
לספור: 60k
ביאור: יש
תיאור: ערכת הנתונים של התפריט הסינית והאנגלית מכילה תמונות או דוגמאות טקסט של תפריטי מסעדות הכוללים שפות סינית ואנגלית כאחד. הוא כולל גופנים, פריסות ומבני תפריט שונים, ומציג שמות, תיאורים ומחירים דו-לשוניים של מנות. מערך נתונים זה שימושי למשימות כגון זיהוי תווים אופטי (OCR), תרגום מכונה ודיגיטציה של תפריטים בהגדרות רב לשוניות.
ערכת נתונים של קומפוזיציה בכתב יד סינית
תיבה תוחמת+טקסט
מקרה שימוש: OCR
פוּרמָט: תמונה
לספור: 3k
ביאור: יש
תיאור: ערכת הנתונים של חיבור בכתב יד בסינית מכילה דוגמאות של טקסט סיני בכתב יד, כולל חיבורים, חיבורים וטקסט ארוך אחר. הוא כולל סגנונות שונים של כתב יד ורמות מורכבות, ומשמש למשימות כמו זיהוי כתב יד, ניתוח טקסט והכשרת מודלים של למידת מכונה.
ערכת נתונים של בקשת WIFI סינית
תיבה תוחמת+טקסט
מקרה שימוש: OCR
פוּרמָט: תמונה
לספור: 1k
ביאור: יש
תיאור: מערך הנתונים של הנחיות ה-WIFI הסיני מורכב מדוגמאות טקסט שנמצאות בהודעות WIFI ומסכי כניסה שנכתבו בסינית. זה בדרך כלל כולל הנחיות שונות, הוראות והודעות שגיאה הקשורות לחיבור או ניהול רשתות WIFI. מערך נתונים זה משמש למשימות כמו זיהוי טקסט, עיבוד שפה טבעית ושיפור ממשקי משתמש עבור קישוריות רשת.
ערכת נתונים של כתב יד באנגלית וסינית
תיבה תוחמת+טקסט
מקרה שימוש: OCR
פוּרמָט: תמונה
לספור: 12k
ביאור: יש
תיאור: ערכת הנתונים של כתב יד באנגלית וסינית מכילה דוגמאות בכתב יד הן באנגלית והן בסינית, המציגות סגנונות כתיבה שונים ומורכבות תווים. הוא משמש בדרך כלל להדרכה והערכת מודלים של זיהוי כתב יד, תמיכה בניתוח טקסט רב לשוני ומחקרים קשורים אחרים. מערך הנתונים כולל מגוון רחב של תווים, ספרות, מילים ומשפטים בשתי השפות.
ערכת נתונים של Shopsign באנגלית וסינית
תיבה תוחמת+טקסט
מקרה שימוש: OCR
פוּרמָט: תמונה
לספור: 30k
ביאור: יש
תיאור: ערכת הנתונים של Shopsign האנגלית והסינית כוללת תמונות של שלטי חנויות המכילים טקסט באנגלית וגם בסינית. הוא לוכד אלמנטים שונים של שילוט כגון שמות חנויות, פרסומות, מבצעים וכיוונים, המוצגים בגופנים, סגנונות ופורמטים מגוונים. מערך נתונים זה משמש למשימות כמו זיהוי וזיהוי טקסט, הבנת סצנה רב לשונית ושיפור מודלים של ראייה ממוחשבת לפירוש שילוט דו לשוני.
ערכת נתונים של טקסט בזווית מיוחדת באנגלית וסינית
תיבה תוחמת+טקסט
מקרה שימוש: OCR
פוּרמָט: תמונה
לספור: 50k
ביאור: יש
תיאור: ערכת הנתונים של הזווית המיוחדת של האנגלית והסינית מכילה תמונות של טקסט המוצגות בזוויות ובכיוונים שונים באנגלית ובסינית. הוא כולל טקסט ממקורות כמו שלטים, פרסומות ומסמכים שאינם מוצגים בפורמטים אופקיים סטנדרטיים. מערך נתונים זה משמש לאימון והערכת מודלים של זיהוי וזיהוי טקסט, במיוחד אלה המסוגלים לטפל בטקסט באוריינטציות ובנקודות מבט לא מסורתיות.
ערכת נתונים של תפריט אנגלית
תיבה תוחמת+טקסט
מקרה שימוש: OCR
פוּרמָט: תמונה
לספור: 20k
ביאור: יש
תיאור: מערך הנתונים של התפריט האנגלי כולל תמונות או דוגמאות טקסט של תפריטי מסעדות שנכתבו באנגלית. הוא כולל מגוון גופנים, פריסות וסגנונות עיצוב, עם תוכן החל משמות מנות ועד תיאורים ומחירים. מערך נתונים זה משמש לעתים קרובות למשימות כמו זיהוי תווים אופטי (OCR), חילוץ טקסט ודיגיטציה של תפריטים ביישומים הקשורים למזון.
ערכת נתונים של סצנות באנגלית
תיבה תוחמת+טקסט
מקרה שימוש: OCR
פוּרמָט: תמונה
לספור: 33k
ביאור: יש
תיאור: ערכת הטקסט של סצנות באנגלית מורכבת מתמונות המכילות סצנות טבעיות עם טקסט אנגלי מוטבע. הטקסט מופיע בצורות שונות, כגון שלטים, שלטי חוצות ופוסטרים, לרוב בגופנים, גדלים וכיוונים מגוונים. מערך נתונים זה משמש בדרך כלל להדרכה ובדיקת מודלים במשימות זיהוי, זיהוי והבנת סצנות טקסט.
ערכת נתונים של טקסט בכתב יד
מקרה שימוש: מסמך AI
פוּרמָט: HEIC (תמונות) ו-.mov (סרטונים)
לספור: 94053
ביאור: לא
תיאור: תמונות חיות עם טקסט בכתב יד ליפנית, קוריאנית ורוסית
מכשיר הקלטה: מצלמת אייפון ואייפד
מצב הקלטה: - תאורה אגרסיבית/בוהק - פלאש מצלמה מופעל - אור צבעוני - אור נמוך, ללא פלאש מצלמה - רגיל
ערכת נתונים של שפה יפנית וקוריאנית
תיבה תוחמת+טקסט
מקרה שימוש: OCR
פוּרמָט: תמונה
לספור: 40k
ביאור: יש
תיאור: מערך הנתונים של השפה היפנית והקוריאנית כולל דוגמאות טקסט ביפנית ובקוריאנית. הוא כולל מגוון של תוכן כגון משפטים, ביטויים ומילים, הכולל הקשרים וסגנונות שונים. מערך נתונים זה משמש למשימות כמו עיבוד שפה טבעית (NLP), תרגום מכונה וניתוח טקסט ביישומים רב לשוניים.