תיאור מקרה: רישוי מערכי נתונים רפואיים

שינוי בטיפול בילדים וברפואת רופא נשים באמצעות איסוף נתונים מדויק והדרכה בהערות

שחרור כוחם של נתונים רפואיים: איסוף נתונים מקיף, ביטול זיהוי, ICD-10 CM והערה לאימון מודל AI מעולה.

רישוי מערכי נתונים רפואיים

סקירת הפרויקט

שייפ שיתפה פעולה עם חברת בינה מלאכותית מובילה בתחום הבריאות כדי לאצור ולהעיר מערכי נתונים רפואיים באיכות גבוהה ללא זיהוי להכשרת מודלים מתקדמים של NLP. הפרויקט התמקד בהתמחויות ברפואת ילדים ו-OB-GYN, תוך אספקת רישומי אשפוז עם הערות בקודי ICD-10 CM באמצעות מסגרת API חזקה.

מערך הנתונים נבנה כדי להקל על אימון בינה מלאכותית על תיעוד בריאות בעולם האמיתי, תוך שיפור יכולת המודל בהבנת נרטיבים קליניים.

רישוי מערכי נתונים רפואיים

סטטיסטיקות מפתח

דפי 750 / ~300 רשומות אמבולטוריות

375 עמודים רפואת ילדים

375 עמודים גינקולוג

ביאורים לקוד רפואי של ICD-10 CM 2023

היקף הפרויקט

סוג מערך נתונים התמחות תכולה מטא נתונים נלכדו הערות
הערות רפואיות תוֹרַת רִפּוּי יְלָדִים 375 עמודים (כ-150 רשומות) שם קובץ, מומחיות,
סוג מסמך, מחלקת מטופל (מרפאת חוץ)
כולל סעיפי הערכה / תכנית
אוב-גין 375 עמודים (כ-150 רשומות)
ביאורים ICD-10 CM (2023) מערך נתונים מלא מיפוי קוד באמצעות API אימות הקוד על ידי קודנים הוא מחוץ לתחום

אתגרים

הפרויקט הציג מספר אתגרים קריטיים שדרשו תכנון וביצוע קפדניים:

1. איסוף נתונים מיוחדים

השגת רשומות אמבולטוריות באיכות גבוהה אך ורק מתחומי רפואת ילדים ו-OB-GYN הייתה מאתגרת. כל מסמך צריך לכלול סעיפים קליניים מרכזיים כמו הערכה ותוכנית כדי לתמוך בהערות מדויקות.

2. ביטול זיהוי PHI מקיף

הבטחת הסרה מלאה של כל המידע המאפשר זיהוי אישי (PII) תוך שמירה על ההקשר הרפואי הייתה חיונית לתאימות HIPAA. זה הצריך ביקורות מפורטות כדי למנוע כל הפרת פרטיות.

3. ביאור ICD-10 CM מורכב

יישום קודי ICD-10 CM (2023) מדויקים באמצעות API היה מורכב בשל סגנונות נרטיביים מגוונים ומינוח רפואי. עקביות ודיוק בקידוד היו קריטיים כדי להבטיח הכשרה אמינה של מודל AI.

4. דיוק ועקביות של מטא נתונים

לכידה ואימות של מטא נתונים כגון התמחות, סוג מסמך ומחלקת מטופל ללא סתירות היה חיוני. כל חוסר התאמה עלול להשפיע על אימון המודלים ועל שימושיות הנתונים.

5. סינון חוץ קפדני

הבטחת שכל הרשומות היו במרפאות חוץ לחלוטין, נוספה מורכבות, מכיוון שמסמכים קליניים רבים עשויים להכיל כיתות מעורבות של מטופלים או קטעים לא שלמים.

6. תקני אבטחת איכות ודיוק

עמידה בסף הדיוק של 90% דרשה סקירות מרובות רמות כדי למנוע כפילויות, לאמת יישור מומחיות ולהבטיח ביטול זיהוי - עם הוראות לעיבוד חוזר בעת הצורך.

פתרון

רישוי נתונים מקיף והערות

  • רישומי רפואת ילדים ו-OB-GYN מורשים
  • הובטח הכללת סעיפים קריטיים: תלונת ראשי, היסטוריה, ROS, הערכה, תוכנית
  • ביאור ICD-10 CM מבוסס API (גרסת 2023)

ביטול זיהוי ותאימות

  • הוחלף PHI במצייני מיקום (PERSON_NAME, DATE, LOCATION וכו')
  • הבטיח עמידה בתקני הפרטיות של שירותי בריאות

תיוג מטא נתונים

  • מטא נתונים מפורטים שנלכדו לכל קובץ:
    • שם קובץ
    • התמחות (רפואת ילדים או OB-GYN)
    • סוג מסמך (מעקב, H&P, ייעוץ)
    • כיתת חולים (מרפאות חוץ בלבד)

בקרת איכות

  • הערכות איכות קפדניות עם:
    • אין רשומות כפולות
    • אימות התאמה מומחיות
    • בדיקה באשפוז בלבד
    • בדיקת עקביות של מטא נתונים
  • החלפה או תיקון של רשומות מתחת לסף דיוק של 90%.

תוֹצָאָה

שייפ סיפק מערך מידע מובנה ומוסבר של הערות רפואיות שאיפשר ללקוח:

  • אימון מודלים של AI לחיזוי קוד ICD-10 CM מדויק
  • שפר את יכולות ה-NLP בתרחישי בריאות בעולם האמיתי
  • לשמור על עמידה בתקני הפרטיות והרגולציה
  • קנה מידה של מודלים של AI בתחום הבריאות על פני תחומי רפואת ילדים ו-OB-GYN

הגישה המובנית של שייפ לאיסוף נתונים והערות עלתה על הציפיות שלנו. הדיוק, ביטול הזיהוי ודיוק המטא-נתונים חיזקו משמעותית את צינור ההדרכה שלנו למודלים של AI.

5 כוכבים זהובים