שיפור מחקר NLP אונקולוגי

דיוק נתונים אונקולוגי: רישוי, ביטול זיהוי והערה עבור חדשנות במודל NLP

אונקולוגיה nlp

מהפכה בטיפול בסרטן עם טכנולוגיות NLP מתקדמות

הלקוח, שחקן מרכזי בתעשיית הבריאות, דרש פתרון NLP מתקדם לעיבוד נפח משמעותי של רשומות רפואיות אונקולוגיות. כחלק מיוזמה מרכזית לחדד את המחקר האונקולוגי, הצורך לאזן ניתוח נתונים מפורט עם תקני פרטיות מחמירים הוא בעל חשיבות עליונה. תיאור מקרה זה מתאר את תרומתנו לשיפור מאמצי המחקר של הלקוח באמצעות הערות נתונים נאמנות גבוהה, שיטות ביטול זיהוי קפדניות ויישום טכניקות עיבוד שפה טבעית (NLP), והכל במסגרת הרגולטורית שמספקת HIPAA.

תכולה

רישוי נתונים + זיהוי נתונים
10 עמודים
קשרים אונקולוגיים
10 עמודים
תחום לא אונקולוגי
10 עמודים
שְׁלִילָה
10 עמודים
תחום אונקולוגיה
10 עמודים
NER + מיפוי מערכות יחסים
10 עמודים

אתגרים

הפרויקט דרש הבנה מגוונת של תיעוד קליני, זיהוי מדויק של ישויות רפואיות ויכולת להחיל את תוויות השלילה במדויק, הכל במסגרת מאובטחת המגנה על פרטיות המטופל בהתאם לתקנות HIPAA. המאמץ דרש לא רק מומחיות טכנית בטיפול בכמויות גדולות של נתונים מורכבים אלא גם גישה אסטרטגית לשילוב משוב ושמירה על איכות בכל שלבי תהליך ההערה.

יעדים

תיאור מפורט של השירותים

קטגוריהתיאור
כיסוי נתונים קליניים מקיףמשתרע על סוגים שונים של הערות, הגדרות טיפול ותת התמחויות אונקולוגיות, מה שמבטיח מערך נתונים חזק המשקף תרחישים קליניים מגוונים.
ביטול זיהוי קפדניהבטחת ביטול זיהוי של כל הרשומות המסומנות בהתאם לשיטת Safe Harbor של HIPAA, מה שמבטיח את אמון הלקוח בפרטיות ואבטחת הנתונים.
הנחיות להערותיצירה והטמעה של הנחיות סטנדרטיות להערות נתונים להכנת רשומות מתויגות בהתאם לתקני HIPAA.
אסטרטגיות הערות מתקדמותביאור ידני של 10,000 עמודים של רשומות הקשורות לאונקולוגיה בוצע תוך התמקדות מפורטת בזיהוי סטטוסי שלילה ומידע רלוונטי אחר בהתאם להנחיות שנקבעו.
אבטחת איכות קפדניתהשג את תקן האיכות המצוין המתואר בהנחיה

פתרון

הגישה שלנו כללה את האסטרטגיות המרכזיות הבאות:

הידור מותאם אישית של ערכות נתונים אונקולוגיות

מארכיון עצום של למעלה מ-5 MN EHR's, חולצה תת-קבוצה של נתונים שנבחרה בקפידה, שמטרתה לתת מענה לדרישות המיוחדות של הלקוח לנתונים אונקולוגיים תוך התמקדות בישויות גנומיות. תהליך האיסוף כלל יצירת רשימה ממצה של סמני גידול, גנים, גרסאות ושלבי TNM, תוך שימוש בחיפושי מילות מפתח כדי לאתר מסמכים הנמצאים בשפע בנתונים אלה. ביטויים רגולריים שימשו לזיהוי מגוון של וריאציות גנטיות ושלבי סרטן. גישה זו, בשילוב עם כיסוי נתונים רחב הכולל סוגי מסמכים שונים, התמחויות, הגדרות טיפול ונתונים ממספר רופאים, הבטיחו מערך נתונים אונקולוגי מקיף ורלוונטי.

הידור מערכי נתונים אונקולוגיים

ביטול זיהוי קפדני

התהליך דבק בקפדנות בשיטת Safe Harbor של HIPAA לביטול זיהוי, המבטיחה את אמון הלקוח בפרטיות ואבטחת המידע. זה כרוך בהסרה של כל מידע בריאותי מוגן (PHI) והחלפתו במצייני מיקום מסומנים, ובכך לשמור על השימושיות של הנתונים תוך הגנה על סודיות המטופל.

משתני ביטול זיהוי

קטגוריהקטגוריית משנה
שםשם המטופל, שם הרופא, שם המטפל, שם בן המשפחה, שם המרכז הרפואי, שם המרפאה, שם בית האבות, שם החברה, שם האוניברסיטה
גיל 
תַאֲרִיךדפוס תאריך, חודש שנה דפוס, יום חודש דפוס, יום שנה דפוס, יום, חודש, שנה, עונה
מקוםמדינה, מדינה, עיר, רחוב, מיקוד, מספר חדר, מספר סוויטה, מספר קומה
IDמספר תעודת זהות, מספר רישום רפואי, מספר מוטב קופת חולים, מספר חשבון, מספר תעודה/רישיון, מזהה ביומטרי, מזהה רישום, מספר הצטרפות, מספר זיהוי רכב, מספר לוחית רישוי מזהי מכשיר ומספר סידורי
צרו קשרמספר טלפון, מספר פקס, כתובת דואר אלקטרוני, כתובת אתר אינטרנט, כתובת IP

דוגמא:

ב-25 בספטמבר, 2106, בשעה 11:00 בבוקר, אושפז מר הארי פייס, בן 90, לבית החולים הכללי פורסט לצורך ניתוח ירך מתוכנן, בו התייעץ בעבר הרופא הראשי שלו, ד"ר חוסה מרטין, ובהשתתפות קנדרה רייט, MD. במהלך שהותו, הוא היה תחת השגחתם של מרי הו, NP, וסוזן ריי, RN, כאשר גם ר' צ'ארלס מלנקון, הרשות הפלסטינית התייעץ. הניתוח שלו, שנערך באותו יום עם האשפוז, הצליח ללא דיווח על סיבוכים. לאחר הניתוח, מר פייס הועבר לחדר 202, קומה 2, לצורך התאוששות. אשתו, אמה פייס, נכחה לאורך כל הדרך וקיבלה את כל העדכונים הדרושים. במהלך שהותו הקצרה, התיעוד הרפואי שלו, כולל MRN MR99062619 וחשבון KV000014764, טופלו על פי הפרוטוקולים הסטנדרטיים של בית אבות גרייסווד, מקום מגוריו הקודם. הוא שוחרר מאוחר יותר באותו יום לטיפול במרפאת החוץ של אוקלנד לצורך החלמה נוספת. לאורך התהליך, כל הנהלים תועדו ואובטחו תוך הקפדה על תקני סודיות.

דוגמה: ביטול זיהוי

On [דפוס תאריך], בשעה 11:00 בבוקר, מר. [שם המטופל], זקן [גיל], התקבל [שם המרכז הרפואי] לניתוח מתוכנן של מפרק הירך, שהתייעץ בעבר על ידי הרופא הראשי שלו, ד"ר. [שם רופא], ובהשתתפות [שם רופא] MD. במהלך שהותו, הוא היה תחת השגחתו [אחות], NP, ו [אחות], RN, עם [שם רופא], הרשות, גם בהתייעצות. הניתוח שלו, שנערך באותו יום עם האשפוז, הצליח ללא דיווח על סיבוכים. לאחר הניתוח, מר. [שם המטופל] הועבר לחדר מס. [מספר חדר], קומה מס. [מספר קומה], להתאוששות. אשתו, [שם בן משפחה], נכחה לאורך כל הדרך וקיבלה את כל העדכונים הדרושים. במהלך שהותו הקצרה, התיעוד הרפואי שלו, כולל MRN [מספר תיעוד רפואי] וחשבון [מספר חשבון], טופלו על פי הפרוטוקולים הסטנדרטיים של [שם בית אבות], מקום מגוריו הקודם. הוא שוחרר מאוחר יותר באותו יום לטיפולו של [שם המרפאה] להחלמה נוספת. לאורך התהליך, כל הנהלים תועדו ואובטחו תוך הקפדה על תקני סודיות.

הנחיות הערות וטכניקות הערות מתקדמות

שייפ סייע בביסוס וביישום של הנחיות סטנדרטיות להערות נתונים ודאג לכך שכל הרשומות המסומנות הוכנו בעקביות ובהתאמה לתקני HIPAA. יתרה מכך, 10,000 עמודים מתוך רשומות רפואיות שונות צוינו בקפדנות, תוך התמקדות בתיוג מפורט של סטטוסי שלילה וישויות רלוונטיות קלינית אחרות כולל תת-התמחויות אונקולוגיות שונות. ההערה בוצעה על ידי צוות של כותבים מומחים בעלי ידע מיוחד באונקולוגיה ותקנות פרטיות נתונים.

קריטריוני הערה מורכבים

קטגוריהקטגוריית משנה
הערת תאריך (אונקולוגיה)תאריך אבחון, תאריך שלב, התחלה, תאריך הפרוצדורה, תאריך תחילת הטיפול, תאריך סיום הרפואה, תאריך תחילת הקרינה, תאריך סיום הקרינה
מחלה (אונקולוגיה)בעיית סרטן, היסטולוגיה, מצב קליני, אתר גוף, התנהגות, כיתה, שלב סרטן, שלב TNM, בדיקת סמן גידול, מידות, קוד
טיפול (אונקולוגיה)רפואת סרטן, מינון תרופות, תדירות, ניתוח סרטן, תוצאת ניתוח, שיטת קרינה, מינון קרינה
ג'נומיקסקוד וריאציה, חקר גנים, שיטה, דגימה
שְׁלִילָהשלילי, אפשרי שלילי, לא בטוח, אפשרי חיובי
NER קליניבעיית סרטן – אתר גוף, היסטולוגיה – אתר גוף, התנהגות – אתר גוף, ניתוח סרטן – מערכות יחסים גוף, שיטת קרינה – אתר גוף, היסטולוגיה – ציון, בעיית סרטן – מימד

דוגמא:

הערה קלינית אונקולוגית

הצהרת הערה קלינית אונקולוגית

"המטופלת ג'יין דו אובחנה עם סרטן ריאות של תאים לא קטנים בשלב IIIB (NSCLC), במיוחד אדנוקרצינומה, ב-03/05/2023. הסרטן ממוקם באונה התחתונה הימנית של הריאה. הוא מסווג כ-T3N2M0 על פי מערכת הסטיגינג TNM, עם גודל גידול של 5 ס"מ על 3 ס"מ. מחיקת EGFR exon 19 זוהתה באמצעות ניתוח PCR של דגימת הביופסיה של הגידול. כימותרפיה עם Carboplatin AUC 5 ו- Pemetrexed 500 מ"ג/מ"ר החלה ב-03/20/2023 והיא אמורה להינתן כל 3 שבועות. טיפול בקרינה חיצונית (EBRT) במינון של 60 Gy ב-30 חלקים החל ב-04/01/2023. הטיפול של המטופל נמשך, ואין עדות לגרורות במוח ב-MRI האחרון. עדיין לא נקבעה אפשרות של פלישה לימפווסקולרית, והסבילות של המטופל למשטר הכימותרפיה המלא נותרה לא ברורה.

הצהרת הערה קלינית אונקולוגית

הערה קלינית אונקולוגית

אבטחת איכות קפדנית

הטמיע מסגרת גמישה לניהול פרויקטים שהקלה על שילוב אפקטיבי של משוב מלקוחות תוך שמירה על תקני איכות מחמירים. פרוטוקול אבטחת איכות מקיף נאכף, המתאים להנחיות כדי להגיע לאמות המידה הנדרשות. פרוטוקול זה כלל סבבים רצופים של סקירה ואימות, הבטחת הדיוק והאמינות של הנתונים המוערים. פיקוח איכות קפדני שכזה הוא חיוני ביצירת פתרון NLP מהימן, חיוני לקבלת החלטות קליניות מושכלות ולמצוינות מחקרית.

תוֹצָאָה

סיפק בהצלחה 10,000 רשומות עם תווית לא מזוהה באיכות גבוהה, מתן מערך נתונים מאובטח ובעל ערך לפיתוח מודל ה-NLP של הלקוח. היישום המדוקדק של NLP והקפדה על תקני ביטול זיהוי HIPAA הביאו למערך נתונים מעודן ביותר שיעמוד בבסיס מאמצי המחקר האונקולוגיים המתמשכים והעתידיים של הלקוח, שבסופו של דבר מטרתו לשפר את התוצאות של המטופלים האונקולוגיים ואת יעילות מתן הטיפול.

הצלחת הפרויקט ממחישה את יכולתנו לטפל בנתונים רפואיים מורכבים בדייקנות, ותורמת למטרת הלקוח לשפר את תוצאות הטיפול בחולים ולהאיץ את קצב החדשנות בתחום הבריאות.

השותפות שלנו עם שייפ הייתה מכרעת בקידום יכולות ה-NLP שלנו בתחום האונקולוגי. הטיפול המקצועי ב-10,000 רשומות רפואיות, עם ביאור שלילה מפורטת וישויות קליניות אחרות, הוכיח את מחויבותם למצוינות ולציות. יתרה מכך, המחויבות שלהם לתקני פרטיות כמו HIPAA סיפקה לנו משאבים שלא יסולא בפז כדי להניע את יוזמות הבינה המלאכותית שלנו לפיתוח טיפולים אונקולוגיים ודיאגנוסטיקה מתקדמת.

זהב-5 כוכבים

האץ את AI הבריאות שלך
פיתוח אפליקציות ב 100%