שיפור הבנת שאילתות חיפוש בעזרת ביאור אנושי
מינוף שיקול דעת אנושי וטקסונומיה מובנית לטיפול עקבי במקרי קצה מעורפלים ולשיפור הרלוונטיות של החיפוש עבור תאגיד מסחר אלקטרוני מוביל שבסיסו בפולין.
סקירת הפרויקט
הלקוח, חברה מובילה בתחום המסחר האלקטרוני שבסיסה בפולין, מקבל מיליוני שאילתות חיפוש מדי יום. רבות משאילתות אלו הן דו - משמעי, כולל שגיאות כתיב, או להתייחס ל קטגוריות מוצרים מרובות, ויוצר אתגרים למנועי חיפוש אוטומטיים.
כדי לשפר אתדיוק חיפוש וחוויית לקוח, שייפ פיתח מסגרת ביאור מובנית בהשראת המחקר של ביימארד. שאילתות סווגו באופן שיטתי ל קטגוריות 11 (לדוגמה, קטגוריית מוצר, נושא, מאפיין ספציפי, מדויק, סוחר, סימפטום, לא מוצר וכו') עם כללי עדיפות כדי להבטיח סיווג עקבי.
סטטיסטיקות מפתח
50,000+ שאילתות עם הערות
על פני מספר קטגוריות
11 שיעורי ביאור
עם הגדרות ברורות וכללי עדיפות
תהליך עבודה בן 3 שלבים
ביאור ➔ שאלות ותשובות ➔ בוררות לעסקים קטנים ובינוניים
היקף הפרויקט
הפרויקט התמקד בבניית טקסונומיה מקיפה כדי ללכוד את מלוא הספקטרום של התנהגות חיפוש משתמשים בפלטפורמת זירת מסחר בקנה מידה גדול. ההיקף כלל:
- פיתוח טקסונומיה של 11 קטגוריות עם הגדרות ברורות והיררכיית עדיפויות כדי לטפל במקרים בהם שאילתות יכולות להתאים ליותר ממחלקה אחת.
- הערות על אלפי שאילתות אמיתיות בתחומי המוצר והלא-מוצר כאחד, כדי לאמן ולכייל את מערכת הסיווג.
- פתרון שאילתות דו-משמעיות על ידי הסלמה למומחי נושא (SMEs), תוך הבטחת עקביות באופן הטיפול בתיקים קצה.
- מתן דוגמאות ונימוקים עם הערות לצורך כיול QA, יצירת מערך אימונים שעליו יוכלו מפרטים עתידיים להסתמך כמקור מידע.
הערות לדוגמה כלולות:
- דה דיטריך אלנסיו ➔ מדויק
- E 91 ➔ קשה לומר
- tezfiles ➔ סוחר
- סובארו BRZ טויוטה GT86 ➔ לא מוצר
- okulary BHP ➔ קטגוריית מוצר
- סימפטום ➔
אתגרים
הפרויקט היה צריך להתגבר על מספר בעיות מורכבות נתונים האופייניים בסביבות חיפוש של מסחר אלקטרוני:
דו משמעות
שאילתות כמו "E 91" יכולות להתוות למוצרים שונים בתכלית (דגם רכב, מחזיק נתיך, חותם על קפסולה), מה שהופך את הפרשנות לבלתי ודאית מאוד.
שגיאות כתיב ווריאציות
שגיאות כתיב או קיצורים, כגון "lampa uf zestaw", דרשו פרשנות אנושית הקשרית כדי להבין את המונח "lampa UV zestaw".
קטגוריות חופפות
שאילתות לעיתים קרובות תאמו למספר מחלקות (למשל, תכונה מדויקת לעומת תכונה תואמת לעומת תכונה ספציפית), מה שדרש כללי עדיפות כדי להבטיח עקביות.
קלט לא חוקי
קודי סידוריים או מזהים ללא כל התאמה למוצר היו צריכים להיות מתויגים כ"ביטוי לא חוקי" במקום להיות מסווגים באופן שגוי.
בקרת מערכות ותקשורת
יישום עקבי של כללי סיווג מעודנים על פני כל עשרות אלפי שאילתות דרש ניהול אבטחת איכות חזק וניהול הערות.
פתרון
כדי להתמודד עם אתגרים אלה, א מסגרת ביאור מובנית הוצג, תוך איזון בין אוטומציה לבין פיקוח אנושי:
הנחיות להערות
הגדרות מפורטות, דוגמאות והוראות נוצרו כדי לסייע למבוארים לסווג באופן עקבי, אפילו בתרחישים מורכבים.
כללי עדיפות
נוצרה היררכיה (למשל, תואם > מדויק > תכונה ספציפית) כך שמקרים חופפים נפתרו באופן שיטתי.
תהליך אבטחת איכות רב-מפלסי
- ביאור ראשוני על ידי מפרשים מיומנים.
- סקירה משנית על ידי מומחי אבטחת איכות.
- הסלמה לעסקים קטנים ובינוניים לצורך בוררות בתיקי קצה או חילוקי דעות
יישום מעשי של הנחיות עם שאילתות מהעולם האמיתי
- 4008146044786 ➔ ביטוי לא חוקי
- קרוליקה מירקולום ➔ תכונה נושאית
- אפור גלקטי zcd ➔ תוֹאֵם
- אוצ'ארק בלגי ➔ נושא
זה הבטיח יישור, איכות ואמינות לאורך צינור ההערות.
תוֹצָאָה
היוזמה הביאה לשיפורים מדידים במערכת החיפוש של הלקוח:
- 50,000+ שאילתות מסווגות בדיוק גבוה, ויוצרים מערך נתונים איתן לאימונים לשיפורי חיפוש.
- רלוונטיות משופרת של תוצאות החיפוש, מה שמגביר באופן ישיר את שביעות רצון המשתמשים ומפחית תסכול מהתאמות לא רלוונטיות.
- עמימות מופחתת על ידי פתרון שיטתי של מקרי קצה באמצעות בוררות וכללי עדיפות המונעים על ידי עסקים קטנים ובינוניים.
- גילוי משופר של מוצרים, מה שמבטיח שמשתמשים יוכלו למצוא פריטים בצורה מדויקת יותר בקטגוריות, מאפיינים ונושאים שונים.
בסך הכל, הפרויקט הניח את היסודות ל- חוויית חיפוש חכמה יותר וממוקדת משתמש, ועוזר ללקוח לשמור על יתרון תחרותי בשוק המסחר האלקטרוני.
תהליך העבודה של ביאור אנושי הוסיף בהירות לשאילתות חיפוש מורכבות. הטקסונומיה המובנית וכללי העדיפות שיפרו משמעותית את דיוק מנוע החיפוש שלנו והפכו את חוויית המשתמש לחלקה יותר.
– ראש מחלקת חיפוש וגילוי, תאגיד מסחר אלקטרוני שבסיסו בפולין