איך לנתח תשובות פתוחות בשאלון בעזרת בינה מלאכותית? מדריך מעשי

תהילה נובוסלסקי
11 במאי
זמן קריאה 2 דקות

עודכן: 11 במאי

כשאנחנו מנתחים תשובות פתוחות בסקר, אנחנו מחפשים את הנושאים שחוזרים: יוקר המחייה, ביטחון, תחבורה. לדעת ש־30% מהמשיבים דיברו על תחבורה - זו תובנה חשובה, ולפעמים היא מספיקה. אבל כשרוצים להבין לעומק, השאלה הבאה היא מי אמר את זה: תושבי איזו שכונה, באיזה גיל, ובאיזה הקשר. זה ההבדל בין "התושבים מתלוננים על תחבורה" לבין "צריך להוסיף קו לשכונה הצפונית".

בינה מלאכותית מאפשרת לעשות את שני השלבים האלה בזמן סביר - גם לזהות תמות במאות תשובות, וגם לחבר אותן למאפייני המשיבים. בשביל שזה יקרה - צריך לעבוד איתה נכון.

הנה ארבעה שלבים שעובדים לנו בפועל:

ועכשיו נרחיב:

שלב 1: מנקים לפני שמעלים הטעות הנפוצה: מעתיקים את כל עמודת התשובות מהאקסל ומדביקים ל־AI. התוצאה — הוא סופר שורות ריקות כתשובות, מתבלבל בכפילויות, ומייצר תמות שלא קיימות.

מה לעשות במקום: להעתיק רק את התשובות המלאות למסמך נפרד, להסיר שורות ריקות וכפילויות, ולמספר כל תשובה בשורה נפרדת. ככה ה־AI מקבל טקסט נקי ורציף, והניתוח מתחיל ממקום מדויק.

שלב 2: ניסוח הפרומפט

פרומפט טוב הוא לא בקשה לניתוח - הוא הגדרה של שיטת העבודה. במקום "נתח לי את התשובות", צריך להגדיר מה השאלה שנשאלה, איך לקבץ, מה להציג בכל תמה, ומה לא לעשות.

"יש לי X תשובות פתוחות לשאלה: [השאלה המדויקת]. אני רוצה לזהות את הנושאים המרכזיים שעלו בתשובות. קבץ תשובות דומות לפי משמעות, גם אם הן מנוסחות אחרת. הצג 5–6 תמות מרכזיות בלבד. סדר את התמות לפי שכיחות, מהגבוהה לנמוכה. לכל תמה כתוב: שם קצר, הסבר קצר, מספר משיבים משוער, ו־2–3 ציטוטים ישירים מתוך התשובות. תשובה שמתייחסת לכמה נושאים יכולה להשתייך ליותר מתמה אחת. אל תוסיף המלצות או פרשנות שלא מופיעה בדאטה."

זה הבסיס. בפועל, אנחנו מדייקים את ההנחיות לפי סוג השאלה והדאטה, מוסיפים הוראות לטיפול בחריגים, סינון רעשים, פילוח לפי קבוצות והשוואה בין תמות. ככל שהפרומפט מדויק יותר, כך הניתוח אמין יותר.

שלב 3: לאמת לפני שמשתמשים לעולם לפני שמכניסים את התוצאה לדוח, צריך לבצע כמה בדיקות:

ציטוטים — האם הם באמת מופיעים בדאטה כמו שהם?
שכיחות — האם המספרים שהמודל נתן תואמים את הספירה בפועל?
חפיפה — האם שתיים מהתמות בעצם אומרות את אותו דבר?
פרשנות — האם המסקנה באמת נובעת מהתשובות, או שהמודל הוסיף שכבה משלו?

לא מדובר בעבודה ארוכה, אבל זו העבודה שמפרידה בין פלט של AI לבין ניתוח מקצועי.

שלב 4: להבין למה - דרך פילוח והקשר

עד כאן יש לנו את ה"מה": אילו נושאים חזרו, באיזו שכיחות, ובאילו מילים. עכשיו צריך להבין אצל מי הם מופיעים.

נושא שמופיע ב־30% מהתשובות יכול להיראות משני עד שמגלים שהוא מופיע אצל רוב המשיבים בקבוצת גיל מסוימת, או משכונה אחת. פתאום זו כבר לא תמה כללית, אלא סימן לצורך ממוקד.

הדרך לעשות את זה היא לחבר את התשובות הפתוחות למאפייני המשיבים - גיל, מגדר, מקום מגורים, סטטוס - ואז להשוות בין קבוצות. מה אמרו צעירים לעומת מבוגרים? מי מדבר על יוקר המחייה ומי על ביטחון אישי?

לסיכום, בינה מלאכותית לא תחליף את החשיבה האנליטית - אבל כשעובדים איתה נכון, היא תחסוך את השעות שבהן קראתם 400 תשובות פתוחות בעיניים אדומות, ותשאיר זמן לשאלות החשובות באמת.

איך לנתח תשובות פתוחות בשאלון בעזרת בינה מלאכותית? מדריך מעשי

פוסטים אחרונים

תגובות