מתודולוגיית סקרים
מתודולוגיית סקרים (באנגלית: Survey methodology) היא תחום מחקר במדעי הסטטיסטיקה היישומית העוסק בשיטות לעריכת סקרים.[1] התחום מתמקד בבחירה של יחידים מאוכלוסייה כלשהי (באמצעות דגימה), בבניית שאלונים, ובפיתוח שיטות לאיסוף נתונים המשפרות את שיעור ההיענות ואת אמינות התשובות.[2]
סקרים סטטיסטיים נערכים במטרה להסיק מסקנות לגבי אוכלוסייה שלמה מתוך תצפיות על מדגם מייצג. איכות המסקנות תלויה רבות בניסוח השאלות ובמבנה הסקר. סוגי סקרים נפוצים כוללים: סקרי דעת קהל, סקר בריאות, סקרי שוק, סקרים ממשלתיים ומפקדי אוכלוסין. אף שמפקד אינו מבוסס על מדגם, הוא עדיין משתמש בכלים של מתודולוגיית סקרים – כגון שאלונים, מרואיינים ומעקב אחרי נשאלים שלא הגיבו.
תחום זה מספק כלים חשובים למחקר בתחומים רבים, ביניהם שיווק, פסיכולוגיה, סוציולוגיה ובריאות הציבור.[1]
סקירה כללית
כל סקר מורכב לפחות משלושה מרכיבים: מדגם (או האוכלוסייה כולה, במקרה של מפקד), שיטת איסוף הנתונים (לרוב שאלון) ושאלות הסקר עצמן, שהופכות לנתונים סטטיסטיים הניתנים לניתוח. הסקר עשוי להתמקד בהעדפות (למשל בחירה לנשיא), עמדות (כגון האם יש להתיר הפלות מלאכותיות), התנהגויות (למשל עישון או שתיית אלכוהול), או מידע עובדתי (כמו הכנסה).
כיוון שרוב הסקרים מבוססים על מדגם, ההצלחה של המחקר תלויה במידת הייצוגיות של המדגם ביחס לאוכלוסיית היעד. אוכלוסייה זו עשויה להיות כלל הציבור במדינה מסוימת, קבוצה מוגדרת (כגון עובדים בענף מסוים), או חברי ארגון מסוים.
האנשים העונים לסקר נקראים נשאלים או משיבים. בהתאם לשאלות שנשאלו, תשובותיהם עשויות לייצג את דעתם האישית, את משק הבית שלהם, את מקום עבודתם או את הארגון שהם מייצגים.
כתחום מדעי
מתודולוגיית סקרים כתחום מדעי שואפת לפתח עקרונות ותובנות בכל אחד משלבי הסקר:
- תכנון מדגמים
- בניית שאלונים וכלי איסוף נתונים
- התאמות סטטיסטיות לנתונים
- ניתוח שגיאות סקר שיטתיות ואקראיות
- עיבוד וניתוח סופי של הנתונים
לעיתים קרובות בוחנים שגיאות סקר גם במונחים של עלות מול איכות; האם ניתן לשפר את איכות הנתונים במסגרת מגבלות תקציב, או לחסוך בעלויות מבלי לפגוע באיכות. תחום זה הוא גם מדעי וגם מקצועי; יש חוקרים העוסקים בניתוח אמפירי של שגיאות סקר, ואחרים העוסקים בפועל בתכנון סקרים תוך ניסיון לצמצם את אותן שגיאות.
אתגרים עיקריים
בין האתגרים המרכזיים של העוסקים במתודולוגיית סקרים ניתן למנות:
- בחירה וזיהוי של משתתפים פוטנציאליים במדגם
- יצירת קשר עם נשאלים קשים להשגה או כאלו המסרבים לענות
- ניסוח ובדיקה של שאלות הסקר
- בחירת אופן ההגשה של השאלות ואיסוף התשובות (כגון טלפון, רשת, דואר או ריאיון אישי)
- הכשרת מראיינים ופיקוח על עבודתם
- בדיקת תקינות הנתונים ועמידה בעקרונות של עקביות פנימית
- ביצוע התאמות סטטיסטיות לתיקון שגיאות שהתגלו
- שילוב נתוני סקר עם מקורות נתונים נוספים, במידת הצורך
בחירת מדגמים
המדגם נבחר מתוך מסגרת הדגימה – רשימה של כל חברי האוכלוסייה הרלוונטית למחקר. מטרת הסקר איננה לתאר את המדגם עצמו, אלא להסיק מסקנות על האוכלוסייה כולה. היכולת להכליל ממצאים מהמדגם לאוכלוסייה תלויה במידת הייצוגיות של המדגם.
כל פרט באוכלוסייה מכונה אלמנט. במהלך בחירת מדגם מייצג, נתקלים לעיתים קרובות בקשיים. שגיאה נפוצה בתהליך זה היא הטיית ברירה (Selection Bias) – מצב שבו שיטת הדגימה גורמת לייצוג-יתר או לייצוג-חסר של קבוצות מסוימות באוכלוסייה. למשל, אם האוכלוסייה כוללת 75% נשים ו־25% גברים, אך במדגם מופיעות רק 40% נשים ו־60% גברים – המשמעות היא שנשים מיוצגות בחסר, בעוד שגברים מיוצגים ביתר.
כדי לצמצם הטיות מסוג זה, נהוג להשתמש בשיטת דגימה אקראית בשכבות (Stratified Random Sampling). בשיטה זו מחלקים את האוכלוסייה לתת-קבוצות (שכבות) בהתאם למאפיינים מסוימים, ודוגמים אקראית מכל שכבה – לעיתים באופן פרופורציונלי לגודלה באוכלוסייה.
שיטות איסוף נתונים
ישנן מספר דרכים לבצע סקר, והבחירה ביניהן מושפעת ממספר גורמים, ביניהם:
- עלויות
- יכולת כיסוי של אוכלוסיית היעד
- גמישות השאלות שניתן לשאול
- מידת שיתוף הפעולה הצפויה מצד המשיבים
- דיוק ואמינות התשובות
שיטות שונות גורמות ל"אפקטי מדיה" (Mode Effects) – כלומר, שינוי באופן שבו משיבים עונים על שאלות, כתוצאה מאופי הפלטפורמה או שיטת ההגשה. לכל שיטה יתרונות וחסרונות, והן נבחרות בהתאם למטרת הסקר והקהל היעד.
שיטות איסוף הנתונים הנפוצות כוללות:
- סקרים טלפוניים
- סקרים בדואר
- סקרים מקוונים (אינטרנטיים)
- סקרים דרך טלפונים ניידים
- סקרים בבית המרואיין (פנים-אל-פנים)
- סקרים באזורים ציבוריים (כגון קניונים או רחוב)
- סקרים משולבים (שילוב של כמה שיטות)
תכנוני מחקר
במחקרי סקרים קיימים מספר מבני מחקר (או "דיזיינים") שונים שניתן לבחור מתוכם, בהתאם למטרות המחקר. שלושת הסוגים הכלליים הם:[3]
- מחקר חתך (Cross-sectional)
- מחקר מדגמים עצמאיים עוקבים (Successive independent samples)
- מחקר אורך (Longitudinal study)
מחקר חתך
במחקר חתך, מדגם (או מספר מדגמים) נבחר מן האוכלוסייה הרלוונטית ונחקר בנקודת זמן אחת בלבד. הסקר מתאר את מאפייני האוכלוסייה בזמן מסוים, אך אינו מאפשר להסיק על סיבתיות בין המשתנים, משום שמדובר במחקר תיאורי וקורלטיבי בלבד.
מחקר מדגמים עצמאיים עוקבים
במחקר זה נמשכים מספר מדגמים אקראיים בנקודות זמן שונות מאותה אוכלוסייה. עיצוב זה מאפשר למדוד שינויים באוכלוסייה הכללית לאורך זמן, אך לא מאפשר לעקוב אחרי שינויים אצל אותם יחידים, שכן האנשים הנבדקים אינם בהכרח אותם אנשים בכל פעם, לכן, קשה לזהות את הסיבות לשינוי לאורך זמן באמצעות מחקר מסוג זה.
כדי שמחקר מדגמים עצמאיים עוקבים יהיה תקף, יש לוודא כי:
- כל המדגמים נבחרו מאותה אוכלוסייה.
- הם מייצגים את האוכלוסייה באותה מידה.
- והשאלות שנשאלו נותרות זהות – כדי שניתן יהיה להשוות תשובות בצורה תקפה.
מחקר אורך
במחקר אורך נמדדים אותם משתתפים באותן שאלות בנקודות זמן שונות. בכך שונה מחקר זה ממדגמים עצמאיים עוקבים – הוא מאפשר לזהות שינויים אישיים ולנסות להבין את סיבותיהם. באמצעות מעקב אישי לאורך זמן, ניתן לבדוק השפעות של אירועים טבעיים (כגון גירושין) שלא ניתן לבדוק בניסוי.[4]
עם זאת, מחקרי אורך נחשבים יקרים וקשים לביצוע:
- קשה לגייס משתתפים שיתחייבו למחקר הנמשך חודשים ואף שנים.
- משתתפים רבים נושרים מהמחקר לפני סיומו – מה שפוגע בייצוגיות המדגם.
- כאשר נדרש לשמור על אנונימיות או סודיות, קשה לקשר בין התשובות לאורך הזמן.
אחת הדרכים להתמודד עם אתגר זה היא שימוש בקוד זיהוי עצמי (Self-generated identification code – SGIC), שנוצר לעיתים על סמך פרטים כלליים כמו "חודש לידה" או "האות הראשונה של שמה האמצעי של האם". גישות אנונימיות חדשות אף מצמצמות את הצורך במידע אישי, למשל על ידי שימוש בשאלות כלליות כמו "מה היה שם חיית המחמד הראשונה שלך?".
עם זאת, שימוש בקוד כזה עלול לגרום לאובדן היכולת להתאים בין התשובות של חלק מהמשיבים.
בנוסף, נשירה של משתתפים לאורך זמן אינה אקראית – מה שעלול לפגוע בייצוג המדגם לאורך זמן. כדי להתמודד עם זאת, ניתן להשוות בין אלו שנטשו את הסקר לאלו שנותרו, ולבדוק אם הם מייצגים אוכלוסיות שונות מבחינה סטטיסטית. כמו כן, משתתפים עלולים לנסות לשמור על עקביות מלאכותית בתשובותיהם – אף אם דעתם השתנתה בפועל.
שאלונים
שאלונים הם הכלי הנפוץ ביותר במחקרי סקרים. עם זאת, איכות התוצאות תלויה ישירות באיכות בניית השאלון – שאלון שנכתב בצורה לקויה יפיק תוצאות חסרות ערך. שאלונים תקניים צריכים להפיק מדידות אמינות ותקפות של משתנים דמוגרפיים וכן מדידות תקפות של הבדלים בין אישיים באמצעות סולמות דיווח עצמי.[5]
שאלונים ככלי מדידה
קטגוריה נפוצה של משתנים הנמדדת בסקרים היא משתנים דמוגרפיים – המשמשים לתיאור מאפייני האנשים במדגם. משתנים אלו כוללים לרוב:
- מוצא אתני
- מצב סוציו-אקונומי
- גזע
- גיל
שאלונים רבים עוסקים גם במדידת העדפות ועמדות של הנבדקים, לרוב באמצעות סולמות דיווח עצמי – כלי מדידה שבהם הנשאלים מדרגים את דעתם לגבי נושאים שונים. סולמות אלה משמשים גם להשוואת הבדלים בין אישיים.
בפסיכולוגיה, סולמות דיווח עצמי הם כלי מדידה מרכזי, ולכן ישנה חשיבות רבה לבנייתם הקפדנית – כך שיהיו גם מהימנים וגם תקפים.
מהימנות ותקפות של סולמות דיווח עצמי
מהימנות (Reliability) של שאלון פירושה עקביות: שאלון מהימן יניב תוצאות עקביות בכל פעם שהוא נמדד. אחת הדרכים לבדוק זאת היא מהימנות מבחן-מבחן חוזר (Test-retest), שבה עורכים את אותו שאלון פעמיים לאותו מדגם בזמנים שונים. אין צורך שהתוצאות יהיו זהות, אך המיקום היחסי של כל נבדק בהתפלגות הציונים אמור להיות דומה.
גורמים נוספים המשפיעים על המהימנות:
מספר פריטים רב יותר לשם מדידת מבנה מסוים; שונות גבוהה יותר במשתנה הנמדד בין משתתפי המדגם; הוראות ברורות ומיעוט הסחות דעת בזמן המענה.
תקפות (Validity), לעומת זאת, מתייחסת לשאלה האם השאלון מודד את מה שהתכוונו למדוד. התקפות המבנית (Construct validity) בודקת אם הכלי מודד באמת את המבנה התאורטי שלשמו נבנה.
בניית שאלון
תהליך בניית שאלון תקף ומהימן כולל שישה שלבים:
- הגדרת סוג המידע הדרוש
- בחירת שיטת ההפצה של השאלון
- ניסוח טיוטה ראשונה
- עריכת השאלון
- ביצוע סקר ניסיון (Pretest)
- עריכת הגרסה הסופית והגדרת נוהלי השימוש
ניסוח שאלות בשאלון
אופן ניסוח השאלות משפיע רבות על התשובות. לכן, יש לנסח שאלות בזהירות, תוך רגישות תרבותית ולשונית. ישנם שני סוגי שאלות עיקריים:
- שאלות פתוחות – מאפשרות תשובות חופשיות, אך קשה לקודדן
- שאלות סגורות – קלות להמרה לנתונים מספריים, אך מגבילות את ביטוי המשיב
הנחיות כלליות לניסוח שאלות:
- שימוש בשפה פשוטה וברורה
- שאלות קצרות (פחות מ־20 מילים)
- הימנעות משאלות מנחות או מוטות
- כאשר משתמשים במספר פריטים לאותו מבנה, כדאי שחלקם ינוסחו בכיוון הפוך כדי למנוע הטיית תגובה
- לשאלות פתוחות ניתן גם להצמיד סולם תגובה בדיעבד, או לנתח אותן באופן איכותני.
סדר השאלות בשאלון
גם לסדר השאלות יש השפעה פסיכולוגית.
בשאלונים עצמאיים (Self-administered) – שאלות מעניינות צריכות להופיע בתחילה, בעוד ששאלות דמוגרפיות יופיעו בסוף. בראיונות טלפוניים או פרונטליים – שאלות דמוגרפיות יופיעו בתחילה, להגביר את אמון הנבדק.[6] שאלות קודמות עשויות להשפיע על תשובות בהמשך – תופעה הנקראת אפקט סדר השאלות (Priming effect).
תרגום שאלונים
כאשר סקר נערך במספר שפות, חשוב לתרגם את השאלון כך שהתוצאות תהיינה ברות השוואה. התרגום צריך לכלול מעורבות של:
- מתרגמים
- מומחים לתחום
- דוברים ילידיים של שפת היעד
שיטות מומלצות כוללות:
- תרגום מקבילי (Parallel translation)
- בדיקות קבוצתיות
- הרצת פיילוט בשפה המתורגמת
שיטה מקובלת היא מודל TRAPD:
- Translation (תרגום)
- Review (סקירה)
- Adjudication (הכרעה)
- Pretesting (בדיקת פיילוט)
- Documentation (תיעוד)
מודל זה פותח עבור ה־European Social Survey ונמצא בשימוש נרחב בעולם.[7] תיאוריה בתחום הסוציולינגוויסטיקה קובעת כי תרגום שאלון תקף הוא תרגום הלוקח בחשבון לא רק את הלשון, אלא גם את ההקשר התרבותי והחברתי של שפת היעד.
הפחתת היעדר תגובה
במחקרי סקרים, במיוחד טלפוניים ופרונטליים, מושם דגש רב על צמצום תופעת אי-התגובה (Nonresponse). להלן שיטות מקובלות להפחתת שיעור אי-התגובה:
- מכתב מקדים: נשלח לנשאלים טרם הפנייה, ומסביר בקצרה מהות הסקר, תוכנו, וחשיבות שיתוף הפעולה. המכתב מנוסח בצורה אישית אך לא מוגזמת, מכין את הקרקע ליצירת קשר טלפוני או אישי, וכולל הזמנה לשאלות מצד הנשאל.
- הכשרת מראיינים: מראיינים צריכים להיות מיומנים בהצגת שאלות, שימוש במחשוב, ותיאום זמני שיחה חוזרת עם נבדקים שלא השיבו.
- פתיחה קצרה ומזמינה: המראיין צריך להציג את שמו, את הגוף שמטעמו הוא פועל, משך הסקר ומטרתו, ולציין במפורש שהסקר אינו קשור למכירה, דבר שהוכח כמעלה את שיעור ההיענות.
- שאלון ידידותי: שאלות צריכות להיות ברורות, קצרות, לא פוגעניות וקלות להבנה ולמענה.
- קיצור השאלון: אף כי יש מחלוקת על כך, מחקרים מצאו ירידה מסוימת בהיענות לסקרים ארוכים – ירידה של כ־3% אחרי 10 שאלות, ו־6% אחרי 20 שאלות; ירידה זו מואטת בהמשך. עם זאת, קיימות אינדיקציות גם לכך שאיכות התשובות נפגעת ככל שהשאלון מתקדם.
בנוסף, מעמדו המקצועי של הנבדק עשוי להשפיע על אופן קבלת הסקר. למשל, למרות שכיום פקס נחשב לכלי מיושן להפצת סקרים, מחקר העלה כי רוקחים דווקא העדיפו סקרים בפקס – עקב חשיפה שגרתית למרשמים שמגיעים בפורמט זה.
השפעות המראיין
מתודולוגים של סקרים הקדישו מאמץ ניכר לחקר השפעת תכונותיו האישיות של המראיין על תשובות הנשאלים. תכונות בולטות שהוכחו כבעלות השפעה:
- מוצא אתני / גזע
- מגדר
- משקל גוף (BMI)
השפעות אלו בולטות במיוחד כשנשאלות שאלות הקשורות לאותה תכונה. למשל:
- מוצא המראיין משפיע על תשובות לשאלות בנושאי גזע
- מגדר המראיין משפיע על שאלות מגדריות
- BMI של המראיין משפיע על תשובות לשאלות על תזונה ודיאטה
השפעות אלו קיימות לא רק בסקרים פנים-אל-פנים, אלא גם בטלפוניים ובסקרים מקוונים עם ווידאו. ההסבר המקובל לכך הוא הטיית הרצייה החברתית (Social desirability bias) – נטיית נשאלים לשדר תדמית "חיובית" שמתיישבת עם הנורמות שהם מייחסים למראיין.
שילוב ביג דאטה במחקרי סקרים
מאז 2018, חוקרי מתודולוגיית סקרים החלו לבחון כיצד ניתן לשלב את הביג דאטה עם מתודולוגיית הסקרים, על מנת לאפשר לחוקרים ולאנשי מקצוע לשפר את ייצור הסטטיסטיקות הסקריות ואת איכותן. לביג דאטה עלות נמוכה לכל נקודת נתון, והוא עושה שימוש בטכניקות ניתוח באמצעות למידת מכונה וכריית נתונים, וכולל מקורות מידע מגוונים וחדשים, כגון רישומים, רשתות חברתיות, יישומונים וצורות נוספות של נתונים דיגיטליים. נערכו שלושה כנסים בסדרה "Big Data Meets Survey Science (BigSurv)" בשנים 2018, 2020, ו־2023, וכנס נוסף מתוכנן לשנת 2025, וכן פורסמו גיליונות מיוחדים בנושא בכתבי העת Social Science Computer Review, [8]Journal of the Royal Statistical Society,[9] ו־EPJ Data Science,[10] לצד ספר בשם Big Data Meets Social Sciences, בעריכת קרייג א. היל וחמישה עמיתים נוספים באיגוד האמריקאי לסטטיסטיקה.
קישורים חיצוניים
הערות שוליים
- ^ 1.0 1.1 Priscilla A. Glasow, [https://www.mitre.org/sites/default/files/pdf/05_0638.pdf#page=5 Fundamentals of Survey Research Methodology], MITRE, 2005, עמ' 5
- ↑ Survey Methodology – InMoment, inmoment.com, 2022-10-25 (באנגלית אמריקאית)
- ↑ Robert M. Groves, Floyd J. Fowler Jr, Mick P. Couper, James M. Lepkowski, Eleanor Singer, Roger Tourangeau, Survey Methodology, John Wiley & Sons, 2011-09-20, מסת"ב 978-1-118-21134-2. (באנגלית)
- ↑ Robert M. Groves, Floyd J. Fowler Jr, Mick P. Couper, James M. Lepkowski, Eleanor Singer, Roger Tourangeau, Survey Methodology, John Wiley & Sons, 2011-09-20, מסת"ב 978-1-118-21134-2. (באנגלית)
- ↑ Robert M. Groves, Floyd J. Fowler Jr, Mick P. Couper, James M. Lepkowski, Eleanor Singer, Roger Tourangeau, Survey Methodology, John Wiley & Sons, 2011-09-20, מסת"ב 978-1-118-21134-2. (באנגלית)
- ↑ Mandy Sha, Stephen Immerwahr, Survey Translation: Why and How Should Researchers and Managers be Engaged?, Survey Practice 11, 2018-02-19 doi: 10.29115/SP-2018-0016
- ↑ AAPOR/WAPOR Task Force Report on Quality in Comparative Surveys, World Association for Public Opinion Research (באנגלית אמריקאית)
- ↑ Don Jang, Ana Lucía Córdova Cazar, Big Data Meets Survey Science, Journal of the Royal Statistical Society Series A: Statistics in Society 185, 2022-12-01, עמ' S167–S169 doi: 10.1111/rssa.12967
- ↑ Adam Eck, Ana Lucía Córdova Cazar, Mario Callegaro, Paul Biemer, “Big Data Meets Survey Science”, Social Science Computer Review 39, 2021-08-01, עמ' 484–488 doi: 10.1177/0894439319883393
- ↑ Integrating Survey and Non-survey Data to Measure Behavior and Public Opinion, www.springeropen.com (באנגלית)
מתודולוגיית סקרים41166572Q814232