שיפוט השוואתי והערכה עצמאית מייצגות שתי גישות שונות להערכת איכות בהקשרים של חשיבה ביקורתית. בעוד ששיפוט השוואתי מסתמך על השוואות יחסיות בין זוגות עבודות, הערכה עצמאית משתמשת בקריטריונים מוחלטים המוחלים על כל פריט בנפרד. לשתי השיטות יש רקורד מוכח במסגרות חינוך ומחקר.
הדגשים
שיפוט השוואתי משתמש בהשוואות זוגיות בעוד שהערכה עצמאית מיישמת רובריקות מוחלטות
מודלים סטטיסטיים כמו בראדלי-טרי תומכים במהימנות של שיפוט השוואתי
הערכה עצמאית שולטת בהקשרים של בדיקות סטנדרטיות והסמכה
שיפוט השוואתי מפחית הטיה של בוחנים אינדיבידואליים באמצעות השוואות מצטברות
מה זה שיפוט השוואתי?
שיטת הערכה יחסית שבה מעריכים משווים זוגות של פריטים ובוחרים את הטוב יותר מביניהם.
התפתח מחוק השיפוט ההשוואתי של ת'רסטון בשנות ה-20
משתמש בהשוואות זוגיות במקום בסולמות ניקוד מוחלטים
מסתמך על מודל בראדלי-טרי כדי להמיר בחירות זוגיות לדירוגים
דורש מספר שופטים שעושים השוואות רבות לצורך אמינות סטטיסטית
אומץ באופן נרחב במערכות חינוך בבריטניה להערכת כתיבה של תלמידים
מה זה הערכה עצמאית?
גישת הערכה מוחלטת שבה כל פריט נשפט לגופו על פי קריטריונים קבועים.
מושרש בתורת המדידה הפסיכומטרית המסורתית
משתמש ברובריקות, רשימות תיוג או סולמות דירוג המוחלים על כל פריט בנפרד.
מאפשר השוואה ישירה מול סטנדרטים קבועים מראש
מהווה את הבסיס לרוב מסגרות הבדיקות הסטנדרטיות ברחבי העולם
מאפשר הערכה מהירה יותר כאשר כבר קיימים מדדי ייחוס ברורים
טבלת השוואה
תכונה
שיפוט השוואתי
הערכה עצמאית
סוג הערכה
יחסית (השוואה זוגית)
מוחלט (מבוסס קריטריון)
שיטת ניקוד
השופטים בוחרים את הטוב מבין שני פריטים
כל פריט קיבל ציון לפי רובריקה קבועה
מודל סטטיסטי
מודלים של בראדלי-טרי או ת'רסטון
תורת הבחינה הקלאסית או תורת תגובת הפריט
עומס עבודה של שופטים
גבוה (יש צורך בהשוואות רבות)
בינוני (הערכה אחת לכל פריט)
התנגדות להטיה
חזק נגד הטיה של שופטים אינדיבידואליים
פגיע לסחיפה של מדרגים אינדיבידואליים
מקרה השימוש הטוב ביותר
הערכת איכות הוליסטית
הסמכה מבוססת תקנים
מהירות משוב
איטי יותר עקב נפח ההשוואה
מהר יותר עם רובריקות מבוססות
מקור אמינות
השוואות רבות בין שופטים
רובריקות מכוילות ומעריכים מאומנים
השוואה מפורטת
מתודולוגיה מרכזית
ההבדל המהותי טמון באופן שבו כל שיטה ניגשת לאיכות. שיפוט השוואתי מבקש מהמעריכים לבחון שני פריטים זה לצד זה ולהחליט איזה מהם טוב יותר, תוך עקיפת הקושי של מתן ציונים מוחלטים. הערכה עצמאית, לעומת זאת, מבקשת מהמעריכים לדרג כל פריט מול רובריקה או סטנדרט קבועים מראש, תוך התייחסות לכל הגשה כאל מקרה בודד בפני עצמו.
אמינות ועקביות
שיפוט השוואתי בונה אמינות באמצעות כמות עצומה של השוואות זוגיות, כאשר מודלים סטטיסטיים מחליקים את המוזרויות של שופטים בודדים. הערכה עצמאית תלויה במידה רבה בבהירות הרובריקה ובהכשרת המעריכים, כלומר העקביות יכולה להשתנות באופן משמעותי בין מעריכים אלא אם כן מפגשי כיול משולבים בתהליך.
יישומים מעשיים
במסגרות חינוכיות, שיפוט השוואתי צבר תאוצה בהערכת תיקי עבודות כתיבה שבהם איכות הוליסטית חשובה יותר מעמידה ברשימת התיוג. הערכה עצמאית נותרה דומיננטית במבחנים סטנדרטיים, הסמכה מקצועית ובכל הקשר שבו החלטות עובר/נכשל חייבות להתאים לתקני כשירות קבועים.
חוזקות ומגבלות
שיפוט השוואתי מצטיין בלכידת הבדלים דקדקניים באיכות שרובריקות עשויות לפספס, אך הוא דורש יותר זמן ומאגר שופטים גדול יותר כדי להגיע למשמעות סטטיסטית. הערכה עצמאית מציעה מהירות ונקודות ייחוס ברורות, אך היא יכולה לצמצם עבודה מורכבת לציון ברשימת בדיקה שמפספס את התמונה הגדולה יותר של האיכות הכוללת.
גיבוי מחקרי
מחקרים מבריטניה הראו ששיפוט השוואתי מייצר מהימנות בין-בודקת דומה להערכה מסורתית, ובמקביל מהיר יותר באופן כללי. להערכה עצמאית עשרות שנים של מחקר פסיכומטרי התומכים בתוקף שלה, במיוחד באמצעות מסגרות כמו הטקסונומיה של בלום ומודלים מודרניים מבוססי-מיומנויות להערכה.
יתרונות וחסרונות
שיפוט השוואתי
יתרונות
+מפחית הטיה אישית
+לוכד איכות הוליסטית
+גיבוי סטטיסטי חזק
+תהליך קבלת החלטות טבעי
המשך
−התקנה עתירת זמן
−דורש הרבה שופטים
−קשה יותר להסביר
−צריך עוד השוואות
הערכה עצמאית
יתרונות
+נקודות מידה ברורות
+אספקה מהירה יותר
+מובן באופן נרחב
+קל לתקנן
המשך
−תלות ברובריקה
−סיכון סחף של מדרג
−יכול לפשט יתר על המידה
−פחות ניואנסים שנקלטו
תפיסות מוטעות נפוצות
מיתוס
שיפוט השוואתי הוא בסך הכל תחרות פופולריות בין שופטים.
מציאות
השיטה משתמשת במודלים סטטיסטיים מתוחכמים כדי לאגד השוואות בלתי תלויות רבות, תוך סינון הטיות אינדיבידואליות. עם מספיק שופטים והשוואות, הדירוגים המתקבלים משקפים הבדלים אמיתיים באיכות ולא העדפות של שופט בודד.
מיתוס
הערכה עצמאית היא אובייקטיבית לחלוטין משום שהיא משתמשת ברובריקות.
מציאות
אפילו עם רובריקות מפורטות, שיקול דעת אנושי מכניס סובייקטיביות בכל החלטת ניקוד. רובריקות מצמצמות אך לעולם לא מבטלות את הבחירות הפרשניות שעושים מעריכים בעת יישום קריטריונים לעבודה אמיתית.
מיתוס
שיפוט השוואתי אינו יכול לספק משוב ללומדים.
מציאות
יישומים מודרניים יכולים לייצר משוב מפורט על ידי ניתוח אילו פריטים מדורגים גבוה יותר באופן עקבי וזיהוי התכונות המבדילות עבודות בעלות דירוג גבוה מהגשות בעלות דירוג נמוך יותר.
מיתוס
הערכה עצמאית מיושנת בהשוואה לשיטות חדשות יותר.
מציאות
הערכה עצמאית נותרה סטנדרט הזהב בהקשרים בעלי סיכון גבוה כמו רישוי רפואי, הסמכה משפטית ובדיקות סטנדרטיות דווקא משום שסטנדרטים מוחלטים חשובים כאשר חיים או תעודות תלויים על כף המאזניים.
שאלות נפוצות
מה ההבדל העיקרי בין שיפוט השוואתי להערכה עצמאית?
שיפוט השוואתי מבקש מהמעריכים להשוות בין שני פריטים ולבחור את הטוב יותר, בעוד שהערכה עצמאית נותנת ציון לכל פריט על פי רובריקה או סטנדרט קבועים. הראשון הוא יחסי, השני הוא מוחלט.
איזו שיטה אמינה יותר להערכת כתיבה של תלמידים?
מחקרים ממערכות חינוך בבריטניה מצביעים על כך ששניהם יכולים להשיג מהימנות גבוהה, אך שיפוט השוואתי לעיתים קרובות מניב תוצאות עקביות יותר בין המעריכים משום שהוא עוקף את השונות של הניקוד המוחלט. הערכה עצמאית יכולה להתאים זאת עם כיול רובריק קפדני.
כמה השוואות נדרשות כדי ששיפוט השוואתי יעבוד?
רוב היישומים דורשים להשוות כל פריט לפחות 10 עד 15 פעמים על ידי שופטים שונים. עם 30 הגשות, זה אומר בערך 200 עד 300 השוואות בסך הכל כדי ליצור דירוגים בעלי משמעות סטטיסטית.
האם שיפוט השוואתי יכול להחליף לחלוטין את הציונים המסורתיים?
בהקשרים מסוימים, כן. בתי ספר המשתמשים בפלטפורמת No More Marking החליפו את ציון החיבורים המסורתי בשיפוט השוואתי. עם זאת, הוא עובד בצורה הטובה ביותר להערכה מעצבת והוליסטית ולא לתעודה בעלת סיכון גבוה.
מדוע מבחנים סטנדרטיים עדיין משתמשים בהערכה עצמאית?
מבחנים סטנדרטיים זקוקים לספי עובר/נכשל ברורים הקשורים לכישורים ספציפיים. הערכה עצמאית מספקת את אמות המידה המוחלטות הנדרשות להחלטות הסמכה, בעוד ששיפוט השוואתי מייצר רק דירוגים יחסיים.
האם שיפוט השוואתי מהיר יותר מבדיקה מסורתית?
בניגוד לאינטואיציה, כן. בעוד שכל השוואה אורכת שניות בלבד, הגישה המצטברת מפחיתה את זמן הבדיקה הכולל מכיוון ששופטים מקבלים החלטות מהירות יותר בעת השוואת שני פריטים מאשר בעת מתן ציונים מוחלטים לעבודה מורכבת.
איזו הכשרה שופטים צריכים לצורך הערכה עצמאית?
מעריכים בדרך כלל זקוקים לפגישות כיול בהן הם מתרגלים את יישום הרובריקה על עבודת דוגמה ודנים בפערים. רוב התוכניות דורשות מספר שעות הכשרה בתוספת בדיקות איכות מתמשכות כדי לשמור על עקביות.
האם ניתן לשלב את שתי השיטות בהערכה אחת?
בהחלט. מחנכים רבים משתמשים בהערכה עצמאית לסינון ראשוני מול קריטריונים, ולאחר מכן מיישמים שיפוט השוואתי לדירוג סופי בין פריטים העומדים בקריטריונים הבסיסיים. גישה היברידית זו ממנפת את נקודות החוזק של שתי השיטות.
איזו שיטה טובה יותר להערכת חשיבה ביקורתית?
שיפוט השוואתי נוטה ללכוד את איכות החשיבה הביקורתית בצורה הוליסטית יותר משום שהוא משקף את השיפוט הכללי במקום לצמצם את החשיבה לפריטים ברשימת הבדיקה. הערכה עצמאית עובדת היטב כאשר ניתן להגדיר ולהפריד בבירור את רכיבי החשיבה הביקורתית.
האם שיפוט השוואתי עובד גם במקצועות אחרים מלבד כתיבה?
כן, זה יושם בפתרון בעיות מתמטיות, חקירות מדעיות, תיקי עבודות אמנות ואפילו במשימות קידוד. בכל מקום שבו איכות הוליסטית חשובה, השוואה זוגית יכולה לייצר דירוגים שימושיים.
פסק הדין
בחרו בשיפוט השוואתי בעת הערכת איכות הוליסטית על פני הגשות רבות ותהיה לכם גישה לשופטים מיומנים רבים המוכנים לבצע השוואות רבות. הערכה עצמאית עובדת טוב יותר כאשר אתם זקוקים להחלטות מהירות מול סטנדרטים קבועים, כגון בחינות הסמכה או בדיקות כשירות עם תשובות נכונות ברורות.