قراءة نقدية في نتائج PISA
1
كناشة الورق
كناشة الورق
٩ يناير ٢٠٢٦

بين صدق القياس وسوء توظيف المؤشرات

التصنيف: القياس والتقويم التربوي

النطاق: تحليل السياسات التعليمية الدولية

التاريخ: 2024

على الرغم من تسويق منظمة التعاون الاقتصادي والتنمية (OECD) لاختبار PISA بوصفه معياراً دولياً مرجعياً لمقارنة أداء النظم التعليمية، فإن الأدبيات التربوية والقياسية تؤكد ضرورة التمييز بين جودة أداة القياس، وصحة توظيف نتائجها في صنع القرار. وفي هذا السياق، يبرز نقاش علمي مشروع حول مفهومي الصدق والموثوقية في اختبار بيزا.

أولاً: مدى صدق (Validity) وموثوقية (Reliability) اختبار بيزا دولياً


1. إشكالية الصدق (Validity): ماذا يقيس اختبار بيزا فعلياً؟

أ. صدق المحتوى والمنهج (Curricular Validity)

من الناحية القياسية، لا يدّعي اختبار بيزا قياس مدى إتقان الطالب لمحتوى المنهج الوطني، بل يعرّف نفسه صراحة بأنه اختبار قائم على محو الأمية الوظيفية (Literacy-based Assessment) في القراءة والرياضيات والعلوم. أي أنه يركز على قدرة المتعلم على توظيف المعرفة في سياقات حياتية غير مألوفة، وليس على استرجاع المحتوى الدراسي.

وعليه، فإن الإشكال لا يكمن في صدق أداة القياس نفسها، بل في سوء استخدام نتائجها عند:

  • الحكم على جودة المناهج الوطنية.
  • أو مقارنة نظم تعليمية تختلف جذرياً في فلسفة بناء المناهج (محتوى معرفي مقابل كفايات).

📌 الاستخدام الدقيق علمياً لنتائج بيزا هو: تقييم جاهزية النظام التعليمي لتنمية الكفايات القابلة للنقل (Transferable Competencies)، وليس تقييم مدى تغطية المنهج أو عمقه المعرفي.

ب. التحيز اللغوي والثقافي وعبء القراءة (Reading Load Effect)

يعتمد اختبار بيزا بدرجة عالية على القراءة الاستيعابية العميقة، حتى في مجالات الرياضيات والعلوم، حيث تُقدَّم المسائل في سياقات لغوية مطوّلة تتطلب:

  • تفسير نصوص.
  • تحليل رسوم بيانية.
  • والتمييز بين معطيات صريحة واستنتاجات ضمنية.

تباين غير ذي صلة بالبناء (Construct-Irrelevant Variance) هذا التباين في الأداء ناتج عن مهارة غير مستهدفة أصلاً (القراءة)، لكنه يؤثر بقوة على النتيجة.

وفي السياقات متعددة اللغات أو ذات البنية اللغوية المختلفة عن اللغات الأوروبية، قد يفشل الطالب ليس لضعف في المفهوم الرياضي أو العلمي، بل لارتفاع العبء اللغوي غير الضروري. وهذا يُضعف صدق الاستدلال عند مقارنة قدرات "رياضيات صرفة" أو "علوم صرفة" بين نظم تعليمية غير متجانسة لغوياً.


2. إشكالية الموثوقية (Reliability): حين يكون الثبات الإحصائي مضللاً

إحصائياً، يتمتع اختبار بيزا بدرجات عالية من الثبات عبر النماذج البنائية ونظرية الاستجابة للمفردة. غير أن الإشكال الحقيقي يظهر في ما يمكن تسميته: الموثوقية السلوكية (Behavioral Reliability).

عامل الجدية والدافعية (Test Motivation)

اختبار بيزا هو اختبار منخفض المخاطر (Low-stakes) بالنسبة للطالب، فلا يؤثر على نجاحه أو معدله، ولا يترتب عليه أثر مباشر في مساره التعليمي. تشير الأدبيات إلى أن هذا النوع من الاختبارات يعاني من:

  • التخمين السريع (Rapid Guessing).
  • ترك الأسئلة دون إجابة.
  • انخفاض الجهد الذهني مع تقدم وقت الاختبار.

وهذا يعزز تبايناً ناتجاً عن ضعف الدافعية وليس عن ضعف القدرة، مما يحد من الصدق الظاهري والصدق التنبؤي للنتائج في بعض السياقات الثقافية.

ثانياً: لماذا جاءت نتائج المملكة العربية السعودية متدنية؟

انخفاض ترتيب المملكة في دورتي 2018 و2022 لا يعني بالضرورة ضعف قدرات الطالب السعودي، بل يعكس عدم مواءمة بين ما يتم تدريسه، وما يتم قياسه، وكيفية القياس. ويمكن تلخيص الأسباب في مثلث مترابط:


1. فجوة المنهج: من المحتوى إلى الكفايات

لسنوات طويلة، ركزت الممارسات التعليمية على التذكر، التطبيق المباشر، والحل النمطي للمسائل. وهي مستويات تقع غالباً في المستويات الدنيا من تصنيف Bloom المعدل (Remember – Apply).

بينما تقيس بيزا التحليل، التقييم، ونقل المعرفة إلى سياقات جديدة، وهي مستويات معرفية عليا لم تكن جزءاً أصيلاً من ثقافة التقويم اليومية داخل الصف.


2. عائق القراءة الاستيعابية العميقة

بيزا في جوهره اختبار قراءة قبل أن يكون اختبار رياضيات أو علوم. وتشير المؤشرات الوطنية والدولية إلى وجود ضعف في استراتيجيات القراءة فوق المعرفية (Metacognitive Reading)، مثل التلخيص، والاستنتاج، ومراقبة الفهم.

هذا يجعل الطالب يتعثر عند فهم السؤال الطويل أو تفسير السياق، فيترك السؤال أو يخمّن إجابته، ما ينعكس سلباً على أدائه الكلي.


3. عامل الدافعية المؤسسية

لا يرتبط اختبار بيزا في وعي الطالب والأسرة بدرجات أو قبول جامعي أو مسار مهني. وبالتالي، لا يولّد النظام التعليمي دافعية داخلية مؤسسية تجاهه. وهذا يفسر الفجوة بين أداء الطالب في الاختبارات التحصيلية الوطنية، وأدائه في الاختبارات الدولية منخفضة المخاطر.


4. الممارسات التدريسية والتقويم الصفي

لا يزال جزء معتبر من التدريس يعتمد على التلقين أو التدريب على أسئلة أحادية الخطوة. كما أن ثقافة التقويم الصفي لا تزال تفتقر إلى أسئلة عالية الطلب المعرفي، ومهام أداء، ومواقف حل مشكلات حقيقية.


الخلاصة: الرأي المهني

اختبار بيزا يتمتع بصدق استدلالي عالٍ في قياس جاهزية المتعلم لتوظيف المعرفة في سياقات جديدة ومعقدة، لكنه ليس أداة عادلة للحكم على جودة المحتوى المعرفي الذي يتلقاه الطالب في منهجه المحلي.

المملكة العربية السعودية تسير في المسار الصحيح عبر:

  • التحول التدريجي نحو المناهج القائمة على الكفايات.
  • استحداث اختبارات وطنية مثل "نافس" لمحاكاة نمط بيزا وكسر حاجز الرهبة.
  • التركيز على الطفولة المبكرة وردم فجوة القراءة من الجذور.

ومع ذلك، فإن تحسن النتائج لن يكون فورياً، بل هو تحول ثقافي وبنيوي عميق يحتاج من 6 إلى 9 سنوات (دورتين إلى ثلاث دورات بيزا) ليظهر أثره الحقيقي والمستدام.

ملاحظة ختامية: هذا التحليل لا يهدف إلى تبرير النتائج، ولا إلى جلد الذات، بل إلى وضع النتائج في إطارها القياسي الصحيح، بما يخدم تحسين السياسات التعليمية على أسس علمية راسخة.