مادلين غراويتز / ترجمة: محمد الطيب قويدري
الاختبارات : 1- التعريف
الاختبارات في علم النفس وعلم الاجتماع . كلمة test أو têt هي كلمة فرنسية قديمة مرادفة لكلمة كوب (اللاتينية testa: مزهرية ترابية) التي كانت تستخدم للإشارة إلى أواني التراكوتا الصغيرة، وقد استخدمها الكيميائيون لاختبار سبائكهم. في اللغة الإنجليزية هي تعين كاشفا، أو محاولة. اختبار الكلمات. هو اختبار يساء استخدامه في عصرنا. تصبح أي إجابة أو رد فعل على سؤال أو لغز بمثابة اختبار. ومع ذلك، فإن رد الفعل، العرضي أو الكاشف كما يظهر، لا يشكل إلا اختبارًا إذا كان الموقف والحافز، من ناحية، معياريًا، ومن ناحية أخرى، إذا كان يمكن تقييم سلوك الشخص كميًا، عن طريق المقارنة الإحصائية مع ذلك انطلاقا من مجموعة من الموضوعات وضعت في نفس الموقف.
يقترح H. Piéron التعريف التالي: “الاختبار هو اختبار محدد، يتضمن مهمة يجب إكمالها، مطابقة لجميع الموضوعات التي تم فحصها، مع تقنية دقيقة لتقدير النجاح أو الفشل أو للمفهوم الرقمي للنجاح[1]. ”قد تشمل المهمة تنفيذ إما المعرفة المكتسبة: الاختبار التربوي، أو الوظائف الحسية أو العقلية: اختبار نفسي.
التعريفات الأخرى أوسع؛ وبالتالي، فإن M. Reuchlin يعين تحت اسم “اختبار”، «أي أسلوب يسمح بوصف كمي يمكن التحكم فيه لسلوك الفرد الموضوع في موقف محدد، بالرجوع إلى سلوك أفراد مجموعة محددة وضعوا في نفس الموقف [2]».
2- لمحة تاريخية
نشأت طريقة الاختبار، مثل الكثير من علم النفس الاجتماعي الحديث، نتيجة ظهور مشاكل عملية يطرحها التطور التقني، متزامنة مع تحسين وسائل التحقيق.
كتب بينيه في عام 1911: “لا يوجد شيء يضاهي الضرورة العملية لإيجاد طرق جديدة. كنا سنبقى في الوضع الراهن لفترة طويلة إذا لم نكن مضطرين، من أجل مصلحة اجتماعية حقيقية، لأخذ قياسات الذكاء بالمنهج النفسي [3] “.
أدركنا أولاً أن لدينا مصلحة في وضع “الرجل المناسب في المكان المناسب”. في الواقع، الشخص الأكثر قدرة من غيره على القيام بعمل ما، يتكيف بسرعة أكبر، ويقوم بعمله بشكل أفضل، مع مخرجات أفضل، وإرهاق أقل، وخطر أقل للحوادث، ومزيد من الرضا. كيف تجد الشخص الأنسب؟ لذلك، كان من الضروري أن يتقدم علم النفس، أي أن يدرك الفروق بين الأفراد، لمحاولة قياسها، لإدراك أن سلوك شخص ما، أو نجاحه أو فشله في موقف معين، ليس بسبب الصدفة وحدها، بل يعتمد على كفاءات معينة، على استمرارية بعض العوامل التي يجعل استقرارها التنبؤ ممكنًا.
الأصول
لفهم كيف ولأي سبب ولدت الاختبارات، يجب أن نعود إلى أصول علم النفس التفاضلي. نجد هنا ثلاث توجهات رئيسية:
1°- المدرسة الألمانية للفيزياء النفسية، ومركزها مختبر Wundt، وهو مبتكر علم النفس التجريبي في لايبزيغ؛ ومثل هذه المدرسة الأعلى هو صرامة علم النفس الفيسيولوجي والفيزياء.
2°- التيار الآخر تطور في الولايات المتحدة تحت قيادة كاتيل (Cattell). بالنسبة لهذا المؤلف وتلاميذه، فإن المثل الأعلى للعلم هو أن يكون فعالًا ولا ينبغي أن يكون علم النفس استثناءً. من ناحية أخرى، يكشف التوسع الصناعي، وتطوير الجامعات، والحاجة إلى الهجرة (التكيف)، وعمل خط التجميع (التايلورية : Taylorism: طريقة التنظيم العلمي للعمل الصناعي ، من خلال الاستفادة القصوى من الأدوات والقضاء على الإيماءات غير الضرورية.) عن العديد من المشكلات العملية. من ناحية أخرى، إلى جانب فلسفة العمل، تتطور الأفكار التطورية. التباين، الذي كان حتى ذلك الحين يعتبر غير ذي فائدة للتعميم العلمي، يظهر الآن، حتى في المرحلة الفردية، كمبدأ توضيحي للمجال الحي.
علم نفس كاتيل هو قبل كل شيء سيكولوجية الفرد. في مقالته الشهيرة التي نُشرت عام 1890، كان أول من استخدم كلمة “اختبار عقلي” ودافع عن تطبيق المقياس على عدد كبير من الأشخاص. لأول مرة، يتعلق الأمر بمسألة الاعتماد المتبادل، والتنوع، والتوحيد، مع الاهتمام بالاستخدام العملي. إن فكرة القياس هذه، المطبقة على الفرد، هي رأس المال، لأنها تحطم فكرة معينة عن عدم الحركة عن الإنسان. كما يقول زازو: “سيسمح هذا الإجراء بوضع الفرد في مجموعة محددة بيولوجيًا واجتماعيًا[4].”
مساهمة الإحصاء
الاختبارات تنطوي على مفهوم الاختلاف. كما أنها تتطلب تقدمًا في تقنية أخرى: الإحصاء. ليس من قبيل المصادفة أن مقال كاتيل نُشر تحت رعاية جالتون، مبتكر القياسات الحيوية، والإحصاء في علم الأحياء. وهكذا فإن العناصر التي من المقرر أن يولد منها القياس النفسي متحدة: التباين الفردي، دقة القياس، الإحصاء. ومع ذلك، لمدة خمسة عشر عامًا، احتفظ علماء النفس الأمريكيون، على الرغم من رغبتهم في تحقيق نتائج عملية ورفض روح علم النفس الألماني، بأدواته وتقنياته ولم يأتوا بأي شيء جديد.
أخيرًا، ظهر بينيه! وجد بينيه، وهو طبيب فرنسي، كان يعمل بمفرده تقريبًا، في عام 1905، حلاً للمشكلات التي يطرحها الأمريكيون. تتمثل فرضيته اللامعة في الافتراض بأنه ليست الظواهر الأولية هي التي تميز الأفراد، «أو على الأقل، كما يصرح، لا تسمح لنا تقنياتنا بفهم الاختلافات على هذا المستوى. ففي العمليات المعقدة: الشخصية والذكاء تكون الفروق الفردية قابلة أكثر لأن تُدركً». من خلال اكتشاف أنه كلما كانت العملية أكثر تعقيدًا وارتفاعاً، كلما تفاوتت حسب الأفراد، خلّص بينيه Binet علم النفس التفاضلي من شبق علم وظائف الأعضاء النفسي المنحصر في المخبر، والمحدود في قياس الأحاسيس.
يتحدث Binet أولاً عن “مقياس متري للذكاء” ويضع علم النفس في منظور تكويني، من خلال تحديد مراحل التطور الفكري حسب العمر، وهو معيار دقيق وقابل للقياس الكمي. في عام 1904، تم تكليفه من قبل وزارة التعليم العام لإنشاء اختبار فحص لتمييز الأطفال المتخلفين عقليًا عن أولئك الذين تأخروا فقط بسبب تمدرسهم غير المنتظم. عندئذ أنشأ Binet أول مقياس متري، عُرف باسم اختبار Binet-Simon.
اختبار بيني – سيمون (Binet-Simon)
الفكرة الأساسية هي تجميع سلسلة من الاختبارات المتزايدة الصعوبة، تبدأ من أدنى مستوى فكري وتنتهي عند المستوى العادي. تمت معايرة الاختبارات على الطلاب العاديين من المدارس الباريسية. إن فكرة العمر العقلي، التي اقترحها بينيه، تجعل من الممكن تحديد تأخر الأطفال مقارنة بالعمر الطبيعي، وفقًا لدرجة النجاح في الأسئلة المختلفة[5]. ولهذا السبب لاحظ زازو، بروح الدعابة، أن هذا الاختبار كان مقياسا للذكاء أكثر منه ذكاءً.
في عام 1917، عندما اضطرت الولايات المتحدة إلى تجنيد وتصنيف عدة ملايين من الرجال في غضون بضعة أشهر، استخدموا اختبارًا جماعيًا: Binet-Simon، على ما يقرب من مليوني فرد. بدأت الحركة لصالح الاختبار وفي عام 1940 كان من المقرر أن تؤدي إلى استخدام أكثر شمولاً وفعالية للاختبارات المحسنة والمكيفة.[6]
بناء الاختبارات.
تفترض طريقة الاختبار استقرارًا نسبيًا للسلوكات مما يجعل التنبؤ بها ممكنًا. وهو يقوم على افتراضات نظرية يمكن من خلالها، في ظل ظروف معينة، استخلاص النتائج العملية. تنبع هذه الافتراضات مما يلي: هناك كفاءات، تختلف باختلاف الأفراد، تتجلى في أنشطة معينة ومسؤولة عن النجاحات أو الإخفاقات. يمكن عزلها وقياس آثارها وكذلك الفروق بين الأفراد. إنها تظهر اتساقًا معينًا، مما يجعل من الممكن التنبؤ بسلوك موضوع ما في موقف معين، من سلوكه في الموقف المرصود والتحكم في هذه القيمة التنبؤية وتحسينها.
يعتمد التحقق من الفرضية ودقة التنبؤ على صحة الأدوات، التي يتم من خلالها التنبؤ. من الضروري أيضًا أن تكون المظاهر التي تمت ملاحظتها موضوعية للغاية. يأتي هذا الشرط العملي في إطار مفهوم الإخلاص.
1 ° الافتراضات: أ) وجود استعدادات مختلفة حسب الأفراد.
الأفراد الذين يخضعون لنفس التدريب، وينشرون نفس التطبيق، لا يحصلون على نفس النتائج. لماذا هذا الاختلاف؟
تخيلنا مفهوم “الاستعداد، أو القابلية”، وهو «الشرط الخلقي لطريقة معينة من النجاعة».
العنصر الفطري في الفرد لا يمكن قياسه. لذلك لا يمكن ملاحظة القابلية، بل ولا قياسها لأسباب قوية إلا بشكل غير مباشر، أي منذ اللحظة التي تتجلى فيها في نشاط ما. هذا الإجراء غير المباشر لا يتعارض مع الموقف العلمي، على العكس من ذلك. لا يعطي الفيزيائي تعريفا للكهرباء. إنه يقيسها في التأثيرات التي تنتجها، على الأدوات التي تسجل الجوانب المختلفة للظاهرة. التعريفات لا تزال افتراضية. إذا نعرّف أولا، لنقيس بعد ذلك، يجب أن نكون على يقين من أن القياس يتعلق بشكل صارم بكِبَرِ الحجم الذي حددناه مسبقًا.
ستظهر القابلية كما تم إبطاؤها أو تنميتها، وفي بعض الأحيان تشويهها، من قبل التجربة، والحياة في المجتمع. هل يمكننا؟ وكيف يمكننا التمييز بين العنصر الفطري ومساهمة التعليم؟ لنتخيل أننا نتخلى عن تقييم المساهمات الخارجية ونقتصر على قياس القابليات كما تظهر. هل هذا ممكن؟ هل يمكننا عزل القدرات عن بعضنا البعض، واعتبارها مسؤولة بمفردها عن أداء معين؟
تأخذ المشكلة كل أهميتها، عندما يتعلق الأمر بالتفكير في التوقع انطلاقا من الاختبار. هذا ليس فقط لتقدير بعض القدرات الجسدية، مثل المهارات اليدوية، ولكن أيضًا في حالة العناصر الأكثر تعقيدًا. هل هناك عامل ذكاء يمكن عزله على هذا النحو؟ قدرة على العزف على البيانو، وأخرى على العزف على الكمان، أو القدرة على فهم الموسيقى؟ أليس لهذا عوامل عديدة؟
تم تقديم العديد من الإجابات على هذه الأسئلة، اعتمادًا على المواقف النظرية أو العملية [7].
ب) القدرات التي تظهر في بعض الأنشطة هي المسؤولة عن النجاح أو الفشل.
تتجلى بعض المهارات البسيطة أو المعقدة في الحياة: القدرة على اكتشاف الملاحظات الخاطئة، والتفاعل بسرعة مع المنبه. يمكن اكتشافها في الاختبارات أو الاختبارات الاصطناعية. تتكون هذه من المهام المعدة صراحة لقياس الكفاءة. يعتمد تصميم العناصر أو الأسئلة التي تشكل اختبارات الاختبار على الافتراضات المتعلقة بخصائص القابلية للقيام بالقياس [8].
الخطوة الأولى في إنشاء اختبار تتمثل في تحديد معنى القابلية، أي حصر حقل الأداء أو التطبيق.
ضبط حدود حقل القابلية هو البحث عن الأوضاع التي تتجلى فيها خصائصها.
يمكن لنا أن نتصور عددًا معينًا من العمليات المختلفة، المتعلقة بهذه القابلية أو تلك: الضغط على زر عندما تضيء الإشارة، إلخ. والاعتراف بأن عامل سرعة رد الفعل، يحسم في حالات مختلفة. يمكننا أيضًا أن نفترض أن ما يسمح للطفل بالنجاح في التاريخ والجغرافيا والتلاوة هو القدرة على التذكر، وهذا ما يسمى بالذاكرة. عندما تتضمن العملية التي سيتم تنفيذها الكفاءة، سيكون هذا الشخص مسؤولاً عن النجاح. من ناحية أخرى، في الرياضيات، تكون الذاكرة قليلة الأهمية والنتائج المسجلة ستكون أقل جودة.
يمكننا أيضًا أن نتصور مواقف ملموسة أكثر تعقيدًا، حيث سيتم تقسيم العمليات (الإيماءات التي تشكل ردودًا على الحافز) إلى عناصر مختلفة. يمكن اعتبار هذه العناصر مؤشرات محددة وممثلة لخصائص الأداء، أي أنه يُفترض أنها متجانسة، تتعلق بنفس الكفاءة وفي علاقة تناسبية مع إجمالي الأداء المنسوب إلى هذا. يعترف طالما أننا نعرف ما هي الإيماءات أو الردود التي تشير إلى وجود الكفاءة؛ ما زلنا بحاجة إلى أن نكون قادرين على قياس درجته.
2 ° قياس القابلية.
في الامتحان، تكون بعض الاختبارات أكثر صعوبة من غيرها. لذلك من الضروري اكتشاف القرائن، لمعرفة القوة الانتقائية، ودرجة صعوبة الاختبارات أو الأسئلة، لأنهم يختارون أكثر أو أقل من الموضوعات الموهوبة. نقوم بتطبيق العناصر المرتبة والمرجحة وفقًا لقيمة مؤشرها (درجة الصعوبة والقوة الانتقائية) على مجموعة سيتم تصنيف موضوعاتها وفقًا لنجاحها الأكبر أو الأقل. من خلال تبسيط جميع المراحل في بناء الاختبار إلى حد كبير، يمكننا القول
أنه بعد تحديد مجال الكفاءة، بسبب عدم القدرة على قياسه، يمكننا فقط إعطائه قيمة، أي تقييم الفرد فيما يتعلق بالآخرين؛ هذا ما تفعله المعايرة.
أ) إجراءات المعايرة.
“معايرة اختبار ما، كما كتب ج. Palmade، هي فقط إنشاء مقياس يجعل من الممكن تحديد نجاح موضوع ما بشكل ملائم فيما يتعلق بالمجموعة الإجمالية للنجاحات في مجتمع ما[9].” هناك إجراءات مختلفة[10]. لنفترض أننا أجرينا اختباراً يتكون من مائة سؤال لألف شخص؛ نظرًا لأن إجابة واحدة صحيحة فقط ممكنة لكل منهم، فسنعطي نقطة لكل إجابة صحيحة وسنجمع الإجمالي لكل موضوع. سنقوم بعد ذلك بتصنيفها عن طريق تجميعها، على سبيل المثال، في فترات من 5 نقاط.
الرسم البياني للتوزيع الذي تم الحصول عليه من نوع معروف. يتم العثور عليها عندما يتم إزعاج ظاهرة من قبل عدد كبير من العوامل، يتم ترك شدة التدخل وتواتره للصدفة. إنه منحنى جاوس [11] أو منحنى الجرس.
ب) التحليل الداخلي للاختبار سؤالا بسؤال.
نحن ندرس جانبين معينين. درجة صعوبة كل سؤال؛ يتم تحديده من خلال النسبة المئوية للموضوعات الذين يقدمون الإجابة الصحيحة لكل سؤال. بشكل عام، يعتبر السؤال للسماح بأفضل تمييز عندما تكون درجة الصعوبة فيه 50٪ (أي أن 50٪ من المشاركين يعطون الإجابة الصحيحة). لكن من الضروري مراعاة الهدف من الاختبار: استبعاد الموضوعات الأقل جودة، واختيار الأفضل، وتصنيف الكل. يتيح هذا الفحص، بناءً على هذا الهدف، استبعاد الأسئلة التي تكون سهلة للغاية أو صعبة للغاية.
إن دراسة القوة التمييزية لكل سؤال (أو الصلاحية الداخلية للاختبار)، تجعل من الممكن تحديد إلى أي مدى يميز كل موضوع المواضيع إلى جيد وأقل جودة.
يتم تشكيل مجموعتين من الموضوعات وفقًا للنتيجة الإجمالية للاختبار. يتم تحديد التوزيع التكراري للعلامات ويتم فصل الموضوعات وفقًا للنسبة المئوية المختارة. النسبة المثلى هي 27٪ من المواد في كل مجموعة.
ما هي القيمة التنبؤية لهذا الترتيب؟
3. § – مفهوم الصلاحية.
مفهوم المعيار:
إن تحديد القيمة الموضوعية لترتيب الأفراد، فيما يتعلق بالمهمة التي يتعين القيام بها، يعود إلى إيجاد معيار مستقل في الحياة الواقعية، معيار يغطي نفس القابلية، ويرتب هرميا نفس الأشخاص بطريقة متطابقة. لا شك أن عوامل أخرى مؤثرة يمكن أن تتدخل في الواقع، ولكن من الضروري أن تؤثر القابلية التي يحاول المرء تحديدها في الاختبار أيضًا على الترتيب الفعلي، الذي تم إنشاؤه وفقًا لهذا المعيار.
إذا اجتاز هذا الفرد الاختبارات التي تتضمن السرعة، فيمكننا استنتاج أنه سينجح في الحياة في الأنشطة التي سيتدخل فيها هذا العامل. هذا يعني أنه يمكننا عزل المؤهلات في المختبر والتي وُجدت لتكون حاسمة في المواقف الحقيقية، المهنية أو غير ذلك، التي يتعلق بها التنبؤ. بين الاختبارات أو عناصر الاختبار، التي جرى قياسها في المختبر والأداء الخاص بمهنة أو وضع معين، قياسا يتبع معيارا محددا، يجب أن يوجد عنصر مشترك: كالقابلية أو عامل من عوامل التأهيل.
لكي يكون التنبؤ ممكنًا، من الضروري إذن، ليس فقط أن الأداة: أي الاختبار، تقيس جيدًا ما يفترض أن تقيسه: القابلية، ولكن لا يزال هناك شرط آخر، وهو أن القابلية التي تم قياسها في المختبر، يمكن العثور عليها في الوضع كما هو واقع فعلا.
الصلاحية المنطقية والصلاحية التجريبية
طريقة الاختبار، بسبب فائدتها العملية وأصولها، تهم كل من الممارسين الذين يستخدمونها؛ الإحصائيون الذين يتلاعبون بالنتائج الكمية وعلماء النفس الذين يناقشون المفاهيم التي تثير التساؤل. تنجذب كل مجموعة من هذه المجموعات بشكل أكثر تحديدًا إلى جانب من جوانب المنهج، وسوف تميل إلى الاحتفاظ، في المجال الذي يهمها، بمفهوم معين عن الصلاحية.
الصلاحية المنطقية. – إنها متطلّبة بصورة خاصة فيما يتعلق بالاختبارات، بما أنها تتطلب شرطا مزدوجا: الأداة يجب ليس فقط أن تقيس بدقة ما يفترض فيها قياسه، ولكن أيضا فإن الاستعداد المكتشف بهذا الشكل ينبغي أن يعثر عليه في الوضعية الواقعية.
لن يكون المعيار الداخلي الغامض بشأن ما يريد المرء قياسه بشكل أو بآخر كافياً. لا بد من وجود معيار خارجي. يناقش القائلون بالعوامل وكتاب المقالات تعريفه والتقنية المستخدمة لتحديده.
الصلاحية التجريبية. – الممارسون المتأثرون بالمكانة الهامة لعنصر التنبؤ الملموس وبصعوبة تعريف المهارات المعقدة، ركزوا أبحاثهم على الصلاحية التجريبية على حساب الصلاحية المنطقية. بالنسبة لأتباع Binet والإحصائيين، فإن التنبؤ الصحيح هو أفضل دليل على أن الاختبار قام بقياس ما يريد المرء قياسه.
1° صلاحية تجريبية. أ) الكفاءة مطابقة لنتيجة الاختبار.
ننسب إلى Binet التعريف التالي: “الذكاء هو ما يقيسه اختباري.” في الواقع، هذه مزحة، لكنها تتوافق مع تفكير العديد من الممارسين.
إن استدعاء أي نتيجة اختبار “قياس الكفاءة” هو حصر المرء في حشو: الاختبار هو وسيلة قياس الكفاءة، والاستعداد، وهذا ما يقاس بالاختبار. التحقق من الجانب الأول للصلاحية: يقيس الجهاز جيدًا ما يُفترض أن يقيسه، وبالتالي يصبح مستحيلًا.
ب) الصلاحية الإحصائية.
لا يهتم الممارسون كثيرًا بشأن النظرية، فموقعهم عملياتي محض: سيتم إثبات قيمة الاختبار من خلال صحة التنبؤ. هذا النظام، الذي بموجبه يتم التحقق من صحة الاختبار فقط من خلال نجاح الموضوعات المختارة، يستحق عددًا معينًا من التحفظات.
أولاً، تعد صحة “المصاحبة 1” بين الاختبار والمعيار نادرة. في التطبيق، من الضروري أحيانًا الانتظار وقتًا طويلاً لمعرفة الأداء الحقيقي للأفراد الخاضعين للاختبارات. يمكننا أيضًا الاكتفاء بمقارنة مجموعات مختلفة من الأفراد، أولئك الذين يجتازون الاختبارات وأولئك الذين ينجحون في الممارسة العملية.
لكن، من الصعب الحصول في الحياة على معايير نجاح موضوعية مرضية. في الواقع، يمكن أن يعتمد النجاح المهني على عناصر أخرى غير الكفاءة المَقيسة فقط، ومن الخطر الاحتفاظ بعامل اجتماعي مثل النجاح، لتحديد معيار الكفاءة، الذي يهدف من خلال التعريف إلى الموضوعية.
يستشهد Reuchlin 1 بحالة التلميذة الشابة التي، في امتحان الخياطة، تركب الأكمام بشكل مقلوب. سيرى المعلمون في ذلك نقصًا في الذكاء، وسيحكم المحترفون بشكل أقل قسوة، لأن السوء قابل للإصلاح، ما لم يتم إهدار القماش. سيكون الأمر مختلفًا تمامًا للحكم على ضربة مقص خرقاء. لذلك يمكننا القول إنه لا يوجد أهلية في ذاتها في مهنة الخياطة، لكن هناك أهلية بالنسبة لبعض الشروط الفنية، الاقتصادية والاجتماعية التي تضبط مفهوم النجاح في ممارسة هذه المهنة.
2° الصلاحية المنطقية. تعريف المعيار.
إشكالية تحديد المعيار أمر جوهري.
في أنواع معينة من الاختبارات، يتم توقع توافق المعيار مسبقا مع محتوى الاختبار إلى حد ما. هذه هي الاختبارات التي تسعى إلى توقع أقل من عنصر التحكم، وبالتالي فإنها تطرح مشكلات أقل حساسية في التحقق من الصحة. هذا هو الحال مع الاختبارات البيداغوجية. هذه لا تقيس القابلية بشكل غير مباشر من خلال الأداء، ولكنها تسعى ببساطة إلى إجراء تشخيص لنتائج التعلّم، التي تم إنجازها في ظل ظروف معروفة ويمكن التحكم فيها. امتحانات التاريخ هي حكم على التعلم الذي تمثله دروس التاريخ، بناءً على معيار واحد: المعرفة التاريخية.
في هذه الحالة، هناك تطابق مباشر بين محتوى الاختبار والمعيار. من ناحية أخرى، فإن الاختبارات من هذا النوع غير كافية تمامًا لإجراء تنبؤ أوسع. في الواقع، لعدم القدرة على تحديد معايير النجاح للمدرسة الحديثة، فيما يتعلق بغرضها الثلاثي: توجيه، تعليم، توجيه، هذه الاختبارات تقيس فقط الجوانب الأكثر ميكانيكية للتعليم، الجوانب الوحيدة التي يمكن التحقق منها. لأن فقط التي تحددها معايير محددة.
المعيار الخارجي.
التوقعات تتطلب صلاحية خارجية. يجب أن يحتوي المعيار على عناصر على غرار تلك الموجودة في عناصر الاختبار، يجب أن تكون “مشبعة” بنفس العوامل. يجب أن تحتوي السرعة المطلوبة في المهنة على نفس مكونات السرعة المقاسة في المختبر. تكمن الصعوبة الكبرى في إيجاد معيار خارجي يمكن إدراكه بموضوعية. كيف تحدد السرعة؟ ما القرائن للاحتفاظ بها؟ ألا نجازف بالخلط بينه وبين العصبية؟
سنواجه نفس هذه الصعوبة مع مقاييس المواقف، والتي غالبًا ما تكون مكتفية بمعيار داخلي 1. متخليةً عمليًا عن أي توقع، فهي معنية بشكل خاص بالصلاحية على مستوى أحادية البعد للعناصر، أي، وهذا يعني أن هذه تتعلق فقط بالموقف المتوخّى. من الواضح أن هذا الحذر وهذا التقييد غير واردين في حالة الاختبارات، لأن التنبؤ هو هدفها الجوهري. إن الارتباط بين عنصر الاختبار ومعيار النجاح في الواقع أمر لازم وأساسي.
معامل الصلاحية.
درجة التوافق بين تصنيف الأفراد حسب المعيار والتصنيف من خلال الاختبار (الارتباط المتحصل رياضياً بين سلسلتي النتائج) يشكل معامل الصحة. إذا كان الارتباط صفريًا أو ضعيفًا جدًا، فذلك لأن الترتيب مقارنة بالاختبار ومقارنة بالمعيار يعتمد على عوامل مختلفة، إذا كان متوسطًا، يمكن تقديم عدة تفسيرات: ظروف سيئة لإجراء الاختبار، هدف تقدير ضئيل للغاية المعيار، وما إلى ذلك…
سيضطر عالم القياس النفسي إلى البحث عن هذه الأسباب. بجانب الأخطاء الفنية، التي يمكن أن تتسلل في جميع مراحل الاختبار، توجد “الأخطاء النسبية”. إنها موجودة فقط وفقًا لما يسعى إليه المرء ويمكن أن يأتي من الاختبار الذي لا يقيس القابلية جيدًا أو من المعيار الخارجي سيِّءِ التحديد.
لنتخيل شخصًا يعمل بشكل سيئ في المهنة التي تمت إحالته إليها. قد تكون الاختبارات غير كافية، أو تفشل في عكس قدرات الشخص المعني، أو قد تكون الأخطاء قد تسللت إلى نتائج الاختبارات. قد يأتي الخطأ أيضًا من التحليل غير الكافي للمهنة ومن الصفات المطلوبة للنجاح فيها.
وبالتالي، فإن الصلاحية ليست دالة للاختبار، ولكنها دالة على الاستخدام الذي يتوخى الاختبار من أجله. هذه هي المشكلة الكبرى لمحتوى الاختبار، والتي يجب أن تكشف عما نبحث عنه: أهلية الفرد، وفقًا لما يفترض أن يكون مفيدًا، وللقابلية نفسها، هي عامل النجاح في الواقع.
[1] تعريف معتمد من الجمعية الدولية لعلم النفس التقني في 1933. المعجم النفسي، ط2، باريس، م، ج، ف.
[2] (15).
[3][3] مذكور في (3).
[4] (18). ص. 473.
[5] تحاول هذه الأخيرة ألا تستعين بمعارف مدرسية
[6] أكثر من 8 ملايين رجل في الولايات المتحدة أجروا اختبارات التصنيف العام للجيش.
[7] راجع. رقم 743 وما بعده.
[8] الفرضيات تحدد قيمة الاختبار، لكن قيمته الخاصة ترتبط بحالة المعارف النفسية والنظريات التي تنهض عليها.
[9] (11)والجدول أدناه.
[10] نزع القشرة، خلع الرباعية، معامل الذكاء.(QI).
[11] راجع ملحق الإحصاء.