عرب لندن
نجح باحثون في جامعة ريدينغ في خداع أساتذتهم من خلال تقديم إجابات تم الرد عليها بواسطة الذكاء الاصطناعي سرًا على الامتحانات، والتي لم يتم اكتشافها خلال التصحيح وحصلت في النتيجة على درجات أفضل من الطلاب الحقيقيين.
أنشأ المشروع هويات طلابية مزيفة لتقديم إجابات غير محررة تم إنشاؤها بواسطة ChatGPT-4 في الامتحانات المنزلية عبر الإنترنت للدورات الجامعية.
وقام مراقبو الجامعة - الذين لم يتم إخبارهم بالمشروع - بملاحظة إجابة واحد فقط من بين الإجابات الـ 33، مع حصول إجابات الذكاء الاصطناعي المتبقية على درجات أعلى من متوسط نتائج الطلاب.
وقال المؤلفون إن النتائج التي توصلوا إليها أظهرت أن معالجات الذكاء الاصطناعي مثل ChatGPT تجتاز الآن "اختبار تورينج" - الذي سمي على اسم رائد الحوسبة آلان تورينج - والقدرة على اجتيازه دون أن يكتشفه القضاة ذوو الخبرة.
وبحسب صحيفة الجارديان "The Guardian" وُصفت التجربة بأنها "أكبر وأكثر دراسة عمياء قوة من نوعها" لاستكشاف ما إذا كان يمكن للمدرسين البشريين اكتشاف الاستجابات التي تم إنشاؤها بواسطة الذكاء الاصطناعي، وحذر الباحثون أن لهذا تأثيرات كبيرة على كيفية تقييم الجامعات للطلاب.
وقال الدكتور بيتر سكارف، أحد المؤلفين والأستاذ المشارك في كلية علم النفس وعلوم اللغة السريرية في ريدينغ: "يظهر بحثنا أنه من الأهمية الدولية فهم كيف سيؤثر الذكاء الاصطناعي على سلامة التقييمات التعليمية".
وأضاف "لن نعود بالضرورة بشكل كامل إلى الامتحانات المكتوبة بخط اليد، ولكن قطاع التعليم العالمي سيحتاج إلى التطور في مواجهة الذكاء الاصطناعي".
وخلصت الدراسة إلى أنه "استنادًا إلى الاتجاهات الحالية، فإن قدرة الذكاء الاصطناعي على إظهار المزيد من الاستدلال المجرد سوف تزداد وستنخفض إمكانية اكتشافه، مما يعني أن مشكلة النزاهة الأكاديمية ستزداد سوءًا".
وقال الخبراء الذين راجعوا الدراسة إنها كانت بمثابة ناقوس خطر للامتحانات المنزلية أو الدورات الدراسية غير الخاضعة للرقابة.
وقالت البروفيسور كارين يونج، زميلة القانون والأخلاق والمعلوماتية بجامعة برمنغهام: "إن نشر اختبار ضمان الجودة الواقعي هذا يوضح بوضوح شديد أن أدوات الذكاء الاصطناعي التوليدية المتاحة بحرية وبشكل مفتوح تمكن الطلاب من الغش في المنزل ومع ذلك فإن مثل هذا الغش لا يمكن اكتشافه تقريبًا".
وتشير الدراسة إلى أنه يمكن للجامعات دمج مواد الذكاء الاصطناعي التي ينتجها الطلاب في التقييمات. وقال البروفيسور إتيان روش، وهو مؤلف آخر: "كقطاع، نحتاج إلى الاتفاق على الكيفية التي نتوقع بها من الطلاب استخدام والاعتراف بدور الذكاء الاصطناعي في عملهم. وينطبق الشيء نفسه على الاستخدام الأوسع للذكاء الاصطناعي في مجالات أخرى من الحياة لمنع حدوث أزمة ثقة في المجتمع.
ومن جهتها قالت البروفيسور إليزابيث مكرم، نائبة رئيس جامعة ريدينغ لشؤون التعليم، إن الجامعة "تبتعد" عن استخدام الاختبارات المنزلية عبر الإنترنت، وتعمل على تطوير بدائل من شأنها أن تشمل تطبيق المعرفة في إعدادات "الحياة الواقعية، والتي غالبًا ما تكون ذات صلة بمكان العمل".
قال ماكروم: “ستدعم بعض التقييمات الطلاب في استخدام الذكاء الاصطناعي وتعليمهم كيفية استخدامه بشكل نقدي وأخلاقي؛ تطوير مهاراتهم في الذكاء الاصطناعي وتزويدهم بالمهارات اللازمة لمكان العمل الحديث. وسيتم استكمال التقييمات الأخرى دون استخدام الذكاء الاصطناعي".
أما يونج يرى إن السماح باستخدام الذكاء الاصطناعي في الامتحانات في المدارس والجامعات يمكن أن يخلق مشاكله الخاصة في "تقليل مهارات" الطلاب.
وأوضح وجهة نظره: "مثلما لم يعد الكثير منا قادرين على التنقل في أماكن غير مألوفة دون مساعدة خرائط جوجل، هناك خطر حقيقي من أن ينتهي الأمر بالجيل القادم مرتبطًا بشكل فعال بهذه الآلات، وغير قادر على الانخراط في التفكير الجاد أو التحليل أو الكتابة دون مساعدة الذكاء الاصطناعي".
وفي التعليقات الختامية للدراسة، علق المؤلفون أنهم ربما استخدموا الذكاء الاصطناعي لإعداد البحث وكتابته، قائلين: “هل تعتبره غشًا؟” إذا كنت تعتبر ذلك "غشًا" ولكننا أنكرنا استخدام GPT-4 (أو أي ذكاء اصطناعي آخر)، فكيف ستحاول إثبات أننا كنا نكذب؟ وأكد متحدث باسم ريدينغ أن الدراسة "أجريت بالتأكيد من قبل البشر".