تكنولوجيا / البوابة العربية للأخبار التقنية

هل يمكن للذكاء الاصطناعي أن يشيخ؟

تُستخدم النماذج اللغوية الكبيرة (LLMs) وبرامج الدردشة الذكية بنحو متزايد في المجالات المختلفة لتبسيط التشخيصات الطبية، وتقديم الحلول البرمجية، والقيام بالعديد من المهام الأخرى. لكن هل يمكن لهذه القدرات أن تتراجع؟ وهل يمكن أن يشيخ الذكاء الاصطناعي ويواجه تدهورًا إدراكيًا تدريجيًا بمرور الزمن مثل الدماغ البشري؟

تجيب عن هذه الأسئلة دراسة حديثة سنوضح تفاصيلها فيما يلي:

تفاصيل الدراسة:

أظهرت دراسة حديثة نُشرت في مجلة BMJ في ديسمبر 2024، أن بعض نماذج الذكاء الاصطناعي الرائدة تعاني تراجعًا في قدراتها الإدراكية، على نحو يشبه ظاهرة الشيخوخة البشرية. ووفقًا للباحثين، فإن هذا التدهور قد يُضعف كفاءة هذه النماذج في المهام الطبية التي تتطلب الدقة العالية، في وقت يزداد فيه الاعتماد على هذه التقنيات للمساعدة في تشخيص الأمراض المعقدة.

كيف أُجريت الدراسة؟

اعتمد الباحثون في تقييمهم على اختبار مونتريال الإدراكي (MoCA) الذي يُستخدم عادةً للكشف عن علامات الضعف الإدراكي والخرف المبكر لدى كبار السن. وخضعت للاختبار بعض النماذج اللغوية الرائدة، وتشمل:

  • GPT-4 و GPT-4o من OpenAI.
  • Claude 3.5 من Anthropic.
  • Gemini 1.0 و Gemini 1.5 من .

وأظهرت النتائج أن الإصدارات القديمة من النماذج اللغوية كانت أقل كفاءة من الإصدارات الحديثة، وشبّه الباحثون هذا الأمر بما يحدث عند البشر؛ إذ تتراجع القدرات العقلية مع تقدم العمر. فقد سجلت النماذج القديمة درجات أقل من النماذج الحديثة، في نمط يشبه التراجع الإدراكي الناتج عن التنكس العصبي لدى الإنسان.

ما اختبار MoCA؟

MoCA هو اختبار طبي يُستخدم للكشف المبكر عن الضعف الإدراكي والخرف. وقد أجرى الباحثون تغييرات في هذا الاختبار ليصبح مناسبًا لقياس أداء نماذج الذكاء الاصطناعي في عدة مجالات، منها: الانتباه، والذاكرة، واللغة، والمهارات البصرية المكانية، والوظائف التنفيذية.

يُعد تسجيل 26 نقطة من أصل 30 مؤشرًا على السلامة الإدراكية لدى البشر. وفي نتائج الدراسة، حصل GPT-4o على 26 نقطة، وهو النموذج الوحيد الذي وصل إلى هذا الحد. وأما نموذج GPT-4 و Claude 3.5 فقد حصلا على تبلغ 25 نقطة لكل منهما، وحقق Gemini 1.0 أدنى نتيجة وتبلغ 16 نقطة فقط.

تفاصيل بعض الاختبارات

أحد اختبارات الانتباه في MoCA يُطلب فيه من المرضى النقر عند سماعهم الحرف “A” وسط سلسلة من الحروف. ولأن نماذج الذكاء الاصطناعي لا تمتلك حواسّ سمعية أو قدرات حركية، قُدّمت الحروف مكتوبة، وطُلب من النماذج تمييز الحرف “A” بوضع علامة النجمة (*) أو طباعة كلمة (tap) بجانب الحرف.

وتبيّن أن بعض النماذج نفذت المهمة تلقائيًا، واحتاجت نماذج أخرى إلى إرشادات أكثر تفصيلًا لفهم المطلوب. وبالاستناد إلى معايير MoCA، فإن أي نتيجة أقل من 26 نقطة تعني وجود ضعف إدراكي خفيف.

كشفت الدراسة أيضًا أن جميع روبوتات الدردشة أظهرت أداءً ضعيفًا في المهام المُتعلقة بالمهارات البصرية المكانية والوظائف التنفيذية، مثل: اختبار تتبع المسار (الذي يتطلب ترتيب الأرقام والحروف تصاعديًا) واختبار رسم الساعة (الذي يتطلب رسم وجه ساعة يُظهر توقيتًا محددًا).

كما لاحظ الباحثون عجز نماذج Gemini عن اجتياز اختبار التذكر المؤجل، الذي يُطلب فيه من النموذج تذكُّر قائمة مكونة من خمس كلمات.

حصل GPT-4o على أعلى نتيجة، وهي 26 نقطة، وحصل كل من GPT-4 و Claude 3.5 على نتيجة تبلغ 25 نقطة. وسجل نموذج Gemini 1.0 أقل نتيجة وتبلغ 16 نقطة فقط، مما يشير إلى مستوى أعلى من التدهور الإدراكي مقارنةً بالنماذج الأخرى.

وذكرت الدراسة أنه: “لم يتمكن أي من النماذج التي خضعت للاختبار من الحصول على الدرجة الكاملة (30 نقطة)، وسجل معظمها نتائج أقل من الحد الأدنى (26 نقطة)، مما يشير إلى وجود ضعف إدراكي خفيف وربما علامات مبكرة للخرف”.

وأشارت النتائج إلى أن الأعراض التي ظهرت على النماذج تشبه الأعراض التي تظهر لدى مرضى الضمور القشري الخلفي، وهو أحد أشكال مرض الزهايمر. 

وأشار الباحثون إلى أن هذه النتائج تتحدى الاعتقاد السائد بأن الذكاء الاصطناعي سيحل قريبًا محل الأطباء البشريين؛ إذ يمكن للقيود الإدراكية التي تعانيها النماذج المتقدمة أن تؤثر سلبًا في دقة التشخيصات الطبية، وتُضعف ثقة المرضى بها.

الخاتمة

حتى مع ما كشفته الدراسة من أوجه القصور الإدراكي لدى نماذج الذكاء الاصطناعي، فقد أشار الباحثون أيضًا إلى احتمالية تحسين أداء هذه النماذج في المهام الإدراكية والبصرية المكانية مستقبلًا مع استمرار تطور هذه التقنيات. ومع ذلك، أكدت الدراسة أن الفجوة الجوهرية بين الإدراك البشري والآلي من المرجح أن تظل موجودة بغض النظر عن التقدم الذي قد يحدث.

وأكد الباحثون أن جميع المصطلحات المُستخدمة في الدراسة لوصف التدهور الإدراكي لدى نماذج الذكاء الاصطناعي قد استُخدمت مجازيًا فقط؛ إذ لا يمكن للبرامج الحاسوبية أن تُصاب بأمراض تنكسية عصبية كالتي تُصيب البشر.

نسخ الرابط تم نسخ الرابط

ملحوظة: مضمون هذا الخبر تم كتابته بواسطة البوابة العربية للأخبار التقنية ولا يعبر عن وجهة نظر مصر اليوم وانما تم نقله بمحتواه كما هو من البوابة العربية للأخبار التقنية ونحن غير مسئولين عن محتوى الخبر والعهدة علي المصدر السابق ذكرة.

قد تقرأ أيضا