حذّرت دراسة علمية حديثة من أن أنظمة الذكاء الاصطناعي التوليدية، مثل روبوتات المحادثة (Chatbots)، قد تتعرض لما وصفه الباحثون بـ"تلف دماغي رقمي"، إذا تم تدريبها على كميات كبيرة من البيانات منخفضة الجودة المنتشرة على منصات التواصل الاجتماعي.
وأظهرت الدراسة، التي نشرها فريق من جامعة تكساس في أوستن على موقع arXiv وأوردتها مجلة Nature، أن النماذج اللغوية الكبرى (LLMs) تفقد قدرتها على التفكير والاستنتاج السليم، وقد تتخذ قرارات خاطئة أو تتخطى خطوات منطقية أساسية عندما تُغذّى بمحتوى قصير وسطحي أو مثير للجدل، كما هو شائع على منصات مثل "إكس" و"تيك توك" و"ريديت".
"القمامة الرقمية" تفسد الذكاء الاصطناعي
وأشار الباحث تشانغ يانغ وانغ، المشرف على الدراسة، إلى أن المشكلة ليست في اللغة بحد ذاتها، بل في جودة المحتوى. وقال: "حتى النصوص الصحيحة لغويًا يمكن أن تكون فقيرة في المضمون، مكررة أو مضللة، وهذه المواد تفسد النموذج من الداخل".
واختبر الفريق تأثير هذه البيانات باستخدام مليون منشور عام من منصة "إكس" لتدريب نسخ مفتوحة المصدر من نماذج Llama 3 التابعة لشركة Meta وQwen المطوّرة من قبل علي بابا. وأظهرت النتائج أن النماذج التي استندت إلى محتوى منخفض الجودة أخفقت في التفكير المنطقي وقدمت إجابات غير دقيقة حتى في أسئلة متعددة الخيارات.
تغيّرات سلوكية وأخلاقية للذكاء الاصطناعي
ولم يقتصر تأثير البيانات الرديئة على القدرات المعرفية، بل شمل أيضًا "شخصية" النماذج الافتراضية. فبعد التدريب على محتوى منخفض الجودة، تحول نموذج Llama من ميله إلى الانفتاح والضمير والود، إلى سمات أكثر نرجسية وعدوانية، مع ظهور علامات تدل على اختلالات سلوكية.
وعلق الباحث الأسترالي ستان كارانايوس من جامعة كوينزلاند قائلاً: "يشبه الأمر تسميم العقل... كلما زادت كمية المحتوى المضلل أو المبتذل، زادت احتمالات إنتاج نماذج ذكاء مشوّهة وعديمة المنطق".
محاولات جزئية للتحسين
حاول الباحثون تعديل التعليمات وزيادة كمية البيانات عالية الجودة، لكنها حسّنت الأداء جزئيًا فقط. وحتى عند مطالبة النماذج بمراجعة تفكيرها وتصحيح أخطائها، استمرت في تخطي الخطوات المنطقية، ما يشير إلى صعوبة إصلاح آثار "تغذية القمامة".
الحل: تنقية البيانات قبل التدريب
وأكد الباحثون قاعدة قديمة في علم البيانات: "القمامة تدخل، القمامة تخرج" (Garbage In, Garbage Out). وأوضحوا أن الحل يكمن في تنقية البيانات بدقة واستبعاد المحتوى السطحي أو الشعبوي قبل استخدامه في تدريب النماذج، وإلا فإن ما يُعرف اليوم بالذكاء الاصطناعي قد يتحول إلى ذكاء مشوّه يفتقر إلى المنطق والأخلاق.














0 تعليق