تفكير القطيع في نماذج الذكاء الاصطناعي: هل تتحدث جميعها بصوت واحد؟
كشف باحثون أن النماذج اللغوية الكبرى تتقارب في إجاباتها بصورة لافتة. شركة ناشئة أسترالية طورت نموذجاً يكسر هذه الظاهرة بإدخال تنوع استراتيجي في توليد المخرجات.

أجرِ هذه التجربة البسيطة: افتح أي نموذج لغوي وسائل اختر رقماً عشوائياً بين 1 و10. غالباً ستحصل على الرقم 7. جرّب ذلك مع نموذج آخر. النتيجة نفسها. السبب ليس صدفة.
هذا هو جوهر ظاهرة رصدها باحثون في مؤتمر NeurIPS على مدار 25 نموذجاً لغوياً مختلفاً، ووصفوها بـ"عقلية الخلية النحلية الاصطناعية". بعبارة مباشرة: النماذج اللغوية الكبيرة تميل إلى تقارب الاستجابات وإنتاج مخرجات متطابقة تقريباً رغم اختلاف تصاميمها ومصادر تدريبها.
حين طلب الباحثون من هذه النماذج صياغة استعارات عن الزمن، اجتمعت معظم الردود حول "الوقت كنهر" أو "الوقت كنسّاج". وحين طُلبت أسماء لفرق موسيقية، دارت المقترحات بين كلمات "زجاج" و"نيون" و"مخمل". هذا التكرار ليس تشابهاً في التدريب فحسب، بل انعكاس لطريقة عمل النماذج اللغوية بحد ذاتها.
ترتبط الظاهرة ارتباطاً وثيقاً بما يعرف بمعامل الحرارة، وهو ضبط رقمي يتحكم في مستوى العشوائية في مخرجات النموذج. المعامل المنخفض ينتج ردوداً منطقية لكنها متوقعة، بينما المعامل العالي يفضي إلى مخرجات أكثر تنوعاً لكنها قد تفقد تماسكها. معظم النماذج التجارية تعمل في منطقة وسطى تقلّص التنوع لصالح الجودة.
شركة Springboards الأسترالية الناشئة رأت في هذه الظاهرة فرصة لا مشكلة. طوّرت نموذجاً لغوياً أسمته "فلينت"، بنته على نموذج Qwen 3 من علي بابا الصينية، وأعادت تدريبه للتعرف على نقاط القرار في توليد النصوص وإدخال تنوع مقصود عندها.
الفارق الجوهري بين مقاربة فلينت ومجرد رفع معامل الحرارة هو الذكاء الانتقائي: لا يزيد فلينت العشوائية في كل مكان، بل يحددها استراتيجياً حيث يضيف التنوع قيمة حقيقية. أثبتت الاختبارات أن فلينت يعطي أرقاماً مثل 3.7916 حين تطلب منه رقماً عشوائياً، لا الرقم 7 المعتاد.
يطرح هذا الواقع تساؤلاً عميقاً: هل نبني منظومة معرفية عالمية ترسّخ نمطاً تفكيرياً واحداً؟ إذا بات معظم البشر يستشيرون نماذج لغوية متشابهة في قراراتهم الإبداعية، فهل نتجه نحو عالم تتآكل فيه التعددية الفكرية ببطء؟
قد تبدو المسألة نظرية في مثال الأرقام، لكنها تغدو عملية حين يتعلق الأمر بحملات تسويقية يصممها الذكاء الاصطناعي، أو تحليلات تصدرها. التشابه في الأسلوب يضعف التنوع الذي يغذي الابتكار الثقافي والعلمي.
تحمل ظاهرة التقارب هذه أبعاداً خاصة في السياق العربي؛ إذ تمثّل اللغة العربية أقل من 1% من بيانات تدريب معظم النماذج اللغوية الكبرى، مما يعني أن التنوع الثقافي العربي الضئيل في هذه البيانات يُعمّق ظاهرة التقارب ويجعل مخرجات الذكاء الاصطناعي بالعربية أقلّ أصالةً وأكثر اعتماداً على أنماط مستعارة من محتوى إنجليزي مُترجَم. يُمثّل هذا تحدياً للمبادرات التقنية العربية كمبادرة مبادر (MBZUAI) في الإمارات وجامعة الملك عبدالله للعلوم والتقنية (كاوست)، التي تسعى إلى بناء نماذج لغوية عربية أصيلة تعكس التعددية الثقافية واللغوية للعالم العربي.
النماذج الأساسية الكبرى تُدرَّب على بيانات متداخلة، وتتشارك بنى معمارية متقاربة، وتُحسَّن وفق تفضيلات بشرية تميل إلى اختيار الإجابات المألوفة. هذا الضغط التراكمي نحو الوسطية يجعل التنوع الحقيقي غير محتمل الظهور عفوياً.
المزيد من ذكاء اصطناعي

الذكاء الاصطناعي الزراعي يعد بالكثير لكن مشكلة البيانات تعرقل طريقه
تعد نماذج الذكاء الاصطناعي الزراعية بتحسين إنتاجية المحاصيل 26% وخفض استهلاك المياه 41%، لكن معظم المؤسسات الزراعية تفتقر إلى البنية البيانية الضرورية لتحقيق هذه الوعود.

كلاودفلير تلزم شركات الذكاء الاصطناعي بالدفع مقابل محتوى الناشرين
أعلنت كلاودفلير سياسة جديدة تلزم شركات الذكاء الاصطناعي بالتمييز بين زواحف البحث وزواحف التدريب قبل 15 سبتمبر 2026 أو تواجه الحجب الافتراضي على ملايين المواقع.

شركة ناشئة تطلب نشر 100 ألف قمر صناعي كمراكز بيانات في الفضاء
تقدمت شركة أوربيتال الأمريكية الناشئة بطلب إلى هيئة الاتصالات الفيدرالية لإطلاق مئة ألف قمر صناعي يعمل كل منها مركزاً للبيانات في المدار المنخفض، بهدف توفير 10 جيجاواط من قدرة الحوسبة.