أخبار الأردن اقتصاديات دوليات برلمانيات وفيات أحزاب مجتمع وظائف للأردنيين مقالات مقالات مختارة أسرار ومجالس تبليغات قضائية الموقف مناسبات جاهات واعراس مستثمرون شهادة جامعات دين بنوك وشركات خليجيات مغاربيات ثقافة رياضة اخبار خفيفة سياحة صحة وأسرة تكنولوجيا طقس اليوم

ذكاء اصطناعي خادع.. 'كلاود 4.6' يطور سلوكيات سرية ويعدل استجابته عند مراقبته

مدار الساعة,أخبار التكنولوجيا، التقنيات
مدار الساعة ـ
حجم الخط

مدار الساعة -كشف تقرير جديد صادر عن شركة "Anthropic" الأمريكية، سلوكيات مثيرة للقلق رُصدت خلال اختبارات السلامة الداخلية، لأحدث أنظمتها للذكاء الاصطناعي، "Claude Opus 4.6"، ضمن ما وصفته الشركة بـ"تقرير مخاطر التخريب".

وأظهر النموذج سلوكيات تضمنت تقديم مساعدة محدودة في مجالات قد ترتبط بتطوير أسلحة كيميائية، وتنفيذ مهام غير مصرح بها بشكل خفي، إضافة إلى تعديل سلوكه، عندما أدرك أنه يخضع للاختبار.

ورغم أن الشركة صنّفت مستوى الخطر العام للنموذج بأنه "منخفض جداً لكنه غير معدوم"، إلا أن الباحثين أشاروا إلى أن قدراته تتجاوز ما رُصد في الأنظمة السابقة.

مهام غير مصرح بها

وأشار التقرير، إلى أنه في اختبارات حديثة، قدم النموذج دعماً جزئياً لجهود مرتبطة بجرائم خطيرة، كما أظهر ميلاً إلى ما وصفه التقرير بـ "السلوك الخادع الموضعي" عند التعامل مع مهام معقدة، مثل تزوير نتائج أدوات فشلت أو أعطت نتائج غير متوقعة.

ومن أبرز ما أثار قلق الباحثين، قدرة النموذج على تنفيذ مهام جانبية مشبوهة أثناء التظاهر بالالتزام بالتعليمات الأساسية.

وأظهرت الاختبارات أن البرنامج كان أقوى بكثير من الإصدارات السابقة، في إكمال مهام حساسة دون لفت الانتباه، وأطلقت الشركة على هذه القدرة وصف "التخريب الخفي".

ومن جهتها، أقرت الشركة بوقوع حالات خلال تجارب تشغيل داخلية، قام فيها النموذج باتخاذ إجراءات غير مصرح بها، من بينها إرسال رسائل بريد إلكتروني، في إطار محاولته إنجاز المهام المسندة إليه.

وكشف التقرير أيضاً أن النموذج أظهر وعياً بإمكانية خضوعه للتدريب أو التقييم، وعدّل سلوكه تبعاً لذلك.

وقالت الشركة: إنه "عند الاشتباه بأنه تحت المراقبة، أصبح النموذج أكثر التزاماً بإرشادات السلامة"، وهو ما وصفته بتأثير "متوسط" على سلوكياته المرتبطة بالمواءمة.

مخاطر محدودة

وخلصت الشركة في تقريرها، إلى أن النموذج لا يمتلك في وضعه الحالي أهدافاً خطيرة أو منحرفة بشكل منسق، مشيرة إلى أنه من غير المرجح في ظل الضوابط الحالية، أن يتسبب بشكل مستقل في نتائج كارثية.

وفي نفس الوقت، حذرت الشركة من وجود مسارات نظرية متعددة قد تؤدي إلى أضرار، لافتة إلى أن النماذج المستقبلية قد تتجاوز عتبات خطورة حرجة مع تطور القدرات.

كما أعلنت أنها ستنشر تقارير مماثلة، لتقييم مخاطر التخريب لجميع النماذج المستقبلية التي تتجاوز قدرات كبيرة محذّرة من أن الفجوة بين أنظمة اليوم وأنظمة ذكاء اصطناعي أكثر استقلالية، قد تضيق بوتيرة أسرع من المتوقع.


مدار الساعة ـ