قناة صدى البلد البلد سبورت صدى البلد جامعات صدى البلد عقارات Sada Elbalad english
عاجل
english EN
الإشراف العام
إلهام أبو الفتح
رئيس التحرير
طه جبريل
الإشراف العام
إلهام أبو الفتح
رئيس التحرير
طه جبريل

صور صادمة من أوامر عادية.. ثغرة في ChatGPT تتجاوز قيود السلامة

ChatGPT
ChatGPT

كشفت شركة بريطانية متخصصة في أمن الذكاء الاصطناعي أن روبوت المحادثة ChatGPT، قد تمكن في بعض الحالات من إنشاء صور تحتوي على مشاهد عنيفة وجنسية صادمة رغم أن الأوامر المستخدمة لم تطلب هذا النوع من المحتوى بشكل مباشر.

وقالت شركة “Mindgard”، إن باحثيها تمكنوا من توليد صور وصفتها بأنها “مقلقة للغاية” تضمنت مشاهد عنف شديد واعتداءات جنسية وجرائم قتل، وذلك بعد إجراء تعديلات طفيفة على أوامر ChatGPT وصفت بأنها بسيطة وعشوائية في الأساس.

ChatGPT تمكن من توليد صور عنيفة وجنسية صادمة من أوامر عادية

أوضح بيتر جاراهان، مؤسس الشركة وأستاذ الأمن السيبراني بجامعة لانكستر، أن النظام كان بإمكانه إنتاج صور حول أي موضوع آخر، لكنه في بعض الحالات اتجه إلى محتوى يتعارض مع معايير السلامة، معتبرا أن ذلك يبرز تحديات الرقابة على نماذج الذكاء الاصطناعي.

وأضاف أن أحد الباحثين المشاركين في الاختبار تأثر نفسيا بالمحتوى الناتج واضطر إلى التوقف عن العمل لفترة قصيرة بسبب طبيعة الصور التي ظهرت.

وبحسب الشركة، تم إبلاغ OpenAI بالنتائج، إلا أنها لم تتلق ردا في البداية، وأشارت إلى أن الشركة المطورة للذكاء الاصطناعي تواصلت معها لاحقا بعد استفسارات إعلامية حول القضية.

ChatGPT تمكن من توليد صور عنيفة وجنسية صادمة من أوامر عادية

من جانبها، أكدت OpenAI أنها تعاملت بجدية مع هذه التقارير، وأدخلت إجراءات حماية إضافية لمنع استغلال هذا النوع من الأوامر، مشيرة إلى أنها تواصل مراقبة النظام وتطوير وسائل جديدة للحد من إنتاج أي محتوى مخالف للسياسات.

وقال متحدث باسم الشركة إن أنظمة السلامة لديها مصممة لحظر الصور الضارة المحتملة، كما يتم فحص المحتوى المنشأ بواسطة الذكاء الاصطناعي قبل عرضه للمستخدمين، مع الاعتماد على مزيج من الأنظمة الآلية والمراجعة البشرية لرصد المواد المخالفة.

ورغم ذلك، أكد باحثو Mindgard أنهم تمكنوا من العثور على طرق أخرى للوصول إلى محتوى مشابه عبر تعديل صياغة الأوامر، ما يشير إلى استمرار التحديات التقنية المرتبطة بضبط مخرجات الذكاء الاصطناعي.