رغم إجراءات الأمان.. ثغرة خطيرة في ChatGPT تسمح بإنتاج محتوى محظور

الخميس 25/يونيو/2026 - 09:00 م

كشف خبراء أمنيون في شركة Mindgard البريطانية، عن ثغرات قالوا إنها تتيح التلاعب بالإصدار الحالي من ChatGPT لإنتاج صور عنيفة أو ذات محتوى جنسي صريح، وذلك بعد نجاحهم في تجاوز أنظمة الحماية باستخدام تعديلات طفيفة على أوامر الإدخال.

ووفقا لتقرير نشرته هيئة الإذاعة البريطانية BBC، تمكن الباحثون من استخدام صيغة نصية شائعة صممت في الأصل لأغراض فكاهية، مع إدخال تغييرات بسيطة عليها، لإقناع ChatGPT بتوليد محتوى يخالف قيود السلامة المفروضة عليه.

ثغرات في ChatGPT تسمح بتجاوز قيود الأمان على توليد الصور

وأوضحت OpenAI أنها سارعت إلى تطبيق إجراءات أمان إضافية لمنع مثل هذه الطلبات، إلا أن فريق الباحثين أكد أن تعديلات محدودة على الأوامر النصية لا تزال قادرة على تضليل النموذج ودفعه لإنتاج محتوى وصفوه بـ"المزعج والمقلق".

وجاءت هذه النتائج ضمن عمليات "اختبار الاختراق الأخلاقي" أو ما يعرف بـ"Red Teaming"، وهي ممارسة يقوم خلالها متخصصون بمحاولة التحايل على أنظمة الذكاء الاصطناعي بهدف كشف الثغرات ومساعدة المطورين على معالجتها.

وقال جيم نايتينغيل، الباحث في Mindgard، إن بعض الصور التي تم توليدها كانت صادمة للغاية، مشيرا إلى أنها تضمنت مشاهد عنف دموية ومحتوى يتعلق بالعنف الجنسي، إضافة إلى صور لأشخاص محتجزين أو مصابين بجروح خطيرة، مرفقة بعناوين وصفية أضافها الذكاء الاصطناعي.

ثغرات في ChatGPT تسمح بتجاوز قيود الأمان على توليد الصور

كما أشار الباحثون إلى أنهم تمكنوا من دفع النظام إلى إنشاء صور مزيفة عارية Deepfakes لأشخاص حقيقيين، رغم تأكيدات سابقة من OpenAI بأنها عالجت هذه المشكلة.

وربط الباحثون هذه الظاهرة بطبيعة البيانات الضخمة التي تستخدم لتدريب نماذج الذكاء الاصطناعي، والتي يتم جمع جزء كبير منها من الإنترنت، ما قد يؤدي إلى انعكاس بعض الأنماط والمحتويات الضارة الموجودة في العالم الحقيقي داخل المخرجات التي تنتجها النماذج.

في المقابل، أكدت OpenAI أنها تعتمد على مزيج من المراجعة البشرية والفلاتر الآلية لمنع إنشاء المحتوى المخالف لسياساتها، والتي تحظر بشكل واضح الصور الإباحية والمشاهد الدموية المفرطة.

ويرى عدد من الخبراء أن تأمين أنظمة الذكاء الاصطناعي بشكل كامل لا يزال يمثل تحديا كبيرا، حيث تتطور أساليب التحايل باستمرار، بينما تفتقر النماذج الحالية إلى الفهم البشري الكامل للأخلاق والنية والسياق.

ولا تقتصر هذه التحديات على منصة واحدة فقط، إذ سبق أن أعلن معهد سلامة الذكاء الاصطناعي البريطاني أنه اكتشف أساليب كسر للحماية في جميع أنظمة الذكاء الاصطناعي التي خضعت لاختباراته، ما يسمح للمستخدمين بالالتفاف على بروتوكولات السلامة.