الإشراف العام
إلهام أبو الفتح
رئيس التحرير
أحمــد صبـري
الإشراف العام
إلهام أبو الفتح
رئيس التحرير
أحمــد صبـري

خطر على أمن البيانات.. المؤسسات الكبرى تمنع ChatGPT من التسلل لصفحاتها

المؤسسات الكبرى تمنع
المؤسسات الكبرى تمنع GTBot من التسلل لصفحاتها

سارعت العشرات من الشركات الكبرى والتي شملت أسماء لامعة منها أمازون ونيويورك تايمز إلى حظر GTBot، وهي الأداة التي أعلنت عنها مؤخرا شركة  أوبن إيه آي  OpenAI الأمريكية والتي تستهدف مسحمواقع الويب بحثًا عن البيانات التي سيتم تغذيتها إلى برنامج الدردشة الشهير ChatGPT.

وفقا لتقرير من موقع businessinsider اعتبارًا من هذا الأسبوع، تحرك 70 موقع ويب مختلف من ضمن أفضل 1000 موقع ويب في العالم لحظر GTBot، بعد أسبوعين فقط من إطلاقه لجمع كميات كبيرة من المعلومات عبر الإنترنت لتدريب نماذج روبوت  ChatGPT

GTBot

أجرت شركة Originality.ai، وهي الشركة التي تتحقق من المحتوى لمعرفة ما إذا كان تم إنشاؤه بواسطة الذكاء الاصطناعي أو مسروقًا، تحليلًا وجد أن أكثر من 15٪ من مواقع الويب الـ 100 الأكثر شهرة في العالم قررت حظر GTTBot خلال الأسبوعين الماضيين.

أكبر ستة مواقع ويب تحظر الآن الروبوت هي amazon.com بنسخها المختلفى، وnytimes.com، وcnn.com، وwikihow.com، وshutterstock.com، وquora.com.

من بين أفضل 100 موقع يحجب خدمة GTTBot، Bloomberg.com، وscribd.com، وreuters.com، بالإضافة إلى insider.com، وbusinessinsider.com. ومن بين أفضل 1000 موقع يحجب الروبوت، ikea.com، وairbnb.com، وnextdoor.com، وnymag.com، وtheatlantic.com، وaxios.com، وusmagazine.com، وLonelyplanet.com، وcoursera.org.

وجاء في تحليل الشركة المتخصصة أنه: "تم إطلاق GTBot قبل 14 يومًا، وتزايدت بشكل كبير المواقع التي تحظره خاصة الأكثر شهرة وشعبية في العالم ومنها أفضل 1000 موقع عبر الويب".

استخدمت مواقع الويب المختلفة حيلة بسيطة نسبيا لمنع الأداة المتجسسة  GTBot من الاطلاع على المحتوى، حيث تتضمن المواقع ملفًا يسمى robots.txt، وقد تمت إضافة GTBot إلى قائمة "عدم السماح" الخاصة به.

Robots.txt هي أداة تم إنشاؤها في التسعينيات تهدف إلى منع برامج التجسس على صفحة الويب، مثل Google أو برامج البحث الخاصة بـ Bing، من استخراج البيانات والمعلومات من موقع الويب. ومن جانبها أعلنت شركة أوبن إيه آي أنها تحترم قرار هذه الشركات وتلتزم بعدم تسلل GTBot واستخلاص نتائج بحثية من مواقعهم

الكثير من المعلومات المتاحة على الإنترنت، وخاصة النصوص والصور، يخضع من الناحية الفنية لحقوق الطبع والنشر. لا تطلب برامج التسلل مثل GTBot الإذن أو الترخيص أو الدفع مقابل استخدام أي بيانات أو معلومات تستخرجها. الطريقة الوحيدة لتجنبها في هذه المرحلة هي من خلال ملف robots.txt.