قناة صدى البلد البلد سبورت صدى البلد جامعات صدى البلد عقارات Sada Elbalad english
english EN
الإشراف العام
إلهام أبو الفتح
رئيس التحرير
طه جبريل
الإشراف العام
إلهام أبو الفتح
رئيس التحرير
طه جبريل

آبل تطور نموذج ذكاء اصطناعي جديد لفهم الصور وتوليدها بقدرات مزدوجة

آبل
آبل

في خطوة جديدة نحو تعزيز قدراتها في الذكاء الاصطناعي، تعمل شركة آبل Apple على تطوير نموذج متعدد الوسائط يحمل اسم Manzano، وهو اسم يترجم إلى “شجرة التفاح” بالإسبانية، ليكون قادرا على فهم الصور وتوليدها في آنٍ واحد، وهي مهمة تقنية معقدة لا تزال تشكل تحديا لغالبية النماذج مفتوحة المصدر.

نموذج ذكاء اصطناعي جديد لفهم الصور وتوليدها بقدرات مزدوجة

كشفت آبل عن تطوير نموذج الذكاء الاصطناعي Manzano، وهو مصمم للتعامل مع الصور من خلال فهمها وتوليدها في آن واحد. 

يعد هذا النوع من النماذج من التحديات التقنية المعقدة، حيث عادة ما تجد النماذج مفتوحة المصدر نفسها مضطرة للاختيار بين إحدى الميزتين فقط، إما تحليل الصور بدقة أو توليدها بجودة عالية، أما النماذج التجارية مثل تلك التي تقدمها OpenAI أو جوجل، فقد نجحت في الجمع بين المهمتين.

النموذج لم يتم إطلاقه بعد للجمهور، ولا توجد أي نسخة تجريبية أو واجهة تفاعلية متاحة، لكن آبل نشرت ورقة بحثية تضمنت عينات لصور منخفضة الدقة تم توليدها عبر Manzano لتحديات معينة، وقارنتها مع نتائج نماذج أخرى مفتوحة المصدر وتجارية. 

إحدى المشكلات التي تحاول آبل معالجتها تكمن في كيفية معالجة النماذج للصور: فبينما يعتمد الفهم على بيانات مستمرة، يتطلب التوليد بيانات رمزية، هذا التعارض يجعل من الصعب على نموذج واحد التفوق في كليهما.

ولحل هذه المشكلة، اعتمدت أبل تصميما هجينا في Manzano، يجمع بين نوعين من التمثيلات داخل وحدة تشفير واحدة، هذا يسمح للنموذج بتحليل الصور باستخدام الرموز المستمرة وتوليدها باستخدام الرموز المنفصلة، مما يقلل من الصراع الداخلي في المهام المختلفة. 

النموذج الجديد مبني على بنية من ثلاثة مكونات: وحدة ترميز هجينة، نموذج لغوي موحد، ووحدة لفك التشفير خاصة بالصور.

دربت آبل النموذج باستخدام كميات ضخمة من البيانات تشمل مليارات الأزواج من النصوص والصور، بعضها مأخوذ من مصادر صناعية مثل DALL· E 3 وShareGPT-4o، ووصل عدد الرموز المستخدمة في التدريب إلى 1.6 تريليون. 

في اختبارات الأداء، سجل Manzano نتائج متميزة في معايير تحليل الوثائق والرسوم البيانية، وتفوق على نماذج معروفة، خاصة في النسخ الأكبر منه.

ورغم هذا التقدم، تعترف آبل أن نماذجها الأساسية لا تزال متأخرة عن المنافسين مثل OpenAI، ما دفعها إلى التعاون معهم لاستخدام GPT-5 في ميزة Apple Intelligence، القادمة ضمن تحديث iOS 26، ورغم أن Manzano يظهر تطورا تقنيا كبيرا، إلا أن قدرته على تقليل اعتماد آبل على الشركات الأخرى ستتضح فقط مع التحديثات المستقبلية.