محافظ المنوفية يكرم 3طلاب عثروا على مبلغ مالي كبير ويهديهم مكافآت
محافظ الدقهلية: لن نتهاون مع أي صور للعنف أو التنمّر ضد المرأة
كيف يؤدي المريض الصلاة؟.. الأزهر للفتوى يوضح
فاز بـ كأس الدنمارك.. من هو توماسبيرج مدرب الأهلي الجديد؟
تدفق كبير للقوافل المصرية عبر رفح محملة بالمساعدات الإنسانية إلى غزة
قطاع المعاهد الأزهرية يطلق تطبيق القارئ الإلكتروني للمصحف الشريف
سلامة الغذاء: 185 ألف طن صادرات غذائية مصرية إلى 180 دولة في أسبوع
الزراعة: التوجه نحو الاقتصاد الأخضر ضرورة ملحة لمواكبة المتغيرات العالمية
الحبس 6 أشهر عقوبة إرسال العديد من الرسائل الإلكترونية لشخص دون موافقته
الداخلية تكشف ملابسات فيديو مطاردة "توك توك" مسروق بالإكراه في الجيزة
وزير خارجية إيران: نرفض إعادة تفعيل قرارات منتهية بموجب القرار "2231"
تصاعد الحرب في غزة.. مصر تواصل دورها السياسي والإغاثي دعماً للشعب الفلسطيني
آبل تطور نموذج ذكاء اصطناعي جديد لفهم الصور وتوليدها بقدرات مزدوجة

في خطوة جديدة نحو تعزيز قدراتها في الذكاء الاصطناعي، تعمل شركة آبل Apple على تطوير نموذج متعدد الوسائط يحمل اسم Manzano، وهو اسم يترجم إلى “شجرة التفاح” بالإسبانية، ليكون قادرا على فهم الصور وتوليدها في آنٍ واحد، وهي مهمة تقنية معقدة لا تزال تشكل تحديا لغالبية النماذج مفتوحة المصدر.

نموذج ذكاء اصطناعي جديد لفهم الصور وتوليدها بقدرات مزدوجة

كشفت آبل عن تطوير نموذج الذكاء الاصطناعي Manzano، وهو مصمم للتعامل مع الصور من خلال فهمها وتوليدها في آن واحد. 

يعد هذا النوع من النماذج من التحديات التقنية المعقدة، حيث عادة ما تجد النماذج مفتوحة المصدر نفسها مضطرة للاختيار بين إحدى الميزتين فقط، إما تحليل الصور بدقة أو توليدها بجودة عالية، أما النماذج التجارية مثل تلك التي تقدمها OpenAI أو جوجل، فقد نجحت في الجمع بين المهمتين.

النموذج لم يتم إطلاقه بعد للجمهور، ولا توجد أي نسخة تجريبية أو واجهة تفاعلية متاحة، لكن آبل نشرت ورقة بحثية تضمنت عينات لصور منخفضة الدقة تم توليدها عبر Manzano لتحديات معينة، وقارنتها مع نتائج نماذج أخرى مفتوحة المصدر وتجارية. 

إحدى المشكلات التي تحاول آبل معالجتها تكمن في كيفية معالجة النماذج للصور: فبينما يعتمد الفهم على بيانات مستمرة، يتطلب التوليد بيانات رمزية، هذا التعارض يجعل من الصعب على نموذج واحد التفوق في كليهما.

ولحل هذه المشكلة، اعتمدت أبل تصميما هجينا في Manzano، يجمع بين نوعين من التمثيلات داخل وحدة تشفير واحدة، هذا يسمح للنموذج بتحليل الصور باستخدام الرموز المستمرة وتوليدها باستخدام الرموز المنفصلة، مما يقلل من الصراع الداخلي في المهام المختلفة. 

النموذج الجديد مبني على بنية من ثلاثة مكونات: وحدة ترميز هجينة، نموذج لغوي موحد، ووحدة لفك التشفير خاصة بالصور.

دربت آبل النموذج باستخدام كميات ضخمة من البيانات تشمل مليارات الأزواج من النصوص والصور، بعضها مأخوذ من مصادر صناعية مثل DALL· E 3 وShareGPT-4o، ووصل عدد الرموز المستخدمة في التدريب إلى 1.6 تريليون. 

في اختبارات الأداء، سجل Manzano نتائج متميزة في معايير تحليل الوثائق والرسوم البيانية، وتفوق على نماذج معروفة، خاصة في النسخ الأكبر منه.

ورغم هذا التقدم، تعترف آبل أن نماذجها الأساسية لا تزال متأخرة عن المنافسين مثل OpenAI، ما دفعها إلى التعاون معهم لاستخدام GPT-5 في ميزة Apple Intelligence، القادمة ضمن تحديث iOS 26، ورغم أن Manzano يظهر تطورا تقنيا كبيرا، إلا أن قدرته على تقليل اعتماد آبل على الشركات الأخرى ستتضح فقط مع التحديثات المستقبلية.

آبل ذكاء اصطناعي Manzano تحديث iOS 26

