مفاجأة صينية.. نموذج DeepSeek للذكاء الاصطناعي كلف 294 ألف دولار فقط

أعلنت شركة ديب سيك DeepSeek الصينية الناشئة في مجال الذكاء الاصطناعي أنها أنفقت 294 ألف دولار فقط لتدريب نموذجها اللغوي المتقدم R1، في خطوة لافتة من شأنها إعادة إشعال الجدل حول موقع الصين في السباق العالمي لتطوير تقنيات الذكاء الاصطناعي.

جاء هذا الكشف النادر في بحث علمي محكم نشر في مجلة Nature يوم الأربعاء، ويعد أول تقدير رسمي تعلنه الشركة لتكلفة تدريب نموذج DeepSeek R1.

تكلفة منخفضة وتأثير عالمي

في يناير الماضي، أعلنت DeepSeek عن إطلاق نماذج ذكاء اصطناعي منخفضة التكلفة، مما دفع بأسهم شركات التكنولوجيا للهبوط وسط مخاوف من تهديد هذه النماذج لهيمنة لاعبين كبار مثل إنفيديا وOpenAI، ومنذ ذلك الحين، توارت الشركة إلى حد كبير عن الأنظار، رغم إصدارها بعض التحديثات التقنية المحدودة.

ووفقا للمقال المنشور، استخدم في تدريب النموذج 512 وحدة معالجة رسوميات من نوع Nvidia H800، وهي شرائح مخصصة للسوق الصينية بسبب القيود الأمريكية على تصدير شرائح H100 وA100 الأكثر تقدما.

وأوضحت الشركة أنها استخدمت في المراحل التحضيرية شرائح A100، لكنها اعتمدت لاحقا على H800 في تدريب النموذج الأساسي لمدة 80 ساعة فقط.

الاستفادة من النماذج القائمة

كما ردت الشركة بشكل غير مباشر على اتهامات أمريكية بأنها قامت بـ تقطير نماذج OpenAI في نماذجها الخاصة، وأكدت DeepSeek أن التقطير يسمح ببناء نماذج أكثر كفاءة بتكلفة أقل، ما يجعل تقنيات الذكاء الاصطناعي أكثر شمولا وقابلية للاستخدام.

وذكرت الشركة أن بعض بيانات تدريب الإصدار الثالث من نماذجها V3، تضمنت صفحات ويب تحتوي على إجابات منشأة من نماذج OpenAI، ما يعني أن نموذجها قد يكون “استفاد بشكل غير مباشر” من تقنيات منافسة.

تكشف DeepSeek عن نهج صيني مختلف لتطوير الذكاء الاصطناعي يعتمد على التكلفة المنخفضة، والاستفادة من المصادر المفتوحة، وتقنيات التقطير، مما يفتح الباب أمام منافسة متزايدة مع عمالقة الصناعة في الولايات المتحدة.

