
قالت شركة ديب سيك (DeepSeek) الصينية، إن تدريب نموذجها R1 للذكاء الصناعي لم يتكلف إلا 294 ألف دولار، وهو ما يقل كثيراً عن الأرقام الخاصة بمنافساتها الأميركية.
جاء إعلان الشركة في ورقة بحثية، من المرجح أن تشعل الجدل من جديد حيال مكانة بكين في سباق تطوير الذكاء الاصطناعي.
ظهر هذا التحديث النادر من الشركة، التي تتخذ من هانجتشو مقراً لها، في مقال بدورية “نيتشر” (Nature) الأكاديمية نُشر الأربعاء بعد أن خضع لمراجعة النظراء، وهو أول تقدير تصدره الشركة لتكاليف تدريب النموذج R1.
دفع إصدار DeepSeek لما قالت إنها أنظمة ذكاء اصطناعي منخفضة التكلفة في يناير المستثمرين العالميين إلى التخلص من أسهم شركات التكنولوجيا، لقلقهم من أن النماذج الجديدة قد تهدد هيمنة الشركات الرائدة في مجال الذكاء الاصطناعي ومنها إنفيديا.
ومنذ ذلك الحين، توارت الشركة ومؤسسها ليانج وين فنج عن الأنظار إلى حد بعيد، باستثناء طرح بعض تحديثات المنتجات الجديدة.
استخدام شرائح إنفيديا
وجاء في مقال “نيتشر”، التي أدرجت ليانج كأحد المشاركين في إعداده، إن تدريب النموذج R1، الذي يركز على التفكير المنطقي والاستدلال تكلف 294 ألف دولار واستخدم 512 شريحة (إتش800) من التي تطورها إنفيديا. ولم تتضمن نسخة سابقة من المقال منشورة في يناير هذه المعلومات.
وكان سام ألتمان، الرئيس التنفيذي لشركة OpenAI الأميركية العملاقة للذكاء الاصطناعي قال في 2023 إن ما أسماه “تدريب النموذج التأسيسي” تكلف “أكثر بكثير” من 100 مليون دولار، على الرغم من أن شركته لم تقدم أرقاماً مفصلة لأي من إصداراتها.
وتشير تكاليف تدريب النماذج اللغوية الكبيرة، التي تشغل روبوتات الدردشة الآلية التي تعمل بالذكاء الاصطناعي، إلى النفقات المترتبة على تشغيل مجموعة من الرقائق القوية لأسابيع أو أشهر لمعالجة كميات هائلة من النصوص والأكواد.
وشككت شركات ومسؤولون أميركيون في بعض بيانات DeepSeek عن تكاليف التطوير والتكنولوجيا التي استخدمتها.
كما يُعتقد أن R1 هو أول نموذج لغوي كبير يخضع لعملية مراجعة علمية محكّمة. ويتمثل الابتكار الرئيسي لـ DeepSeek في استخدام نهج تجريبي آلي يُعرف باسم “التعلم المعزز النقي” لتطوير R1، حيث يُكافأ النموذج عند الوصول إلى إجابات صحيحة، بدلاً من تدريبه على أمثلة استدلالية مختارة من قِبَل البشر.
وتقول الشركة إن هذا النهج مكّن النموذج من تطوير استراتيجيات استدلالية ذاتية، مثل التحقق من خطواته دون اتباع أساليب بشرية محددة. ولتعزيز الكفاءة، اعتمد النموذج على تقييم محاولاته ذاتياً باستخدام تقديرات داخلية، بدلاً من استخدام خوارزمية منفصلة، وهي تقنية تُعرف باسم “تحسين سياسة المجموعة النسبية”.
نقلاً عن: الشرق