الكشف عن أول نموذج ذكاء اصطناعي لتوليد الصور بتجارب بصرية فريدة

في خطوة جديدة تؤكد التزامها بتعزيز حضورها في سباق الذكاء الاصطناعي التوليدي، أعلنت شركة مايكروسوفت عن إطلاق نموذجها الأول لتوليد الصور بالذكاء الاصطناعي، الذي يمثل انتقالًا استراتيجيًا مهمًا للشركة.

وكشفت شركة مايكروسوفت عن MAI-Image-1، والذي يُعد أول نموذج توليد صور عبر الذكاء الاصطناعي تطوره مايكروسوفت داخليًا تحت تصنيف Microsoft AI، وقد صُمم هذا النموذج لدمجه قريبًا في أدوات مثل Copilot وBing Image Creator، ليشكل خطوة مهمة في سعي مايكروسوفت لتعزيز قدراتها الإبداعية في مجال الذكاء الاصطناعي.
وتم الظهور العام الأول لـ MAI-Image-1 عبر منتدى LMArena، حيث دخل ضمن قائمة أفضل 10 نماذج لتحويل النص إلى صورة، ويتساءل كثيرون عما إذا كان بإمكانه منافسة نماذج مثل Google Gemini Nano Banana، لكن النتائج المبدئية تشير إلى أن مايكروسوفت تأخذ هذا التحدي على محمل الجد، ويذكر أنه منذ مطلع عام 2025، كثفت مايكروسوفت جهودها لتطوير نماذج توليد مبتكرة ضمن سلسلة Microsoft AI، بعيدًا عن تركيزها التقليدي في منصة Azure المخصصة للمؤسسات، كما شدّدت مايكروسوفت على أن النموذج لم يُصمم ليكون مجرد أداة تجريبية، بل ليُستخدم في سياقات واقعية داخل منتجاتها، ويقدم تجارب غامرة وديناميكية أكثر للمستخدمين.
إمكانيات التصوير الواقعي
عند صدوره، حل MAI-Image-1 في المرتبة التاسعة ضمن تصنيف LMArena لنماذج التحويل من نص إلى صورة، وهو ترتيب أولي مبني على اختبارات ما قبل الإصدار الرسمي، وبينما تتصدر التصنيفات نماذج مثل Gemini Nano Banana وImagen 4 و GPT-image-1، إلا أن مايكروسوفت تؤكد أن MAI-Image-1 سيُدمج في أدوات مثل Copilot و Bing Image Creator ليتيح وصولًا أوسع لقدراته.

السرعة والجودة
لم تكشف مايكروسوفت كافة التفاصيل التقنية للنموذج، لكنها أشارت إلى أنه قادر على إنتاج صور فوتوغرافية عالية الجودة في موضوعات مثل الإضاءة المعقدة، والبيئات الطبيعية، والمشاهد الإبداعية الأخرى، كما أوضحت الشركة أن النموذج يحقّق توازنًا بين السرعة والجودة، إذ يُنتج الصور أسرع مقارنة ببعض النماذج الأكبر والأبطأ.
التحديات والتطلعات
مع دخولها ميدان توليد الصور الذكي، ستواجه مايكروسوفت تحديات كبيرة في منافسة نماذج مخضرمة مثل Gemini Nano Banana من غوغل وغيرها، يعتمد التنافس على جودة الصور، سرعة المعالجة، القدرة على السيطرة على المفاتيح الإبداعية، ومدى التكامل داخل بيئة المستخدم.
لذلك، إن دمج MAI-Image-1 ضمن منتجات مايكروسوفت قد يسهّل وصول المبدعين والهواة إلى أدوات متقدمة دون الحاجة لمعرفة تقنية عميقة، وهو ما قد يلعب دورًا كبيرًا في انتشار النموذج.
لكن يبقى السؤال كم سيستغرق النموذج ليحدث تغييرات ملموسة في المشهد الإبداعي، وهل سيثبت نفسه منافسًا قويًا في الساحة التي تسيطر عليها الآن نماذج شركة غوغل وشركاء آخرون؟
نقلاً عن: إرم نيوز