OpenAI تطلق ChatGPT Image 2.0 بقدرات تفكير وبدقة غير مسبوقة
كشفت شركة OpenAI الرائدة في مجال الذكاء الاصطناعي عن أحدث ابتكاراتها في عالم توليد الصور، حيث أطلقت نموذجًا جديدًا يحمل اسم ChatGPT Image 2.0. يأتي هذا الإطلاق بعد أيام قليلة من تعليق العمل على نموذج Sora لتوليد الفيديو، في خطوة تؤكد تركيز الشركة على تعزيز قدراتها البرمجية لتلبية الطلب المتزايد على أدواتها
يتميز ChatGPT Image 2.0 بقدرته الفائقة على إنتاج صور دقيقة وجاهزة للاستخدام الفوري، متجاوزًا العديد من التحديات التي واجهت النماذج السابقة. وبحسب الشركة، فإن هذا النموذج الجديد يتبع التعليمات بدقة متناهية، ويربط بين العناصر المختلفة بسلاسة، بل ويتضمن النصوص داخل الصور بشكل احترافي.
مزايا وقدرات ChatGPT Image 2.0
صرحت OpenAI في منشور مدونتها أن نموذجها الجديد لتوليد الصور يمتلك حسًا فنيًا وذوقًا بصريًا فريدًا، مما يجعله قادرًا على إنتاج صور تبدو “أقل اعتمادًا على الذكاء الاصطناعي وأكثر تصميمًا بعناية”. كما يتيح النموذج إمكانية إنشاء صور بنسب أبعاد مختلفة، مما يوفر مرونة أكبر للمستخدمين.
قدرات التفكير المتقدمة
بعد فترة طويلة من الاختبار المكثف، أصبح ChatGPT Image 2.0 متاحًا الآن لجميع مستخدمي ChatGPT وCodex. ويُعد هذا النموذج الأول من نوعه الذي تطلقه OpenAI مزودًا بقدرات التفكير، مما يرفع من مستوى تفاعله مع المستخدمين.
عند تفعيل وضع التفكير أو الوضع الاحترافي في ChatGPT، يصبح Image 2.0 قادرًا على:
- البحث في الإنترنت عن معلومات فورية.
- إنشاء صور متعددة ومختلفة من طلب واحد.
- التحقق من مخرجاته لضمان دقتها.
تتوفر هذه المخرجات المتقدمة المدعومة بتقنيات الذكاء الاصطناعي لمستخدمي اشتراكات ChatGPT Plus وPro وBusiness.
تحسينات في سهولة الاستخدام ودقة التفاصيل
رغم أن توليد الصور بالذكاء الاصطناعي ليس جديدًا، إلا أن المستخدمين غالبًا ما واجهوا صعوبة في التعامل مع المخرجات التي لم تكن دائمًا تعكس المعنى المقصود بدقة. تأتي OpenAI بـ Image 2.0 لتقدم منتجًا عمليًا وقابلًا للاستخدام، قادرًا على عرض عناصر دقيقة مثل:
- النصوص الصغيرة.
- الرموز.
- عناصر واجهة المستخدم.
- التركيبات المعقدة.
- القيود الأسلوبية الدقيقة.
عرض توضيحي وتجربة واقعية
نشرت OpenAI على منصة X عرضًا توضيحيًا لـ ChatGPT Image 2.0، شمل لقطة شاشة لمحادثة ChatGPT مع تعليق يؤكد أنها ليست لقطة شاشة فعلية، بل صورة مولدة توضح عناصر واجهة ChatGPT على نظام macOS. تستفيد OpenAI من نجاح نموذج GPT-40 في توليد الصور، والذي اكتسب شهرة واسعة.
دعم أقوى للنصوص وتعدد اللغات
تجاوزت OpenAI مشكلة الأخطاء الإملائية والنحوية الشائعة في النصوص داخل الصور. يؤكد نموذج Image 2.0 على فهمه متعدد اللغات، مع تحقيق تقدم ملحوظ في اللغات غير اللاتينية.
يمكن للنموذج الآن عرض النصوص باللغات التالية بدقة:
- اليابانية.
- الكورية.
- الصينية.
- الهندية.
- البنغالية.
يُتوقع أن يفيد هذا النموذج بشكل كبير المبدعين، مثل مؤلفي الكتب والقصص المصورة، حيث سيقوم بإنجاز جزء كبير من العمل تلقائيًا. يمكن للمستخدمين طلب إنشاء مجموعة متناسقة من ثمانية مخرجات دفعة واحدة، مع بناء ترابط تلقائي للشخصيات والأشياء.
في وضع التفكير، يمكن لـ Image 2.0 إنشاء صور متعددة ومختلفة في آن واحد، مع إمكانية تحديد نسب أبعاد ولغات مختلفة، مما يفتح آفاقًا جديدة للإبداع الرقمي.


تعليقات