تعرف على مزايا chatgpt images 1.5 لإنشاء الصور من openai
أطلقت شركة OpenAI إصداراً جديداً من أداة إنشاء الصور داخل ChatGPT تحت اسم ChatGPT Images، مدعومًا بنموذجها الأحدث والأقوى لتوليد الصور GPT Image 1.5، في خطوة تصفها الشركة بأنها نقلة نوعية في قدرات الذكاء الاصطناعي الإبداعي، سواء من حيث الدقة، أو سرعة التنفيذ، أو سهولة الاستخدام.
وقالت OpenAI إن الإصدار الجديد يوفّر مساحة إنشاء جديدة بالكامل، تتيح للمستخدمين تحويل أفكارهم البصرية إلى صور أقرب ما تكون لما يتخيلونه، سواء عبر إنشاء صور من الصفر أو تعديل صور قائمة.
وأوضحت الشركة، في بيان، أن النموذج الجديد قادر على تنفيذ تعديلات دقيقة للغاية مع الحفاظ على التفاصيل الأساسية للصورة، مثل الإضاءة والتكوين العام وملامح الأشخاص، إلى جانب تسريع عملية توليد الصور بما يصل إلى 4 أضعاف مقارنة بالإصدار السابق.
وكشفت OpenAI عن تجربة جديدة مخصصة للصور داخل ChatGPT، تحمل اسم Images، صُممت لجعل إنشاء الصور أكثر متعة وسلاسة، ولتحفيز الإلهام الإبداعي وتقليل الجهد المطلوب في كتابة الأوامر النصية، عبر توفير قوالب جاهزة وأنماط شائعة وأفكار متداولة يمكن للمستخدم الاختيار منها مباشرة.
وأكدت الشركة أن نموذج GPT Image 1.5 بدأ طرحه، الثلاثاء، لجميع مستخدمي ChatGPT، كما أصبح متاحًا أيضًا عبر واجهة البرمجة API، في حين يجري إطلاق تجربة Images الجديدة داخل ChatGPT لمعظم المستخدمين حاليًا، على أن يصل الدعم الكامل لحسابات Business وEnterprise في مرحلة لاحقة.
نموذج جديد
أوضحت OpenAI أنه في ما يتعلق بتحرير الصور، أصبح النموذج الجديد أكثر التزامًا بنيّة المستخدم عند طلب تعديل صورة قائمة، إذ بات ينفّذ التعليمات المطلوبة بدقة عالية ويركز على التفاصيل الصغيرة، مع تغيير العناصر المطلوب تعديلها فقط، والإبقاء على باقي مكونات الصورة كما هي.
ويشمل ذلك الحفاظ على الإضاءة، وتناسق الألوان، وزوايا التصوير، وملامح الوجوه، بما يضمن اتساق النتائج عبر التعديلات المتكررة.
وترى الشركة أن هذه التحسينات تفتح الباب أمام استخدامات أكثر واقعية وفائدة، مثل تحسين تعديلات الصور اليومية، وتجربة الملابس وتسريحات الشعر بشكل أكثر إقناعًا، إلى جانب تطبيق الفلاتر الأسلوبية والتحويلات المفاهيمية التي تحافظ على جوهر الصورة الأصلية.
وبهذا يمكن للنموذج أن يتحول إلى “استوديو إبداعي في الجيب”، يجمع بين التعديلات العملية وإعادة التخيل الفني، بحسب وصف OpenAI.
وأشارت OpenAI إلى أن النموذج يتفوّق في أنواع متعددة من عمليات التحرير، بما في ذلك الإضافة والحذف والدمج والمزج وإعادة ترتيب العناصر داخل الصورة، بما يسمح بالحصول على التغييرات المطلوبة دون فقدان السمات التي تمنح الصورة طابعها المميز.
واستعرضت الشركة أمثلة عدة توضح كيف يمكن الانتقال من صورة واحدة إلى سلسلة طويلة من التغيرات المتتابعة، مع الحفاظ على الاتساق البصري العام.
وفي جانب التحويلات الإبداعية، أكدت OpenAI أن قدرات النموذج تظهر بوضوح عند تنفيذ التحويلات التي تغيّر أو تضيف عناصر جديدة، مثل النصوص، لإحياء الأفكار بصريًا مع الحفاظ على التفاصيل الأساسية.
وتعمل هذه الميزة مع المفاهيم البسيطة والمعقدة على حد سواء، ويمكن تجربتها بسهولة من خلال الأنماط الجاهزة والأفكار المسبقة داخل تجربة Images الجديدة، دون الحاجة إلى كتابة أوصاف نصية مطولة.
في ما يتعلق بتنفيذ التعليمات، شددت الشركة على أن GPT Image 1.5 أكثر قدرة من الإصدار الأول على اتباع التعليمات بدقة، سواء في التعديلات التفصيلية أو في إنشاء تكوينات أصلية معقدة تتطلب الحفاظ على علاقات محددة بين العناصر، مثل ترتيبها ضمن شبكات أو مشاهد متعددة الطبقات.
وفي ما يتعلق بعرض النصوص داخل الصور، قالت OpenAI إن النموذج يحقق تقدمًا إضافيًا في هذه النقطة، إذ أصبح قادرًا على التعامل مع نصوص أكثر كثافة وأحجام أصغر بدرجة أوضح وأكثر دقة، وهو ما يعد عنصرًا حاسمًا في تصميم الملصقات والمواد الإعلانية والإنفوجرافيك والمحتوى التحريري المرئي.
وأضافت الشركة أن النموذج الجديد يتضمن تحسينات إضافية تتعلق بجودة المخرجات النهائية، من بينها التعامل الأفضل مع المشاهد التي تضم عددًا كبيرًا من الوجوه الصغيرة، وتحسين الواقعية العامة للصور، وتقليل العيوب البصرية مثل الوهج غير الطبيعي أو فقدان التركيز.
قيود الأداء
ورغم هذه القفزة، أقرت OpenAI بوجود قيود لا تزال قائمة، موضحة أنها أعادت اختبار العديد من الأمثلة التي استخدمتها في الإطلاق الأول لتوليد الصور، ولاحظت تحسنًا واضحًا في الأداء عبر نطاق واسع من الحالات، إلا أن النتائج لا تزال غير مثالية.
وأشارت إلى أن بعض الأنماط الفنية، والتعامل مع عدد كبير من الوجوه، ودعم بعض اللغات، مثل الصينية والعربية والعبرية، لا تزال تمثل تحديات تحتاج إلى مزيد من التطوير في الإصدارات المستقبلية.
خفض التكلفة للمطورين
على صعيد واجهة البرمجة، أوضحت OpenAI أن GPT Image 1.5 يقدم جميع التحسينات نفسها المتوفرة داخل ChatGPT، مع أداء أقوى في الحفاظ على ملامح الصور والعناصر البصرية عبر التعديلات، ما يجعله مناسبًا بشكل خاص لأعمال التسويق وبناء الهوية البصرية وتصميم الشعارات، وكذلك لشركات التجارة الإلكترونية التي تحتاج إلى توليد كتالوجات صور كاملة لمنتجاتها انطلاقًا من صورة واحدة فقط.
وأعلنت الشركة خفض تكلفة مدخلات ومخرجات الصور بنسبة 20% مقارنة بالإصدار السابق، ما يسمح للمطورين والشركات بإنتاج عدد أكبر من الصور ضمن الميزانية نفسها، ويمكن تجربة النموذج الجديد عبر OpenAI Playground، والاطلاع على معرض الأمثلة، وقراءة دليل كتابة الأوامر للحصول على أفكار إبداعية.
وأكدت OpenAI أن شركات ومؤسسات ناشئة وكبرى في مجالات الأدوات الإبداعية والتجارة الإلكترونية وبرمجيات التسويق بدأت بالفعل استخدام GPT Image 1.5، مشيرة إلى تصريحات من شركة Canva التي قالت إن النموذج الجديد أظهر تحسنًا ملحوظًا في الدقة البصرية وقابلية التوجيه والأداء عبر نطاق أوسع من الأنماط والموضوعات.
متاح للجميع
بالنسبة للإتاحة أوضحت OpenAI أن نموذج ChatGPT Images الجديد وصل إلى جميع مستخدمي ChatGPT حول العالم، ويعمل عبر مختلف النماذج دون الحاجة إلى اختيار إعدادات خاصة، فيما يظل إصدار مولد الصور السابق متاحًا كـ GPT مخصص للمستخدمين الراغبين في الاستمرار باستخدامه.
نقلاً عن: الشرق
