من يظن أن الصور لا تكذب عليه أن يقلق بسبب الذكاء الاصطناعي

من يظن أن الصور لا تكذب عليه أن يقلق بسبب الذكاء الاصطناعي

كنتُ أعقد آمالاً كبيرة على الجيل الجديد من أدوات تحرير الصور المدعومة بالذكاء الاصطناعي. وكنتُ أرغب عبرها في بث روح إلكترونية في جدي المتوفى الذي اشتهر في عائلتي بوسامته، وكانوا يلقبونه “جيمس دين أوكيناوا”. ليس لدي سوى بضع صور بالأبيض والأسود محببة له عندما كان صغيراً، وكنتُ آمل أن أعيد كامل رونقه في هذه الصور.

كانت أدوات الذكاء الاصطناعي السابقة الرائجة تعتمد في معظمها على نماذج تحويل النصوص إلى صور، حيث تُدخل نصوصاً مثل “قطة مرقطة في الفضاء الخارجي” ثم تتلقى صورة مصطنعة سريالية. لكن سلسلة من التحديثات التقنية الحديثة حسنت قدرة تطبيقات الذكاء الاصطناعي المختلفة على معالجة الصور الموجودة دون تحويل الشخصيات إلى نسخ مشوهة وغريبة من نفسها.

فنان الذكاء الاصطناعي “دال-إي” يتحول من الإدهاش إلى الاحتراف

قد لا يكون الاختراق الاستهلاكي الحقيقي للذكاء الاصطناعي هو روبوتات الدردشة، بل أدوات كهذه تُغيّر الصور الأقرب إلينا. إذا سبق لك أن التقطت صورةً لم تظهر بالشكل المطلوب، فإنهم يعدون بإصلاح ذلك فوراً بلا حاجة إلى إعادة التصوير.

لكن الأمر يتجاوز مجرد تجميل الصور الملتقطة ذاتياً: إذ يُمكن إضافة أفراد العائلة الذين فاتتهم فرصة لمّ الشمل أو نجمكم المفضل. كما يُمكن للعلامات التجارية استبدال المنتجات التي يرتديها العارضون.

تمكنت من الحصول قبل الآخرين على إحدى أدوات تحرير ما يُسمى “الصور المرجعية” من “فيدو” (Vidu)، وهي منصة تابعة لشركة ”شينغشو تكنولوجي“ (Shengshu Technology) التي تتخذ في بكين مقراً لها وقد انبثقت عن جامعة تسينغهوا المرموقة.

للأسف، فشلت الأداة في تجربة الترميم التي أجريتها، فتركت لي نصاً مشوهاً في الخلفية وغيرت ملامح الوجه التي كنتُ آمل في الحفاظ عليها وتحسينها.

جمع لابوبو مع رئيس الصين متعذر

لكن سهولة الاستخدام كانت مذهلة. خلال ثوانٍ، أنشأتُ صورةً للرئيس دونالد ترمب وهو يحمل دمية لابوبو مبهرة من خلال دمج لقطتين منفصلتين وجدتهما على الإنترنت. (رفض التطبيق تنفيذ طلب مماثل يعرض الدمية مع الرئيس الصيني شي جين بينغ).

تدعم الأداة ما يصل إلى سبع صور مرجعية مختلفة، وتتميز بزمن وصول منخفض بشكل مدهش. حتى مع وجود بعض الثغرات، فإن إمكانية استخدام المعلنين والمستهلكين لهذه الميزة لا يمكن إنكارها.

تطبيق (Vidu) ليس الوحيد، فالمنافسة تشتد. أُطلقت الميزة الجديدة بعد فترة وجيزة من تحديث (nano banana) من ”جوجل” لنظام ”جيميني“ (Gemini) الذي أحدث ضجة كبيرة على الإنترنت. كما وسّعت منصة ”كوين“ (Qwen) التابعة لمجموعة ”علي بابا“ حديثاً عروضها لتحرير الصور. وأصدرت ”بايت دانس“ المحدودة هذا الأسبوع ردها الخاص على (nano banana) للمستخدمين المحليين لتطبيق (Doubao). في تجربتي الصغيرة، اتضح أن نموذج ”علي بابا: هو الذي نجح على أفضل وجه في إعادة الصورة التي كنت أحاول استعادتها.

سوق واعدة ومربحة

إن طلب المستهلكين حقيقي. ما يقرب من نصف أفضل 50 تطبيق ذكاء اصطناعي توليدي للجوال، من حيث عدد المستخدمين النشطين شهرياً، هي منصات لتحرير الصور أو الفيديو، وفقاً لتصنيف نشرته شركة رأس المال الاستثماري ”أندرسن هورويتز“ (Andreessen Horowitz) الشهر الماضي.

وإمكانات الإيرادات مغرية، فقد أعلنت شركة ”كويشو تكنولوجي“ (Kuaishou Technology) خلال مكالمة أرباح الشهر الماضي أنها تتوقع أن محرر الفيديو “كلينغ” التابع لها، وهو منافس وثيق لـ”فيدو”، سيضاعف إيراداته السنوية الأولية المستهدفة أو يفوق ذلك.

هناك فرصة لاستنساخك بالذكاء الاصطناعي.. لمَ لا تجرب؟

بالنسبة لمنصات التقنية الصينية التي تبحث منذ فترة طويلة عن طريق للربحية باستخدام الذكاء الاصطناعي، قد تثبت برامج تحرير الصور الموجهة للمستهلكين أنها التطبيق الأقوى، وتوفر أسرع طريق لتحقيق الربح.

لكن المخاطر لا تقل جسامة. برغم جاذبية هذه الأدوات لمهام بسيطة مثل إزالة الصور المزعجة أو تعديل الإضاءة، إلا أنها تنطوي أيضاً على احتمالية عالية لإساءة استخدامها. لقد كنا نتنقل في العصر الرقمي بحيث لم يعد التصديق حقيقة منذ فترة.

لكن حتى قبل ستة أشهر، كان أسهل بكثير رصد إشارات الصور المولّدة بالذكاء الاصطناعي- مثل أن نرى يداً لها ستة أصابع أو ما شابه. إن احتمالية الضرر تتجاوز بكثير مجرد جهات شريرة تنشر معلومات مضللة على نطاق واسع أو تحاول زعزعة ثقة الجمهور بالمسؤولين. لقد جعلت التقنية التلاعب الرقمي المُقنع أمراً بالغ الأهمية، حتى لو كانت صورة أي شخص، بما في ذلك وجوه أطفال.

قانون يمنع التلاعب

تسعى الصين إلى استباق هذا التلاعب. فقد بدأت السلطات السيبرانية تسنّ قانوناً جديداً يلزم بوضع علامات واضحة ومبنية على البيانات الوصفية لجميع المحتوى المُولّد بواسطة الذكاء الاصطناعي على الإنترنت. في بيئة رقمية مُحكمة الرقابة، يُصبح تطبيق هذه السياسات أسهل، ويقول النقاد إنه يستحيل مراقبة الإنترنت العالمي بحثاً عن محتوى مُصنّع.

لكن تطبيق هذا القانون على شبكة الإنترنت العالمية ما يزال سؤالاً مفتوحاً، وقد يُؤدي تزايد انعدام الثقة في الوسائط الرقمية إلى تدخلات أكثر صرامة في مجالات أخرى. من مصلحة صانعي السياسات وشركات التقنية وضع حواجز أمان أشد، ويمكنهم البدء بفرض الشفافية في المجالات الأكثر حساسية مثل المحتوى السياسي المُضلّل ثم بناء اللوائح التنظيمية بناءً على ذلك.

لماذا تنتشر مقاطع “التزييف العميق”؟ وهل يمكن إيقافها؟

تبرز منصات الذكاء الاصطناعي متعددة الوسائط، ذات الجذب القوي للمستهلكين، كأحد أكثر محركات الإيرادات الواعدة. ومع ذلك، فإن نافذة توسيع الربحية ستُحدد بالتنظيم والثقة بقدر ما ستُحدد بالابتكار في المنتجات.

للأسف، قد لا تُنصف الصور جيمس دين، الأوكيناواني أبداً. في حالتي، لم تكن الأدوات كافية لاستعادة الماضي. لكنها أثبتت بالفعل قدرتها على تشويه الحاضر.

نقلاً عن: الشرق بلومبرج

أحمد ناجي محرر الأخبار العاجلة بموقع خليج فايف