بثانية واحدة.. أبل تطلق نموذج يحوّل الصور ثنائية الأبعاد إلى ثلاثية
في خطوة جديدة تعكس تسارع استثماراتها في مجال الذكاء الاصطناعي، أعلنت شركة أبل عن إطلاق نموذج تقني متقدم يُدعى SHARP، قادر على تحويل صورة ثنائية الأبعاد إلى مشهد ثلاثي الأبعاد واقعي خلال أقل من ثانية.
ويمثل هذا النموذج قفزة نوعية في مجال الرؤية الحاسوبية وتوليد المحتوى ثلاثي الأبعاد، إذ يمكّن المطورين والباحثين والمبدعين من إعادة تشكيل الصور بشكل أكثر عمقًا وواقعية، دون الحاجة إلى التقاط عدة صور أو استخدام أجهزة خاصة.
وتأتي هذه التقنية في إطار جهود أبل المتواصلة لتعزيز أدوات الذكاء الاصطناعي وتوفير حلول مبتكرة تساعد على تطوير التطبيقات والمحتوى الرقمي بشكل أسرع وأكثر دقة.

طريقة العمل؟
يستند نموذج SHARP إلى تدريب شبكة عصبية عميقة على بيانات ضخمة من صور واقعية وصور صناعية، تعلمت من خلالها الأنماط الهندسية والعمق في المشاهد.
وعند إعطاء صورة واحدة فقط، يقوم النموذج بتقدير العمق والمكوّنات الهندسية للصورة، وتوقع ملايين من العناصر الثلاثية الأبعاد التي تمثّل الألوان والإضاءة في المكان.
بعد ذلك يقوم النموذج بتركيب المشهد ثلاثي الأبعاد بحيث يمكن عرضه من زوايا رؤية متعددة بشكل واقعي وسلس. وهذه الطريقة تختلف تمامًا عن أساليب النماذج التقليدية التي تتطلب عشرات أو مئات الصور من زوايا مختلفة لإنشاء نموذج ثلاثي الأبعاد.

أداء استثنائي
من أبرز ميزات تقنية SHARP أنها تعمل بسرعة فائقة، إذ تعيد بناء المشهد الثلاثي الأبعاد في أقل من ثانية واحدة على بطاقة رسومية قياسية، مقارنة بأساليب سابقة كانت تستغرق وقتًا أطول.
وتظهر النتائج الأولية أن النموذج يتفوق على الحلول السابقة في دقة التجسيد وتقليل الأخطاء البصرية، مع الحفاظ على مقاييس واقعية للمسافات والأحجام داخل المشهد.
حدود وإمكانيات
رغم قدراته المذهلة، هناك حدود لما يمكن لـ SHARP إنجازه. فهو قادر على إعادة بناء المشاهد من زوايا قريبة نسبيًا لنقطة الالتقاط الأصلية للصورة فقط، ولا يمكنه تخمين أو إنشاء أجزاء من المشهد غير موجودة في الصورة الأصلية.
وهذا التصميم هو ما يتيح له السرعة العالية، لكنه يعني أيضًا أن النموذج لا يمكن أن يولّد لقطات ثلاثية كاملة من منظور بعيد أو خيالي لم يظهر في الصورة.
ونشرت أبل الشفرة المصدرية لـ SHARP على منصة GitHub، مما يفتح الباب أمام المطورين والباحثين لتجربة النموذج وتطويره في تطبيقات متعددة.
وبدأ المجتمع التقني بالفعل في مشاركة نتائج واختبارات على الشبكات الاجتماعية، معربين عن إعجابهم بالقدرات التي يوفرها النموذج في تحويل الصور العادية إلى مشاهد حية ثلاثية الأبعاد.
نقلاً عن: إرم نيوز
