منظمة العفو الدولية

أداة الذكاء الاصطناعي الجديدة من فيسبوك تحول الصورة ثنائية الأبعاد إلى نماذج ثلاثية الأبعاد

أداة الذكاء الاصطناعي الجديدة من فيسبوك تحول الصورة ثنائية الأبعاد إلى نماذج ثلاثية الأبعاد

عندما يتعلق الأمر بتقدير نموذج ثلاثي الأبعاد من مصادر ثنائية الأبعاد ، فإننا نواجه زاوية بسبب التعارض بينهما سعة الذاكرة و صحة. نحن بحاجة إلى قدر مستدام من تدفق البيانات للحفاظ على سياق عالٍ لأجهزتنا بينما تعد الدقة العالية ضرورية لتقديم عروض دقيقة مع الشبكات العصبية. حتى الآن ، فضلت التطبيقات في هذا المجال المدخلات منخفضة الدقة لتغطية مساحة أكبر بشكل عام. تأخذنا هذه الدراسة قفزة للأمام إلى أرضية وسط مريحة.

يعالج Facebook Research هذه المشكلة من خلال اعتماد نظام تحليل متعدد الطبقات. يأخذ التحليل الخام الصورة بأكملها ، مع التركيز على المنطق الشامل لما هو المكان. المستوى الثاني يأخذ بيانات الإخراج من هنا لاستخدامها كخريطة طريق ويجمع ملف هندسة أكثر تفصيلاً بمساعدة الصور عالية الدقة.

انظر أيضًا: ما هو التعلم العميق ولماذا هو أكثر أهمية من أي وقت مضى؟

هذا البحث ليس المسعى الوحيد في هذا المجال. يمكن للرقمنة البشرية أن تفتح الباب للعديد من الاحتمالات لمجموعة متنوعة من المجالات مثل التصوير الطبي إلى الواقع الافتراضي لمجرد عرض رموز تعبيرية ثلاثية الأبعاد مخصصة. حتى يومنا هذا ، كانت هذه التقنية محدودة لعامة الناس بسبب قيود مثل الحاجة إلى كاميرات متعددة ومتطلبات الإضاءة الصارمة. يهدف الفريق في بحث Facebook إلى تحقيق نظام عرض مرن للغاية يمكنه الحفاظ على دقة عالية عندما يتعلق الأمر بتفاصيل مثل طيات في الملابسوالأصابع والفروق الدقيقة في ملامح الوجه.

التكنولوجيا الموجودة سابقًا

مثال بارز ، SCAPE ، نُشر في 2005 ، وظف ستانفورد شبكات مسبقة الصنع على مدخلات الصورة لإنتاج عروض ثلاثية الأبعاد. بينما تظهر هذه التفاصيل من تلقاء نفسها ، هم لم يمثله بأمانة ما كانوا يصممونه. في هذا المشروع ، ومع ذلك ، لا يتم فرض هندسة ثلاثية الأبعاد على الصور ، بدلاً من ذلك ، يتم تطبيق السياق الهندسي على مستويات أعلى دون وضع افتراضات سابقة لأوانها. بمعنى ، من المدخلات الخشنة إلى التحليل التفصيلي ، يتم تنفيذ التفاصيل المفقودة بشكل تدريجي ويتم التحديد النهائي للخصائص الهندسية للنموذج فقط في المستوى النهائي.

الجانب الخلفي

لكن ماذا عن المؤخر؟ يبقى غير مرئي في إعادة بناء صورة واحدة. المعلومات المفقودة تعني بالتأكيد عدم وضوح التقديرات ، أليس كذلك؟ حسنًا ، تغلب الفريق على هذه المشكلة من خلال تحديد الأعراف الخلفية ، على حد تعبيرهم: "لقد تغلبنا على هذه المشكلة من خلال الاستفادة من شبكات الترجمة من صورة إلى صورة لإنتاج الأعراف المؤخرة. إن تكييف استدلال الشكل المحاذي متعدد المستويات مع سطح الجانب الخلفي المستنتج بشكل طبيعي يزيل الغموض ويحسن بشكل كبير الجودة الإدراكية لعمليات إعادة البناء لدينا بمستوى أكثر اتساقًا من التفاصيل ".

إذا كنت مهتمًا ، فقد استبعدوا مجموعة أدوات الاختبار الذاتي في Google Colab ، على الرغم من أنها تتطلب قدرًا معينًا البراعة التقنية وفهم أساسي لـ بيئات البرمجة يهرب.


شاهد الفيديو: تحويل الصورة العادية الى صورة ثلاثية الابعاد 3D متحركة بإستخدام Photoshop, After Effects (كانون الثاني 2022).