طورت شركة Toshiba Corporation ذكاءً اصطناعيًا بتقنية التعرف على الأبعاد الثلاثية قادرة على قياس المسافة بدقة كاميرا ستريو ، باستخدام الصورة الملتقطة بكاميرا تجارية وتحليل تشويش الصورة الناتج عن عدسة الكاميرا باستخدام التعلم العميق. ستقضي هذه التقنية على استخدام كاميرات الاستريو مما يقلل في النهاية من التكلفة والمساحة. ستقدم توشيبا هذا الإنجاز في المؤتمر الدولي حول رؤية الكمبيوتر (ICCV2019) الذي سيعقد في كوريا الجنوبية في 30 أكتوبر 2019 ، من الساعة 10 صباحًا.
أصبح استشعار الصور أكثر أهمية وتطبيقات مثل الروبوتات المتحركة ، والمركبات ذاتية التشغيل بدون طيار ، والطائرات بدون طيار التي يتم التحكم فيها عن بعد لتفقد البنية التحتية وما إلى ذلك ، تتطلب أكثر من مجرد صور للأشياء ، فهي بحاجة إلى جهاز صغير لتحليل البيانات ثلاثية الأبعاد لتشمل الشكل والمسافة. ومن ثم تم زيادة الأبحاث لتطوير تقنية قياس باستخدام كاميرات أحادية (يسهل تصغيرها) باستخدام التعلم العميق لتعلم أفضل للشكل والخلفية وبيانات المناظر الأخرى للكائن المصور.
هذه الطريقة لها عيب. يتم تقدير دقة المسافة بمساعدة الكاميرا الأحادية اعتمادًا على بيانات المشهد التي تم تعلمها والتي تسبب انخفاضًا في الدقة بسبب اللقطات التي تم التقاطها في مناظر طبيعية مختلفة. للتغلب على هذا ، طورت توشيبا التصوير الفوتوغرافي للفتحة المصفاة بالألوان حيث يتم إرفاق مرشح لونين بالعدسة ويتم تحليل لون وحجم ضباب الصورة الناتج وفقًا للمسافة من الهدف. على الرغم من أن هذا يحل مشكلة الاعتماد على البيانات ، إلا أنه يكلف الوقت والمال لتعديل العدسات الحالية.
تغلبت توشيبا على هذه المشكلة من خلال تطوير الذكاء الاصطناعي بتقنية التعرف على الأبعاد الثلاثية التي تستخدم التعلم العميق لتحليل كيفية تشويش الصورة وفقًا لموقعها على العدسة ، من أجل تحقيق قياس المسافة بنفس الدقة العالية مثل نظام الكاميرا الاستريو.، بكاميرا أحادية عادية ولكن دون الحاجة إلى بيانات المشهد. حتى الآن ، كان يُعتبر من المستحيل نظريًا قياس المسافة بناءً على شكل التمويه ، وهو نفس الشيء بالنسبة للأشياء ذات المسافة والبعيدة عندما تكون على مسافة متساوية من النقطة المحورية. ولكن ، أظهرت النتائج التحليلية اختلافًا جوهريًا بين الأشكال الضبابية القريبة والأجسام البعيدة ، حتى أنها على مسافة متساوية من النقطة المحورية. نجحت Toshiba في تحليل البيانات الضبابية من الصور الملتقطة بواسطة وحدة التعلم العميق المدربة على نموذج الشبكة العصبية العميقة.
عندما يمر الضوء عبر العدسة ، من المعروف أن شكل التمويه الناتج يتغير اعتمادًا على الطول الموجي للضوء وموضعه في العدسة. في الشبكة المطورة ، تتم معالجة الموضع واللون بشكل منفصل لإدراك التغييرات في شكل التمويه بشكل صحيح ، وبعد ذلك ، بعد المرور عبر آلية الانتباه المرجح ، للتحكم في مكان التدرج اللوني للسطوع للتركيز من أجل قياس المسافة بشكل صحيح. من خلال التعلم ، يتم تحديث الشبكة لتقليل الخطأ بين المسافة المقاسة والمسافة الفعلية. باستخدام وحدة AI هذه ، أكدت Toshiba أن صورة واحدة تم التقاطها بكاميرا متوفرة تجاريًا تحقق نفس دقة قياس المسافة المضمونة بكاميرات الاستريو. يمكن العثور على مزيد من المعلومات على هذه الصفحة الرسمية لشركة Toshiba.
ستؤكد Toshiba تنوع النظام مع الكاميرات والعدسات المتاحة تجاريًا وتسريع معالجة الصور ، بهدف التنفيذ العام في السنة المالية 2020.