El ojo humano no puede ver a través de objetos opacos, pero la tecnología suele encontrar alternativas para lograr cosas que a priori parecen inviables.
Hablamos de lo que se conoce como el "periscopio computacional" o las "cámaras periscopio", una tecnología que pese a lo llamativo de su propuesta en realidad lleva varios años siendo desarrollada por ingenieros del MIT. Te explicamos en qué consiste esta técnica, qué limitaciones tienen para ver detrás de las esquinas y qué avances se han presentado a principios de este mismo año.
"Cámaras periscopio", una tecnología que lleva años en desarrollo
¿Cuál es el truco para poder ver detrás de las esquinas? La idea es muy sencilla, aunque difícil de reproducir. Las cámaras periscopio se basan en el análisis de las sombras que proyectan en las paredes cercanas. Mediante un sistema de cámaras y algoritmos complejos, se pueden transformar estas sombras en objetos y reproducirlo en la pantalla para conocer qué habría detrás de la esquina.
Los primeros sistemas se basaban en rayos láseres, pero la tecnología ha ido mejorando lo suficiente como para que con la cámara de un móvil se puedan identificar los objetos ocultos e incluso reproducir su movimiento. Todo mediante el análisis de las sombras que van proyectando.
CornerCameras es el nombre que pusieron los investigadores del MIT a su proposición de cámara periscopio. Con una grabación estándar RGB demostraron que eran posible identificar los objetos detrás de las esquinas en diversas condiciones de iluminación, superficies de materiales diferentes y tanto en interior como en exterior.
La tecnología mostrada por Katherine L. Bouman y Vickie Ye es de 2017. En aquel momento únicamente se detectaba su presencia pero no su factor forma o detalles del mismo. Una limitación, que como ahora explicaremos ha sido mejorada en los nuevos trabajos.
Los requisitos de estas cámaras son un pequeño ordenador para procesar los algoritmos y una cámara digital. Unas herramientas que se pueden reproducir por ejemplo en un móvil. Sin embargo no son este tipo de dispositivos los que a priori sacarán más partido a esta tecnología.
Más allá de lo llamativo, sus creadores lo están enfocando en la mejora de los sistemas de conducción autónoma. Los LIDAR de los coches autónomos permiten detectar por láser todo tipo de objetos con una precisión sorprendente, pero el componente de procesado posterior también es muy relevante para dar tiempo de reacción al coche. Con estas cámaras periscopio, el coche podría detectar peatones y ciclistas que están a punto de girar.
El machine learning ha permitido dar un gran salto en los resultados
En una reciente investigación publicada en Nature a día 23 de enero de 2019, un equipo de científicos de la Universidad de Boston liderados por el ingeniero eléctrico Vivek Goyal, ha demostrado que mediante lo que ellos llaman "periscopio computacional" son capaces de identificar objetos detrás de las esquinas mediante una cámara digital y un portátil de gama media.
A diferencia de los proyectos anteriores, el equipo de Goyal ha logrado que estas cámaras periscopio no solo identifiquen que hay algo detrás sino también su forma y color. Así es como Goyal describe en su investigación cómo funciona:
"Básicamente, nuestra técnica permite ver lo que hay alrededor de la esquina mirando la penumbra en un muro mate. Si ese muro fuera un espejo, la tarea sería muchísimo más sencilla. Pero los muros también reflejan la luz en todas direcciones, solo que está completamente borrosa. En esencia, nuestro trabajo de computación busca transformar ese muro mate en un espejo."
En los tests realizados, se ha probado con unas imágenes inspiradas en Mario, unas barras de tres colores básicos y un logo con las letras "BU". Como vemos en la imagen, las reconstrucciones son bastante precisas y permiten identificar más o menos qué es lo que se oculta detrás.
La limitación del trabajo de Goyal reside en que estos tests han sido realizados en un laboratorio relativamente a oscuras. Los propios investigadores admiten que sería bastante más difícil la realización en una sala más iluminada ya que la reconstrucción de la escena se vuelve considerablemente más compleja.
Por el momento, la reconstrucción de la imagen en los tests tiene una duración de menos de un minuto aunque los investigadores creen que podría realizarse más rápido si se incrementa la potencia de computación. Tanto como en un futuro poder realizarlo directamente durante la grabación de un vídeo.