Visión Estereoscópica : un maravilloso don

Imagen Profundidad 3D

Una mirada analítica

La capacidad que tenemos los seres humanos de observar la realidad en tres dimensiones es conocida como Visión Estereoscópica. Esta capacidad se desarrolla durante la primera etapa de la vida y se logra entrenando al cerebro para combinar las imágenes percibidas por ambos ojos y convertirlas en una sola imagen que permita observar los objetos en tres dimensiones que podríamos llamar altura, ancho y profundidad. Un sencillo experimento para notar la diferencia es tomar un lápiz y ponerlo frente a usted de tal forma que pueda sostenerlo con la mano e irlo acercando hacia su nariz, notará que a partir de cierto punto no ve un lápiz sino dos ya que la imagen que se forma cada ojo es bastante diferente para que pueda ser interpretada por el cerebro.

¿En qué consiste el proceso?

Como en muchos otros casos, ya sabemos que el ser humano lo hace bastante bien, pero si quisiéramos lograr el mismo efecto en robots o sistemas informáticos es necesario entender las variables que gobiernan los aspectos físicos y matemáticos detrás de lo que conocemos como Visión Estereoscópica. No es de extrañarse que los modelos estudiados hayan tomado como referencia el mecanismo biológico, provisto de dos cámaras separadas por una distancia conocida a semejanza de los ojos humanos; de esta forma ambas cámaras tomarán la misma imagen, pero desde una perspectiva distinta que permitirá evaluar la profundidad de los objetos presentes en la imagen. Según lo expuesto por Barnard y Fischler (1982), el proceso de Visión Estereoscópica contempla seis pasos:

  1. Adquisición de imágenes
  2. Modelado de la cámara (geometría del sistema)
  3. Extracción de las características
  4. Correspondencia de las imágenes (características)
  5. Determinación de la distancia (profundidad)
  6. Interpolación si es necesaria

Análisis Geométrico – Modelo Estereoscópico

Geometría Visión Estereoscópica

En este sistema se observan los elementos que hacen parte del modelo donde OI representa al Ojo Izquierdo o Cámara Izquierda y OD representa al Ojo Derecho o Cámara Derecha. El punto P con coordenadas X, Y, Z; se proyecta en la imagen izquierda como PI y en la imagen derecha como PD. Para determinar la proyección de un punto en una imagen se traza un rayo desde el centro óptico (On) hasta el punto P. En la intersección de este rayo con el plano imagen se formará la proyección del punto. Los rayos de proyección POI y POD definen el plano de proyección del punto en 3D.

Se puede observar por simple inspección que al estar en una ubicación diferente (las cámaras) el punto se proyecta en la imagen en diferentes ubicaciones; esta es una característica que permite calcular la profundidad por triangulación.

Triangulación

Triangulación

La imagen anterior representa la vista desde arriba del esquema visto en 3D. Por semejanza de triángulos se pueden obtener las siguientes ecuaciones:

Donde b es la distancia entre las dos cámaras o también conocida como distancia de la línea base, la distancia focal con f, que es la distancia de la cámara al plano epipolar. P es un punto en al escena con coordenadas (x,y,z); PI es la proyección del punto P en la imagen izquierda y tiene coordenadas (XI,YI); PD es la proyección del punto P en la imagen derecha con coordenadas (XD,YD). Con la letra d se representa la disparidad del punto, que es desplazamiento horizontal que se produce.

Aunque las fórmulas sean explicitas, la Visión Estereoscópica artificial aún enfrenta desafíos que requieren investigación para llegar a ser tan eficiente como la humana, entre ellos la deformación de las imágenes, la falta de precisión, la distorsión radial y la distorsión tangencial, entre otros.

Autor: Carlos Alberto Trujillo

Editor: Carlos Pinzón

Código: UCRV-4

Universidad: Universidad Central

Fuentes:

Clínica Baviera. (2017). ¿Qué es la visión estereoscópica? Clínica Baviera. https://www.clinicabaviera.com/blog/bye-bye-gafasconoce-tus-ojosque-es-la-vision-estereoscopica/

Barnard, S., Fishler, M. (1982). Computational Stereo, ACM Computing Surveys, 14, 553-572.

Montalvo Martínez, M, A (2020). Técnicas de visión estereoscópica para determinar la estructura tridimensional de la escena. [Master en Investigación en Informática – Facultad de Informática].
Universidad Complutense de Madrid. https://bit.ly/2Yd7tkk

Pexels. (2016). Archivo Cajas Documentos. [Fotografía]. Pixabay. https://pixabay.com/es/photos/archivo-cajas-documentos-carpetas-1850170/

Trujillo, C. (2020). Geogebra. (Versión 6.0.518). [Software de Computación]. Geogebra. https://www.geogebra.org/m/zehvyfsq

Suscríbete gratis al boletín de noticias sobre Tecnología e Innovación


Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *