Apuntes de Topología Digital

1.6. Representación de Objetos Tridimensionales

Al analizar la estructura tridimensional de una escena a partir de una o más imágenes, frecuentemente es necesario representar cómo se divide la escena en objetos de varios tipos y espacio vacío. En principio, esto se podría hacer usando una matriz 3-d en la que los valores representan los tipos de los objetos; por ejemplo, en una matriz binaria los 1’s podrían representar puntos ocupados por objetos y los 0’s podrían representar puntos no ocupados. De todas formas, excepto para tamaños muy pequeños, las matrices 3-d requieren una cantidad de espacio prohibitiva; incluso una matriz binaria de 64 x 64 x 64 requiere 2¹⁸ > 250.000 bits. Así, las representaciones y aproximaciones compactas llegan a ser especialmente importantes en el caso de 3D.

Una aproximación a la representación 3D es considerar la matriz 3-d como una secuencia de matrices 2D (“rodajas” o “secciones en serie”), justo como en el caso de bi-dimensional considerábamos una imagen como una secuencia de filas. Cualquiera de los esquemas de representación descritos en este capítulo pueden ser usados para representar las rodajas individuales.

Otra posibilidad es usar bloques 3D. El equivalente 3D al MAT está basada en cubos maximales (o bloques de alguna otra forma estándar) de valor constante centrados en cada punto. El equivalente al árbol de cuadrados es el “octree”, obtenido mediante subdivisiones sucesivas de la matriz 3-d (que asumimos que es 2^k x 2^k x 2^k) en octetos hasta que se alcancen octetos de valor constante.

Una clase de las representaciones aproximadas conocida como conos generalizados (o cilindros) ha sido ampliamente usada para representar objetos tridimensionales [42]. Un cono generalizado se define por un eje, un borde de sección transversal, y una función de tamaño; es el volumen barrido mientras la forma se mueve a lo largo del eje (perpendicular a él, o a algún otro ángulo fijo, y con el eje pasando a través de él en un punto de referencia especificado), cambiando el tamaño de posición a posición como se especifica en la función de tamaño.

El borde de una región 3D consiste en un conjunto de superficies. La pendiente de una superficie en un punto está definida por un par de ángulos que especifican cómo está orientada la normal a la superficie en ese punto. Así el equivalente de un código de cadena o de fisura, en el caso de una superficie, sería una matriz de valores cuantificados representando los pares de pendientes para cada parche unidad de la superficie. Sobre códigos de cadena 3D para curvas de espacio véase [19].

Se pueden representar varios tipos de información tridimensional sobre una escena en la forma de matrices bidimensionales. Por ejemplo, dada una imagen de una escena, el rango desde el observador a cada punto visible, y la pendiente de la superficie en cada punto visible, se pueden representar como matrices en un registro con la imagen. Nótese que la matriz de pendientes es una matriz de vectores; Marr ha llamado a esta matriz “esbozo 21/2D”. Debería señalarse que la resolución tridimensional de tal matriz varía de un punto a otro de la escena.

Volver a la página principal

Volver a apuntes de Topología Digital