En los últimos años, el reconocimiento de gestos debutó en los mercados de juegos y entretenimiento. El reconocimiento de gestos ahora se está convirtiendo en una tecnología popular, lo que facilita que los humanos y las máquinas interactúen en nuestros hogares, automóviles y lugares de trabajo. Imagina a alguien sentado en tu sofá y controlando tus luces o tu televisor con solo un movimiento de tu mano.
prólogo En los últimos años, el reconocimiento de gestos debutó en los mercados de juegos y entretenimiento. El reconocimiento de gestos ahora se está convirtiendo en una tecnología popular, lo que facilita que los humanos y las máquinas interactúen en nuestros hogares, automóviles y lugares de trabajo. Imagina a alguien sentado en tu sofá y controlando tus luces o tu televisor con solo un movimiento de tu mano. Esta función y otras funcionan con tecnología de reconocimiento de gestos que permite interacciones naturales con los dispositivos electrónicos que nos rodean. El reconocimiento de gestos se ha estudiado durante mucho tiempo en la visión 2D, pero con el advenimiento de la tecnología de sensores 3D, sus aplicaciones se han diversificado y se han extendido a diferentes mercados.
Limitaciones de la visión 2D basada en coordenadas (x, y)
Las computadoras están limitadas cuando se trata de comprender escenas porque son incapaces de analizar el mundo que las rodea. Los principales problemas que tienen las computadoras para comprender escenas incluyen la segmentación, la representación de objetos, el aprendizaje automático y el reconocimiento. Las computadoras están limitadas por la representación 2D de la escena, por lo que los sistemas de reconocimiento de gestos deben aplicar diferentes señales para obtener resultados más precisos e información más valiosa. Las posibilidades incluyen el seguimiento de todo el cuerpo y otras técnicas que combinan múltiples señales, pero solo usan representaciones 2D sin modelos 3D conocidos de los objetos a identificar, como manos, cuerpos y rostros humanos.
Innovación “z” (profundidad)
La información de profundidad (“z”) habilita capacidades mucho más allá del reconocimiento de gestos. El desafío de incorporar la visión 3D y el reconocimiento de gestos a la tecnología es obtener esta tercera coordenada ‘z’. El ojo humano registra naturalmente las coordenadas x, y, z de todo lo que ve, y el cerebro interpreta esas coordenadas en una imagen 3D. Hasta ahora, la electrónica no se podía ver en 3D debido a la falta de tecnología de análisis de imágenes. Hoy en día existen tres técnicas populares mediante las cuales se pueden obtener imágenes en 3D. Cada uno tiene sus propias fortalezas y casos de uso comunes. estereoscopia, patrones de luz estructurada y tiempo de vuelo (TOF). La tecnología de reconocimiento de gestos se realiza mediante el análisis de imágenes 3D generadas por estas tecnologías.