Lección 1, Tema 1
En Progreso

Introducción a la Visión por Computadora Copy

29/06/2022

¿Cómo funciona la visión humana?

Para comprender la visión por computadora, primero debemos observar cómo funciona la visión humana.

Capturar imagen: los humanos capturan imágenes usando sus ojos. La imagen capturada se forma en la retina, que es similar a cómo la cámara captura la imagen, pero en un formato muy crudo.

Identifique los objetos y sus características: la imagen en bruto se transfiere al cerebro a través de los nervios ópticos para su procesamiento. El cerebro comienza a identificar diferentes objetos como una vela, un ser humano, una silla y muchos otros junto con sus características como el tamaño, el color, la forma y otros.

Extraer información: en este paso, nuestro cerebro compara las características del objeto con su conocimiento pasado para recopilar información. Por ejemplo, puede diferenciar entre tu padre y tu madre porque puedes distinguir sus características visuales.

Actuar: una vez que obtenga la información de nivel superior, puede comenzar a actuar sobre ella. Por ejemplo, si puede identificar que una pelota se acerca a su cara, entonces puede moverse a un lado para evitar golpear la pelota. 

Todos estos pasos ocurren a un ritmo muy rápido debido a la perfección del ojo humano y la coordinación del cerebro. 

Visión por computador

La visión por computadora también sigue un enfoque similar al de la visión humana.

La visión por computadora se ocupa de cómo se pueden hacer las computadoras para obtener una comprensión de alto nivel a partir de imágenes o videos digitales. Desde la perspectiva de la ingeniería, busca automatizar tareas que la visión humana puede realizar.

Las tareas de visión por computadora incluyen métodos para adquirir, procesar, analizar y comprender imágenes digitales.

Ejemplo: automóvil autónomo con visión

Un automóvil autónomo es un vehículo que es capaz de detectar su entorno y moverse de manera segura con poca o ninguna intervención humana.

Para este ejemplo, consideremos que un automóvil autónomo puede avanzar, girar a la izquierda, a la derecha o detenerse . Veamos cómo reaccionaría el coche si un peatón se le adelantara.

Adquirir: los coches autónomos utilizan cámaras para adquirir imágenes. Adquieren y procesan imágenes a un ritmo muy elevado. Consideremos que nuestra cámara ha adquirido esta imagen:

Proceso: La computadora comienza a identificar todos los objetos en la imagen y hace una lista de los objetos con su posición. En este caso, hay algo en camino. La computadora aún no tiene información sobre qué objeto es.

Analizar: la computadora luego clasifica cada objeto en diferentes categorías. En este caso, identifica al objeto como una niña. También etiqueta cierta información del objeto como velocidad, distancia y otros parámetros. Estas etiquetas son la información de nivel superior que se utiliza para tomar una decisión.

Actuar: Basado en la información de nivel superior, la computadora puede actuar. En este caso, el automóvil se detendrá.

Conclusión

En este tema, ha aprendido qué es la visión por computadora y su proceso utilizando el ejemplo de un automóvil autónomo. En el siguiente tema, aprenderá sobre la extensión de Inteligencia Artificial en PictoBlox, con la que realiza varios proyectos de IA.