Lección 1, Tema 1
En Progreso

Bloques de Visión Artificial Copy

26/06/2022

En este tema, veremos qué bloques nos tiene reservado PctoBlox para la visión por computadora.

Bloques de visión artificial

La extensión de Inteligencia Artificial tiene los siguientes 3 bloques que toman una imagen como entrada y analizan las características de la imagen:

reconocer () en la imagen de la cámara después de () segundos : este bloque inicia la cámara, toma una imagen después del tiempo especificado y la analiza. Luego guarda las características de la imagen en PictoBlox.


reconocer () en la imagen de la URL () : este bloque extrae la imagen de la URL especificada, la analiza y luego guarda la información en PictoBlox.


reconocer () en la imagen de () : este bloque extrae la imagen del escenario, el disfraz o el fondo en PictoBlox, la analiza y luego guarda la información en PictoBlox.

Puede reconocer lo siguiente en imágenes:

  1. Características de la imagen: visión por computadora
  2. Texto escrito a mano
  3. Texto impreso
  4. Detalles de la cara

Nota: Una vez que realiza una solicitud de reconocimiento en PictoBlox, identifica todas las características de la imagen en variables locales. Luego, cuando solicita una característica en particular, la informa desde la propia variable local para que no tenga que realizar solicitudes de reconocimiento una y otra vez.

En esta lección, solo nos interesan las funciones de imagen .

Resultados de características de imagen

Al analizar las imágenes en busca de características de imagen, puede reconocer lo siguiente:

Marcas: la detección de marcas utiliza una base de datos de miles de logotipos globales para identificar marcas comerciales en imágenes. El servicio Computer Vision detecta si hay logotipos de marcas en una imagen determinada; si es así, devuelve el nombre de la marca, de lo contrario, devuelve NULL.


Celebridad: la detección de celebridades utiliza una base de datos para identificar celebridades en imágenes. El servicio Computer Vision detecta si hay una celebridad en una imagen determinada; si es así, devuelve su nombre, de lo contrario, devuelve NULL.


Objetos: la visión por computadora detecta si hay objetos en una imagen determinada; si es así, devuelve su nombre, de lo contrario, devuelve NULL.


Puntos de referencia: la detección de puntos de referencia utiliza una base de datos de miles de puntos de referencia globales para identificarlos en imágenes, por ejemplo, Taj Mahal.


Etiquetas de imagen: la visión por computadora devuelve las categorías basadas en taxonomía detectadas en una imagen. Computer Vision puede categorizar una imagen de manera amplia o específica de acuerdo con las 86 categorías que se dan en el siguiente diagrama:


Descripción de la imagen: oración legible por humanos que describe el contenido de la imagen.

Ahora, veamos cómo podemos usar la visión por computadora en nuestros proyectos PictoBlox. Primero, veamos qué bloques están disponibles para la visión por computadora.

recuento reconocido ()

El bloque de recuento reconocido () informa el número de elementos seleccionados para contar en la imagen. Puede haber varias celebridades, marcas, objetos y etiquetas de imagen en una sola imagen.

Reconozcamos esta imagen:

Copie la imagen de aquí y analice la imagen usando la URL:(https://semillerodeinnovacion.com/wp-content/uploads/2020/11/Robert-and-Chris-1.jpg)

En esta imagen se reconocen los siguientes recuentos:

1- Marca: 1

2- Celebridad: 2

3- Objeto: 4


4- Etiqueta de imagen: 1


nombre () () RECONOCIDO

El bloque de nombre reconocido () () informa el nombre de la celebridad / marca / objeto / etiqueta de imagen reconocidos. Hay dos entradas al bloque:

  1. Tipo: celebridad, marca, objeto o etiqueta de imagen
  2. Número: # de lo que desea analizar. Por ejemplo, si hay dos celebridades, puede obtener el nombre de la celebridad 1 y el nombre de la celebridad 2 cambiando esta entrada.

Si el número está fuera de rango, el bloque devolverá NULL.

Por ejemplo, para la imagen dada arriba, puede obtener lo siguiente:

1- Nombre de la celebridad: Chris Evans y Robert Downey Jr.

2- Marca: Audi

3- Objetos: Corbata, Corbata, Persona, Persona

4- Etiqueta de imagen:


Veremos cómo usar este bloque en nuestro programa en el siguiente tema.

() resultado del reconocimiento

El bloque de resultado de reconocimiento () informa el punto de referencia y la descripción de la imagen identificada en la imagen. 

Analicemos esta imagen:

Taj Mahal

Copie la URL de la imagen aquí:https://semillerodeinnovacion.com/wp-content/uploads/2020/11/Taj-Mahal-2-600×338-1.jpg

Los siguientes resultados provienen del bloque:

  1. Punto de referencia: Taj Mahal
  2. Descripción de la imagen: un grupo de personas de pie frente al Taj Mahal

Conclusión

En este tema, analizamos los bloques que reconocen imágenes e informan la marca, la celebridad, el objeto, el punto de referencia, la etiqueta de la imagen y la descripción de la imagen. En la siguiente lección, crearemos un programa para comprender cómo usar estos bloques en proyectos de CV.