Lección 1, Tema 1
En Progreso

Reconocer texto a partir de una imagen Copy

29/06/2022

¿Qué es OCR?

OCR significa reconocimiento óptico de caracteres. Es una tecnología generalizada que se utiliza para reconocer texto dentro de imágenes, como documentos escaneados y fotos.

La tecnología OCR se utiliza para convertir prácticamente cualquier tipo de imagen que contenga texto escrito (mecanografiado, escrito a mano o impreso) en datos de texto legibles por máquina.

Reportaje de noticias

La tecnología OCR se hizo popular a principios de la década de 1990 al intentar digitalizar periódicos históricos. Desde entonces, la tecnología ha experimentado varias mejoras. Hoy en día, las soluciones ofrecen una precisión de OCR casi perfecta.

¿Cómo funciona el OCR?

El siguiente enfoque de visión por computadora se utiliza para identificar texto dentro de la imagen:

  1. Aplica  filtros  para que los personajes se destaquen del fondo.
  2. Aplica la  detección de contorno  para reconocer los personajes uno por uno.
  1. Aplicar  clasificación de imágenes para identificar a los personajes.
  2. Fusiona los personajes para formar palabras y oraciones.

Aplicaciones de OCR

A continuación se presentan algunas aplicaciones de OCR en diferentes industrias:

Conversión de libros históricos o imágenes de libros a PDF

El OCR se usa ampliamente para convertir libros históricos en documentos editables como PDF. La naturaleza estructurada de los documentos impresos hace que sea mucho más fácil analizarlos.

Libros OCR

Seguridad: placas de matrícula

Otro caso de uso común de OCR es el reconocimiento de matrículas. Esto requiere detectar la matrícula y luego reconocer sus caracteres . La forma de la placa es relativamente constante, por lo que la gente usa métodos simples de remodelación antes de reconocer realmente los dígitos. A continuación, se muestran algunos ejemplos de la web:

Gastos de envío

ORC también se usa ampliamente para detectar información clave de cartas postales como Pincode, direcciones, etc. Por lo general, las cartas postales están diseñadas de manera que le resulte fácil a la computadora obtener la información relevante de una parte particular de la imagen.

Ahora, echemos un vistazo a cómo detectar texto en PictoBlox.