Glosario
La visión artificial es clave para la optimización de procesos de inspección visual humana. Descubre aquí la terminología principal y los conceptos básicos relacionados con los sistemas y tecnologías de visión.
A
- Adquisición de Imagen
Se suele referir a cómo un PC obtiene una imagen procedente de una cámara. - Análisis de Imagen
Software que incluye una serie de funciones y herramientas de proceso y medida, con el que un PC puede hacer decisiones sobre los objetos de la imagen. - Análogo/Analógico
Normalmente se refiere a cámaras análogas o cámaras analógicas que no tienen una salida digital. Estas cámaras proporcionan una señal parecida a la de la TV, que debe ser digitalizada en el PC mediante un frame grabber, para poder utilizarse en sistemas de visión artificial. - Autoiris
Algunas ópticas/lentes, especialmente las que se utilizan en el exterior, incorporan un sistema del tipo galvanómetro para controlar la apertura o iris de la lente. Hay dos tipos de autoiris: DC-Iris y Vídeo-Iris.
B
- Bin Picking
Es una metodología utilizada en sistemas de Robótica Guiada por Visión (Vision Guided Robotics-VGR) en el que se seleccionan y extraen piezas amontonadas aleatoriamente en un contenedor, utilizando un sistema de visión para la localización y un sistema robótico para la extracción y su posterior reubicación. - Binning
Es la técnica de combinar píxeles adyacentes en un sensor para crear menos píxels pero más grandes. El binning combina la carga de píxeles adyacentes de forma que se incrementa la sensibilidad efectiva de la cámara. - Blob Análisis
Un algoritmo utilizado en visión artificial que identifica objetos segmentados y los mide según parámetros morfométricos (tamaño, diámetro, perímetro,…) o densitométicos (nivel de gris medio, media, color).
C
- Cámara de Área
Se refiere al sensor de la cámara compuesto por una matriz de píxeles rectangular. Las cámaras de área son las más comunes y se suelen denominar también cámaras matriciales. - Cámara Inteligente
Es una cámara que incluye un procesador abordo y software de análisis de imagen, que es capaz de realizar aplicaciones de visión de forma autónoma sin necesidad de estar conectada a un PC - CameraLink
Es uno de los interfaces de las cámaras digitales más utilizados. Ofrece alta transferencia de datos, pero está limitado en cuanto a distancia de cable. Las máximas velocidades de transferencia a la que se puede acceder es de 680Mb/s - Capacidad Límite de Almacenamiento
Conocido en inglés como Full Well Capacity, es la capacidad de almacenar fotones que tiene un píxel antes de la saturación, expresada en electrones. A mayor superficie sensible del píxel (cuanto mayor es físicamente) mayor capacidad tiene de almacenar fotones. - CCD
CCD es la abreviatura de Charge-Coupled Device. Un sensor CCD es un dispositivo semiconductor sensible a la luz, que convierte las partículas de luz (fotones) en cargas eléctricas (electrones). Las cámaras CCD son una de los dos tipos de cámaras que dominan el mercado de la visión, conjuntamente con las cámaras CMOS. - CMOS
Es el acrónimo de Complementary Metal Oxide Semiconductor. Esta tecnología funciona como un fotodiodo donde la luz genera una corriente que es representativo de la cantidad de luz que impacta en cada píxel, por tanto difiere significativamente de la tecnología CCD. Hay un número de ventajas en la utilización de los sensores CMOS con respecto a los CCD entre los que se destaca el coste, velocidad, anti-blooming, y características de respuesta programable (Ej. Respuesta con múltiples pendientes).
D
- Dark Current (Corriente Oscura)
Es la acumulación de electrones en el sensor de imagen CCD o CMOS, que están generados térmicamente en lugar de por la luz incidente. Es un tipo de ruido que es especialmente problemático, en aplicaciones con baja iluminación y que requieren largos tiempos de exposición. - DCAM
DCAM o IIDC es un interface de software estándar para comunicación con cámaras Firewire – IEEE 1394. Es un conjunto de registros estandarizados. Si una cámara cumple con DCAM, quiere decir que su control de registros y sus estructuras de datos están en consonancia con las especificaciones del estándar. De forma que esta cámara puede conectarse sin problemas con sistemas y programas que utilizan este estándar. En la actualidad las versiones de este estándar son IIDC 1.30 and IIDC 1.31. - Decibelio o dB
Una unidad logarítmica de medida. Cuando se utiliza en cámaras digitales esta unidad se describe la relación señal/ruido o el rango dinámico. A mayor valor mejor calidad de imagen. - Deep Learning
Es una rama de la inteligencia artificial cuyo objetivo es desarrollar técnicas que permitan a las computadoras aprender. De forma más concreta, se trata de crear programas capaces de generalizar comportamientos a partir de una información no estructurada suministrada en forma de ejemplos.
E
- Escala de Grises
En visión este término se refiere a una imagen monocroma con una gradación de grises. Una cámara monocroma que trabaje a 8 bits, generará una imagen con 256 tonos de gris. Si la cámara trabaja a 12 bits su escala de gises será de 4096 niveles.
F
- Filter Driver
Con respecto a las cámaras Gigabit Ethernet, un filter driver, o «filtro» se utiliza para reducir la carga de CPU cuando se manejan grandes volúmenes de datos procedentes de cámaras GigE. éste filtra los datos de la imagen de los paquetes Ethernet a bajo nivel de forma que la CPU no tenga que hacerlo. Utilizando un filter driver se puede reducir de forma significativa la carga de CPU asociada a la captura de imagen. - Firewire
Una interface estándar de PC con varias versiones denominadas también IEEE-1394a, o IEEE-1394b. Se trata de una interface serie digital rápida de bajo coste con fácil conectividad («plug and play»), muy utilizada en las cámaras de visión en todo tipo de entorno. - Frame Grabber (Framegrabber)
Éste es el nombre que utiliza la industria de la visión para denominar la placa de captura y/o proceso, que se utilizan como interface entre las cámaras análogas o las cámaras CameraLink, CameraLink HS, CoaXpress y el PC. - Full Well Capacity
Ver Capacidad Límite de Almacenamiento
G
- Gaging (Gauging)
Cuando se refiere a visión artificial significa una medida dimensional sin contacto de un objeto utilizando las imágenes captadas por las cámaras. - Ganancia (Gain)
Es el mismo concepto que se tiene cuando se utiliza el regulador de contraste de una TV. Es una multiplicación de la señal. En términos matemáticos, controla la pendiente de la curva exposición/tiempo. La cámara debería funcionar con la menor ganancia posible, ya que la ganancia no solo multiplica la señal, sino que también incrementa el ruido. La Ganancia es muy útil cuando se trabaja con bajos tiempos de exposición, (por ejemplo cuando el objeto se mueve muy rápidamente y no se quiere que aparezca movido o borroso en la imagen), pero al mismo tiempo no se tiene suficiente iluminación. - Genicam o GenCam
Es un interface de cámara estándar apoyado por la European Machine Vision Association (EMVA) que ofrece una interface de software independiente del hardware de la cámara. - Gigabit Ethernet
Un interface estándar de la industria, también denominada ‘GigE , ‘GbE’, ‘1000-speed’, etc., que se utiliza para redes de alta velocidad capaz de transferir a 1000 megabits por segundo. Gigabit Ethernet ha sido adaptado a las cámaras de altas prestaciones para aplicaciones industriales. Esta interface de red se ha adaptado para su utilización en cámaras de visión artificial con el nombre de GigE Vision. - GigE Vision
Es una interface estándar promovida por la AIA (Automated Imaging Association), para cámaras de visión artificial de altas prestaciones, basado en Gigabit Ethernet. GigE Vision incluye una interface hardware estándar (Gigabit Ethernet), protocolos de comunicación y control de registros estandarizados para las cámaras. Los controles de registros para las cámaras están basados en una estructura de comandos denominado GenICam. - Global Shutter
Esta nomenclatura se utiliza normalmente con cámaras CMOS, en oposición a Rolling Shutter. Aunque algunos fabricantes la utilizan en cámaras CCD de forma análoga al termino Progresivo. Es un método de funcionamiento de las cámaras que consiste en que todos los píxeles de la cámara capturen la luz al mismo tiempo, durante el tiempo de obturación o shutter. Este método de funcionamiento es fundamental en visión artificial cuando se desean captar imágenes en movimiento.
H
- Histograma
Es una representación gráfica de los valores de todos los píxeles de la imagen. Generalmente a la izquierda de la gráfica se representa el valor cero correspondiente al negro y a la derecha se representa el valor máximo (que depende del número de bits) correspondiente al blanco. La curva del histograma representa la cantidad de píxeles de cada valor de gris que hay en la imagen. Si la imagen es en color se acostumbran a representar los histogramas de valores de rojo, verde y azul.
I
- IIDC
Ver DCAM - Imagen Digital
Se refiere a la captura de una imagen de vídeo de forma que la imagen resultante está expresada en datos digitales, fácilmente analizado por un PC. - Integración
Se refiere generalmente a las labores de ensamblaje de componentes de un sistema de visión (iluminación, ópticas/lentes, cámara, cables, accesorios, software, etc). - Integrador de Sistemas
Compañía que se dedica a hacer integración de sistemas de visión, conjuntamente con sistemas de robótica y/o automatismos. Normalmente se trata de ingenierías especializadas en visión o automatización industrial. - Interline Transfer
Una arquitectura de funcionamiento del CCD donde hay un canal opaco vertical entre las columnas de píxeles del sensor. Este tipo de CCD no requieren obturador mecánico, sin embargo el rango dinámico y la resolución se reducen debido a esta columna enmascarada entre las columnas sensibles a la luz. - IR Lens
Una óptica diseñada específicamente para corregir aberraciones cromáticas en las longitudes de onda infrarrojas. Las ópticas IR se deben utilizar en los casos en que las cámaras reciban luz visible e infrarroja; si no se utilizan este tipo de ópticas es posible que se vean las imágenes borrosas cuando se cambia de un tipo de iluminación infrarroja a uno visible.
J
- Jumbo Frames
Son los tamaños de paquetes de datos utilizados en cada imagen transferida digitalmente vía GigaEthernet. Es el método comúnmente utilizado para reducir la sobrecarga de transferencia de la cámara al PC. Estos bloques de datos de gran tamaño se denominan Jumbo frames.
K
L
- Linescan (Linear Array)
Una cámara lineal tiene una sola línea de píxeles. Captura la imagen escaneando línea a línea el objeto que pasa frente a ella.
M
- Manual Focus
Se refiere a las ópticas /lentes que deben ser enfocadas manualmente moviendo la rosca del foco. Son por tanto opuestas a las ópticas autofoco que se enfocan automáticamente o a las ópticas con foco motorizado que pueden enfocarse mediante un PC o un Joystick. - Megapíxel
Es el nombre dado a un millón de píxeles – con referencia a la resolución espacial de una cámara. Así una cámara con resolución de 1300 x 1024 píxeles se diría que tiene 1.3 megapíxel. - Microlente
Una tecnología utilizada en algunas cámaras CCD y CMOS donde cada píxel se cubre con una pequeña lente que direcciona la luz directamente a la parte sensible del sensor.
N
- NIC
Siglas procedentes de Networking Interface Card. Es una placa de interface Ethernet/GigaEthernet que permite transferir las imágenes digitales procedentes de la cámaras con dicha salida.
O
- Óptica rápida (Fast Lens)
Una óptica que captura muy bien la luz. ópticas con valores de número-F muy bajo. Una lente de este tipo tendría un número F de 0.95. Se utilizan para aplicaciones donde hay muy poca luz o para capturas de muy alta velocidad con tiempos de exposición muy bajos.
P
- Pick and Place
Es un sistema de Robótica Guiada por Visión (Vision Guided Robotics-VGR) que identifica una pieza individualizada mediante un sistema de visión, procediendo a un posterior agarre y posicionamiento mediante un sistema robótico. - Píxel
Abreviación de «Picture Element». El elemento individual de una imagen digital. - Profundidad de Campo (Depth of Field)
La profundidad de campo se refiere al campo de visión de una imagen que aparece enfocado. Cuando se utiliza una óptica, especialmente en distancias cortas, los objetos que están o muy cerca o muy lejos de la cámara aparecen borrosos o desenfocados. La profundidad de campo aumenta si la apertura de la lente es pequeña (un número f grande), y la profundidad de campo disminuye con una apertura grande (número f pequeño). - PTP- Precison Time Protocol
Sistema de sincronización por hardware de cámaras Gigabit Ethernet, que permite velocidades de sincronización del orden de los 10 nanosegundos.
Q
R
- Rango Dinámico (Dynamic Range)
La relación de la señal máxima relativa a la señal mínima medible, generalmente medida en decibelios o dB. El rango dinámico se utiliza habitualmente de forma similar al SNR (relación Señal/Ruido). También se expresa a veces como Rango Dinámico óptico. - Rango Dinámico Extendido (Extended Dynamic Range)
Algunas cámaras CMOS utilizan lo que se denomina multi-pendiente, o knee LUT, o rango dinámico extendido. La multi-pendiente proporciona un modo no lineal que permite visualizar a la vez zonas muy oscuras y muy claras de la misma imagen. - Readout
Se puede definir como velocidad de trasferencia y se refiere a cómo los datos se transfieren desde el sensor al PC. La velocidad de transferencia es uno de los parámetros importantes a tener en cuenta en las cámaras, a mayor velocidad de transferencia mayor será el número de imágenes capturadas en un periodo de tiempo determinado. - Región de Interés
También denominada área de Interés (AOI) se refiere a una función de la cámara, donde sólo una parte, normalmente rectangular, de la imagen se envía a la salida para ser procesada. El resultado no es solamente obtener una imagen menor al tamaño del sensor, sino que además aumenta la velocidad de trasferencia de forma proporcional. También puede denominarse escaneado parcial. - Resolución Espacial
La medida de cómo un sensor o una cámara puede distinguir los objetos pequeños. Normalmente no es solo una función del número de píxeles, sino que depende también de la resolución de la lente. - Rolling Shutter
Algunos sensores CMOS funcionan de esta manera, de forma que las líneas de la imagen se escanean de forma consecutiva a diferentes tiempos de exposición. Este tipo de funcionamiento no se puede utilizar para objetos en movimiento, excepto si se sincroniza con un sistema de iluminación estroboscópica
S
- Sensibilidad
La medida de sensibilidad del sensor de la cámara a la cantidad de luz que recibe. - Sincronismo (Sync)
Una señal externa generada por una cámara u otro dispositivo que se puede utilizar para sincronizar la cámara con eventos externos como una iluminación flash u otras cámaras. - Sub-muestreo – Subsampling
Técnica que permite seleccionar píxeles alternos de un sensor para generar imágenes de menor resolución, pero manteniendo el campo de visión.
T
- Tiempo de Exposición
Es la cantidad de tiempo que el sensor está expuesto a la luz. éste es el control que se utiliza para ajustar la cámara a las condiciones de luz de la imagen a capturar (antes de utilizar la ganancia y el offset). - Tiempo de Integración
También denominado tiempo de exposición. éste es el periodo de tiempo que el sensor de la imagen está expuesto a la luz mientras se captura la imagen. Es equivalente al tiempo de exposición de las cámaras fotográficas con carrete fotográfico. A mayor tiempo de exposición, mayor cantidad de luz es capturada. Condiciones de baja iluminación requieren largos tiempos de integración. - Trigger
Una entrada a una cámara digital que inicia la captura de la imagen o secuencia de imágenes. También, una señal eléctrica o grupo de señales utilizadas para sincronizar una o varias cámaras con un evento externo.
U
V
- Velocidad de captura (Frame Rate)
Es la medida de la velocidad de la cámara. La unidad de esta medida es «imágenes por segundo» (img/s) y se define como el número de imágenes que puede capturar una cámara en un segundo. También se utiliza este término cuando se utilizan regiones de interés, pudiendo alcanzar de este modo velocidades de miles de imágenes por segundo.
W
X
Y
Z