Hoje entrevistamos Xavier Poch, engenheiro de desenvolvimento de software da INFAIMON e responsável pela nova solução InTelligence para o processamento de imagens através de Deep Learning. O software InTelligence permite resolver todas aquelas aplicações que sempre resistiram à visão artificial convencional.

INFAIMON – Bom dia, Xavier. A primeira pergunta é quase obrigatória: Podes explicar brevemente o que é e como funciona o Deep Learning

Xavier Poch – Quando falamos de Deep Learning referimo-nos à aprendizagem de características por meio de um classificador baseado em camadas de redes neuronais que é responsável por definir que características são as mais adequadas. Isto é conseguido através do processo de treino, no qual a rede é ensinada com um conjunto de imagens corretas e incorretas, sendo a própria rede capaz de decidir em que aspetos irá basear a sua decisão. Em poucas palavras: o Deep Learning permite resolver tarefas específicas sem uma programação prévia.

INF – O que são as camadas de redes neuronais em Inteligência Artificial?

XP – É um sistema informático modelado a partir da interconexão de muitos neurónios artificiais, de forma que as saídas de um grupo deles sejam usadas como entradas de outros. Cada camada tem uma série de operações que são multiplicadas de maneira que o volume total de características a combinar cresça exponencialmente.

Estas redes neuronais tentam imitar a forma do cérebro humano trabalhar, onde não só as características morfológicas, de textura e de cor são aplicáveis, mas também o resultado de relacionar estas opções entre elas e com o ambiente. Por exemplo, escolhemos um objeto com uma textura rugosa com outro objeto que é de cor verde, e então sabemos de que objeto se trata. Durante o treino, as características são ajustadas continuamente até os dados do treino com as mesmas classes produzam sistematicamente resultados similares.

INF – E quais são as principais vantagens do processamento de imagens com o Deep Learning?

XP – A principal vantagem baseia-se em não ser necessário desenvolver algoritmos de visão complexos para uma única tarefa específica e concreta, com o risco de qualquer pequena alteração nessa tarefa, ser necessário reconfigurar todo o algoritmo. Por outro lado, ao não depender tanto da experiência do programador em si, as aplicações que não se podiam resolver com classificadores mais convencionais, agora são viáveis graças ao Deep Learning. Estamos a falar de aplicações com imagens de baixo contraste onde antes não era possível visualizar defeitos, que por outra parte podem chegar a ser muito variáveis.

Tomemos como exemplo um defeito num comprimido, desde uma mancha negra a um arranhão ou um pedaço em falta. Se tivéssemos de fazer este processo manualmente com classificadores convencionais, teríamos muitas limitações e no final, evitaríamos qualquer defeito que não fosse inicialmente contemplado. Com o Deep Learning, em função do número de camadas da rede, é possível alcançar milhões de características combináveis.

desarrollo

INF – Podes dar alguns exemplos de aplicações de Deep Learning na prática?

XP – O Deep Learning é aplicável em qualquer processo. Na área da vigilância e supervisão, por exemplo, é utilizado na deteção de encomendas, equipamento de proteção individual (EPI) como a utilização de óculos de proteção para os empregados, etc. Também no caso de aplicações ao ar livre que são difíceis de gerir devido a alterações constantes da iluminação.

INF – Fala-nos um pouco sobre o software InTelligence, como o definirias em poucas palavras?

XP – InTelligence é um software com uma interface simples e rápida que se pode compreender sem qualquer experiência de programação ou visão artificial. Eu definiria em poucas palavras como uma solução “tudo em um”: engloba desde a tarefa mais básica que seria a captura de imagens, algo que nem todos os softwares no mercado proporcionam. Também inclui controlo da câmara, classes, treino e a inferência de resultados.

A classificação das classes das imagens é essencial em qualquer aplicação de Deep Learning para definir entre imagens boas e más, de modo a podermos inclusive detetar objetos minúsculos dentro de um ambiente muito caótico, como encontrar uma agulha num palheiro. Isto já é possível com o InTelligence, mas em segundos.

Quanto ao treino, se for relativamente simples, é possível realizá-lo com um CPU convencional, pelo que não é necessário trabalhar com um GPU especial para Deep Learning. Finalmente, os resultados são apresentados como um mapa de calor para identificar a zonas mais discordante. A parte com um defeito aparece realçada numa cor diferente.

InTelligence

INF – É realmente possível alcançar o objetivo de zero defeitos?

XP – Ter 100% de “corretos” é bastante difícil porque depende das amostras e da classificação das classes que foi feita. Ainda assim, o grau de sucesso no Deep Learning situa-se geralmente entre 95 – 99%, o que implica um mínimo de falsa rejeição.

Contudo, não podemos esperar que com um par de imagens boas e duas más possamos cobrir uma grande variedade de defeitos. Por vezes precisamos de milhares de imagens para que uma rede neuronal funcione corretamente. Em contraste, a ferramenta de deteção de anomalias do InTelligence requer apenas um mínimo de 50 a 100 imagens para obter bons resultados, uma vez que a rede vem pré-treinada com muito mais imagens.

INF – O InTelligence tem muito potencial para trabalhar num sistema de bin picking como o InPicker, certo?

XP – Exatamente. Dentro de todas as suas características, o InTelligence permite-nos realizar e exportar as classes e o treino para o InPicker, o que facilita a segmentação de objetos muito mutáveis como as maçãs, que podem ser de várias cores, formas, etc. Com o InTelligence podemos segmentá-los corretamente e exportar estes dados de posição para o InPicker para realizar o processo de picking.

InTelligence tem um enorme potencial e muitas possibilidades de desenvolvimento futuro, porque é uma aplicação viva que está em constante evolução pelos nossos programadores. A sua flexibilidade permite-nos adotar novas funcionalidades de acordo com as exigências do mercado.

Xavier Poch
Xavier Poch, engenheiro de desenvolvimento da INFAIMON

INF – Muito obrigado pelo seu tempo, Xavier. Esclareceste todas as nossas dúvidas sobre a aplicação do Deep Learning para o processamento de imagens.

INFAIMON

Quer falar com um especialista?

Oferecemos-lhe soluções inovadoras, suporte técnico e um serviço personalizado para integrar a visão artificial nos seus projetos. Contate-nos!