Redes Neurais Artificiais — Classificação de Padrões

Marcos de Benedicto (Bene)
4 min readOct 21, 2024

A função principal de uma rede neural é classificar padrões de entrada em categorias ou classes. Uma rede neural pode ser treinada com um conjunto de padrões de entrada juntamente com a categoria à qual cada padrão específico pertence. Uma vez treinada, a rede pode ser apresentada a um novo padrão, ainda não visto, e sua tarefa é classificar corretamente esse novo padrão. Esse tipo de classificação é geralmente resolvido por meio de aprendizado supervisionado.

A vantagem de usar uma rede neural para classificação de padrões está em sua capacidade de construir fronteiras de decisão não lineares entre diferentes classes, fornecendo uma abordagem prática para resolver problemas de classificação altamente complexos. O aprendizado não supervisionado também desempenha um papel importante na classificação de padrões, especialmente quando não há conhecimento prévio das categorias nas quais os padrões serão classificados.

É importante diferenciar Agrupamento de Classificação: o agrupamento envolve agrupar amostras de entrada com base na proximidade espacial, enquanto a classificação atribui rótulos às amostras de entrada com base em algum critério externo (Nievola, 1996).

Para que o processo de classificação de padrões tenha sucesso, é necessário que haja um mapeamento dos padrões de entrada em um espaço de classificação. Esse espaço é definido por regiões de decisão que separam os padrões, atribuindo cada um a uma classe específica. Em seguida, uma taxonomia de classificadores, baseada no trabalho de Lippmann (1989), é desenvolvida, agrupando os classificadores em quatro categorias, com base na definição de funções discriminantes que estabelecem as regras de decisão.

1. Classificadores Probabilísticos

Este grupo fundamenta-se numa rigorosa base probabilística assumindo que a estrutura e distribuição dos dados no espaço do problema são a principio bem conhecidas (caracterizam classes por sua função densidade de probabilidade no espaço de entrada). Os parâmetros da distribuição são tipicamente estimados usando treinamento supervisionado onde supõe que todos os dados de treinamento estão disponíveis simultaneamente. A construção dos classificadores baseia na conversão da probabilidade a priori das classes dos padrões de treinamento em medidas de probabilidade condicionada a posteriori de um dado padrão pertencer a uma dada classe de treinamento ( TODESCO, 1995)

2. Classificadores De Hiperplano

As funções discriminantes usadas nos classificadores de hiperplano são capazes de formar regiões de decisão complexas que usam nós para formar hiperplanos como fronteiras de decisão no espaço de entradas transformado. A transformação do espaço de entradas é feita sobre nós formados por uma soma ponderada das entradas e que passam esta soma através da não-linearidade da sigmoide ou tangente hiperbólica. O Perceptron multi-camadas treinado com o “Backpropagation” pode ser um exemplo de classificadores de hiperplanos.

3. Classificadores De Kernel

Em classificadores de Kernel existe uma transformação do espaço de entradas para um espaço maior. Os classificadores de Kernel criam regiões de decisão complexas baseados nos campos receptivos formados pelos nodos de função-kernel. O treinamento dos classificadores de kernel são relativamente rápidos, principalmente quando se utiliza treinamento não supervisionado para a determinação dos centros. Estes classificadores tem requerimentos de memória e de computação intermediários, quando comparados aos de hiperplanos. “… classificadores de kernel incluem classificadores convencionais que estimam funções de distribuição de probabilidade que usam a abordagem de “Parzen Window” ou distribuições mistas, e classificadores que formam funções discriminantes usando funções kernel. Redes neurais classificadoras de kernel incluem abordagens baseadas em mapas que usam matrizes de nodos que calculam funções kernel, classificadores baseados no Cerebellar Model Articulation Controller — CMAC, e classificadores que usam o método das funções potenciais, as vezes chamadas classificadores de funções de base radial…” (Lippmann, 1989).

4. Classificador De Exemplares

Esta categoria de classificadores se baseia na distância entre os padrões de entrada e exemplares, ou exemplos treinados previamente. A idéia é atribuir os padrões de entrada para os exemplares mais próximos calculados por alguma métrica. A métrica mais comum é a euclidiana ponderada que é usada para medir a distância entre as entradas e os centros que representam exemplares previamente selecionados durante o treinamento. O treinamento empregado geralemente é o combinado não-supervisionado/supervisionado. Alguns dos classificadores de exemplares são: o classificador de mapa-de-características, o “Learning Vector Quantizer” (LVQ), o classificador “Restricted Coulomb Energy” (RCE), os classificadores da Teoria da Ressonância Adaptativa (ART), os classificadores que usam “raciocínio baseado-na-memória” e os classificadores que usam interpolação linear local (TODESCO, 1995)

Referências Bibliográficas do capítulo:

  • Duda, Richard O., “Pattern Recognition for HCI”, artigo, Department of Electrical Engineering, 1996–1997, http://www-engr.sjsu.edu/~knapp/HCIRODPR/PR_model/PR_model.htm, Keywords .: Classification, Pattern, Recognition Models) — De forma objetiva este artigo faz distinção imediata das formas de “Reconhecimento de Padrões” e desenvolve os temas de reconhecimento, classificação, reconhecimento e classificação de padrões durante o artigo. Aparenta ser um artigo bem estruturado e sugere o aprofundamento da pesquisa. Acesso a este material.: 11/04/2003
  • Lippmann, R. (1989) “Review of neural networks for speech recognition”, Neural Computation, p.1–38. Keyword.: Recognition, Neural Networks. Utilizei este artigo para fazer a taxonomia de classificadores (itens 1.1., 1.2., 1.3. e 1.4 desta revisão bibliográfica). Contato com o material.: Superficial (leitura do resumo da obra)
  • TODESCO, José L. (1995). “Reconhecimento de Padrões usando uma rede neuronal artificial com uma função de base radial: uma aplicação na classificação de cromossomos humanos”. Tese apresentada ao Programa de Pós-Graduação em Engenharia de Produção da Universidade Federal de Santa Catarina para obtenção do Título de Doutor em Engenharia, Florianópolis, Dezembro de 1995. In.: http://www.eps.ufsc.br/teses/todesco/capit_3/cap3_tod.htm (Keywords.: Reconhecimento de Padrões, Redes Neurais Artificiais) => Esta tese apresenta uma qualidade alta e Dificuldade para interpretação baixa. Fornece, entre outros temas abordados, conceitos de classificação de padrões e aprofundamento no reconhecimento de Padrões usando RNA com função de base radial”. Acesso a este material.: 18/04/2003

https://mbenedicto-rn.blogspot.com/

--

--

No responses yet