Next: Algoritmos de seleção Up: Redução de dimensionalidade Previous: Discriminantes Lineares (LDA) Contents Index

Seleção de Características

Métodos automáticos de seleção de características são importantes em muitas situações em que se tem disponível um conjunto grande de características e deseja-se selecionar um subconjunto adequado. Além de ser uma forma de redução de dimensionalidade, uma aplicação importante é a fusão de dados procedentes de múltiplas modalidades de sensores ou de múltiplos modelos de dados. A importância de redução de dimensionalidade está explícita no capítulo 3.

A seleção automática de características é uma técnica de otimização que, dado um conjunto de características, tenta selecionar um subconjunto de tamanho () que maximiza uma função critério.

Formalmente, dado um conjunto $\mathcal{Y}$ de características, o algoritmo de seleção de características deve encontrar um subconjunto $\mathcal{X} \subseteq \mathcal{Y}$ tal que $\vert\mathcal{X}\vert = m$ , em que $\vert\calX\vert$ denota a cardinalidade de $\calX$ , e

$\begin{displaymath} J(\mathcal{X}) = \max_{\mathcal{Z} \subseteq \mathcal{Y}, \vert\mathcal{Z}\vert=m}{J(\mathcal{Z})}, \end{displaymath}$

(3.21)

em que

é a função critério. Um exemplo simples é definir-se $J(\calX) = 1 - E$ , sendo

é a taxa ou probabilidade de erro de um classificador. É desejável que a função critério seja maior quanto menor for a redundância entre as características e quanto maior a facilidade de discriminar padrões de classes diferentes.

Dessa forma, o algoritmo de seleção de características poderá reduzir a dimensionalidade de forma que ocorra a menor queda possível no poder de distinção das classes por um classificador no espaço de características. Uma conseqüência da aplicação de um bom algoritmo de seleção de atributos é a redução do número necessário de amostras de treinamento para obter-se bons resultados com um classificador, ou seja, a redução do problema da dimensionalidade (vide seção 2.3).

Além da escolha da função critério, também é importante determinar a dimensionalidade apropriada do espaço de características reduzido. Uma forma simples de resolver esse problema é efetuar a seleção de características para vários valores de . Conforme foi mencionado na seção 2.3, em [Jain et al., 2000], os autores defendem que, em problemas práticos, sendo $\forall {\bf x}_j \notin \omega_i$ o tamanho do conjunto de treinamento, é seguro não ocorrer o problema da dimensionalidade se forem usadas menos que $\vert T\vert/10$ características.

Apesar da importância de seleção de atributos, não há regras ou procedimentos definitivos para essa tarefa em cada aplicação particular [Castleman, 1996], principalmente quando o número de características disponíveis for grande. Por esse motivo, um grande conjunto de algoritmos de seleção de atributos tem sido proposto. Em [Jain and Zongker, 1997] foi proposta uma taxonomia sobre este tópico. A seguir serão descritos separadamente alguns algoritmos de seleção de características e algumas funções critério.

Subsections

Next: Algoritmos de seleção Up: Redução de dimensionalidade Previous: Discriminantes Lineares (LDA) Contents Index

Teofilo Emidio de Campos 2001-08-29