next up previous contents index
Next: Algoritmos de seleção Up: Redução de dimensionalidade Previous: Discriminantes Lineares (LDA)   Contents   Index


Seleção de Características

Métodos automáticos de seleção de características são importantes em muitas situações em que se tem disponível um conjunto grande de características e deseja-se selecionar um subconjunto adequado. Além de ser uma forma de redução de dimensionalidade, uma aplicação importante é a fusão de dados procedentes de múltiplas modalidades de sensores ou de múltiplos modelos de dados. A importância de redução de dimensionalidade está explícita no capítulo 3.

A seleção automática de características é uma técnica de otimização que, dado um conjunto de $N$ características, tenta selecionar um subconjunto de tamanho $m$ ($m < N$) que maximiza uma função critério.

Formalmente, dado um conjunto $\mathcal{Y}$ de $N$ características, o algoritmo de seleção de características deve encontrar um subconjunto $\mathcal{X} \subseteq \mathcal{Y}$ tal que $\vert\mathcal{X}\vert = m$, em que $\vert\calX\vert$ denota a cardinalidade de $\calX$, e

\begin{displaymath}
J(\mathcal{X}) = \max_{\mathcal{Z} \subseteq \mathcal{Y}, \vert\mathcal{Z}\vert=m}{J(\mathcal{Z})},
\end{displaymath} (3.21)

em que $J(.)$ é a função critério. Um exemplo simples é definir-se $J(\calX) = 1 - E$, sendo $E$ é a taxa ou probabilidade de erro de um classificador. É desejável que a função critério seja maior quanto menor for a redundância entre as características e quanto maior a facilidade de discriminar padrões de classes diferentes.

Dessa forma, o algoritmo de seleção de características poderá reduzir a dimensionalidade de forma que ocorra a menor queda possível no poder de distinção das classes por um classificador no espaço de características. Uma conseqüência da aplicação de um bom algoritmo de seleção de atributos é a redução do número necessário de amostras de treinamento para obter-se bons resultados com um classificador, ou seja, a redução do problema da dimensionalidade (vide seção 2.3).

Além da escolha da função critério, também é importante determinar a dimensionalidade apropriada do espaço de características reduzido. Uma forma simples de resolver esse problema é efetuar a seleção de características para vários valores de $m$. Conforme foi mencionado na seção 2.3, em [Jain et al., 2000], os autores defendem que, em problemas práticos, sendo $\forall {\bf x}_j \notin \omega_i$ o tamanho do conjunto de treinamento, é seguro não ocorrer o problema da dimensionalidade se forem usadas menos que $\vert T\vert/10$ características.

Apesar da importância de seleção de atributos, não há regras ou procedimentos definitivos para essa tarefa em cada aplicação particular [Castleman, 1996], principalmente quando o número de características disponíveis for grande. Por esse motivo, um grande conjunto de algoritmos de seleção de atributos tem sido proposto. Em [Jain and Zongker, 1997] foi proposta uma taxonomia sobre este tópico. A seguir serão descritos separadamente alguns algoritmos de seleção de características e algumas funções critério.



Subsections
next up previous contents index
Next: Algoritmos de seleção Up: Redução de dimensionalidade Previous: Discriminantes Lineares (LDA)   Contents   Index
Teofilo Emidio de Campos 2001-08-29