next up previous contents index
Next: Experimentos de Seleção de Up: Método Proposto para Seleção Previous: Algoritmo e complexidade   Contents   Index


Considerações Sobre o Comportamento da Função Critério

Nesta seção, serão discutidas as principais propriedades dessa abordagem, as quais nos motivaram a utiliza-la em seleção de características. Tais propriedades se relacionam com a distância entre os suportes (protótipos) das classes diferentes e com o quão os conjuntos são compactos (compacidade). Cada parâmetro das equações 3.36 e 3.37 será discutido isoladamente, sendo posteriormente analisados os resultados da integração desses parâmetros nessas equações. Para facilitar a ilustração dos casos, os resultados a serem mencionados em relação a compacidade são válidos para conjuntos (classes de padrões) com distribuições aproximadamente isotrópicas. As considerações a respeito da distância entre os protótipos também são válidas para conjuntos de padrões com distribuições normais. Posteriormente há uma discussão considerando casos genéricos.

  1. Compacidade. Fixando-se a distância entre os protótipos de classes diferentes e o raio da bola $\tau $, quando a distribuição de uma classe $\omega _i$ for compacta (possuir compacidade grande), para a maioria dos padrões ${\bf x}_i \in \omega_i$, os valores de $\nu_{\omega_i}({\bf x}_i)$ serão grandes, pois o grau de pertinência de um padrão a sua classe é inversamente proporcional à distancia entre esse e o protótipo dessa classe. Caso contrário (quando a compacidade da classe for grande), os valores de $\nu_{\omega_i}({\bf x}_i)$ serão pequenos para a maioria dos padrões ${\bf x}_i: {\bf x}_i \in \omega_i$.

  2. Distância entre os protótipos. Seja $\omega _i$ e $\omega_j$ duas classes e ${\bf x}$, ${\bf y}$, ${\bf z}$ padrões com ${\bf y} \in
\omega_i$ e ${\bf z} \in \omega_j$, ${\bf x} \in \omega_i \bigcup
\omega_j$, fixando-se a compacidade da distribuição das classes de padrões e o raio da bola $\tau $, quando a distância entre os protótipos de classes diferentes for grande, será mais provável que um dado padrão ${\bf x}$ esteja próximo do protótipo de uma classe e distante de outra. Sendo $p^{\omega_i}$ o protótipo que se encontra mais próximo do padrão ${\bf x}$ e $p^{\omega_j}$ o protótipo que se encontra mais distante do padrão ${\bf x}$, o valor de $\nu_{\omega_i}({\bf y})$ será grande, e o valor de $\nu_{\omega_j}({\bf z})$ será pequeno (para ${\bf y} \in
\omega_i$ e ${\bf z} \in \omega_j$). Com isso, a diferença $\vert\nu_{\omega_i}({\bf y}) - \nu_{\omega_j}({\bf z})\vert$ será grande. Se isso ocorrer na maioria dos padrões dentro da bola $B({\bf x}, \tau)$, o valor de $d_{\bf x}^{\tau}$ será grande. Como isso provavelmente ocorrerá para a maioria dos padrões, o valor total da distância $d_p^{\tau} (\nu_{\omega_i}, \nu_{\omega_j})$ será grande. Caso a distância entre os protótipos de classes diferentes seja pequena, seguindo o mesmo racionício, conclui-se que o valor de $d_p^{\tau} (\nu_{\omega_i}, \nu_{\omega_j})$ será pequeno.

  3. Tamanho da bola. Fixando-se a distância entre os protótipos e a compacidade, devemos considerar dois casos: Por isso, a determinação do valor de $\tau $ é muito importante na utilização da distância de [Lowen and Peeters, 1998] como função critério. Para determinar o melhor valor de $\tau $ para um dado conjunto de padrões de treinamento, uma estratégia possível é a de tentativa e erro com vários valores diferentes de $\tau $, sendo que o valor máximo deve ser menor que $\sup_{{\bf y}, {\bf z}
\in F} d_E({\bf y}, {\bf z})$. Na seção 5.3, estão descritos experimentos de seleção de características com variação no tamanho da bola.

Considerando a utilização de uma bola cujo tamanho seja ideal para avaliar um determinado conjunto de características com um certo conjunto de treinamento de duas classes, podemos construir uma lista de possibilidades, denotando por $d_{1a}, d_{1b}, d_{2a}, d_{2b}, d_{3a}, d_{3b}$ seus prováveis resultados. A relação entre os resultados será comentada posteriormente.

  1. Ambas as classes são compactas e...
    1. a distância entre os protótipos é pequena $\Rightarrow d_p^{\tau} (\nu_{\omega_i}, \nu_{\omega_j}) = d_{1a}$
    2. a distância entre os protótipos é grande $\Rightarrow d_p^{\tau} (\nu_{\omega_i}, \nu_{\omega_j}) = d_{1b}$
  2. Ambas as classes são esparsas e...
    1. a distância entre os protótipos é pequena $\Rightarrow d_p^{\tau} (\nu_{\omega_i}, \nu_{\omega_j}) = d_{2a}$
    2. a distância entre os protótipos é grande $\Rightarrow d_p^{\tau} (\nu_{\omega_i}, \nu_{\omega_j}) = d_{2b}$
  3. Uma classe possui compacidade grande e a outra possui compacidade pequena e...
    1. a distância entre os protótipos é pequena $\Rightarrow d_p^{\tau} (\nu_{\omega_i}, \nu_{\omega_j}) = d_{3a}$
    2. a distância entre os protótipos é grande $\Rightarrow d_p^{\tau} (\nu_{\omega_i}, \nu_{\omega_j}) = d_{3b}$

.6possibilidades.eps Exemplos de distribuições de duas classes em um espaço de características com dimensão 2. Cada círculo representa a compacidade de uma classe e os pontos representam protótipos.

A figura 3.15 ilustra esses casos. Considerando que as duas classes possuem distribuições aproximadamente isotrópicas e que a bola $B({\bf x}, \tau)$ possui tamanho ideal. Podemos afirmar que, intuitivamente, é mais provável que a distância $d_{1b}$ será maior que todas as outras. Da mesma forma, podemos dizer que as distâncias $d_{2a}$ e $d_{1a}$ provavelmente serão as maiores distâncias e que a distância $d_{3a}$ provavelmente será menor que $d_{2b}$ que, por sua vez, provavelmente será menor que $d_{3b}$ .

Essas estimativas resultam da análise dos casos considerando as propriedades citadas anteriormente.

Caso as distribuições dos conjuntos (classes de padrões) com distribuições não normais, convexas ou com formas mais ``complicadas'', torna-se mais difícil realizar uma estimativa dos resultados dessa função critério. Porém pode-se dizer que a influência do número de padrões de classes diferentes que a bola $B({\bf x}, \tau)$ engloba, para diferentes ${\bf x}$, tem mais importância que a distância entre os protótipos. A bola $B({\bf x}, \tau)$ serve como uma medida de sobreposição das distribuições das classes no espaço de características. Se duas classes estiverem muito sobrepostas, o valor da função critério será pequeno. A seguir, mostramos resultados que ilustram esse fato.


next up previous contents index
Next: Experimentos de Seleção de Up: Método Proposto para Seleção Previous: Algoritmo e complexidade   Contents   Index
Teofilo Emidio de Campos 2001-08-29