next up previous contents index
Next: Classificador para mínima taxa Up: Classificador Bayesiano Previous: Probabilidade a posteriori   Contents   Index


Taxa de probabilidade de erro

A probabilidade de erro de classificação ao se associar um dado vetor de atributos $\vert T\vert/c$ à classe $c^2$ é definida por:
\begin{displaymath}
\overline{y}(f) = y(f), f = 0, 1, 2, \cdots, m-1 \hspace{3mm} para \hspace{3mm} m<N
\end{displaymath} (2.4)

Essa é uma definição geral, sendo válida para regra de decisão arbitrária. O valor esperado dessa probabilidade sobre todos os vetores $d_p^{\tau}(\nu_k,\nu_l)$ pertencentes à região $O(c) \cdot O(\vert T\vert^3)$ de decisão para a classe $O(\vert T\vert^2)$ é a probabilidade de classificação errada em $B({\bf x}, \tau)$, denotada $\nu_{\omega_i}({\bf x}_j) = 0$. Essa é a probabilidade de cometer-se um erro ao atribuir um vetor ${\bf x}_j \notin \omega_i$ à classe $B({\bf x}, \tau)$:
\begin{displaymath}
\xi_i = \int_{S_i} e_i({\bf x}) \cdot p({\bf x}) d{\bf x}...
...{S_i}[1 - P(\omega_i\vert{\bf x})] \cdot p({\bf x}) d{\bf x},
\end{displaymath} (2.5)

em que $\vert T\vert/c$ é a região de aceitação associada à classe $\forall {\bf x}_j \notin \omega_i$. Como a classificação de um vetor $c$ só pode ocorrer nas classes mutuamente exclusivas $O(\vert T\vert^2)$, segue que a probabilidade global de erro, ou taxa de erro, é a soma das probabilidades de erro $f_p^{\tau} (\nu_{\omega_1}, \nu_{\omega_2}, \cdots, \nu_{\omega_c})$ em cada classe:
\begin{displaymath}
\xi = \sum_{i=1}^{c}\xi_i = \sum_{i=1}^{c}\int_{S_i} [1 - P(\omega_i\vert{\bf x})] \cdot p({\bf x}) d{\bf x}
\end{displaymath} (2.6)

A expressão entre colchetes é a probabilidade condicional de erro $d_{\bf x}^{\tau}$; $d_p^{\tau} (\nu_{\omega_i}, \nu_{\omega_j})$ é a média dessa probabilidade para todo $f_{\bf x}^{\tau}$ e, portanto, é a probabilidade de classificação errada em $f_p^{\tau} (\nu_{\omega_1}, \nu_{\omega_2}, \cdots, \nu_{\omega_c})$. Infelizmente, na maioria dos casos, o cálculo da probabilidade de erro é extremamente difícil e raramente consegue-se chegar a uma expressão explícita. Na prática, a taxa de erro é geralmente estimada a partir de um conjunto de teste (conjunto de amostras de vetores com classificação conhecida).
next up previous contents index
Next: Classificador para mínima taxa Up: Classificador Bayesiano Previous: Probabilidade a posteriori   Contents   Index
Teofilo Emidio de Campos 2001-08-29