Taxa de probabilidade de erro

Next: Classificador para mínima taxa Up: Classificador Bayesiano Previous: Probabilidade a posteriori Contents Index

Taxa de probabilidade de erro

A probabilidade de erro de classificação ao se associar um dado vetor de atributos $\vert T\vert/c$ à classe

é definida por:

$\begin{displaymath} \overline{y}(f) = y(f), f = 0, 1, 2, \cdots, m-1 \hspace{3mm} para \hspace{3mm} m<N \end{displaymath}$

(2.4)

Essa é uma definição geral, sendo válida para regra de decisão arbitrária. O valor esperado dessa probabilidade sobre todos os vetores $d_p^{\tau}(\nu_k,\nu_l)$ pertencentes à região $O(c) \cdot O(\vert T\vert^3)$ de decisão para a classe $O(\vert T\vert^2)$ é a probabilidade de classificação errada em $B({\bf x}, \tau)$ , denotada $\nu_{\omega_i}({\bf x}_j) = 0$ . Essa é a probabilidade de cometer-se um erro ao atribuir um vetor ${\bf x}_j \notin \omega_i$ à classe $B({\bf x}, \tau)$ :

$\begin{displaymath} \xi_i = \int_{S_i} e_i({\bf x}) \cdot p({\bf x}) d{\bf x}... ...{S_i}[1 - P(\omega_i\vert{\bf x})] \cdot p({\bf x}) d{\bf x}, \end{displaymath}$

(2.5)

em que $\vert T\vert/c$ é a região de aceitação associada à classe $\forall {\bf x}_j \notin \omega_i$ . Como a classificação de um vetor

só pode ocorrer nas classes mutuamente exclusivas $O(\vert T\vert^2)$ , segue que a probabilidade global de erro, ou taxa de erro, é a soma das probabilidades de erro $f_p^{\tau} (\nu_{\omega_1}, \nu_{\omega_2}, \cdots, \nu_{\omega_c})$ em cada classe:

$\begin{displaymath} \xi = \sum_{i=1}^{c}\xi_i = \sum_{i=1}^{c}\int_{S_i} [1 - P(\omega_i\vert{\bf x})] \cdot p({\bf x}) d{\bf x} \end{displaymath}$

(2.6)

A expressão entre colchetes é a probabilidade condicional de erro $d_{\bf x}^{\tau}$ ; $d_p^{\tau} (\nu_{\omega_i}, \nu_{\omega_j})$ é a média dessa probabilidade para todo $f_{\bf x}^{\tau}$ e, portanto, é a probabilidade de classificação errada em $f_p^{\tau} (\nu_{\omega_1}, \nu_{\omega_2}, \cdots, \nu_{\omega_c})$ . Infelizmente, na maioria dos casos, o cálculo da probabilidade de erro é extremamente difícil e raramente consegue-se chegar a uma expressão explícita. Na prática, a taxa de erro é geralmente estimada a partir de um conjunto de teste (conjunto de amostras de vetores com classificação conhecida).

Next: Classificador para mínima taxa Up: Classificador Bayesiano Previous: Probabilidade a posteriori Contents Index

Teofilo Emidio de Campos 2001-08-29