Saltar para o conteúdo

Fração de variância inexplicada

Origem: Wikipédia, a enciclopédia livre.

Em estatística, a fração de variância inexplicada (FVI) no contexto de uma tarefa de regressão é a fração de variância do regressando (variável dependente) Y que não pode ser explicada, ou seja, que não é corretamente predita, pelas variáveis explicativas X.

Definição formal

[editar | editar código-fonte]

Suponha que nos seja dada uma função de regressão rendendo para cada uma estimativa onde é o vetor das i-ésimas observações sobre todas as variáveis ​​explicativas.[1]:181 Definimos a fração de variância inexplicada (FVI) como:

onde R2 é o coeficiente de determinação e VARerr e VARtot são a variância dos resíduos e a variância amostral da variável dependente. SSerr (a soma dos erros quadráticos das previsões, equivalentemente a soma residual dos quadrados), SStot (a soma total dos quadrados), e SSreg (a soma dos quadrados da regressão, equivalentemente a soma explicada dos quadrados) são dados por

Alternativamente, a fração de variância inexplicada pode ser definida da seguinte forma:

onde é o erro quadrático médio da função de regressão .

É útil considerar a segunda definição para entender FVI. Ao tentar prever Y, a função de regressão mais ingênua que podemos pensar é a função constante que prevê a média de Y, ou seja, . Segue-se que o MSE desta função é igual à variância de Y; ou seja, SSerr = SStot, e SSreg = 0. Nesse caso, nenhuma variação em Y pode ser contabilizada e a FVI tem então seu valor máximo de 1.

Mais geralmente, o FVI será 1 se as variáveis ​​explicativas X não nos dizem nada sobre Y no sentido de que os valores previstos de Y não variam com Y. Mas à medida que a previsão melhora e o MSE pode ser reduzido, o FVI diminui. No caso de previsão perfeita onde para todo i, o MSE é 0, SSerr = 0, SSreg = SStot, e o FVI é 0.

Referências

  1. Achen, C. H. (1990). «'What Does "Explained Variance" Explain?: Reply». Political Analysis. 2 (1): 173–184. doi:10.1093/pan/2.1.173