domingo, 12 de março de 2017

Distribuição de probabilidades e outliers [Materiais da aula]

Na aula passada começamos a revisão de estatística básica (materiais aqui) e nesta semana daremos continuidade à revisão, tratando de distribuições de probabilidade e detecção de outliers.

1 SLIDES



2 ARQUIVOS DOS DADOS USADOS NA AULA

Dados para a aula de normalidade
Plan 1

3 DO-FILE DOS PRINCIPAIS COMANDOS

Caso vocês tenham que instalar algum desses comandos, clique aqui e veja como instalar.

** Usando a primeira base de dados
histogram vm
generate lnvm=ln(vm)
ladder vm
gladder vm
qladder vm
sktest vm

** Usando a base nlsw88
sysuse nlsw88, clear
histogram wage, normal
graph box wage
qnorm wage
ladder wage
gladder wage
sktest wage 
** testa a normalidade univariada
** Use transformações para testar, a exemplo de:
g logwage=log(wage)
** Alternativamente: 
g lnwage=ln(wage)
** Padronizando a variável wage, pelo Z-Escore:
sum wage
** A média foi 7.766949 e o desvio-padrão foi 5.755523. Aplicamos isso na fórmula do Z-escore para padronizar a variável, fazendo com que ela fique com média zero e variância constante
** Crio a nova variável
g Zwage=(wage-7.766949)/5.755523
** Verificando:
sum Zwage

** Detectando outliers na primeira vase de dados:
sum rpegaverage cob_eps
extremes  rpegaverage cob_eps
scatter rpegaverage cob_eps

Nenhum comentário:

Postar um comentário

Related Posts Plugin for WordPress, Blogger...