admin 发表于 2015-11-19 18:21:37

predict leverage检测异常值

【问题】
graph box检测异常值(Outlier)

上文提到画图可以简单看下是否存在Outlier
但是,只能检测一个变量一个变量检验。
如果,想检验一组变量,怎么办?
【方法】
利用predict leverage或predict hat 都是一样的。
由于,某个观测点对于回归系数的影响力(leverage),可以通过投影矩阵P来表示:
lev_i\equiv x_{i}'(X'X)^{-1}x_i

去掉βi是去掉第i个观测值后的OLS估计值,则去掉前后的差距为:
\beta-\beta^i=1/(1-lev_i)(X'X)^{-1}x_ie_i

lev越大,差距越大越可能存在异常值。
【例子】
use auto,clear
regprice weight length
*得到leverage (diagonal elements of hat matrix)
predict lev,leverage
*一样结果
predict hat,hat
*从大到小排列
gsort -lev
*查看最大的三个
list lev in 1/3
【参考】
陈强,《高级计量经济学及Stata应用》,高等教育出版社。

graph box检测异常值(Outlier)
gsort排列变量

页: [1]
查看完整版本: predict leverage检测异常值