predict leverage检测异常值
【问题】graph box检测异常值(Outlier)
上文提到画图可以简单看下是否存在Outlier
但是,只能检测一个变量一个变量检验。
如果,想检验一组变量,怎么办?
【方法】
利用predict leverage或predict hat 都是一样的。
由于,某个观测点对于回归系数的影响力(leverage),可以通过投影矩阵P来表示:
lev_i\equiv x_{i}'(X'X)^{-1}x_i
去掉βi是去掉第i个观测值后的OLS估计值,则去掉前后的差距为:
\beta-\beta^i=1/(1-lev_i)(X'X)^{-1}x_ie_i
lev越大,差距越大越可能存在异常值。
【例子】
use auto,clear
regprice weight length
*得到leverage (diagonal elements of hat matrix)
predict lev,leverage
*一样结果
predict hat,hat
*从大到小排列
gsort -lev
*查看最大的三个
list lev in 1/3
【参考】
陈强,《高级计量经济学及Stata应用》,高等教育出版社。
graph box检测异常值(Outlier)
gsort排列变量
页:
[1]