admin 发表于 2015-11-19 18:34:51

graph box检测异常值(Outlier)

【问题】
有时候,需要查看一下数据是否有异常值。
当然,什么是异常值,本身就是个问题。
一般而言,从统计意义上,和大多数据不在一起的就是异常值。
【方法】
本文主要介绍graph box,其他方法,按住不表。

box图分为四个分位点,75th和25th比较简单。
Upper adjacent value(简写为UAV)和Lower adjacent value(简写为LAV)是什么呢?
先定义Interquartitle range(简写为IQR),其为75th-25th。
UAV=75th+1.5*IQR
LAV=25th-1.5*IQR
Stata的程序为:
    scalar `u' = r(p75) + (3/2) * (r(p75) - r(p25))
    scalar `l' = r(p25) - (3/2) * (r(p75) - r(p25))
【例子】






benford检验数据是否造假?
mss检验分位数回归异方差


页: [1]
查看完整版本: graph box检测异常值(Outlier)