R具有非常强大的计算功能,R可以作为一个“大计算器”。基本统计量计算主要包括:均值计算、中位数计算、标准差计算、方差计算、协方差和相关系数计算。 R中如何完成上述计算,汇总如下。 基本统计量一:均值计算。使用mean()函数计算均值。 基本统计量二:中位数计算。使用median()函数计算中位数。 基本统计量三:标准差计算。使用sd()函数计算标准差。 基本统计量四:方差计算。使用var()函数计算方差。 基本统计量五:协方差计算。使用cov()函数计算协方差。 基本统计量六:相关系数计算。使用cor()函数计算相关系数。 关于R基本统计量计算,举例说明如下。 > data1 <- c(1, 3, 5, 7, 9)> data1[1] 1 3 5 7 9> mean(data1)[1] 5> median(data1)[1] 5> sd(data1)[1] 3.162278> var(data1)[1] 10> data2 <- c(2, 4, 6, 8, 10)> data2[1] 2 4 6 8 10> mean(data2)[1] 6> median(data2)[1] 6> sd(data2)[1] 3.162278> var(data2)[1] 10> cov(data1, data2)[1] 10> cor(data1, data2)[1] 1注意:关于基本统计量计算的函数对于数据缺失值敏感。某个变量的缺失值可能导致函数返回NA结果或是计算结果报错。数据中缺失值是否对统计结果产生严重影响?若是,计算机报错是正确的;若不是,可以通过设置参数na.rm=TRUE,告知R忽略缺失值。例如 > data3 <- c(1, 2, 3, NA)> data3[1] 1 2 3 NA> mean(data3)[1] NA> mean(data3, na.rm=TRUE)[1] 2> sd(data3)[1] NA> sd(data3, na.rm=TRUE)[1] 1R基本统计量是统计分析的基本,一方面需要理解每个统计量的物理含义和统计意义,另一方面需要掌握如何基于R 计算各个基本统计量。
【想一想】 1基本统计量有哪些?每一种统计量表示什么含义? 2标准差和方差的计算公式是什么? 【做一做】 1查看women数据集,计算变量height和weight的均值、中位数、标准差、方差以及两者之间的协方差和相关系数。 2自定义峰度和偏度函数,计算上述变量的峰度和偏度。
原文地址:http://mp.weixin.qq.com/s?__biz= ... Mw==&scene=6#rd
|