大数据人|大数据第一社区

 找回密码
 注册会员

扫一扫,访问微社区

查看: 3036|回复: 0
打印 上一主题 下一主题

[其它] 十大经典数据挖掘算法R语言实践(八)EM算法最大期望

[复制链接]
  • TA的每日心情
    奋斗
    2015-7-30 23:05
  • 签到天数: 12 天

    [LV.3]偶尔看看II

    852

    主题

    972

    帖子

    4804

    积分

    管理员

    Rank: 9Rank: 9Rank: 9

    积分
    4804
    QQ
    跳转到指定楼层
    楼主
    发表于 2015-11-18 09:49:31 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
    续《十大经典数据挖掘算法R语言实践(七)》,本文介绍EM算法在R语言中如何使用。

    数据集
    采用R语言内置的iris数据集
    #查看数据集前六个观测
    head(iris)

    EM算法R语言实践
    第一步:加载实现EM算法的R包
    library(mclust)

    第二步:构建EM算法模型
    model.EM <-Mclust(subset(iris, select= -Species))
    第三步:生成混淆矩阵
    table(model.EM$classification, iris$Species)

    思考:如何解读这个混淆矩阵里面的结果??
    EM算法原理
    1 最大期望算法(Expectation-maximizationalgorithm,又译期望最大化算法)在统计中被用于寻找,依赖于不可观察的隐性变量的概率模型中,参数的最大似然估计。
    2 在统计计算中,最大期望(EM)算法是在概率模型中寻找参数最大似然估计或者最大后验估计的算法,其中概率模型依赖于无法观测的隐藏变量(LatentVariable)。最大期望经常用在机器学习和计算机视觉的数据聚类(DataClustering)领域。最大期望算法经过两个步骤交替进行计算,第一步是计算期望(E),利用对隐藏变量的现有估计值,计算其最大似然估计值;第二步是最大化(M),最大化在 E 步上求得的最大似然值来计算参数的值。M步上找到的参数估计值被用于下一个 E 步计算中,这个过程不断交替进行。


    参考资料

    1 《数据挖掘导论》和《数据挖掘:概念与技术》

    2 数据挖掘十大经典算法(详解)

    3 Top 10 data mining algorithms in plain R

    回复

    使用道具 举报

    您需要登录后才可以回帖 登录 | 注册会员

    本版积分规则

    关闭

    站长推荐上一条 /2 下一条


    id="mn_portal" >首页Portalid="mn_P18" onmouseover="navShow('P18')">应用id="mn_P15" onmouseover="navShow('P15')">技术id="mn_P37" onmouseover="showMenu({'ctrlid':this.id,'ctrlclass':'hover','duration':2})">前沿id="mn_P36" onmouseover="navShow('P36')">宝箱id="mn_P61" onmouseover="showMenu({'ctrlid':this.id,'ctrlclass':'hover','duration':2})">专栏id="mn_P65" >企业id="mn_Nd633" >导航 折叠导航 关注微信 关注微博 关注我们

    QQ|广告服务|关于我们|Archiver|手机版|小黑屋|大数据人 ( 鄂ICP备14012176号-2  

    GMT+8, 2024-5-18 14:41 , Processed in 0.263278 second(s), 34 queries .

    Powered by 小雄! X3.2

    © 2014-2020 bigdataer Inc.

    快速回复 返回顶部 返回列表