大数据人|大数据第一社区

 找回密码
 注册会员

扫一扫,访问微社区

查看: 1461|回复: 0
打印 上一主题 下一主题

[其它] 十大经典数据挖掘算法R语言实践(二)支持向量机算法

[复制链接]
  • TA的每日心情
    奋斗
    2015-7-30 23:05
  • 签到天数: 12 天

    [LV.3]偶尔看看II

    852

    主题

    972

    帖子

    4804

    积分

    管理员

    Rank: 9Rank: 9Rank: 9

    积分
    4804
    QQ
    跳转到指定楼层
    楼主
    发表于 2015-11-18 09:42:48 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
    续《十大经典数据挖掘算法R语言实践(一)》,本文介绍支持向量机算法在R语言中如何使用。

    数据集,采用R语言内置的iris数据集。

    查看数据集前六个观测
    head(iris)

    第一步:加载SVM算法的R包e1071

    library(e1071)
    ## Warning: package 'e1071' was built under R version 3.1.3
    library(printr)

    第二步:把iris按着2:1的比例分为训练集和测试集
    index <- sample(1:nrow(iris), 100)
    iris.train <- iris[index, ]
    iris.test <- iris[-index, ]

    第三步:在训练集上用SVM构建模型
    model.SVM <- svm(Species ~ ., data=iris.train)

    第四步:在测试集上对模型做测试
    results.SVM <- predict(object=model.SVM, newdata=iris.test, type="class")

    第五步:生成混淆矩阵,理解测试结果
    table(results.SVM, iris.test$Species)


    SVM原理

    支持向量机,英文为Support Vector Machine,简称SV机(论文中一般简称SVM)。它是一种监督式学习的方法,它广泛的应用于统计分类以及回归分析中。

    SVM 的主要思想可以概括为两点:

    (1) 它是针对线性可分情况进行分析,对于线性不可分的情况,通过使用非线性映射算法将低维输入空间线性不可分的样本转化为高维特征空间使 其线性可分,从而使得高维特征空间采用线性算法对样本的非线性特征进行线性分析成为可能;

    (2) 它基于结构风险最小化理论之上在特征空间中建构最优分割超平面,使得学习器得到全局最优化,并且在整个样本空间的期望风险以某个概率满足一定上界。 在学习这种方法时,首先要弄清楚这种方法考虑问题的特点,这就要从线性可分的最简单情况讨论起,在没有弄懂其原理之前,不要急于学习线性不可分等较复杂的情况,支持向量机。在设计时,需要用到条件极值问题的求解,因此需用拉格朗日乘子理论,但对多数人来说,以前学到的或常用的是约束条件为等式表示的方式,但在此要用到以不等式作为必须满足的条件,此时只要了解拉格朗日理论的有关结论就行。

    参考资料

    1 《数据挖掘导论》和《数据挖掘:概念与技术》

    2 数据挖掘十大经典算法(详解)

    3 Top 10 data mining algorithms in plain R


    回复

    使用道具 举报

    您需要登录后才可以回帖 登录 | 注册会员

    本版积分规则

    关闭

    站长推荐上一条 /2 下一条


    id="mn_portal" >首页Portalid="mn_P18" onmouseover="navShow('P18')">应用id="mn_P15" onmouseover="navShow('P15')">技术id="mn_P37" onmouseover="showMenu({'ctrlid':this.id,'ctrlclass':'hover','duration':2})">前沿id="mn_P36" onmouseover="navShow('P36')">宝箱id="mn_P61" onmouseover="showMenu({'ctrlid':this.id,'ctrlclass':'hover','duration':2})">专栏id="mn_P65" >企业id="mn_Nd633" >导航 折叠导航 关注微信 关注微博 关注我们

    QQ|广告服务|关于我们|Archiver|手机版|小黑屋|大数据人 ( 鄂ICP备14012176号-2  

    GMT+8, 2024-5-7 04:32 , Processed in 0.249185 second(s), 34 queries .

    Powered by 小雄! X3.2

    © 2014-2020 bigdataer Inc.

    快速回复 返回顶部 返回列表