大数据人|大数据第一社区

 找回密码
 注册会员

扫一扫,访问微社区

订阅

技术

数据挖掘150道试题 测测你的专业能力过关吗?
数据挖掘150道试题 测测你的专业能力过关吗?
1. 某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的哪类问题?(A)A. 关联规则发现B. 聚类C. 分类D. 自然语言处理2. 以下两种描述分别对应哪两种对分类算法的评价标准? (A)(a)警 ...
分类:    2015-11-3 10:52
分享 | 我的数据挖掘之路——从菜鸟到实战
分享 | 我的数据挖掘之路——从菜鸟到实战
作者是浙江大学计算机硕士,通过自己的努力终于拿到了心仪的offer(搜狗Web数据挖掘助理研究员),实现了从事互联网数据挖掘的梦 想。他对数据挖掘这个行业的兴趣,以及为了进入这个行业所做的准备和努力,非常值得 ...
分类:    2015-11-3 10:50
Spark系列之四(完):MapReduce 转换到 Spark
Spark 是类似于 MapReduce 的计算引擎,它提出的内存方式解决了 MapReduce 存在的读取磁盘速度较慢的困难,此外,它基于 Scala 的函数式编程风格和 API,进行并行计算时效率很高。由 于 Spark 采用的是 RDD(弹性分布 ...
分类:    2015-11-2 18:39
Spark系列之三:MapReduce VS Spark(2)
SparkDemo 程序运行Spark 源代码可以在 http://spark-project.org/download 处下载,也可以到 github 直接复制 Spark 项目。Spark 提供基本源码压缩包,同时也提供已经编译好的压缩包。Spark 是通过 Scala Shell 来 ...
分类:    2015-11-2 18:36
Spark系列之三:MapReduce VS Spark (1)
Spark系列之三:MapReduce VS Spark (1)
MapReduce 和 Spark 介绍目前的大数据处理可以分为以下三个类型:复杂的批量数据处理(batch data processing),通常的时间跨度在数十分钟到数小时之间;基于历史数据的交互式查询(interactive query),通常的时 ...
分类:    2015-11-2 18:35
Spark系列之二:Scala 语言解释及示例讲解
Spark系列之二:Scala 语言解释及示例讲解
Scala 语言衍生自 Funnel 语言。Funnel 语言尝试将函数式编程和 Petri 网结合起来,而 Scala 的预期目标是将面向对象、函数式编程和强大的类型系统结合起来,同时让人要能写出优雅、简洁的代码。本文希望通过一系列 ...
分类:    2015-11-2 18:34
Spark系列之一:Spark,一种快速数据分析替代方案
Spark系列之一:Spark,一种快速数据分析替代方案
Spark 是一种与 Hadoop 相似的开源集群计算环境,但是两者之间还存在一些不同之处,这些有用的不同之处使 Spark 在某些工作负载方面表现得更加优越,换句话说,Spark 启用了内存分布数据集,除了能够提供交互式查询 ...
分类:    2015-11-2 18:29
大规模主题模型:对Spark LDA算法的改进
大规模主题模型:对Spark LDA算法的改进
这篇文章由Databricks的Feynman Liang和Joseph Bradley,以及Intel的Yuhao Yang撰写。在使用LDA之前,请先 下载Spark 1.5或是 申请试用版的Databricks。人们正在推特上讨论什么呢?为了关注分布式计算,我该阅读哪些 ...
分类:    2015-11-2 18:26
Hadoop新型数据库Kudu应用经验分享
Hadoop新型数据库Kudu应用经验分享
小米使用kudu的背景小米大概在14年中开始和cloudera合作,作为kudu小白鼠用户,帮cloudera在生产环境验证kudu。kudu+Impala可以帮助我们解决实时数据的ad-hoc查询需求。在kudu之前,我们的大数据分析pipeline大概是 ...
分类:    2015-11-2 18:22
让深度学习摆脱束缚应用更广
人工智能经历了几次低潮时期,这些灰暗时光被称作“AI寒冬”。这里说的不是那段时期,事实上,人工智能如今变得异常火热,以至于科技巨头谷歌、Facebook、苹果、百度和微软正在争抢该领域的领袖人物。当前人工智能之 ...
分类:    2015-11-2 18:04
从拉勾网爬的招聘数据,解析中国数据挖掘人才能挣多少钱
从拉勾网爬的招聘数据,解析中国数据挖掘人才能挣多少钱
导 读:如何从拉勾网里面来看互联网企业的数据挖掘现状?缘起是因为数据挖掘入行不久,一直上拉勾网看各种公司的招聘JD,人工看一方面是时间很消耗,更严重的是抓不住重点,最近刚好入手python爬虫,试图简化这部分 ...
分类:    2015-11-1 12:53
大数据的无限价值 正在等你来挖掘
大数据的无限价值 正在等你来挖掘
现如今,任何事都必须用数据来说话。大数据浪潮汹涌来袭,与互联网的发明一样,这绝不仅仅是信息技术领域的革命,更是企业创新、行业变革的契机。大数据的核心并不在于数据量的大小,而是我们能否成功挖掘出大数据价 ...
分类:    2015-11-1 11:56
【干货推荐】如何构建有指导的数据挖掘模型案例分享
【干货推荐】如何构建有指导的数据挖掘模型案例分享
数据挖掘的目的,就是从数据中找到更多的优质用户。接着上篇继续探讨有指导数据挖掘方法模型。什么是有指导的数据挖掘方法模型,以及数据挖掘如何构建模型。在构建一个有指导的数据挖掘模型,首先要理解和定义一些模 ...
分类:    2015-11-1 11:49
【数据挖掘】应用关联规则模型提高超市销量
【数据挖掘】应用关联规则模型提高超市销量
Statistics 和 Modeler作为 IBM SPSS 软件家族中重要的成员,是专业的科学统计、数据挖掘分析工具,其具有功能强大,应用广泛的特点。其核心 组成部分——预测分析模型,不仅是软件功能实现的关键,同时也是软件应用 ...
分类:    2015-11-1 11:43
大数据分析软件包含哪些技术?
大数据分析软件包含哪些技术?
所谓大数据不仅体现在数量上的庞大,还有涉及到的方面比较广泛,以及计算过程比较的庞大而高效等,大数据分析能够从海量的数据中提取出最有效的信息,在企业的营销中发挥关键性的作用,可以说谁能够更好的利用大数据 ...
分类:    2015-10-27 19:31
微信公众号

大数据人的微信公众号

bigdata_ren


扫一扫关注 微信搜索【大数据人】 关注!


大数据人微信公众号

千人读者QQ群

213259606

点击快速加入








相关分类

关闭

站长推荐上一条 /2 下一条


id="mn_portal" >首页Portalid="mn_P18" onmouseover="navShow('P18')">应用id="mn_P15" onmouseover="navShow('P15')">技术id="mn_P37" onmouseover="showMenu({'ctrlid':this.id,'ctrlclass':'hover','duration':2})">前沿id="mn_P36" onmouseover="navShow('P36')">宝箱id="mn_P61" onmouseover="showMenu({'ctrlid':this.id,'ctrlclass':'hover','duration':2})">专栏id="mn_P65" >企业id="mn_Nd633" >导航 折叠导航 关注微信 关注微博 关注我们

QQ|广告服务|关于我们|Archiver|手机版|小黑屋|大数据人 ( 鄂ICP备14012176号-2  

GMT+8, 2024-6-22 20:06 , Processed in 0.224002 second(s), 16 queries .

Powered by 小雄! X3.2

© 2014-2020 bigdataer Inc.

返回顶部