自从Hadoop的出现,引领大数据的浪潮越来越热。大数据存储的主要技术路线有几种: 1.Hadoop 2.Cassandra 3.MongoDB Hadoop是Apache的开源项目,同时有很多商业公司对Hadoop进行版本发行和商业支持,参见:http://wiki.apache.org/hadoop/Distributions%20and%20Commercial%20Support 其中在最有名为人所知的三家: 1.Cloudera
2.Hortonwork
3.MapR
这三个厂商之中,MapR最为封闭;Hortonworks最为开放,产品线全开源,在线文档比较丰富。国内使用Cloudera CDH和Hortonworks的应该是最多的。 准实时计算框架/即席查询 1.CDH的框架有:Impala + Spark; 2.HDP的框架有:Tez + Spark; 3.MapR的框架有:Drill + Tez + Spark。 关于Spark: 2014年大数据最热门的技术路线就是算是Spark了,而且得力于Spark不遗余力的推广和快速成长。Cloudera是最早支持Spark,也是最激进的。下图即是Spark在Cloudera产品线中的定位:
实际上快速计算框架的发展才刚刚开始,社区中已经有如下几种: 1.Spark/Shark 2.Hortonworks Tez/Stinger 3.Cloudera Impala 4.Apache Drill 5.Apache Flink 6.Apache Nifi 7.Facebook Presto |
|广告服务|关于我们|Archiver|手机版|小黑屋|大数据人 ( 鄂ICP备14012176号-2 )
GMT+8, 2024-4-20 22:16 , Processed in 0.195475 second(s), 21 queries .
Powered by 小雄! X3.2
© 2014-2020 bigdataer Inc.