大数据专栏
大数据 营销技术博客
  • 营销大数据基础技术之Hadoop核心
  • 营销大数据最基础的技术当然非Hadoop莫属。 

    Hadoop的核心就是HDFS和MapReduce,而两者只是理论基础,不是具体可使用的高级应用,Hadoop旗下有很多经典子项目,比如HBase、Hive等,这些都是基于HDFS和MapReduce发展出来的。

     1.HDFS HDFS(Hadoop Distributed File System,Hadoop分布式文件系统),它是一个高度容错性的系统,适合部署在廉价的机器上。HDFS能提供高吞吐量的数据访问,适合那些有着超大数据集(large data set)的应用程序。

     2.MapReduce 通俗说MapReduce是一套从海量源数据提取分析元素最后返回结果集的编程模型,将文件分布式存储到硬盘是第一步,而从海量数据中提取分析我们需要的内容就是MapReduce做的事了。

    大数据,又称为巨量资料,指的是传统数据处理应用软件不足以处理它们的大或复杂的数据集的术语。大数据也可以定义为来自各种来源的大量非结构化和结构化数据。




  • 0
  • 0
  • 0
  • 142
  • 2018-05-11 16:13

发布于 5 月 以前





登录 没有账号请 注册
公开的全部图册
认识更多用户
有 1 张图片
有 0 张图片
有 0 张图片
有 0 张图片
有 0 张图片


© 2009-2018 数开网-网络营销SEO优化、百度Google外贸SEO推广、ASO移动App与微信营销、自助建站网上兼职外包众包开发平台