##

资料分享 白皮书

应用Splunk进行大规模、非结构性数据的检索和分析

——更轻松、更高效的MapReduce并行分析模式

MapReduce 是 2004年由Google开发的分散式数据处理模型。MapReduce 的基本设计理念是把 问题分成两个部分:1)将源数据转换成充分统计数据的映射函数;2)将所有充分统计数据合并为最终答 案的化简函数。通过定义,所有并行映射函数可同时运行且不会相互影响。一旦使用映射函数运算所有数 据,就可结合映射阶段的结果进行化简函数运算。对于网页搜索分析方案中常见的大规模批量处理和高速数据检索,MapReduce 能够提供最快速、最 节省且最大规模的数据返回程序。当今,大部分“大规模数据”先进管理技术是基于MapReduce研发的。

点击查看更多白皮书

发表评论

电子邮件地址不会被公开。 必填项已用*标注

联系我们联系我们

希望我们主动联系您

关于我们关于我们

10DATA关注于机器大数据技术与互联数据应用推广拥有国内丰富的项目实施经验和专业的产品技术团队。总部位于上海,在北京和深圳分设办事处。
10DATA团队以Startup初创公司的方式进行组建、成长壮大。 创新、自由、平等、互相尊重的精神始终贯穿于整个团队, 鼓励员工在享受工作的乐趣和满足的同时,为客户带来持续的有深度的价值。

您也可通过以下方式联系我们

  • 客服电话:4000671005
  • 电子邮件:contact@10data.com
  • 公司地址:上海市浦东新区世纪大道1229号东方汇广场1号楼3楼
  • 公司官网:www.10data.com
  • Splunk中文社区: ask.10data.com

##

沪ICP备11017547 沪公网安备 31011502002368号 ©版权所有 2005-2017 上海天旦网络科技发展有限公司(Netis)

GO TOP

返回

发表评论

电子邮件地址不会被公开。 必填项已用*标注