基于Hadoop架构的大数据量日志存储和检索优化
Netinfo Security(2013)
摘要
Hadoop是一个实现MapReduce计算模型的开源分布式并行编程框架,借助于Hadoop,程序员可以轻松编写分布式并行程序,并将其运行于计算机集群上,完成海量数据的计算。本文介绍了基于Hadoop架构的系统的设计与实现,介绍如何提高Hadoop的分布式文件管理系统(HDFS)和MapReduce的执行效率与速度,以及Hadoop的安装部署和基本运行方法。
更多查看译文
关键词
Hadoop,distributed computing,log
AI 理解论文
溯源树
样例
![](https://originalfileserver.aminer.cn/sys/aminer/pubs/mrt_preview.jpeg)
生成溯源树,研究论文发展脉络
Chat Paper
正在生成论文摘要