hadoop如何实现统计输入行数的MAP

这篇文章给大家分享的是有关hadoop如何实现统计输入行数的MAP的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。

坚守“ 做人真诚 · 做事靠谱 · 口碑至上 · 高效敬业 ”的价值观,专业网站建设服务10余年为成都纱窗小微创业公司专业提供企业网站设计营销网站建设商城网站建设手机网站建设小程序网站建设网站改版,从内容策划、视觉设计、底层架构、网页布局、功能开发迭代于一体的高端网站建设服务。

import java.io.IOException;
import java.util.regex.Matcher;
import java.util.regex.Pattern;

import org.apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Mapper;

public class FilterCidMap2 extends Mapper {
	private long count=0;
	@Override
	protected void map(LongWritable key, Text value, Mapper.Context context)
			throws IOException, InterruptedException {

		try {
		           //取得读取的行数
		         count=key.get();
			
		         //正常逻辑
				context.write(new Text(), new LongWritable(1));

		} catch (Exception e) {

			e.printStackTrace();
		}

	}
	
	//map 方法调用完后才调用的
	@Override
	protected void cleanup(Mapper.Context context)
			throws IOException, InterruptedException {
		//map清理资源的操作
		//在reduce中把linescount取出来就行了
		context.write(new Text("linesCount"), new LongWritable(count));
	}

}

感谢各位的阅读!关于“hadoop如何实现统计输入行数的MAP”这篇文章就分享到这里了,希望以上内容可以对大家有一定的帮助,让大家可以学到更多知识,如果觉得文章不错,可以把它分享出去让更多的人看到吧!


本文名称:hadoop如何实现统计输入行数的MAP
转载来于:http://scjbc.cn/article/jpeges.html

其他资讯