博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
hadoop配置lzo
阅读量:6962 次
发布时间:2019-06-27

本文共 1076 字,大约阅读时间需要 3 分钟。

yum -y install *lzo*

修改hdfs 的 core-site.xml

io.compression.codecs=org.apache.hadoop.io.compress.GzipCodec,org.apache.hadoop.io.compress.DefaultCodec,org.apache.hadoop.io.compress.BZip2Codec,com.hadoop.compression.lzo.LzoCodec,com.hadoop.compression.lzo.LzopCodec


添加

io.compression.codec.lzo.class=com.hadoop.compression.lzo.LzoCodec

修改下面参数(必选):

mapreduce.map.output.compress=true;

mapreduce.output.fileoutputformat.compress=true;

mapreduce.map.output.compress.codec=com.hadoop.compression.lzo.LzoCodec;

mapreduce.output.fileoutputformat.compress.codec=com.hadoop.compression.lzo.LzoCodec;

hive.exec.compress.output=true;

4. 测试mapreduce读lzo

hive新建一张表lzo_test

CREATE TABLE lzo_aa( id bigint, name string)ROW FORMAT DELIMITED FIELDS TERMINATED BY '/t'STORED AS INPUTFORMAT "com.hadoop.mapred.DeprecatedLzoTextInputFormat" OUTPUTFORMAT "org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat"

下载lzop工具,load一个lzo文件进lzo_test表中,执行“select * from  lzo_test"和"select count(1) from lzo_test"正确 

hive默认字段分隔符\001

本文转自 yntmdr 51CTO博客,原文链接:http://blog.51cto.com/yntmdr/1839146,如需转载请自行联系原作者
你可能感兴趣的文章
软件测试质量和效率评价之我见
查看>>
kloxo增加了域名,怎么不能访问?如何重启web服务?
查看>>
Nginx调试入门
查看>>
Centos7安装jdk
查看>>
MySQL锁
查看>>
国学题库整理
查看>>
jquery chosen 插件 动态设置+更新选项值
查看>>
求最大值及其下标
查看>>
战力会议1
查看>>
水印情缘。。。
查看>>
为什么重写equals一定要重写hashCode?
查看>>
HDU Problem 4006 The kth great number 【队列】
查看>>
win8阉割版中文输入法
查看>>
Codeforces VK Cup 2015 A.And Yet Another Bracket Sequence(后缀数组+平衡树+字符串)
查看>>
以Drools5.5为例说明“规则引擎在业务系统中应用”---起始篇
查看>>
linux清理内存
查看>>
查看硬盘负载情况:iostat命令
查看>>
《人月神话》阅读笔记03
查看>>
Linux下防火墙开启相关端口及查看已开启端口
查看>>
学习笔记之CloudCompare
查看>>