"HBase_介绍和HBase云存储"分享总结

小网客

浏览: 1217273 次
性别:
来自: 北京

最近访客更多访客>>

aoyouzi

jis117

emaiqi

duguyixiaono1

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

分享汇总

概述：

此分享包括：HBase_介绍和HBase云存储的汇总

汇总点：

HBASE基于HDFS存储；
Hbase实时随机读写；
Hbase是线性扩展，自动分表，支持MapReduce
Hbase Client使用HBase的RPC机制与Master和RegionServer进行通信，对于管理类操作，Client与Master进行RPC；对于数据读写类操作，Client与RegionServer进行RPC。
Client工作过程：从ZooKeeper上获取元数据和ROOT信息；在元数据中查找Region信息；与Region获取数据；缓存元数据相关信息；
Hbase的Master非单节点的，利用选举机制保证一个主Master；
Hbase的Master在功能上主要负责Table和Region的管理工作；
RegionServer主要负责响应用户I/O请求，向HDFS文件系统中读写数据同时向主服务器(Master Server)上报自己的状；
HRegion对应了Table中的一个Region，HRegion中由多个HStore组成。每个HStore对应了Table中的一个Column Family的存储；
HBase存储的核心Store由两部分组成：一部分是MemStore，另一部分是StoreFiles；
MemStore->StoreFile(Compact)->StoreFile->Region Split；
Master通过分发遗留HLog，然后RegionServer通过感知HLog并Replay HLog来保障数据不丢失；
Hbase的行的写操作是始终是“原子”的，只对一行上“锁”；
Hbase适用场景：储海量数据（TB级以上）；对大数据集合进行高效的随机访问（主键查询）；对于结构化和非结构化的数据存储同时不涉及jion操作；
Hbase的Cell为：Row，Column，Version和Value；
Hbase的操作：PUT，DELETE，GET和SCAN；
Region操作：Flush MemStore，Compact，Major Compact和split；
使用技巧：Column Family的数量最好为1；Key的设计避免单调递增，最小化；最小化Column；
MR操作时：Region数=Mapper数；Region数=Reducer数和Reducer写Hfile,再 BulkLoad；
Hbase开发调优：尽可能是使用Bulk Load；Put使用客户端Cache和Scan使用Cache/Batch；
HBASE部署中内存分配：RegionServer 12GB(MemStore  <=40%,HFile DataIndex 和BlockCache <=20%),Master 4GB和ZooKeeper 1GB；
Region管理：预创建Region,Region的大小(hbase.hregion.max.filesize=256MB,1GB,4GB,手动Split,交错负载);
Region合并:hbase.hstore.compactionThreshold=3,hbase.hstore.blockingStoreFiles=7(阻塞,超时),hbase.hstore.compaction.max=10和hbase.hregion.majorcompaction=86400,0；
MemStore Flush：hbase.regionserver.global.memstore.upperLimit和hbase.regionserver.global.memstore.lowerLimit；

运维调优：

Java GC：
JVM GC调整(ParNewGC+CMS)
Full GC-10s/GB
MemStore本地分配(2MB,减少碎片)
LZO压缩：
压缩单位为Block
提高性能
并发数调整：
hbase.regionserver.handler.count
Cache设置：
hfile.block.cache.size

更多详情参见附件

hbase.rar (4.4 MB)
下载次数: 23

0
顶

2
踩

分享到：

"MapReduce研究现状和毕玄-HBase简介与实践 ... | "阿里Hadoop集群架构及服务体系"分享总结

2013-06-25 11:08
浏览 1578
评论(0)
分类:行业应用
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

"HBase_介绍和HBase云存储"分享总结

评论

发表评论

相关推荐

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

"HBase_介绍和HBase云存储"分享总结

评论

发表评论

相关推荐

"宜信大数据金融实践分享"汇总

"一种新的基于相似度计算的本体映射算法"分享

"基于本体实现网页规则分类的方法"分享

"推荐系统的工程挑战"分享

“基于用户兴趣分析的网页生命周期建模”分享

“基于大规模日志分析的网络搜索引擎用户行为研究”分享

“基于验证码破解的 HTTP 攻击原理与防范”分享

Node.js社区：一个人称代词引发的论战(转)

coder我想对你说

4399曹政：中国互联网

基于goagent 上网步骤

"Hadoop集群监控与Hive高可用"分享总结

"Hadoop在ebay中的使用历程"分享总结

"Twitter突发新闻事件监测跟踪"分享总结

"鹰眼下的淘宝-分布式调用跟踪系统介绍"分享总结

"实时流计算应用开发框架-天罡"分享总结

"大数据产品中的异构数据源整合"分享总结

"高性能Web服务器Nginx及相关新技术的应用实践"分享总结

"证券交易的低延迟挑战"分享总结

"打造支持上千万http长连接的应用"分享总结

最近访客更多访客>>