Hbase学习(四)---hbase 的下载,maven依赖,以及官网文档

版权声明:欢迎读者转载,如果有问题请给与评论。 https://blog.csdn.net/qq_41848006/article/details/87879748

Hbase的配置机器依赖

目录

目录

Hbase的配置机器依赖

目录

1.下载tar和src:  https://mirrors.tuna.tsinghua.edu.cn/apache/hbase/

2.官网参考文档:https://hbase.apache.org/book.html

3.hbase的配置分布式基本配置

3.1其他属性值配置

4.分布式集群reionservers配置

5.分布式集群hbase-site.xml的配置

6.maven配置

 7.java客户端配置


1.下载tar和src:  https://mirrors.tuna.tsinghua.edu.cn/apache/hbase/

2.官网参考文档:https://hbase.apache.org/book.html

3.hbase的配置分布式基本配置

HBase的-site.xml中
<?xml version="1.0"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
<configuration>
  <property>
    <name>hbase.zookeeper.quorum</name>
    <value>example1,example2,example3</value>
    <description>The directory shared by RegionServers.
    </description>
  </property>
  <property>
    <name>hbase.zookeeper.property.dataDir</name>
    <value>/export/zookeeper</value>
    <description>Property from ZooKeeper config zoo.cfg.
    The directory where the snapshot is stored.
    </description>
  </property>
  <property>
    <name>hbase.rootdir</name>
    <value>hdfs://example0:8020/hbase</value>
    <description>The directory shared by RegionServers.
    </description>
  </property>
  <property>
    <name>hbase.cluster.distributed</name>
    <value>true</value>
    <description>The mode the cluster will be in. Possible values are
      false: standalone and pseudo-distributed setups with managed ZooKeeper
      true: fully-distributed with unmanaged ZooKeeper Quorum (see hbase-env.sh)
    </description>
  </property>
</configuration>

3.1其他属性值配置

以下文档是使用默认的hbase配置文件hbase-default.xml作为源生成的。

hbase.tmp.dir
描述
本地文件系统上的临时目录。将此设置更改为指向比'/ tmp'更永久的位置,这是java.io.tmpdir的常用解决方案,因为'/ tmp'目录在机器重启时被清除。

默认
${java.io.tmpdir}/hbase-${user.name}

hbase.rootdir
描述
区域服务器共享的目录以及HBase持久存在的目录。URL应该是“完全限定的”以包含文件系统方案。例如,要在端口9000上的namenode.example.org上指定HDFS实例的namenode运行的HDFS目录“/ hbase”,请将此值设置为:hdfs://namenode.example.org:9000 / hbase。默认情况下,我们写入任何$ {hbase.tmp.dir}也设置 - 通常是/ tmp - 所以更改此配置,否则所有数据将在机器重启时丢失。

默认
${hbase.tmp.dir}/hbase

hbase.cluster.distributed
描述
群集将处于的模式。独立模式的可能值为false,分布式模式的值为true。如果为false,则启动将在一个JVM中一起运行所有HBase和ZooKeeper守护程序。

默认
false

hbase.zookeeper.quorum
描述
逗号分隔的ZooKeeper集合中的服务器列表(此配置应该已命名为hbase.zookeeper.ensemble)。例如,“host1.mydomain.com,host2.mydomain.com,host3.mydomain.com”。默认情况下,对于本地和伪分布式操作模式,将其设置为localhost。对于完全分布式设置,应将其设置为ZooKeeper整体服务器的完整列表。如果在hbase-env.sh中设置了HBASE_MANAGES_ZK,则这是hbase将作为集群启动/停止的一部分启动/停止ZooKeeper的服务器列表。在客户端,我们将获取这个集合成员列表并将其与hbase.zookeeper.property.clientPort配置放在一起。并将其作为connectString参数传递给zookeeper构造函数。

默认
localhost

zookeeper.recovery.retry.maxsleeptime
描述
在以毫秒为单位重试zookeeper操作之前的最长休眠时间,此处需要最长时间,以便睡眠时间不会无限增长

默认
60000

hbase.local.dir
描述
本地文件系统上的目录,用作本地存储。

默认
${hbase.tmp.dir}/local/

hbase.master.port
描述
HBase Master应绑定的端口。

默认
16000

hbase.master.info.port
描述
HBase Master Web UI的端口。如果您不想运行UI实例,请设置为-1。

默认
16010

hbase.master.info.bindAddress
描述
HBase Master Web UI的绑定地址

默认
0.0.0.0

hbase.master.logcleaner.plugins
描述
由LogsCleaner服务调用的以逗号分隔的BaseLogCleanerDelegate列表。这些WAL清洁器按顺序调用,所以把清洁器放在前面修剪最多的文件。要实现自己的BaseLogCleanerDelegate,只需将其放在HBase的类路径中,并在此处添加完全限定的类名。始终在列表中添加以上默认日志清理程序。

默认
org.apache.hadoop.hbase.master.cleaner.TimeToLiveLogCleaner,org.apache.hadoop.hbase.master.cleaner.TimeToLiveProcedureWALCleaner

hbase.master.logcleaner.ttl
描述
WAL保留在归档({hbase.rootdir} / oldWALs)目录中多长时间,之后将由主线程清理。该值以毫秒为单位。

默认
600000

hbase.master.procedurewalcleaner.ttl
描述
过程WAL将保留在归档目录中多长时间,之后将由主线程清除。该值以毫秒为单位。

默认
604800000

hbase.master.hfilecleaner.plugins
描述
由HFileCleaner服务调用的以逗号分隔的BaseHFileCleanerDelegate列表。这些HFiles清洁剂按顺序调用,因此将清洁剂修剪成前面的大多数文件。要实现自己的BaseHFileCleanerDelegate,只需将其放在HBase的类路径中,并在此处添加完全限定的类名。始终在列表中添加上述默认日志清理程序,因为它们将在hbase-site.xml中被覆盖。

默认
org.apache.hadoop.hbase.master.cleaner.TimeToLiveHFileCleaner

hbase.master.infoserver.redirect
描述
Master是否侦听Master Web UI端口(hbase.master.info.port)并将请求重定向到Master和RegionServer共享的Web UI服务器。配置。当Master服务区域时(而不是默认值),这是有意义的。

默认
true

hbase.master.fileSplitTimeout
描述
拆分区域,在中止尝试之前等待文件拆分步骤需要多长时间。默认值:600000。此设置曾在hbase-1.x中称为hbase.regionserver.fileSplitTimeout。Split现在运行master-side因此重命名(如果找到'hbase.master.fileSplitTimeout'设置,将使用它来填充当前'hbase.master.fileSplitTimeout'配置。

默认
600000

hbase.regionserver.port
描述
HBase RegionServer绑定的端口。

默认
16020

hbase.regionserver.info.port
描述
HBase RegionServer Web UI的端口如果不希望RegionServer UI运行,请设置为-1。

默认
16030

hbase.regionserver.info.bindAddress
描述
HBase RegionServer Web UI的地址

默认
0.0.0.0

hbase.regionserver.info.port.auto
描述
Master或RegionServer UI是否应搜索要绑定的端口。如果hbase.regionserver.info.port已在使用中,则启用自动端口搜索。用于测试,默认情况下关闭。

默认
false

hbase.regionserver.handler.count
描述
在RegionServers上旋转的RPC侦听器实例的数量。Master使用相同的属性来计算主处理程序的数量。太多的处理程序可能适得其反。使其成为CPU数量的倍数。如果大部分是只读的,那么处理程序数量接近cpu计数就好了。从CPU计数的两倍开始并从那里调整。

默认
30

hbase.ipc.server.callqueue.handler.factor
描述
用于确定呼叫队列数的因素。值0表示在所有处理程序之间共享的单个队列。值为1表示每个处理程序都有自己的队列。

默认
0.1

hbase.ipc.server.callqueue.read.ratio
描述
将呼叫队列拆分为读写队列。指定的间隔(应介于0.0和1.0之间)将乘以调用队列的数量。值为0表示不拆分调用队列,这意味着读取和写入请求都将被推送到同一组队列。低于0.5的值意味着读取队列将少于写入队列。值为0.5表示将有相同数量的读写队列。大于0.5的值意味着将有比写入队列更多的读取队列。值1.0表示除了一个队列之外的所有队列都用于分派读取请求。示例:如果调用队列的总数为10,则read.ratio为0意味着:10个队列将包含两个读/写请求。read.ratio为0.3意味着:3个队列仅包含读取请求,7个队列仅包含写入请求。read.ratio为0.5意味着:5个队列仅包含读取请求,5个队列仅包含写入请求。read.ratio为0.8意味着:8个队列仅包含读取请求,2个队列仅包含写入请求。read.ratio为1表示:9个队列仅包含读取请求,1个队列仅包含写入请求。

默认
0

hbase.ipc.server.callqueue.scan.ratio
描述
给定读取呼叫队列的数量,根据呼叫队列的总数乘以callqueue.read.ratio计算,scan.ratio属性将读取呼叫队列分成小读取和长读取队列。低于0.5的值意味着长读取队列的数量将少于短读取队列。值0.5意味着将有相同数量的短读取和长读取队列。大于0.5的值意味着将有比长读取队列更多的长读取队列值0或1表示使用相同的队列集进行获取和扫描。示例:如果读取队列的总数为8,则scan.ratio为0或1意味着:8个队列将包含长读取请求和短读取请求。scan.ratio为0.3意味着:2个队列只包含长读请求,6个队列只包含短读请求。scan.ratio为0.5意味着:4个队列只包含长读请求,4个队列只包含短读请求。scan.ratio为0.8意味着:6个队列只包含长读请求,2个队列只包含短读请求。

默认
0

hbase.regionserver.msginterval
描述
从RegionServer到Master的消息之间的间隔(以毫秒为单位)。

默认
3000

hbase.regionserver.logroll.period
描述
无论编辑日志有多少,我们将滚动提交日志的时间段。

默认
3600000

hbase.regionserver.logroll.errors.tolerated
描述
在触发服务器中止之前我们将允许的连续WAL关闭错误的数量。如果在日志滚动期间关闭当前WAL编写器失败,则设置为0将导致区域服务器中止。即使很小的值(2或3)也允许区域服务器跨越瞬态HDFS错误。

默认
2

hbase.regionserver.hlog.reader.impl
描述
WAL文件阅读器实现。

默认
org.apache.hadoop.hbase.regionserver.wal.ProtobufLogReader

hbase.regionserver.hlog.writer.impl
描述
WAL文件编写器实现。

默认
org.apache.hadoop.hbase.regionserver.wal.ProtobufLogWriter

hbase.regionserver.global.memstore.size
描述
在阻止新更新并强制刷新之前,区域服务器中所有存储库的最大大小。默认为堆的40%(0.4)。更新被阻止,并且强制刷新,直到区域服务器中所有存储库的大小达到hbase.regionserver.global.memstore.size.lower.limit。此配置中的默认值有意留空,以便遵守旧的hbase.regionserver.global.memstore.upperLimit属性(如果存在)。

默认
没有

hbase.regionserver.global.memstore.size.lower.limit
描述
强制刷新之前区域服务器中所有存储库的最大大小。默认为hbase.regionserver.global.memstore.size(0.95)的95%。当由于memstore限制而阻止更新时,此值的100%值会导致最小可能的刷新。此配置中的默认值有意留空,以便遵守旧的hbase.regionserver.global.memstore.lowerLimit属性(如果存在)。

默认
没有

hbase.systemtables.compacting.memstore.type
描述
确定要用于系统表(如META,命名空间表等)的memstore类型。默认情况下,NONE是类型,因此我们对所有系统表使用默认的memstore。如果我们需要对系统表使用压缩memstore,则将此属性设置为BASIC / EAGER

默认
NONE

hbase.regionserver.optionalcacheflushinterval
描述
在自动刷新之前编辑在内存中的最长时间。默认1小时。将其设置为0可禁用自动刷新。

默认
3600000

hbase.regionserver.dns.interface
描述
区域服务器应从其报告其IP地址的网络接口的名称。

默认
default

hbase.regionserver.dns.nameserver
描述
域名服务器(DNS)的主机名或IP地址,区域服务器应使用该地址来确定主站用于通信和显示目的的主机名。

默认
default

hbase.regionserver.region.split.policy
描述
拆分策略确定何时应拆分区域。当前可用的各种其他拆分策略包括BusyRegionSplitPolicy,ConstantSizeRegionSplitPolicy,DisabledRegionSplitPolicy,DelimitedKeyPrefixRegionSplitPolicy,KeyPrefixRegionSplitPolicy和SteppingSplitPolicy。DisabledRegionSplitPolicy阻止手动区域拆分。

默认
org.apache.hadoop.hbase.regionserver.SteppingSplitPolicy

hbase.regionserver.regionSplitLimit
描述
限制区域数量,之后不再发生区域分裂。这不是区域数量的硬限制,而是作为区域服务器在某个限制之后停止拆分的指导。默认设置为1000。

默认
1000

zookeeper.session.timeout
描述
ZooKeeper会话超时(以毫秒为单位)。它以两种不同的方式使用。首先,该值用于HBase用于连接集合的ZK客户端。HBase在启动ZK服务器时也会使用它,并将其作为'maxSessionTimeout'传递。见http://hadoop.apache.org/zookeeper/docs/current/zookeeperProgrammers.html#ch_zkSessions。例如,如果HBase区域服务器连接到也由HBase管理的ZK集合,则会话超时将是此配置指定的会话超时。但是,连接到使用不同配置管理的集合的区域服务器将受到该集合的maxSessionTimeout。因此,即使HBase可能建议使用90秒,整体可以具有低于此的最大超时,并且它将优先。ZK附带的当前默认值是40秒,低于HBase。

默认
90000

zookeeper.znode.parent
描述
ZooKeeper中HBase的Root ZNode。所有使用相对路径配置的HBase的ZooKeeper文件都将位于此节点下。默认情况下,所有HBase的ZooKeeper文件路径都配置了相对路径,因此除非更改,否则它们都将在此目录下。

默认
/hbase

zookeeper.znode.acl.parent
描述
用于访问控制列表的根ZNode。

默认
acl

hbase.zookeeper.dns.interface
描述
ZooKeeper服务器应从中报告其IP地址的网络接口的名称。

默认
default

hbase.zookeeper.dns.nameserver
描述
ZooKeeper服务器应使用的名称服务器(DNS)的主机名或IP地址,用于确定主服务器用于通信和显示目的的主机名。

默认
default

hbase.zookeeper.peerport
描述
ZooKeeper对等体使用的端口相互通信。有关详细信息,请参阅http://hadoop.apache.org/zookeeper/docs/r3.1.1/zookeeperStarted.html#sc_RunningReplicatedZooKeeper。

默认
2888

hbase.zookeeper.leaderport
描述
ZooKeeper用于领导者选举的端口。有关详细信息,请参阅http://hadoop.apache.org/zookeeper/docs/r3.1.1/zookeeperStarted.html#sc_RunningReplicatedZooKeeper。

默认
3888

hbase.zookeeper.property.initLimit
描述
来自ZooKeeper的配置zoo.cfg的属性。初始同步阶段可以采用的滴答数。

默认
10

hbase.zookeeper.property.syncLimit
描述
来自ZooKeeper的配置zoo.cfg的属性。在发送请求和获取确认之间可以传递的滴答数。

默认
5

hbase.zookeeper.property.dataDir
描述
来自ZooKeeper的配置zoo.cfg的属性。存储快照的目录。

默认
${hbase.tmp.dir}/zookeeper

hbase.zookeeper.property.clientPort
描述
来自ZooKeeper的配置zoo.cfg的属性。客户端将连接的端口。

默认
2181

hbase.zookeeper.property.maxClientCnxns
描述
来自ZooKeeper的配置zoo.cfg的属性。限制由IP地址标识的单个客户端可以对ZooKeeper集合的单个成员进行的并发连接数(在套接字级别)。设置为高以避免运行独立和伪分布的zk连接问题。

默认
300

hbase.client.write.buffer
描述
BufferedMutator写缓冲区的默认大小(以字节为单位)。更大的缓冲区需要更多的内存 - 在客户端和服务器端,因为服务器实例化传递的写缓冲区来处理它 - 但更大的缓冲区大小减少了RPC的数量。有关使用的服务器端内存的估计,请评估hbase.client.write.buffer * hbase.regionserver.handler.count

默认
2097152

hbase.client.pause
描述
常规客户端暂停值。主要用作在运行重试失败的get,区域查找等之前等待的值。有关我们如何从此初始暂停量退回以及此暂停如何重试的说明,请参阅hbase.client.retries.number。

默认
100

hbase.client.pause.cqtbe
描述
是否为CallQueueTooBigException(cqtbe)使用特殊客户端暂停。将此属性设置为比hbase.client.pause更高的值,如果您从同一RegionServer观察频繁的CQTBE并且其中的调用队列保持满

默认
没有

hbase.client.retries.number
描述
最大重试次数。用作所有可重试操作的最大值,例如获取单元格的值,开始行更新等。重试间隔是基于hbase.client.pause的粗略函数。起初我们在这个间隔重试,但随后退回,我们很快就会每十秒重试一次。有关备份如何增加的信息,请参阅HConstants#RETRY_BACKOFF。更改此设置和hbase.client.pause以适合您的工作负载。

默认
15

hbase.client.max.total.tasks
描述
单个HTable实例将发送到群集的最大并发突变任务数。

默认
100

hbase.client.max.perserver.tasks
描述
单个HTable实例将发送到单个区域服务器的最大并发突变任务数。

默认
2

hbase.client.max.perregion.tasks
描述
客户端将维护到单个Region的最大并发变异任务数。也就是说,如果已经有hbase.client.max.perregion.tasks正在为此区域写入正在进行的操作,则在某些写入完成之前,不会将新的put发送到此区域。

默认
1

hbase.client.perserver.requests.threshold
描述
所有客户端线程中一台服务器的最大并发挂起请求数(进程级别)。超过请求将立即抛出ServerTooBusyException,以防止用户的线程仅被一个慢速区域服务器占用和阻止。如果使用固定数量的线程以同步方式访问HBase,请将此值设置为与线程数相关的合适值,这将对您有所帮助。有关详细信息,请参阅https://issues.apache.org/jira/browse/HBASE-16388。

默认
2147483647

hbase.client.scanner.caching
描述
如果未从(本地,客户端)内存提供服务器,则在扫描器上调用next时我们尝试获取的行数。此配置与hbase.client.scanner.max.result.size一起使用,以有效地尝试使用网络。默认值默认值为Integer.MAX_VALUE,因此网络将填充由hbase.client.scanner.max.result.size定义的块大小,而不是受特定行数限制,因为行的大小因表而异。如果您提前知道扫描不需要超过一定数量的行,则应通过Scan#setCaching将此配置设置为该行限制。较高的缓存值将使扫描程序更快,但会占用更多内存,而当缓存为空时,下一次调用可能会花费更长时间。请勿将此值设置为调用之间的时间大于扫描程序超时; 即hbase.client.scanner.timeout.period

默认
2147483647

hbase.client.keyvalue.maxsize
描述
指定KeyValue实例的组合最大允许大小。这是为存储在存储文件中的单个条目设置上限。由于它们不能被拆分,因此有助于避免因为数据太大而无法进一步拆分区域。将其设置为最大区域大小的一小部分似乎是明智的。将其设置为零或更小会禁用检查。

默认
10485760

hbase.server.keyvalue.maxsize
描述
单个单元格的最大允许大小,包括值和所有关键组件。值0或更小会禁用检查。默认值为10MB。这是一个安全设置,用于保护服务器免受OOM情况的影响。

默认
10485760

hbase.client.scanner.timeout.period
描述
客户端扫描程序租期(以毫秒为单位)。

默认
60000

hbase.client.localityCheck.threadPoolSize
默认
2

hbase.bulkload.retries.number
描述
最大重试次数。这是在分割操作时尝试原子批量加载的最大迭代次数0意味着永不放弃。

默认
10

hbase.master.balancer.maxRitPercent
描述
平衡时转换区域的最大百分比。默认值为1.0。所以没有平衡器限制。如果将此配置设置为0.01,则表示平衡时转换中最多有1%的区域。然后,在平衡时,群集的可用性至少为99%。

默认
1.0

hbase.balancer.period
描述
区域平衡器在主站中运行的时间段。

默认
300000

hbase.normalizer.period
描述
区域规范化程序在主服务器中运行的时间段。

默认
300000

hbase.normalizer.min.region.count
描述
配置最小区域数

默认
3

hbase.regions.slop
描述
如果任何regionserver具有平均+(平均* slop)区域,则重新平衡。StochasticLoadBalancer(默认负载均衡器)中此参数的默认值为0.001,而其他负载均衡器(即SimpleLoadBalancer)的默认值为0.2。

默认
0.001

hbase.server.thread.wakefrequency
描述
在搜索工作之间睡觉的时间(以毫秒为单位)。用作服务线程(如日志滚轮)作为睡眠间隔。

默认
10000

hbase.server.versionfile.writeattempts
描述
在中止之前重试尝试编写版本文件的次数。每次尝试都以hbase.server.thread.wakefrequency毫秒分隔。

默认
3

hbase.hregion.memstore.flush.size
描述
如果memstore的大小超过此字节数,则Memstore将刷新到磁盘。值由每个hbase.server.thread.wakefrequency运行的线程检查。

默认
134217728

hbase.hregion.percolumnfamilyflush.size.lower.bound.min
描述
如果使用了FlushLargeStoresPolicy并且有多个列族,那么每次我们达到总memstore限制时,我们会找出其memstores超过“下限”的所有列系列,并且只清除它们,同时将其他列保留在内存中。默认情况下,“下限”将为“hbase.hregion.memstore.flush.size / column_family_number”,除非此属性的值大于该值。如果没有一个系列的memstore大小超过下限,则所有的memstores都将被刷新(就像平常一样)。

默认
16777216

hbase.hregion.preclose.flush.size
描述
如果我们关闭时区域中的存储库大小或更大,请在我们设置区域关闭标志并使该区域脱机之前运行“预刷新”以清除存储库。关闭时,在关闭标志下运行刷新以清空内存。在此期间,该地区处于离线状态,我们不会进行任何写入。如果memstore内容很大,则此刷新可能需要很长时间才能完成。preflush是为了在放置关闭标志并使该区域脱机之前清除大部分memstore,因此在关闭标志下运行的刷新几乎没有。

默认
5242880

hbase.hregion.memstore.block.multiplier
描述
如果memstore的hbase.hregion.memstore.block.multiplier乘以hbase.hregion.memstore.flush.size字节,则阻止更新。有用的防止在更新流量高峰期间失控的memstore。没有上限,memstore会填充,当它刷新生成的flush文件需要很长时间来压缩或拆分,或者更糟的是,我们OOME。

默认
4

hbase.hregion.memstore.mslab.enabled
描述
启用MemStore-Local Allocation Buffer,这是一种可以防止在大量写入负载下堆碎片的功能。这可以减少在大堆上停止世界GC暂停的频率。

默认
true

hbase.hregion.max.filesize
描述
最大HFile尺寸。如果区域的HFiles的大小总和已经增长到超过该值,则该区域被分成两部分。

默认
10737418240

hbase.hregion.majorcompaction
描述
主要压缩之间的时间,以毫秒表示。设置为0可禁用基于时间的自动主要压缩。用户请求的和基于大小的主要压缩仍将运行。此值乘以hbase.hregion.majorcompaction.jitter,以使压缩在给定的时间窗口内以稍微随机的时间开始。默认值为7天,以毫秒为单位。如果主要压缩导致环境中断,您可以将它们配置为在部署的非高峰时间运行,或者通过将此参数设置为0来禁用基于时间的主要压缩,并在cron作业或其他作业中运行主要压缩外部机制。

默认
604800000

hbase.hregion.majorcompaction.jitter
描述
应用于hbase.hregion.majorcompaction的乘数,以使压缩在hbase.hregion.majorcompaction的任一侧发生给定的时间量。数字越小,压缩将越接近hbase.hregion.majorcompaction间隔。

默认
0.50

hbase.hstore.compactionThreshold
描述
如果任何一个Store中存在超过此数量的StoreFiles(每次刷新MemStore时写入一个StoreFile),则运行压缩以将所有StoreFile重写为单个StoreFile。较大的值会延迟压缩,但是当压缩确实发生时,完成需要更长的时间。

Default
3

hbase.regionserver.compaction.enabled

4.分布式集群reionservers配置

里面加入regionserver的结点即可。

5.分布式集群hbase-site.xml的配置

hbase-env.sh文件中的以下行显示如何设置JAVA_HOME环境变量(HBase所需)并将堆设置为4 GB(而不是默认值1 GB)。如果您复制并粘贴此示例,请务必调整JAVA_HOME以适合您的环境。

#要使用的java实现。
export JAVA_HOME = / usr / java / jdk1.8.0 / 

#要使用的最大堆数。默认保留为JVM默认值。
export HBASE_HEAPSIZE = 4G

6.maven配置

对于使用Maven的Java应用程序,在连接到集群时,建议使用hbase-shaded-client模块:

<dependency>
  <groupId>org.apache.hbase</groupId>
  <artifactId>hbase-shaded-client</artifactId>
  <version>2.0.0</version>
</dependency>

 7.java客户端配置

Java客户端使用的配置保存在HBaseConfiguration实例中。

HBaseConfiguration.create();在调用时,HBaseConfiguration 上的工厂方法将读取客户端上找到的第一个hbase-site.xml的内容(CLASSPATH如果存在)(调用也会考虑找到的任何hbase-default.xml ; hbase-default .xml在hbase.XXXjar中发布。也可以直接指定配置,而无需从hbase-site.xml读取。例如,要以编程方式为集群设置ZooKeeper集合,请执行以下操作:

Configuration config = HBaseConfiguration.create();
config.set("hbase.zookeeper.quorum", "localhost");  // Here we are running zookeeper locally
如果多个ZooKeeper实例组成了ZooKeeper集合,则可以在逗号分隔列表中指定它们(就像在hbase-site.xml文件中一样)。Configuration然后可以将此填充的实例传递给表,依此类推。

 

猜你喜欢

转载自blog.csdn.net/qq_41848006/article/details/87879748