Ubuntu16.04下kafka的安装和测试

简单说明一下什么是kafka

Apache kafka是消息中间件的一种，我发现很多人不知道消息中间件是什么，在开始学习之前，我这边就先简单的解释一下什么是消息中间件，只是粗略的讲解，目前kafka已经可以做更多的事情。

举个例子，生产者消费者，生产者生产鸡蛋，消费者消费鸡蛋，生产者生产一个鸡蛋，消费者就消费一个鸡蛋，假设消费者消费鸡蛋的时候噎住了（系统宕机了），生产者还在生产鸡蛋，那新生产的鸡蛋就丢失了。再比如生产者很强劲（大交易量的情况），生产者1秒钟生产100个鸡蛋，消费者1秒钟只能吃50个鸡蛋，那要不了一会，消费者就吃不消了（消息堵塞，最终导致系统超时），消费者拒绝再吃了，”鸡蛋“又丢失了，这个时候我们放个篮子在它们中间，生产出来的鸡蛋都放到篮子里，消费者去篮子里拿鸡蛋，这样鸡蛋就不会丢失了，都在篮子里，而这个篮子就是”kafka“。
鸡蛋其实就是“数据流”，系统之间的交互都是通过“数据流”来传输的（就是tcp、https什么的），也称为报文，也叫“消息”。
消息队列满了，其实就是篮子满了，”鸡蛋“ 放不下了，那赶紧多放几个篮子，其实就是kafka的扩容。
各位现在知道kafka是干什么的了吧，它就是那个"篮子"。

Kafka的名词解释

producer：生产者，就是它来生产“鸡蛋”的。
consumer：消费者，生出的“鸡蛋”它来消费。
topic：你把它理解为标签，生产者每生产出来一个鸡蛋就贴上一个标签（topic），消费者可不是谁生产的“鸡蛋”都吃的，这样不同的生产者生产出来的“鸡蛋”，消费者就可以选择性的“吃”了。
broker：就是篮子了。

安装版本

kafka_2.11-0.10.2.0.tgz,需要安装包的请加博主VX18052079038

输入命令

sudo tar -zxvf kafka_2.11-0.10.2.0.tgz -C /usr/local

然后修改相关权限和名字,输入相关命令

sudo mv  kafka_2.11.0.10.2.0.tgz kafka

sudo chown -R hadoop:hadoop kafka

最后，把kafka加入到环境变量中去，如图所示:

我们修改config/server.properties

修改内容如下:

broker.id=0

log.dir=/usr/local/kafka/kafka-logs

zookeeper.connect=master:2181

接着启动zookeeper服务，输入如下命令

然后启动kafka服务，输入如下命令：

./bin/kafka-server-start.sh ./config/server.properties

打开一个新的终端创建Topic，输入命令如下所示:

./bin/kafka-topic.sh --create --zookeeper master:2181 --replication-factor 1 --partitions 1 --topic spark

创建一个produce，输入代码如下所示:

./bin/kafka-console-producer.sh --broker-list master:9092 --topic spark

打开一个新的终端，创建一个consumer，代码如下所示:

./bin/kafka-console-consumer.sh --bootstrap-server master:9092 --topic spark --from-beginning

当从produce端输入字符串时候，在consumer端就能接收到，表示测试成功，如图所示:

纪文啊！

发布了85 篇原创文章 · 获赞 39 · 访问量 5万+

私信关注