kafka面试知识点整理

其他 2020-08-05 10:23:11 阅读次数: 0

一、部署

1.1、安装部署

二、概念及理论

Kafka是分布式发布-订阅消息系统。它最初由LinkedIn公司开发，之后成为Apache项目的一部分。Kafka是一个分布式的，可划分的，冗余备份的持久性的日志服务。它主要用于处理活跃的流式数据。

在大数据系统中，常常会碰到一个问题，整个大数据是由各个子系统组成，数据需要在各个子系统中高性能，低延迟的不停流转。传统的企业消息系统并不是非常适合大规模的数据处理。为了能在同时搞定在线应用（消息）和离线应用（数据文件，日志）Kafka就出现了。Kafka可以起到两个作用：

降低系统组网复杂度。
降低编程复杂度，各个子系统不在是相互协商接口，各个子系统类似插口插在插座上，Kafka承担高速数据总线的作用。

Kafka主要特点：

同时为发布和订阅提供高吞吐量。据了解，Kafka每秒可以生产约25万消息（50 MB），每秒处理55万消息（110 MB）。
可进行持久化操作。将消息持久化到磁盘，因此可用于批量消费，例如ETL，以及实时应用程序。通过将数据持久化到硬盘以及replication防止数据丢失。
分布式系统，易于向外扩展。所有的producer、broker和consumer都会有多个，均为分布式的。无需停机即可扩展机器。
消息被处理的状态是在consumer端维护，而不是由server端维护。当失败时能自动平衡。支持online和offline的场景。

2.0、Kafka的架构原理

2.1、Producer&Consumer

2.2、Topics and Logs

2.3、kafka文件存储

三、整合

3.1、kafka+flume

3.2、flume+kafka+storm

3.3、kafka 出现错误问题

3.3.1、kafka消费少了

Reference

猜你喜欢

转载自blog.csdn.net/wuxintdrh/article/details/105952112

kafka面试知识点整理

kafka知识点整理

kafka 知识点整理

面试知识点整理

kafka学习笔记：知识点整理

Java 面试通关知识点整理！

JVM面试知识点整理

PHP 面试知识点整理归纳

面试，笔试知识点整理

Java 核心面试知识点整理！

20200103面试知识点整理

[Big Data - Kafka] kafka学习笔记：知识点整理

知识点整理

高级 Java 面试通关知识点整理！

数据库面试知识点整理

Vue 面试中常问知识点整理

Java面试题以及知识点整理（1）

搞定PHP面试 - 变量知识点整理

搞定PHP面试 - 运算符知识点整理

java面试知识点整理之java基础

java面试知识点整理之扩展系列

java面试知识点整理之web系列

C++面试题&知识点整理

面试视频知识点整理1-3

数据库知识点整理（秋招面试）

web前端面试知识点整理

知识点整理，MyBatis面试题

知识点整理，Dubbo面试题

知识点整理，MySQL面试题

知识点整理，Redis面试题

今日推荐

周排行

Access的四舍五入取整

8.23 前端学习过程

入门学习过程方向与漏洞复现总结：

操作分布式文件之八：如何批量并行读写远程文件和事务补偿处理

应邀出个教程（搭建tensorflow跑网络环境）

Kubernetes之Pod控制器应用进阶

14-[mysql内置功能]--

HDU6212 区间dp 好题

VS2015生成代码图

验证手机号的工具类

每日归档

更多

2024-10-21(0)

2024-10-20(0)

2024-10-19(0)

2024-10-18(0)

2024-10-17(0)

2024-10-16(0)

2024-10-15(0)

2024-10-14(0)

2024-10-13(0)

2024-10-12(0)