页面日志采集：ngix+logstash+kafka - 代码天地

页面日志采集：ngix+logstash+kafka

其他 2018-12-17 02:20:29 阅读次数: 0

页面日志采集是指从页面上采集用户行为，将用户行为信息记录成日志，并将日志信息读取到消息队列的过程。一种比较常用的日志采集技术工具是：ngix+logstash+kafka。

进行页面日志的采集，需要在页面的最下端埋一个js代码片段。这个js代码片段通常在</body>的前面。这个js代码片段中有一行核心的代码：“src=XXXX/track.js”。当访问这个页面的时候，会从数据采集服务器上下载track.js。当页面渲染完成之后，会执行这个js，js就会采集到想要的数据，在track.js的最后会向数据采集服务器发送一个请求log.gif?args=……，数据采集服务器会立即返回一个“1*1”像素的图片，又来有回，意味着这次请求结束。在数据采集服务器的内部，会有一个内部的请求，相当于开了一个线程，这个线程专门用于记录log，将track.js发送过来的请求参数用log的形式写到日志文件里面。

可以通过修改ngix的配置（log_format tick{}），来定义log的形式。当log文件产生之后，可以通过flume、logstash等实时采集工具将数据写到消息队列中。这里使用kafka作为消息队列。

使用logstash将log文件的内容写到kafka里面，主要是配置logstash的配置文件，例如下面编写的logstash的配置文件（flow-kafka.conf），用于将log数据写到kafka中。

input{
        file{
          path=>"/home/hadoop/logs/ngix_logs/dir01/*.log"
          discover_interval=>5
          start_position=>"beginning"
        }
}
output{
   kafka{
         topic_id=>"ngixGamelog02"
         codec=>plain{
                format=>"%{message}"
                charset=>"UTF-8"
         }
         bootstrap_servers=>"mini02:9092,mini03:9092,mini04:9092"
   }
}

接下来就是在集群上，启动kafka、logstash，进行页面数据采集：

//启动kafka
//1、需要先启动zookeeper
zkServer.sh start
//2、检查zookeeper是否启动成功
zkServer.sh status
//3、在集群上启动kafka
kafka-server-start.sh export/servers/kafka/config/server.properties &

#启动logstash进行数据采集
./export/servers/logstash/bin/logstash agent -f ./export/servers/logstash/config/flow-kafka.conf

猜你喜欢

转载自blog.csdn.net/hefrankeleyn/article/details/79953118

页面日志采集：ngix+logstash+kafka

业务系统日志采集：logstash+kafka

Filebeat+Kafka+Logstash+ElasticSearch+Kibana 日志采集方案

logstash 采集kafka日志的文件配置xx.conf

logstash采集输送日志

logstash采集laravel日志

logstash kafka 同步日志

logstash 过滤采集nginx日志

Filebeat采集日志交给Logstash

SODBASE CEP学习进阶篇（二）续：日志采集-Logstash、Kafka和CEP集成

logstash kafka output 日志处理

logstash采集日志配置文件

Logstash日志采集安装搭建环境

elk通过logstash采集java日志

ELK-filebeat+logstash采集nginx日志

logstash日志采集工具的安装部署

filebeat采集json日志到logstash

ngix+kafka

使用 logstash + kafka + elasticsearch 实现日志监控

filebeat +kafka + logstash收集日志信息

ELK-Logstash采集日志和输送日志流程测试

日志采集搭建（应用日志+filebeat+logstash+elasticsearch+kibana）

【大数据实战】Logstash采集->Kafka->ElasticSearch检索【大数据实战】Logstash采集->Kafka->ElasticSearch检索

logstash写入到kafka和从kafka读取日志

利用logstash+filebeat采集logj4j日志

微服务框架（十三）Spring Boot Logstash日志采集

通过filebeat、logstash、rsyslog采集nginx日志的几种方式

ELK通过logstash采集java日志（多图演示）

ELK日志分析平台(二)----logstash数据采集

基于filebeat、logstash两种方式采集nginx日志

今日推荐

零基础入门鸿蒙开发 HarmonyOS NEXT星河版开发学习

豆包MarsCode帮我2小时完成Go语言系统从开发、测试到部署全流程最佳实践，云IDE迁移PHP企业级项目最佳实践

内幕！smardaten无代码平台全方位测评，这些细节你绝对想不到！

idea安装及激活配置流程---2024旗舰版(需激活码)

Elastic 创始人：热爱开源，希望合作 OSI 创建新许可证

工业互联网标识解析体系开放开源下载服务中心发布

IDEA取消自动选择光标所在行

828华为云征文 | 使用Flexus X实例搭建Dubbo-Admin服务

Programmer&AI—AI辅助编程学习指南

【Linux】虚拟机安装 openEuler 24.03 X86_64

o1 发布后 Sam Altman 最新访谈：AI 发展不仅没有放缓，而且我们对未来几年已经胜券在握

AI芯片国产化率100%！运营商最大单集群智算中心投产

周排行

【后端】 Spring Cloud 服务间调用

Git 学习教程

Salesforce集成(三). 获取数据02_获取Object和Field信息

Oracle执行计划的稳定（使用MANUAL类型的SQL PROFILE）

js跨域请求之jsonp原理和运用

ios -解决view遮挡按钮问题

【PAT天梯赛】L2-003 月饼（25 分)（贪心思想）

hive 存储格式的生产应用

【Python实践-6】将不规范的英文名字，变为首字母大写，其他小写的规范名字

容器学习点点滴滴（二）

每日归档

更多

2024-10-03(2)

2024-10-02(60)

2024-10-01(0)

2024-09-30(0)

2024-09-29(0)

2024-09-28(4)

2024-09-27(60)

2024-09-26(0)

2024-09-25(0)

2024-09-24(0)