Hive分析项目案例梳理
商业网站中经常统计的数据有哪些:
-
UV:独立访客
同一个用户访问多次会产生多个记录,但是这些记录会在运算的时候合并为1个
语法:count(distinct guid)
-
PV:页面浏览量
同一个用户访问多次,产生多条记录,每一条记录都是一次PV
语法:count(url)
-
登陆人数:
登陆网站访问的人数[普通会员,VIP,SVIP]
endUserId标识会员
-
游客人数:
在没有登陆的情况下访问的客户。
endUserId为空 --> “”/null
-
平均访问时长
用户在网站停留的时间
trackTime --> max - min
-
二跳率:
在同一个网站中平均浏览了2个以上的页面的用户
计算方法:(pv > 2) / 用户总数
-
独立IP:
客户的公网IP
正常情况下,分析一天内的数据,同一个用户的IP是不会变的
语法:cunt(distinct ip)
-
分析结果表的结构
键名 描述 对应track_log字段 session_id 会话id sessionId guid 访客id guid trackerU 访问去掉id,获取 trackerU 会话中的第一个 landing_url 着陆URL url landing_url_ref 着落之前的URL referer user_id 会员id endUserId pv uv stay_time 停留时间 trackTime min_trackTime 最小时间 ip provinceId 省份id provinceId