大数据——Hive分析项目案例

Hive分析项目案例梳理

商业网站中经常统计的数据有哪些:

  1. UV:独立访客

    同一个用户访问多次会产生多个记录,但是这些记录会在运算的时候合并为1个

    语法:count(distinct guid)

  2. PV:页面浏览量

    同一个用户访问多次,产生多条记录,每一条记录都是一次PV

    语法:count(url)

  3. 登陆人数:

    登陆网站访问的人数[普通会员,VIP,SVIP]

    endUserId标识会员

  4. 游客人数:

    在没有登陆的情况下访问的客户。

    endUserId为空 --> “”/null

  5. 平均访问时长

    用户在网站停留的时间

    trackTime --> max - min

  6. 二跳率:

    在同一个网站中平均浏览了2个以上的页面的用户

    计算方法:(pv > 2) / 用户总数

  7. 独立IP:

    客户的公网IP

    正常情况下,分析一天内的数据,同一个用户的IP是不会变的

    语法:cunt(distinct ip)

  8. 分析结果表的结构

     键名				   描述				对应track_log字段
     session_id			会话id				sessionId
     guid				访客id				guid
     trackerU			访问去掉id,获取	trackerU
     					会话中的第一个			
     landing_url			着陆URL				url
     landing_url_ref		着落之前的URL		referer
     user_id				会员id				endUserId
     pv
     uv
     stay_time			停留时间			trackTime
     min_trackTime		最小时间
     ip
     provinceId			省份id				provinceId
    

猜你喜欢

转载自blog.csdn.net/qq_40395687/article/details/88371357