hive数据库数据次数统计排序

其他 2019-02-25 13:27:35 阅读次数: 0

在学习hive中我们首先练笔的应该是数据统计

问题：用py爬取某网站用户名并通过hive分析用户发言次数前十

爬虫代码我就不列出来了

将其爬下来如何上传到linux，通过cat查看

然后我们将其上传到hive数据库

先进hive数据库

/usr/hive/apache-hive-2.1.1-bin/bin/hive

创建表user

create table user(user_name string) row format delimited fields terminated by '#';

解释：创建一个user库再创建一个名叫user_name格式为string的表，其中分割词为#

然后将数据导入到这个表

load data local inpath '/root/data/xm.txt' overwrite into table match_data;

然后按照出现次数从大到小排序排出前十发言用户

select user_id,count(*) as np from user group by user_id order by np desc limit 10;

解释：其中np为红色笔标注的姓名出现次数

猜你喜欢

转载自blog.csdn.net/qq_39562468/article/details/83988167

hive数据库数据次数统计排序

Python读取HDFS统计Hive数据库大小

Hive 与数据库比较

【Hive】Hive 和数据库比较

数据库SQL实践22：统计各个部门对应员工涨幅的次数总和

Oracle、MySQL、Hive 等数据库如何统计连续相同数据？

数据库：统计函数

首次数据库实践

oralce 减少访问数据库的次数

Hive 数据抽象及数据库操作

数据库数据行数等统计

Mysql数据库-----统计、排序、分页、增删改查+Node中操作数据库

数据库SQL实战 --20.统计各个部门对应员工涨幅的次数总和

数据库查询----排序

数据库排序规则

数据库排序order by

Oracle数据库-排序

数据库汉字排序

数据库---排序查询

Hive的数据库和表操作

Hive与传统数据库的区别

Spark SQL操作Hive数据库

Hive笔记之数据库操作

hive查询数据库总条数

Hive Metastore 创建数据库失败

hive 元数据库报错问题

[hive]删除数据库

Hive的数据库和表

Hive 删除包含表的数据库

hive-数据库操作

今日推荐

周排行

成为C++高手之宏与枚举

在CAD二次开发中使用进度条

Js插件ECharts，HighCharts学习网址整理

Celery提交任务出错(on windows.)

cephfs内核客户端性能追踪

thinkphp中PHPExcel用法

EntityFramework动态组合多排序字段

汇编语言（八）实验9 根据材料编程

安装ubuntu后必须做的事情（对我而言）

JS函数式编程

每日归档

2024-10-22(0)

2024-10-21(0)

2024-10-20(0)

2024-10-19(0)

2024-10-18(0)

2024-10-17(0)

2024-10-16(0)

2024-10-15(0)

2024-10-14(0)

2024-10-13(0)