Elasticsearch 超强聚合查询二之天生的条形图数据
把数据转换为图表来显示,是我们在开发中经常要用到的,特别是在数据分析的时候,Elasticsearch有一个很好的特性:查询出来的数据格式能够很好的满足当下绝大多数图表的数据的Json数据格式.本篇文章将结合相关的案例来演示.
对于条形图,在聚合中的historgram函数特别适合,它的本质就是条形图.本文将结合上一篇的例子来进行案例演示.
案例一:以汽车的售价为x轴,每20,000为一个档次,需要知道每个售价区间的收入和汽车的销量.
最终的图片效果如下:
- 墨绿色条线表示销量,紫色的表示总的销售额度
在这里大家需要掌握extended_stats函数
- http请求方式
GET /cars/transactions/_search
{
"size" : 0,
"aggs":{
"price":{//聚合的名字,自己定义
"histogram":{ //这个函数需要两个参数,一个是分组的字段,然后就是每个集合之间的区间间隔
"field": "price",
"interval": 20000//间隔2W
},
"aggs":{
"revenue": {//销售总额的变量名,自己定义
"sum": {
"field" : "price"//累加的字段
}
}
}
}
}
}```
* java-api的请求方式
```java
@Test
public void extendedStats(){
SearchResponse response = transportClient.prepareSearch("cars")
.setTypes("transactions")
.addAggregation(
AggregationBuilders.histogram("price")//设置聚合的名字
.field("price")//字段
.interval(20000)//每个条形图的价格区间
.subAggregation(
AggregationBuilders.sum("revenue")//销售总额的变量名,自己定义
.field("price")//累加的字段
)
)
.setSize(0)
.get();
}
<div class="se-preview-section-delimiter"></div>
- 返回的结果
{
...
"aggregations": {
"price": {
"buckets": [
{
"key": 0,//代表0-19999区间
"doc_count": 3,
"revenue": {
"value": 37000
}
},
{
"key": 20000,//代表20000-40000区间
"doc_count": 4,
"revenue": {
"value": 95000
}
},
//由于中间的价格区间的数据不存在,所以这边没有显示,也不会统计进来
{
"key": 80000,//代表80000-100000区间
"doc_count": 1,
"revenue": {
"value": 80000
}
}
]
}
}
}
案例二:计算10种汽车的平均售价,标准差,并用获得的数据创建一个条形图.
-
最终的条线图如下:
-
http RestFull请求方式:
GET /cars/transactions/_search
{
"size" : 0,
"aggs": {
"makes": {//取名字,用户自定义,到时候解析返回值的时候需要用到.
"terms": {
"field": "make",
"size": 10//每个厂商取10个
},
"aggs": {
"stats": {
"extended_stats": {//Elasticsearch的计算函数
"field": "price"//计算的字段名
}
}
}
}
}
}
- java-api的请求方式:
@Test
public void extendedStats_Second(){
SearchResponse response = transportClient.prepareSearch("cars")
.setTypes("transactions")
.addAggregation(
AggregationBuilders.terms("makes")
.field("make")
.size(10)
.subAggregation(
AggregationBuilders.extendedStats("stats")//变量名自己定义
.field("price")
)
)
.setSize(0)
.get();
}
- 返回的结果:
{
...
"aggregations": {
"makes": {
"doc_count_error_upper_bound": 0,
"sum_other_doc_count": 0,
"buckets": [
{
"key": "honda",
"doc_count": 3,
"stats": {
"count": 3,
"min": 10000.0,
"max": 20000.0,
"avg": 16666.666666666668,
"sum": 50000.0,
"sum_of_squares": 9.0E8,
"variance": 2.222222222222221E7,
"std_deviation": 4714.045207910315,
"std_deviation_bounds": {
"upper": 26094.757082487296,
"lower": 7238.5762508460375
}
}
},
{
"key": "toyota",
"doc_count": 2,
"stats": {
"count": 2,
"min": 12000.0,
"max": 15000.0,
"avg": 13500.0,
"sum": 27000.0,
"sum_of_squares": 3.69E8,
"variance": 2250000.0,
"std_deviation": 1500.0,
"std_deviation_bounds": {
"upper": 16500.0,
"lower": 10500.0
}
}
},
{
"key": "bmw",
"doc_count": 1,
"stats": {
"count": 1,
"min": 80000.0,
"max": 80000.0,
"avg": 80000.0,
"sum": 80000.0,
"sum_of_squares": 6.4E9,
"variance": 0.0,
"std_deviation": 0.0,
"std_deviation_bounds": {
"upper": 80000.0,
"lower": 80000.0
}
}
},
{
"key": "ford",
"doc_count": 1,
"stats": {
"count": 1,
"min": 30000.0,
"max": 30000.0,
"avg": 30000.0,
"sum": 30000.0,
"sum_of_squares": 9.0E8,
"variance": 0.0,
"std_deviation": 0.0,
"std_deviation_bounds": {
"upper": 30000.0,
"lower": 30000.0
}
}
}
]
}
}
}
补充说明
std.deviation:标准差