sparksql 2.x demo I - 代码天地

sparksql 2.x demo I

其他 2018-10-06 11:58:02 阅读次数: 0

package com.ws.sparksql
import org.apache.spark.rdd.RDD
import org.apache.spark.sql.types._
import org.apache.spark.sql._
import org.apache.spark.{SparkConf, SparkContext}

/**
  * spark sql版本 2.x
  */
object SparkSql2Demo {

  def main(args: Array[String]): Unit = {
    //spark 2.X sql创建执行过程
    val session = SparkSession.builder().appName("SparkSql2Demo").master("local[*]").getOrCreate()

    val dataRdd: RDD[String] = session.sparkContext.textFile("hdfs://hadoop-01:9000/student")

    val studentRowRdd: RDD[Row] = dataRdd.map(line => {
      val fieldArr: Array[String] = line.split(",")
      val id = fieldArr(0).toLong
      val name = fieldArr(1)
      val age = fieldArr(2).toInt
      val score = fieldArr(3).toInt
      Row(id, name, age, score)
    })

    //创建结构化表
    val schema: StructType = StructType(List(
      StructField("id", LongType, true),
      StructField("name", StringType, true),
      StructField("age", IntegerType, true),
      StructField("score", IntegerType, true)
    ))

    val dataFrame: DataFrame = session.createDataFrame(studentRowRdd, schema)

    import session.implicits._
    val result: Dataset[Row] = dataFrame.where($"score" > 100).orderBy($"score" desc, $"age" asc)

    result.show()

    session.stop()
  }
}

结果：

+---+----+---+-----+
| id|name|age|score|
+---+----+---+-----+
|  1|  张三| 18|  150|
|  2|  李四| 19|  150|
+---+----+---+-----+

猜你喜欢

转载自blog.csdn.net/bb23417274/article/details/82947182

sparksql 2.x demo I

sparkSql demo I （sql方式）

sparksql 2.x 写WordCount

sparksql基础Demo代码

sparkSQL2.X

sparkSql demo II（sql方式）

sparksql demo III (dataFrame方式)

sparkSQL入门--1.x和2.x编程的区别

sparksql(2)

Vue.js 2.x 实用Demo

SparkSQL入门案例之四(SparkSQL2.x)

SparkSql篇2：SparkSql读写elasticsearch

Can I install Python 3.x and 2.x on the same Windows computer?

sparkSQL（版本2以后）

sparksql实践_2

sparkSql-2.x读写hive操作

Android 模拟触摸事件I2C driver demo

Spring Cloud 2.x 完整入门Demo样例（Greenwich版本）

sparksql

SparkSQL入门案例之一(SparkSQL1.x)

SparkSQL入门案例之二(SparkSQL1.x)

sparkSQL中的example学习(2)

使用SparkSQL2.x的SQL方式实现WordCount

SparkSQL in Scala 简单实践(spark 2x)

Android程序运行分析——中等复杂程度的NTAG I2C Demo为例（四）

Android程序运行分析——中等复杂程度的NTAG I2C Demo为例（三）

Android程序运行分析——中等复杂程度的NTAG I2C Demo为例（二）

Android程序运行分析——中等复杂程度的NTAG I2C Demo为例

Android程序运行分析——中等复杂程度的NTAG I2C Demo为例（五）

mac下Python2运行SparkSQL

今日推荐

周排行

LRU cache算法

windows10, 自带的OpenSSH, key权限问题, 文件权限问题

测试用例书写方法

HIVE-默认分隔符的（linux系统的特殊字符）查看，输入和修改

最贵的AMD 7nm显卡来了！这设计够狂野

java多线程简单demo

[ 转载 ]在Android系统上使用busybox——最简单的方法

QT connect学习

BFSIFT算法分析

Xcode10：library not found for -lstdc++.6.0.9 临时解决

每日归档

更多

2024-08-06(0)

2024-08-05(0)

2024-08-04(0)

2024-08-03(0)

2024-08-02(0)

2024-08-01(0)

2024-07-31(0)

2024-07-30(0)

2024-07-29(0)

2024-07-28(0)