SparkSql在最先开始的时候是怎么和RDD交互的 - 代码天地

SparkSql在最先开始的时候是怎么和RDD交互的

其他 2021-02-28 10:40:50 阅读次数: 0

SparkSql在最先开始的时候是数据元与数据分开的

package com.sparksql

import org.apache.spark.rdd.RDD
import org.apache.spark.sql.{
    
    DataFrame, Row, SparkSession}
import org.apache.spark.sql.types.{
    
    IntegerType, StringType, StructField, StructType}

object DataFrameFromStuctType {
    
    
  def main(args: Array[String]): Unit = {
    
    
    //SparkSession
    val spark: SparkSession = SparkSession
      .builder()
      .master("local")
      .appName("DataFrameFromStuctType")
      .getOrCreate()

    val lineRDD: RDD[String] = spark.sparkContext.textFile("C:\\Users\\小象\\Desktop\\6月\\0627\\resources\\people.txt")

    //DataFrame：（表头信息）元信息，元数据 (name,age)
    val scheme = StructType(List(StructField("name",StringType),StructField("age",IntegerType)))

    //DataFrame：真正需要处理的数据,Row
    val rowRDD: RDD[Row] = lineRDD.map(line => {
    
    
      val linearray: Array[String] = line.split(",")
      Row(linearray(0), linearray(1).trim.toInt)
    })

    //DataFrame数据框，可以把peopleDF当做一个二维表
    val peopleDF: DataFrame = spark.createDataFrame(rowRDD,scheme)

    peopleDF.createOrReplaceTempView("people")

    spark.sql("select avg(age) avgage from people").show()

    spark.stop()
  }
}

但是这种方法由于比较麻烦，所以后来被样例类的方式取代了，不过底层其实还是它只是反射分装了而已

猜你喜欢

转载自blog.csdn.net/dudadudadd/article/details/113868305

SparkSql在最先开始的时候是怎么和RDD交互的

Java零基础初学者，最先开始学什么？｜附Java学习路线

【spark】小试牛刀sparksql和rdd

从RDD创建DataFrame（Sparksql）

配置sparksql读hive，dataframe和RDD，将RDD转换成Dataframe，视图，withcolumn

《SparkSQL剖析》SparkSQL到RDD概述

SparkSQL| RDD&DataFrame&DataSet

SparkSql数据从RDD集转换

SparkSQL与Hive交互

Spark大型电商项目实战-及其改良(1) 比对sparkSQL和纯RDD实现的结果

Spark之【SparkSQL编程】系列(No3)——《RDD、DataFrame、DataSet三者的共性和区别》

easyui spinner去掉秒显示怎么在交互的时候加上':00'

先开始干，你就赢了50%的对手

SparkSQL（五）RDD2DataFrame

SparkSQL编程之RDD与DateFrame转换

SparkSQL中 RDD、DateSet、相互转化

SparkSQL编程之RDD、DataFrame、DataSet

SparkSQL实现RDD转化为DataFrame

SparkSql怎么写

开始的时候

chatgpt怎么和xcode进行交互

spark RDD和RDD算子

RDD和RDD之间的操作

SparkSQL-02 RDD转换DF的两种方式

SparkSQL创建RDD：UDF & UDAF【文字说明+关键代码】

SparkSQL编程之RDD、DataFrame、DataSet区别与共性

SparkSQL 中 RDD 、DataFrame 、DataSet 三者的区别与联系

SparkSQL之RDD丶DataFrame丶DataSet介绍

SparkSQL之实现RDD、DF与DS转换代码演示

SparkSQL学习- SparkSQL编译和执行过程

今日推荐

周排行

AIZU 2224 Save your cats(并查集)

HTTP响应头状态码详解

Python socket编程（2）

MaxCompute Studio使用心得系列7—作业对比

Supervisor安装使用

LeetCode 164. Maximum Gap

mysql面试题: 一张表里面有ID自增主键，当insert了17条记录之后，删除了第15,16,17条记录，再把mysql重启，再insert一条记录，这条记录的ID是18还是15

nutch1.2 DeleteDuplicates IndexMerger 详解

OC - @property与setter,getter方法

SpringBoot @Transactional的rollbackFor属性

每日归档

更多

2024-09-19(0)

2024-09-18(0)

2024-09-17(0)

2024-09-16(0)

2024-09-15(0)

2024-09-14(0)

2024-09-13(0)

2024-09-12(0)

2024-09-11(0)

2024-09-10(0)