Apache Flink - 基本API概念 - 代码天地

Apache Flink - 基本API概念

其他 2018-08-05 17:46:45 阅读次数: 0

Flink程序是实现分布式集合转换的常规程序。集合最初是从源创建的。通过接收器(slink)返回结果，接收器可以将数据写到某个文件或stdout。Flink可以在各种环境(context)中运行，本地JVM或集群。

1.数据集和数据流

Flink用特殊的类DataSet and DataStream来表示程序中的数据。可以认为他们是可以包含重复数据的不可变数据集合。在DataSet中数据是有限的，而在DataStream中数据是无限的。
这些集合不同于java里的集合，他们是不可变的，一旦被创造就不能改动，也不能简单的抽查里面的元素。
最初的集合是通过在Flink程序里添加一个源被创造的，新的集合是使用API方法(如map, filter)通过转换得到的。

2.剖析一个Flink程序

每个程序包含相同的基本部分：

获得一个执行环境(execution environment).
加载/创建初始数据。
指定转换这些数据。
指定放置计算结果的位置。
触发程序执行。

StreamExecutionEnvironment是所有Flink程序的基础。可以通过以下静态方法获得：
```
getExecutionEnvironment()

createLocalEnvironment()

createRemoteEnvironment(String host, int port, String... jarFiles)
```
通常只需要使用getExecutionEnvironment()方法,因为这将根据环境做出正确的事：如果你执行你的程序在IDE上或着作为一个普通Java程序，它将创建一个本地环境,将在本地机器上执行程序。如果您从您的程序创建了一个JAR文件，并通过命令行调用它，Flink集群管理者将执行你的main方法并且getExecutionEnvironment()将返回一个在一个集群上执行程序的执行环境。
用于指定数据源，执行环境有几个方法来从文件读取：你可以逐行阅读，像CSV文件，或者使用完全自定义数据输入格式。要读取一个文本文件的顺序,您可以使用:
```
final StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();

DataStream<String> text = env.readTextFile("file:///path/to/file");
```

猜你喜欢

转载自www.cnblogs.com/ooffff/p/9426407.html

Apache Flink - 基本API概念

Apache Flink应用开发之API基本概念(更新中。。。)

Apache Flink 官方文档--概念

2.3 Apache Flink DataStream API

1.6 Apache Flink 基本概念 — 分布式Runtime

1.5 Apache Flink 基本概念 — 编程模型

Apache Flink简介及概念业务介绍

Apache Flink

2.1 Apache Flink 基本架构

【Flink】idea中flink启动报错org.apache.flink.api.common.ExecutionConfig$GlobalJobParameters

Flink 1.8 Basic API Concepts 基本API概念

Apache Flink-什么是Apache Flink？

Apache Flink：特性、概念、组件栈、架构及原理分析

Apache Flink-编程指南-概念-编程模型

Apache Flink特性、概念、组件栈、架构及原理分析

Apache Flink 零基础入门（一）：基础概念解析

Apache Flink中的各个窗口时间的概念区分

Apache Flink 漫谈系列(13) - Table API 概述

Apache Flink Stream API之State & Fault Tolerance（章节四）

Apache Flink DataStream API之Transformation(章节三)

Apache Flink 零基础入门（三）：DataStream API 编程

如何在 Apache Flink 中使用 Python API？

Apache Flink 零基础入门（八）：Table API 编程

Apache Flink 零基础入门（四）：DataStream API 编程

Exception in thread “main“ org.apache.flink.table.api.NoMatchingTableFactoryException

Flink基本概念

flink编译报错：could not find implicit value for evidence parameter of type org.apache.flink.api.common..

flink Exception in thread “main“ org.apache.flink.api.common.functions.InvalidTypesException:

Flink基本API的使用

Flink基本的API

今日推荐

周排行

vue + echart +map中国地图，省市地图，区县地图

spring boot2 (31)-cors跨域请求

『学习资料推荐』299元买的微信营销资料打包

个人学习卷积神经网络的疑惑解答

网络工程师-软考

模拟人生4 春夏秋冬、星梦起飞版更新下载方法以及常见问题

python关于对象的字符串显示str和repr以及

奇怪的session混乱问题

【3】分治法（divide-and-conquer）

Java项目开发成绩管理系统（九）各模块实现信息修改

每日归档

更多

2024-08-07(0)

2024-08-06(0)

2024-08-05(0)

2024-08-04(0)

2024-08-03(0)

2024-08-02(0)

2024-08-01(0)

2024-07-31(0)

2024-07-30(0)

2024-07-29(0)