1.Flink基本概念

1.Flink基本概念

作者: 尼小摩 | 来源:发表于2018-04-29 02:30 被阅读0次

1.Flink基本概念
Flink流处理API
Flink序列化框架分析
standalone flink on k8s 部署问题
flink异步io应用场景之流表join维表
Flink 的窗口
【Flink SQL】如何解析和校验 Flink SQL
Flink侧输入流应用 kafka --> ODS-->DW
Flink -sql 处理时间的窗口
Flink 架构

一. Flink分层架构

Flink分层架构图

Stateful Stream Processiing
1. 位于最底层，是core API的底层实现
2. process Function
3. 利用低阶，构建一些新组件（比如：利用其定时做一定情况下的匹配和缓存）
4. 灵活度高，但看法比较复杂
Core APIS
1. DataStream 流式处理
2. DataSet 批量处理
Table & SQL
1. SQL构建在Table之上，都需要构建Table环境。
2. 不同类型的Table构建不同的Table环境。
3. Table可以与DataStream或者DataSet进行相互转换。
4. Streaming SQL不同存储的SQL，最终会转化为流式执行计划

Flink 构建的流程

构建计算环境（决定采用哪种计算执行方式）
创建Source（可以多个数据源）
对数据进行不同方式的转换（提供丰富的算子）
对结果的数据进行Sink（可以输出到多个地方）

Flink DataFlow

Flink DataFlow

二. Flink运行架构

Client
JobManager
TaskManager
角色间的通信（Akka）
数据的传输（Netty）
调度图

TaskManager Slot

CoLocation Group

保证所有的i-th的sub-tasks在同一个slots
主要用于迭代流

SlotSharingGroup

保证同一个group的i-th的sub-tasks共享同一个slots
算子默认的group为default
怎么确定一个算子的SlotSharingGroup（根据input的group和和自身是否设置group共同决定）
适当设置可以减少每个slot运行的线程数，从而整体上减少机器负载。

TaskManager Slot

TaskManager Slot

Slots && parallelism

一个应用需要多少Slots

不设置SlotSharingGroup（应用的最大并行度）
设置SlotSharingGroup（所有SlotSharingGroup中最大的并行度之和）

OperatorChain && Task

OpertorChain组成条件

没有禁用Chain
上下游算子并行度一致
下游算子的入度为1
上下游算子在同一个slot group
上下游算子之间没有数据shuffle

OperatorChain的优点

减少线程切换
减少序列化与反序列化
减少延迟并且提高吞吐能力

运行架构小结

JobManager 用于任务调度和checkpoint协调
TaskManager worker节点task执行
TaskManager Slots 用于资源分割
Operator 算子操作
Task 任务执行
Parallelism 并行度

相关文章

1.Flink基本概念
一. Flink分层架构 Stateful Stream Processiing位于最底层，是core API的底...
Flink流处理API
1.Flink的三大处理过程 2.Environment 1）getExecutionEnvironment 创建...
Flink序列化框架分析
1.Flink的TypeInformation类 TypeInformation是flink中所有类型的基类，其作...
standalone flink on k8s 部署问题
1.flink on k8s 读取外部hdfs 报错 hadoop fs -chmod -R 777 /user/...
flink异步io应用场景之流表join维表
1.flink异步io的定义参考 http://wuchong.me/blog/2017/05/17/flink-...
Flink 的窗口
Flink 的窗口分类： 1.Flink 的窗口分类如下图： 2. 窗口的详细介绍：
【Flink SQL】如何解析和校验 Flink SQL
1.flink sql 解析方法1：直接创建 flink sql parser 解析多行 sql 方法2：通过 ...
Flink侧输入流应用 kafka --> ODS-->DW
1.Flink侧输入流--> ODS-->DWD 代码：主类： kafka 工具类 kakfa 命令：控制台输出
Flink -sql 处理时间的窗口
1.flink 窗口的分类 1.1 分类 2. 先看基于处理时间的窗口 2.1 处理时间的滚动窗口 2.1.1 ...
Flink 架构
1.Flink 运行时的角色 Flink系统架构中包含了两个角色，分别是JobManager和TaskManage...

网友评论

Flink

本文标题：1.Flink基本概念

本文链接：https://www.haomeiwen.com/subject/inanlftx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

Flink

关于我们|服务条款|联系我们|1.Flink基本概念|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！