美文网首页
flink任务编程-java版-流-数据库to数据库

flink任务编程-java版-流-数据库to数据库

作者: 李征兵 | 来源:发表于2019-07-22 08:54 被阅读0次

本文就flink流计算的任务工程模板做一介绍,初始数据源和计算结果数据存储都是通过JDBC连接到数据库。本文以mysql为数据库进行演示。

依赖包

        <dependency>
            <groupId>mysql</groupId>
            <artifactId>mysql-connector-java</artifactId>
            <version>8.0.15</version>
        </dependency>

工程结构说明

工程结构

本工程包含以下几个部分:

  1. 结构化数据定义(DTO),本文以常见的学生基本信息为示例。
package com.crazyice.lee.data;

import lombok.*;

@Data
@AllArgsConstructor
@NoArgsConstructor
@ToString(exclude = {"password","age"})
@RequiredArgsConstructor()
public class Student {
    private int studentId;
    private String name;
    private String password;
    private boolean sex;
    private int age;
}
  1. 任务编排,这里演示了一个完整流任务的各个关键环节,包括:环境配置、源数据读取(DataStreamSource)、处理过程(数据过滤筛选)、处理结果输出入库(DataSink)、启动任务执行等。
package com.crazyice.lee.jobs;

import com.crazyice.lee.data.Student;
import com.crazyice.lee.reader.JdbcReader;
import com.crazyice.lee.writer.JdbcWriter;
import lombok.extern.slf4j.Slf4j;
import org.apache.flink.streaming.api.datastream.DataStream;
import org.apache.flink.streaming.api.datastream.DataStreamSource;
import org.apache.flink.streaming.api.environment.StreamExecutionEnvironment;

@Slf4j
public class Mysql2MysqlJob {

    public static void main(String[] args) throws Exception {
        //设置环境
        final StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();

        //获取数据-数据源
        DataStreamSource<Student> students = env.addSource(new JdbcReader());
        students.name("从mysql读取数据");

        //处理数据过程
        DataStream<Student> subStudents = students
                .filter(e -> e.isSex()).name("过滤男生")
                .filter(e -> e.getAge() > 12).name("过滤12岁以上");

        //写入数据-处理结果
        subStudents.addSink(new JdbcWriter()).name("写入备份学生库");
        env.execute("读取Mysql,数据过滤,写入Mysql");
    }
}
  1. 初始数据源、结果写入数据源配置,这部分通过实现RichSourceFunction、RichSinkFunction接口并配合配置文件实现,是相对固定的模式,如果要提高编程效率,可以考虑使用模板及配置的方式动态实现,因为代码结构固定,所以不在此处粘贴,如果感兴趣可以通过文章下面的开源链接查看。

测试验证

flink支持本地测试模式,可以在编码过程中排查错误,只需要在环境设置部分使用本地环境对象即可(将原先的getExecutionEnvironment()替换为createLocalEnvironment())也可以使用profile来进行编译配置。

        //设置环境
        final ExecutionEnvironment environment = properties.getProperty("local.running").equalsIgnoreCase("true") ? StreamExecutionEnvironment.createLocalEnvironment() : StreamExecutionEnvironment.getExecutionEnvironment();

源代码:(https://gitee.com/crazyicelee/flink

相关文章

  • flink任务编程-java版-流-数据库to数据库

    本文就flink流计算的任务工程模板做一介绍,初始数据源和计算结果数据存储都是通过JDBC连接到数据库。本文以my...

  • 数据库编程

    1996年sun公司发布了第1版JAVA数据库连接(JDBC)API ,使编程人员通过这个API连接数据库 JDB...

  • 学习规划

    大数据 Flink 数据库 - MySQL, Redis, TIDB 语言 - Java Python Go C ...

  • JDBC与MyBatis

    传统的JDBC编程 JAVA程序通过JDBC链接数据库,这样我们就可以通过SQL对数据库进行编程。 JAVA链接数...

  • 计算机专业Java必读书单,高清PDF电子版下载

    Java语言学习资料。包括了编程思想、入门进阶、网络编程以及数据库。全部电子版PDF经典图书。 关注公众号 进击的...

  • JDBC

    JDBC是什么? JDBC代表Java数据库连接,这对Java编程语言和广泛的数据库之间独立于数据库的连接标准的J...

  • 1-JDBC是什么

    JDBC概念 JDBC (Java Database Connectivity) API,即Java数据库编程接口...

  • 2019-04-29 Java_JDBC_0

    Java程序访问数据库:①:import java.sql,*; JDBC链接数据库 涉及到一个JDBC连接的编程...

  • 一.JDBC入门

    java数据库编程 思考:JDBC可以操作数据库吗? 学习案例:数据库及表的建立:Create database ...

  • JDBC理解

    DBC:database connection这是数据库连接,JDBC是java编程语言支持的数据库连接。SUM公...

网友评论

      本文标题:flink任务编程-java版-流-数据库to数据库

      本文链接:https://www.haomeiwen.com/subject/aiablctx.html