1 Star 0 Fork 0

樊同学 / Tag Number Statistics FlinkTask

加入 Gitee
与超过 1200万 开发者一起发现、参与优秀开源项目,私有仓库也完全免费 :)
免费加入
该仓库未声明开源许可证文件(LICENSE),使用请关注具体项目描述及其代码上游依赖。
克隆/下载
贡献代码
同步代码
取消
提示: 由于 Git 不支持空文件夾,创建文件夹后会生成空的 .keep 文件
Loading...
README

Tag Number Statistics FlinkTask

介绍

统计历史数据的Flink任务,统计位号历史数据中哪些位号缺少某时间点的数据,生成湖数据或csv报表

软件架构

1,Source

从redis和数据湖分别读取历史数据

2,Flink任务
  • 每天凌晨00:00:20执行程序,统计缺少数据的位号
  • 第一次执行统计数据源的位号的所有历史数据,以后执行就只统计前一天的历史数据
  • 统计所有历史数据的过程也是开窗(一天)进行批处理
3,Sink

统计结果写入数据湖

4,统计结果的表设计

TableName:DeletionDataStat

ID(id) 位号名称(tagName) 缺失日期(deletionDate) 缺失数(deletionCount) 缺失时刻列表(deletionTimestamps)
UUID 11TT-10121 yyyy-MM-dd xx timestamp1,timestamp2,timestamp3
5,如何统计
  • 第一步,遍历位号,对每个位号查询前一天的列表
  • 第二步,筛选出缺失数据
  • 第三步,存入数据湖
6,配置项
  • 配置实例的位号的时间频度(例如:时间间隔是2s,每2s一条历史数据)查询统计的sql动态读取配置项信息进行调整
  • 配置redis和数据湖的连接信息

配置位号时间频度的配置文件

# key:位号名称
# value:时间间隔 S|s 秒 M|m 分 H|h 时 支持小数
11TT-10121=60s
11TT-10122=60s
...

使用教程

  1. 打包Flink程序,上传Flink客户端

  2. 执行命令提交执行任务到Yarn集群

    ​ 如:flink run -d -t yarn-per-job -c com.atguigu.wc.StreamWordCount FlinkTutorial-1.0-SNAPSHOT.jar

  3. 通过ApplicationMaster查看任务执行情况

空文件

简介

Flink实现统计历史数据的一个执行任务,统计历史数据的Flink任务,统计位号历史数据中哪些位号缺少某时间点的数据,生成湖数据或csv报表 展开 收起
Java
取消

发行版

暂无发行版

贡献者

全部

近期动态

加载更多
不能加载更多了
1
https://gitee.com/fanjiangfeng/tag-number-statistics-flink-task.git
git@gitee.com:fanjiangfeng/tag-number-statistics-flink-task.git
fanjiangfeng
tag-number-statistics-flink-task
Tag Number Statistics FlinkTask
master

搜索帮助