大数据 - 潘志浩 (BrucePan) - Gitee.com

开源
企业版
高校版
搜索
帮助中心
使用条款
关于我们

开源企业版高校版私有云 Gitee AI ^NEW

潘志浩的个人主页

/

/

大数据

大数据

0

关注

暂无描述

11 个仓库

添加到

移动到

移出

退出批量操作

最新加入

最新加入

最近更新

仓库名称

403 袋鼠云 / Taier GVP

Taier 名字由来中国古代十大名剑之一 —— 太阿。 Taier 是一个分布式可视化的DAG任务调度系统。旨在降低ETL开发成本、提高大数据平台稳定性，大数据开发人员可以在 Taier 直接进行业务逻辑的开发，而不用关心任务错综复杂的依赖关系与底层的大数据平台的架构实现，将工作的重心更多地聚焦在业务之中。

distributed-schedule-system

最近更新: 1年前

65 DataManagement / Spark-Autotuning

Apache Spark的性能表现受到配置参数的影响，这些参数的调优往往由人力完成，然而不适当的参数配置可能严重地降低系统的性能表现。本工具能够根据历史记录自动调整Apache spark的参数设置

最近更新: 4年多前

207 稍稍 / Spark Streaming Framework
关闭

一个完善的Spark Streaming二次封装开源框架，包含：实时流任务调度、kafka偏移量管理，web后台管理，web api启动、停止spark streaming，宕机告警、自动重启等等功能支持，用户只需要关心业务代码，无需关注繁琐的技术细节，大大提高实时流开发效率和难度(附demo)。

最近更新: 4年多前

209 hellowzk / light-spark

Spark快速开发框架，提高开发效率，主要针对离线任务场景

最近更新: 3年前

104 微野 / datax-web-ui

DataX Web UI

最近更新: 2年多前

1.9K 微野 / datax-web

DataX集成可视化页面，选择数据源即可一键生成数据同步任务，支持批量创建RDBMS数据同步任务，集成开源调度系统，支持分布式、增量同步数据、实时查看运行日志、监控执行器资源、KILL运行进程、数据源信息加密等。

最近更新: 2年多前

5 崔进 / DataLink

DataLink是一个满足各种异构数据源之间的实时增量同步、离线全量同步，分布式、可扩展的数据交换平台。

最近更新: 接近4年前

605 wux-labs / DataService-Framework

大数据平台数据服务框架。实现了Kafka实时数据过滤、清洗、转换、消费，实现了Spark SQL对Redis、MongoDB等非关系型数据库的数据的读写；集成了规则引擎，可基于规则引擎实现客户标签、画像等相关功能。

最近更新: 2年前

1 Gitee 极速下载 / data-accelerator

Data Accelerator 的一些方法可以更容易地在 Apache Spark 上构建流式传输管道：即插即用：轻松设置输入源和输出接收器，以便在几分钟内建立管道

最近更新: 9个月前

1 潘志浩 / BigData-Notes

大数据入门指南 :star:

最近更新: 4年前

1 2

你正在添加一个 Star 仓库到

新建

取消

暂无星选集

新建星选集

名称

描述

公开，允许其他人查看、关注这个星选集

取消

删除星选集

删除星选集，关注此星选集的用户都无法再看到这个星选集的内容。
星选集内的仓库不会被取消 Star。

取消

确定

取消公开星选集

取消公开星选集，关注此星选集的用户都无法再看到这个星选集的内容。

我知道了

添加 Star 仓库到「大数据」

最近更新

最近更新

最新 Star

仓库名称

暂无已 Star 仓库，去看看开源项目

你正在移出 0 个 Star 仓库

移出后，此仓库不会被取消Star。

取消

确定

深圳市奥思网络科技有限公司版权所有

Git 命令学习

CopyCat 代码克隆检测

APP与插件下载

Gitee 封面人物

Gitee 公益计划

Gitee 持续集成

在线自助服务

技术交流QQ群

微信服务号

client#oschina.cn

企业版在线使用：400-606-0201

专业版私有部署：

开放原子开源基金会

合作代码托管平台

违法和不良信息举报中心

粤ICP备12009483号

简体 / 繁體 / English

点此查找更多帮助

搜索帮助

Git 命令在线学习如何在 Gitee 导入 GitHub 仓库

Git 仓库基础操作

企业版和社区版功能对比

SSH 公钥设置

如何处理代码冲突

仓库体积过大，如何减小？

如何找回被删除的仓库数据

Gitee 产品配额说明

GitHub仓库快速导入Gitee及同步更新

什么是 Release（发行版）

将 PHP 项目自动发布到 packagist.org

回到顶部