PiFlow大数据流水线系统v0.9源码
介绍:PiFlow是一个简单易用,功能强大的大数据流水线系统。包含丰富的处理器组件,提供Shell、DSL、Web配置界面、任务调度、任务监控等功能。特性:1、简单易用可视化配置流水线。监控流水线。查看流水线日志。检查点功能。2、扩展性强:支持自定义开发数据处理组件。3、性能优越:基于分布式计算引擎Spark开发。4、功能强大:提供100+的数据处理组件。包括Hadoop 、Spark、MLlib
介绍:
PiFlow是一个简单易用,功能强大的大数据流水线系统。包含丰富的处理器组件,提供Shell、DSL、Web配置界面、任务调度、任务监控等功能。
特性:
1、简单易用
可视化配置流水线。
监控流水线。
查看流水线日志。
检查点功能。
2、扩展性强:
支持自定义开发数据处理组件。
3、性能优越:
基于分布式计算引擎Spark开发。
4、功能强大:
提供100+的数据处理组件。
包括Hadoop 、Spark、MLlib、Hive、Solr、Redis、MemCache、ElasticSearch、JDBC、MongoDB、HTTP、FTP、XML、CSV、JSON等。
集成了微生物领域的相关算法。
环境要求:
JDK 1.8
Spark-2.11.8
Apache Maven 3.1.0
Spark-2.1.0 及以上版本
Hadoop-2.6.0
网盘下载地址:
http://kekewl.net/tPM3zXxuKwS0
图片:
开放原子开发者工作坊旨在鼓励更多人参与开源活动,与志同道合的开发者们相互交流开发经验、分享开发心得、获取前沿技术趋势。工作坊有多种形式的开发者活动,如meetup、训练营等,主打技术交流,干货满满,真诚地邀请各位开发者共同参与!
更多推荐
所有评论(0)