flink分析使用之一环境安装
flink分析使用之一环境安装flink是近两年风头比较强劲的一个开源的流式计算框架,也有人将其定义为第四代大数据引擎,它的主要特点是支持内存流式的高吞吐、低延迟处理(这是不是现代大数据发展的特点);支持带有事件的窗口操作;支持有状态计算的Exactly-once语义;支持轻量级分布式快照实现的容错;在JVM内部实现了内存管理;支持迭代计算;支持具有Backpressure功能的持续流模型;支..
flink分析使用之一环境安装
flink是近两年风头比较强劲的一个开源的流式计算框架,也有人将其定义为第四代大数据引擎,它的主要特点是支持内存流式的高吞吐、低延迟处理(这是不是现代大数据发展的特点);支持带有事件的窗口操作;支持有状态计算的Exactly-once语义;支持轻量级分布式快照实现的容错;在JVM内部实现了内存管理;支持迭代计算;支持具有Backpressure功能的持续流模型;支持程序自动优化等。
随着阿里投入对Flink的支持和应用,相信其在可见的未来还是会越来越重要。要想分析使用Flink,就得先安装其环境。
一、准备工作
1、源码下载
源码可以到Github上下载:
1 git clone https://github.com/apache/flink.git
2、环境工具
1)JDK安装,这里不再赘述,可以上网查找。要求大于JDK8(8u51)以上。
2)开发的IDE这里使用的intel idea,官网推荐的使用是2016.2.5。安装方法是从其官网下载,可以试用30天,如果不想试用,自己找破解的方法或者直接购买官方正品。
3)Maven,直接到官网http://maven.apache.org/download.cgi下载最新,但Flink推荐的使用的是3.2.5(https://archive.apache.org/dist/maven/maven-3/3.2.5/),这里提醒一下,最好使用推荐的版本,否则有较大概率出现各种莫名的错误,吃了不少苦头。
4)Git,这个直接从官网下载或者使用apt-get即可,这个要求不特定。
5)Scala插件,这个直接在Idea的插件里搜索即可,安装成功后可以写一个测试的例子试试。如果需要安装Scala的SDK,有两种方式,一种是在IDE里创建工程时直接下载,特别慢,另外一个是直接在官网上下载SDK再安装。
二、编译
编译有两种方式:
1、IDE编译:
首先,启动IDEA并选择“导入工程”,其次,选择Flink的根目录,跳到下一个窗口后,选择“Import project from external model” and select “Maven”,继续Next直到出现JDK的选择,选择JDK8以上的即可(如果有一个会自动选择),再次Next,直到完成整个项目导入。
这时,IDEA会自动导入相关的依赖,这里可就麻烦了,由于网速的原因,这里的导入进行了将近半天,而且经常超时重复,耐心即可。如果网速好并且能翻墙,可能有十几分钟就搞定了。时间就是金钱啊。
工程导入完毕后,点击左侧的Flink工程,右键,选择“Maven”,选择“Generate Sources and Update Folders”,等待完成后,点击菜单上的Build->Make Project。
正常的情况下,会编译成功,但是需要等待一段时间,如果有错误,可以到网上查找原因,然后配置一下Pom文件即可。一般都是库不匹配。
2、命令行编译
找到刚才下载的源码目录,使用下面的命令:
1 cd flink
2 mvn clean package -DskipTests
github上讲这个需要大约十分钟,可是在虚拟机里,也是各种原因,网络,CPU导致假死了好几次,用了将近小半天才编译成功了。看来要想顺利,还是得翻墙,如果不翻墙,就得考虑在清晨或者傍晚比较好上外国网站时编译,速度快很多。
三、总结
正所谓“其作始也简,其将毕也必钜”。一步步来,从下一篇开始分析Flink的源码。
开放原子开发者工作坊旨在鼓励更多人参与开源活动,与志同道合的开发者们相互交流开发经验、分享开发心得、获取前沿技术趋势。工作坊有多种形式的开发者活动,如meetup、训练营等,主打技术交流,干货满满,真诚地邀请各位开发者共同参与!
更多推荐
所有评论(0)