数据分析:Weka,Matlab,R,SPSS,SAS等分析软件的入门
1 功能角度weka是机器学习方面的工具(开源)。spss是数学工具(商业工具)。具体的说,weka的主要功能是模式分类,或者模式识别或者回归。包括特征的降维(PCA),特征选择,训练模型以及对测试样本进行分类测试,几乎包含了机器学习中的所有常用分类器。当然还有聚类以及结果的图形可视化功能。spss,侧重统计分析。包括基础的数学运算,联合分析,时间序列分析,多元尺度方法等,当然它也有决
1 功能角度
weka是机器学习方面的工具(开源)。spss是数学工具(商业工具)。
具体的说,weka的主要功能是模式分类,或者模式识别或者回归。包括特征的降维(PCA),特征选择,训练模型以及对测试样本进行分类测试,几乎包含了机器学习中的所有常用分类器。当然还有聚类以及结果的图形可视化功能。
spss,侧重统计分析。包括基础的数学运算,联合分析,时间序列分析,多元尺度方法等,当然它也有决策树,神经网络等类似于机器学习中的分类器功能。
相同点是都具有数据的回归功能,但是weka包含了机器学习的大部分工具,而spss只有一两个分类器,更多的是统计分析。weka适合用于计算机或者自动化的学生,主要做机器学习,模式识别等领域。spss更适合用于数学系的学生,可以用于数学建模。
MATLAB,他的功能更强大基本包含了这二者的功能。weka的几乎所有功能MATLAB都有相应的工具包,此外它中文名是矩阵实验室,在数学建模上的功能也非常强大。其simulink工具箱在自动化中应用非常广泛。
2 适用情况
SPSS是傻瓜的软件,适合没有统计背景的人使用,只要输入数据就出来结果的,这个软件最重要的是社会学的人用。
MINITAB是质量管理的人用。
EXCEL所有的人都可以用,他有很多功能。
SAS是所有软件中可靠性最好的,也是最全面的软件,还可以自己继续二次开发还可以利用PERL,C,C++写好的程序转变成SAS内部函数,这是我最喜欢她的地方了。SPSS,MINITAB二次开发比较难。
MATLAB 什么都有,而你只能接受它,不能修改它。
R有很多人开发,很难保证各种方法的可靠性。
EVIEWS二次开发比较难,主要是经济学用,但是没有SAS的ETS好玩。
AMOS主要是处理SEM的,功能比SAS强大,他就是一个专业人员。
参考资料:
http://www.zhihu.com/question/20985683
http://bbs.pinggu.org/forum.php?mod=viewthread&tid=494859&page=1
开放原子开发者工作坊旨在鼓励更多人参与开源活动,与志同道合的开发者们相互交流开发经验、分享开发心得、获取前沿技术趋势。工作坊有多种形式的开发者活动,如meetup、训练营等,主打技术交流,干货满满,真诚地邀请各位开发者共同参与!
更多推荐
所有评论(0)