谈及数据分析工具就不得不谈到R,R作为开源软件,有许多统计学家和职业学者为其开发了丰富的工具包,其中也包含了一些最时髦的统计方法。但是,许多人对R望而生却,觉得R是靠代码进行数据分析,“难度很大”。

R有这么难吗?假如我们不是要进行R工具包开发,我们需要学向量、矩阵运算吗?为什么有好些R培训上来就是高数?普通使用者需要吗?有没有更简单的方法让没接触过R的人也可能无障碍且正确的使用R进行一部分统计分析?

我和很多人都讨论过这些问题,个人觉得,对于普通使用者而言,R可以很简单。培训方是完全可以降低个体的学习成本和使用成本的,但他们从来不这么干。为什么?

为了说明这件事,我开发了一个用于MVN包(用于多元正态性检验的R包)的Excel工具,该工具可在同名公众号左下角的菜单中进入下载。(工具的制作并不难,核心是Excel的数据验证功能以及IF函数)

打开这个Excel工具后,顶部有使用说明。

e761824ea56b1094f2cb0540fa112054.png

接着,我们进入操作区。操作区的黄色部分为必选项,而蓝色部分则是可选项。如果只想进行多元正态性检验,蓝色部分可以不进行更改。此处,我们选择数据集Q2,并使用hz方法进行多元正态性检验。

2c0ed42085d80fafd57c00177203c3f6.png

完成操作后,在最下方的语法区将显示对应的R语法。我们只需将“最终语法”内容复制到R中即可(即粉色区域)。

0a5115d832c69aa9cd4a7347106c01a1.png

此处,我使用RStudio进行演示。

2864d2b973ec7fea360b13cc649d064f.png

运行后,软件输出结果

07583d15984f9cb36eb2c6cb1f76b311.png

这个工具并不是将写好的语法进行整理,对应R包中所拥有的功能和所包含的选择已经全部整理完毕,使用者只需像使用对话框软件那样在下拉菜单中进行选择即可。

a915957df444d7f58cd4abcb82a1c154.png

换言之,R包的语法被制作成了拥有对话框的窗口,可类比SPSS。

c2a21c0ce50ac789dd47ebb889c1f6c1.png

我个人觉得,这是令SPSS看了沉默、Stata看了流泪的思路,因为这完全打破了使用代码的软件和使用对话框的软件之间的界限。以SPSS为例,这可以理解为使用者在SPSS中进行所有设定后,点击下方的“粘贴”按钮

ccc44fdc6ec2b1191ad6bfdc181d33d6.png

从而生成代码进行分析

26b0f2fb0b13c4057587ea447d6617b6.png

估计连SAS看了都会直呼不可战胜。

假如你没有这种感觉,那可能因为你已经度过了学习R最痛苦的那段时间,并不是站在“初学者”/“新手”的立场上考虑这个问题。

换位思考一下,如果对应的每个R包都有这样类似的工具,或者对于每个特定的分析都整理了这样的Excel(可以包含多个R包),那么完全没有R基础的人不是也可以使用R进行分析并且不会出现错误么?使用成本不是大大减少?而且无需反复查看R手册,甚至减少了一部分英语不好的使用者的学习成本。

当然,有部分人可能会反驳说,在R的使用过程中,写出相应功能函数,会有提示帮助,所以这个Excel没有用

2b0bd9c15fbb650de02db37cdf3668c2.png

那么,对于这部分人,我觉得他们说的很有道理。但是,他们只基于自身考虑,而且往往是电脑操作水平比较高、学习能力比较强或者已经有一定R使用经验的人。我希望他们可以更多的从0基础人员的角度进行考虑,而不是使用“这么简单,这你都学不会”的借口将人与人之间的差异拉大。

Logo

瓜分20万奖金 获得内推名额 丰厚实物奖励 易参与易上手

更多推荐