1. Python

2.  Python机器学习的库:scikit-learn

      2.1: 特性:

简单高效的数据挖掘和机器学习分析

对所有用户开放,根据不同需求高度可重用性

基于Numpy, SciPy和matplotlib

开源,商用级别:获得 BSD许可

 

 

     2.2 覆盖问题领域:

          分类(classification), 回归(regression), 聚类(clustering), 降维(dimensionality reduction)

          模型选择(model selection), 预处理(preprocessing)

 

 

3. 使用用scikit-learn

     安装scikit-learn: pip, easy_install, windows installer

     安装必要package:numpy, SciPy和matplotlib, 可使用Anaconda (包含numpy, scipy等科学计算常用

     package)

     安装注意问题:Python解释器版本(2.7 or 3.4?), 32-bit or 64-bit系统

 

4. 例子:

     

 

      文档: http://scikit-learn.org/stable/modules/tree.html

      解释Python代码

      安装 Graphviz: http://www.graphviz.org/

      配置环境变量

      转化dot文件至pdf可视化决策树:dot -Tpdf iris.dot -o outpu.pdf

Logo

开放原子开发者工作坊旨在鼓励更多人参与开源活动,与志同道合的开发者们相互交流开发经验、分享开发心得、获取前沿技术趋势。工作坊有多种形式的开发者活动,如meetup、训练营等,主打技术交流,干货满满,真诚地邀请各位开发者共同参与!

更多推荐