学习Python 2还是Python 3?

看到很多新同学在学习Python的过程中,犹豫学习Python 2还是学习Python 3而迟迟不行动,白白地浪费了大把时间,错过了升职加薪的机会,我真心觉得非常遗憾。所以,我忍不住想对大家粗暴一次,给大家一个粗暴而又正确的答案:

应该学习Python 2还是Python 3?

都要学!

这个答案可能很出乎意料,也很容易反驳,例如:

  • Python 3 才是Python的未来
  • Python 官方都建议指直接学习Python 3
  • Python 2 只维护到2020年

真的是这样吗?作为一个在一线互联网公司奋斗的工程师,也是一个多年的Python老手,大家不妨来看看我这么说的理由。

为什么还要学习Python 2

Python 2只维护到2020年不应该成为你拒绝Python 2的理由

所有纠结学习Python 2还是Python 3的朋友都知道,按照Python官方的计划,Python 2只支持到2020年。可能大家接触Python的时间还不长,不知道Python官方曾经还说过,Python 2只支持到2015年(https://github.com/python/peps/blob/master/pep-0373.txt)。所以,大家可以看到,跳票不是中国人的特权,Python官方也是会跳票的。

如果大家关注科技新闻的话,会注意到,就在前几天,微软刚宣布将在2020年对Win 7停止任何技术支持,之后即使遇到BUG和安全问题,他们也不会再修复,就像现在的XP一样。但是,大家看看我们周围的同事、朋友、亲戚,到底是用Win 7的多还是用Win 10的多?这些用Win 7的人有吵着说我要升级Windows的吗?用Win 10的人有吵着让用Win 7的人升级吗?

但是,在Python这个圈子,就是有很多人吵着要让别人升级Python 3。很多时候用户并不关心自己用的是Python 2还是Python 3,只要能用就行。所以,用Python 2的人并没有什么动力去升级到Python 3。

如果你觉得,Python 3才是Python的未来,不希望接触Python 2的项目。那么,问题来了,女神跟你说,晚上来我家给我修下电脑呗,但是我的电脑是Windows XP的,你是去还是不去?

Python官方建议学习Python 3只是一种一厢情愿的行为

我们来看一下Python 2和Python 3的下载统计数据(Python 2.7 still reigns supreme in pip installs):

Python 2的使用量远远超过Python 3。而且,大家注意竖轴的单位,是指数!简单换算一下就知道,仅从下载量来说,Python 2.7的下载量是总下载量的90%!所以,学习Python,想直接抛弃Python 2学习Python 3,几乎是不可能的事情。

上面的数据是全球范围的统计数据,我们来看看中国互联网的情况。为了写这篇文章,我专门在同学群里面发了红包,邀请了来自百度、阿里、腾讯、网易、美团、华为、招行、建行、eBay、美图、Oracle等公司的一线技术专家,统计了各大公司使用Python的情况。

统计数据如下:

  • 10% 使用 Python 3
  • 20% 既使用Python 2也使用Python 3,Python 2用的更多
  • 70% 使用Python 2

统计数据基本与pypi的全球范围的统计数据吻合。所以,如果你说,我一开始学的就是Python 3,Python 3也是Python的未来,我不想去了解和学习Python 2。那么,你可能要和大半个中国互联网失之交臂了。或许你也不在乎,但是,如果有人拿钱砸你让你维护Python 2的代码呢?

Python 2还会存在很长一段时间

不知道大家有没有想过,为什么Python官方极力让大家使用Python 3,而Python 2依然处于统治地位呢?

其实答案很简单也很粗暴:因为绝大多数人,你给他什么,他就用什么。据我说知,尽管Python 3在2008年12月就已经发布了,但是,目前Python 3仍然不是任何操作系统的默认Python解释器,这是Python 3使用不广泛的主要原因。

我们都知道,在任何一家公司,升级服务器的操作系统版本都是一个很慎重事情。所以,我们有理由相信,Python 2还会存在很长一段时间。很长是多长呢?至少比2020年还要长。

这个世界并不是非黑即白的,Python也不是

有了前面的数据做支撑,我们不是应该学习Python 2吗,为什么Python 2和Python 3都要学呢?

首先,这个世界并不是非黑即白的,Python也不是。在学习Python 2和学习Python 3中间,其实有一个很好的平衡,那就是同时兼容Python 2和Python 3。为了做到同时兼容Python 2和Python 3,需要深用到Python的future库。future库里面包含了不少从Python 3 backport 到Python 2的特性,充分使用future库,可以很好的兼容Python 2和Python 3。

其次,Python 2和Python 3确实有一些差异,但是,并没有大家想象的那么大,Python 2和Python 3之间的差异不到Python语法的10%,我们可以快速地了解哪些Python 2里面的语法在Python 3中已经被弃用,在我们写代码的过程中,规避掉这一部分语法即可。在Python的最佳实践中,Python 3里弃用的Python语法,在Python 2里面也不推荐使用,不然也不会被弃用了。如果你知道并坚持Python的最佳实践,那么,对你来说,Python 2和Python 3的差异就更小了。

最后,我们可以参考优秀的开源软件的做法,如OpenStack,努力做到代码同时兼容Python 2和Python 3(Python3 - OpenStack),也可以借助一些开软的库(如six)来同时兼容。如果能够做到同时兼容Python 2和Python 3,我们的使用者将更广泛,我们的代码也将更有价值。

拿Windows 来说,当 Windows 7 发布的时候(我就不说 Vista 了),很多人依然抱着 XP 不放,当你问他们为什么时,他们会一本正经地说,“新系统好卡啊”,或是“好多软件都不兼容啊”,或是“改变很大啊,好不习惯啊”,甚至是“ XP 已经是很好的系统了,微软出个新系统就是为了坑钱”。

于是乎,春去春又来,送走了 Win 7 ,我们又迎来了 Win 8 ,但是这些人的想法依然没有改变(我相信中国人中这种情况多一些)。如果这种人很多而且这种情况持续下去的话,最终的结局只会是微软的状况越来越差,最终人们毫无选择,投降了Linux的怀抱(咦?怎么有种心花怒放的感觉)。

当我在脑子里把上面的 Win XP 换成 Python 2 、Win 7 换成 Python 3 甚至 Python 4 时,不禁感到一阵恐惧,我差点就和其他人合谋把 Python 给害死!试想一下,多年以后,Ruby 、Go 等语言都有了很多新的特性,虽然最新的 Python 也十分优秀,但因为一些人,不愿改变,坚守着老版本,抛出一些可笑的理由,最终 Python 因为用户习惯而没落了, Guido 和整个 Python 社区的努力都被这些人的习惯给无视了。

让我们来看看这些可笑的理由(关于详细的解释,可以看一下知乎上的徐酿泉的答案,我在这简单总结一下):
什么?支持 Python 3 的库太少?醒醒吧,这都6年了,最新都3.4.1了,现在还不支持 Python 3 的库大多是常年无人维护的东西了。
什么?新版本和旧版本兼容性差?放心吧,以后的版本会越来越不兼容,除非你打算死守 Python 2 一辈子。况且,为了新的特性,改变一下有那么难吗?
最后,那些还在坚守旧版本的人,你们的一堆理由和批评,真的不是在为自己的问题作辩护吗?

stop talking, just do it

前面说了我对学习Python 2还是Python 3的一些观点,希望能够帮助大家少走弯路,另外,关于Python的版本问题,我这里还有一些良心建议:

  • 学习Python前,先了解在Python 3里面已经弃用的Python 2语法,对这些部分简单带过不要花太多时间
  • 使用Python 2,不要使用Python 2.7以前的版本
  • 使用Python 3,不要使用Python 3.4以前的版本
  • 多了解Python 2的future
  • 对同一份代码,不要为Python 2和Python 3分别维护分支,努力在一套代码中兼容Python 2和Python 3

这篇文章详细的说明了为什么要同时学习Python 2和Python 3,如何在Python 2和Python 3中找到一个平衡。但是,重要的不是纠结学习Python 3还是Python 2,而是“stop talking, just do it!”。

Python2与Python3的具体区别

除了引入import from future,了解一下两者的区别也是很必要的

print函数:(Python3中print为一个函数,必须用括号括起来;Python2中print为class)

Python 2 的 print 声明已经被 print() 函数取代了,这意味着我们必须包装我们想打印在小括号中的对象。

Python 2

1 print 'Python', python_version()

2 print 'Hello, World!'

3 print('Hello, World!')

4 print "text", ; print 'print more text on the same line'

run result:
Python 2.7.6
Hello, World!
Hello, World!
text print more text on the same line

Python 3

1 print('Python', python_version())

2 print('Hello, World!')

3 print("some text,", end="")

4 print(' print more text on the same line')

run result:
Python 3.4.1
Hello, World!
some text, print more text on the same line


通过input()解析用户的输入:(Python3中input得到的为str;Python2的input的到的为int型,Python2的raw_input得到的为str类型)统一一下:Python3中用input,Python2中用row_input,都输入为str

幸运的是,在 Python 3 中已经解决了把用户的输入存储为一个 str 对象的问题。为了避免在 Python 2 中的读取非字符串类型的危险行为,我们不得不使用 raw_input() 代替。

Python 2
Python 2.7.6
[GCC 4.0.1 (Apple Inc. build 5493)] on darwin
Type “help”, “copyright”, “credits” or “license” for more information.

>>> my_input = input('enter a number: ') enter a number: 123 >>> type(my_input)<type 'int'> >>> my_input = raw_input('enter a number: ') enter a number: 123 >>> type(my_input)<type 'str'>

Python 3
Python 3.4.1
[GCC 4.2.1 (Apple Inc. build 5577)] on darwin
Type “help”, “copyright”, “credits” or “license” for more information.

>>> my_input = input('enter a number: ') enter a number: 123 >>> type(my_input)<class 'str'>

整除:(没有太大影响)(Python3中/表示真除,%表示取余,//表示地板除(结果取整);Python2中/表示根据除数被除数小数点位得到结果,//同样表示地板除)统一一下:Python3中/表示真除,%表示取余,//结果取整;Python2中带上小数点/表示真除,%表示取余,//结果取整

Python 2

1 print 'Python', python_version()

2 print '3 / 2 =', 3 / 2

3 print '3 // 2 =', 3 // 2

4 print '3 / 2.0 =', 3 / 2.0

5 print '3 // 2.0 =', 3 // 2.0

run result:
Python 2.7.6
3 / 2 = 1
3 // 2 = 1
3 / 2.0 = 1.5
3 // 2.0 = 1.0

Python 3

1 print('Python', python_version())

2 print('3 / 2 =', 3 / 2)

3 print('3 // 2 =', 3 // 2)

4 print('3 / 2.0 =', 3 / 2.0)

5 print('3 // 2.0 =', 3 // 2.0)
k
run result:
Python 3.4.1
3 / 2 = 1.5
3 // 2 = 1
3 / 2.0 = 1.5
3 // 2.0 = 1.0


xrange模块:

在 Python 3 中,range() 是像 xrange() 那样实现以至于一个专门的 xrange() 函数都不再存在(在 Python 3 中xrange() 会抛出命名异常)。

在 Python 2 中 xrange() 创建迭代对象的用法是非常流行的。比如: for 循环或者是列表/集合/字典推导式。
  这个表现十分像生成器(比如。“惰性求值”)。但是这个 xrange-iterable 是无穷的,意味着你可以无限遍历。
  由于它的惰性求值,如果你不得仅仅不遍历它一次,xrange() 函数 比 range() 更快(比如 for 循环)。尽管如此,对比迭代一次,不建议你重复迭代多次,因为生成器每次都从头开始。



|

python 2.4 与 python 3.0 的比较

一、 print 从语句变为函数

原: print 1, 2+3

改为: print ( 1, 2+3 )

二、range 与 xrange

原 : range( 0, 4 ) 结果 是 列表 [0,1,2,3 ]

改为:list( range(0,4) )

原 : xrange( 0, 4 ) 适用于 for 循环的变量控制

改为:range(0,4)

三、字符串

原: 字符串以 8-bit 字符串存储

改为: 字符串以 16-bit Unicode 字符串存储

四、try except 语句的变化

原: try:

      ......

 except    Exception, e :

     ......

改为

try:

      ......

 except    Exception as e :

     ......

五、打开文件

原: file( ..... )

或 open(.....)

改为:

只能用 open(.....)

六、从键盘录入一个字符串

原: raw_input( "提示信息" )

改为: input( "提示信息" )

七、bytes 数据类型

A bytes object is an immutable array. The items are 8-bit bytes, represented by integers in the range 0 <= x < 256.

bytes 可以看成是“字节数组”对象,每个元素是 8-bit 的字节,取值范围 0~255。

由于在 python 3.0中字符串以 unicode 编码存储,当写入二进制文件时,字符串无法直接写入(或读取),必须以某种方式的编码为字节序列后,方可写入。

(一)字符串编码(encode) 为 bytes

例: s = "张三abc12"

   b = s.encode( 编码方式)

   # b 就是 bytes 类型的数据

  # 常用的编码方式为 : "uft-16"    , "utf-8", "gbk", "gb2312", "ascii" , "latin1" 等

  # 注 : 当字符串不能编码为指定的“编码方式”时,会引发异常

(二) bytes 解码(decode)为字符串

  s = "张三abc12"

   b = s.encode( "gbk")    # 字符串 s 编码为 gbk 格式的字节序列

   s1 = b.decode("gbk")   # 将字节序列 b以gbk格式 解码为字符串

   # 说明,当字节序列不能以指定的编码格式解码时会引发异常

(三)使用方法举例

coding=gbk

f = open("c:\1234.txt", "wb")
s = "张三李四abcd1234"

-------------------------------

在 python2.4 中我们可以这样写:

f.write( s )

但在 python 3.0中会引发异常

-------------------------------

b = s.encode("gbk")
f.write( b )
f.close()

input("?")

读取该文件的例子:

coding=gbk

f = open("c:\1234.txt", "rb")
f.seek(0,2) #定位至文件尾
n = f.tell() #读取文件的字节数
f.seek(0,0) #重新定位至文件开始处
b = f.read( n )

------------------------------

在 python 2.4 中 b 是字符串类型

要 python 3.0 中 b 是 bytes 类型

因此需要按指定的编码方式确码

------------------------------

s = b.decode("gbk")
print ( s )

------------------------------

在 python 2.4 中 可以写作 print s 或 print ( s )

要 python 3.0 中 必须写作 print ( s )

------------------------------

f.close()
input("?")

运行后应显示:

张三李四abcd1234

(四) bytes序列,一但形成,其内容是不可变的

例:

s="ABCD"

b=s.encode("gbk")

print b[0] # 显示 65

b[0] = 66

执行该句,出现异常: 'bytes' object does not support item assignment

八、 chr( K ) 与 ord( c )

python 2.4.2以前

chr( K ) 将编码K 转为字符,K的范围是 0 ~ 255

ord( c ) 取单个字符的编码, 返回值的范围: 0 ~ 255

python 3.0

chr( K ) 将编码K 转为字符,K的范围是 0 ~ 65535

ord( c ) 取单个字符的编码, 返回值的范围: 0 ~ 65535

九、 除法运算符

python 2.4.2以前

10/3 结果为 3

python 3.0

10 / 3 结果为 3.3333333333333335

10 // 3 结果为 3

十、字节数组对象 --- 新增

(一) 初始化

a = bytearray(   10 )

 # a 是一个由十个字节组成的数组,其每个元素是一个字节,类型借用 int

 # 此时,每个元素初始值为 0

(二) 字节数组 是可变的

a = bytearray(   10 )

 a[0] = 25

 # 可以用赋值语句更改其元素,但所赋的值必须在 0 ~ 255 之间

(三) 字节数组的切片仍是字节数组

(四) 字符串转化为字节数组

 #coding=gbk

 s ="你好"

 b = s.encode( "gbk")     # 先将字符串按某种“GBK”编码方式转化为 bytes

 c = bytearray( b )          #再将 bytes 转化为 字节数组

 也可以写作

 c = bytearray( "你好", "gbk")

(五) 字节数组转化为字符串

  c = bytearray( 4 )

   c[0] = 65 ; c[1]=66; c[2]= 67; c[3]= 68

  s = c.decode( "gbk" )

   print ( s )

  # 应显示: ABCD           

(六) 字节数组可用于写入文本文件

coding=gbk

f = open("c:\1234.txt", "wb")
s = "张三李四abcd1234"

-------------------------------

在 python2.4 中我们可以这样写:

f.write( s )

但在 python 3.0中会引发异常

-------------------------------

b = s.encode("gbk")

f.write( b )
c=bytearray( "王五","gbk")
f.write( c )
f.close()

input("?")


Logo

开放原子开发者工作坊旨在鼓励更多人参与开源活动,与志同道合的开发者们相互交流开发经验、分享开发心得、获取前沿技术趋势。工作坊有多种形式的开发者活动,如meetup、训练营等,主打技术交流,干货满满,真诚地邀请各位开发者共同参与!

更多推荐