最近接触了Python后,看一些源代码的时候发现编译器会对一些正确的代码报错。原因就在于版本的问题。
那么这里收集了很多网络上的区别,分享给大家。
再次感谢原文的作者:
http://blog.jobbole.com/
__future__模块
[回到目录]
Python 3.x引入了一些与Python 2不兼容的关键字和特性,在Python 2中,可以通过内置的__future__模块导入这些新内容。如果你希望在Python 2环境下写的代码也可以在Python 3.x中运行,那么建议使用__future__模块。例如,如果希望在Python 2中拥有Python 3.x的整数除法行为,可以通过下面的语句导入相应的模块。
Python
1 |
from __future__ import division |
下表列出了__future__中其他可导入的特性:
特性 |
可选版本 |
强制版本 |
效果 |
nested_scopes |
2.1.0b1 |
2.2 |
PEP 227: Statically Nested Scopes
|
generators |
2.2.0a1 |
2.3 |
PEP 255: Simple Generators
|
division |
2.2.0a2 |
3.0 |
PEP 238: Changing the Division Operator
|
absolute_import |
2.5.0a1 |
3.0 |
PEP 328: Imports: Multi-Line and Absolute/Relative
|
with_statement |
2.5.0a1 |
2.6 |
PEP 343: The “with” Statement
|
print_function |
2.6.0a2 |
3.0 |
PEP 3105: Make print a function
|
unicode_literals |
2.6.0a2 |
3.0 |
PEP 3112: Bytes literals in Python 3000
|
(来源: https://docs.python.org/2/library/future.html)
示例:
Python
1 |
fromplatformimportpython_version |
print函数
[回到目录]
虽然print语法是Python 3中一个很小的改动,且应该已经广为人知,但依然值得提一下:Python 2中的print语句被Python 3中的print()函数取代,这意味着在Python 3中必须用括号将需要输出的对象括起来。
在Python 2中使用额外的括号也是可以的。但反过来在Python 3中想以Python2的形式不带括号调用print函数时,会触发SyntaxError。
Python 2
Python
1234 |
print 'Python', python_version()print 'Hello, World!'print('Hello, World!')print "text", ; print 'print more text on the same line' |
1234 |
Python2.7.6Hello,World!Hello,World!textprintmoretextonthesameline |
Python 3
Python
12345 |
print('Python', python_version())print('Hello, World!') print("some text,", end="") print(' print more text on the same line') |
123 |
Python3.4.1Hello,World!sometext,printmoretextonthesameline |
Python
1234 |
File"<ipython-input-3-139a7c5835bd>",line1print'Hello, World!'^SyntaxError:invalidsyntax |
注意:
在Python中,带不带括号输出”Hello World”都很正常。但如果在圆括号中同时输出多个对象时,就会创建一个元组,这是因为在Python 2中,print是一个语句,而不是函数调用。
Python
123 |
print 'Python', python_version()print('a', 'b')print 'a', 'b' |
123 |
Python2.7.7('a', 'b')ab |
整数除法
[回到目录]
由于人们常常会忽视Python 3在整数除法上的改动(写错了也不会触发Syntax Error),所以在移植代码或在Python 2中执行Python 3的代码时,需要特别注意这个改动。
所以,我还是会在Python 3的脚本中尝试用float(3)/2或 3/2.0代替3/2,以此来避免代码在Python 2环境下可能导致的错误(或与之相反,在Python 2脚本中用from __future__ import division来使用Python 3的除法)。
Python 2
Python
12345 |
print 'Python', python_version()print '3 / 2 =', 3 / 2print '3 // 2 =', 3 // 2print '3 / 2.0 =', 3 / 2.0print '3 // 2.0 =', 3 // 2.0 |
12345 |
Python2.7.63/2=13// 2 = 13/2.0=1.53// 2.0 = 1.0 |
Python 3
Python
12345 |
print('Python', python_version())print('3 / 2 =', 3 / 2)print('3 // 2 =', 3 // 2)print('3 / 2.0 =', 3 / 2.0)print('3 // 2.0 =', 3 // 2.0) |
12345 |
Python3.4.13/2=1.53// 2 = 13/2.0=1.53// 2.0 = 1.0 |
Unicode
[回到目录]
Python 2有基于ASCII的str()类型,其可通过单独的unicode()函数转成unicode类型,但没有byte类型。
而在Python 3中,终于有了Unicode(utf-8)字符串,以及两个字节类:bytes和bytearrays。
Python 2
Python
1 |
print 'Python', python_version() |
Python
1 |
print type(unicode('this is like a python3 str type')) |
1 |
<type'unicode'> |
Python
1 |
print type(b'byte type does not exist') |
1 |
<type'str'> |
Python
1 |
print 'they are really' + b' the same' |
Python
1 |
print type(bytearray(b'bytearray oddly does exist though')) |
1 |
<type'bytearray'> |
Python 3
Python
12 |
print('Python', python_version())print('strings are now utf-8 u03BCnicou0394é!') |
12 |
Python3.4.1stringsarenowutf-8μnicoΔé! |
Python
12 |
print('Python', python_version(), end="")print(' has', type(b' bytes for storing data')) |
1 |
Python3.4.1has<class'bytes'> |
Python
12 |
print('and Python', python_version(), end="")print(' also has', type(bytearray(b'bytearrays'))) |
1 |
andPython3.4.1alsohas<class'bytearray'> |
Python
1 |
'note that we cannot add a string' + b'bytes for data' |
123456 |
---------------------------------------------------------------------------TypeErrorTraceback(mostrecentcalllast)<ipython-input-13-d3e8942ccf81>in<module>()---->1'note that we cannot add a string' + b'bytes for data' TypeError:Can't convert 'bytes' object to str implicitly |
xrange
[回到目录]
在Python 2.x中,经常会用xrange()创建一个可迭代对象,通常出现在“for循环”或“列表/集合/字典推导式”中。
这种行为与生成器非常相似(如”惰性求值“),但这里的xrange-iterable无尽的,意味着可能在这个xrange上无限迭代。
由于xrange的“惰性求知“特性,如果只需迭代一次(如for循环中),range()通常比xrange()快一些。不过不建议在多次迭代中使用range(),因为range()每次都会在内存中重新生成一个列表。
在Python 3中,range()的实现方式与xrange()函数相同,所以就不存在专用的xrange()(在Python 3中使用xrange()会触发NameError)。
Python
12345678910 |
import timeit n = 10000def test_range(n): return for i in range(n): pass def test_xrange(n): for i in xrange(n): pass |
Python 2
Python
12345678 |
print'Python',python_version() print'ntiming range()'%timeittest_range(n) print'nntiming xrange()'%timeittest_xrange(n) |
1234567 |
Python 2.7.6 timing range()1000 loops, best of 3: 433 µs per loop timing xrange()1000 loops, best of 3: 350 µs per loop |
Python 3
Python
1234 |
print('Python',python_version()) print('ntiming range()')%timeittest_range(n) |
1234 |
Python 3.4.1 timing range()1000 loops, best of 3: 520 µs per loop |
Python
123456 |
---------------------------------------------------------------------------NameError Traceback (most recent call last)in ()----> 1 print(xrange(10)) NameError: name 'xrange' is not defined |
Python 3中的range对象中的__contains__方法
另一个值得一提的是,在Python 3.x中,range有了一个新的__contains__方法。__contains__方法可以有效的加快Python 3.x中整数和布尔型的“查找”速度。
Python
12345678910111213 |
x=10000000defval_in_range(x,val): returnvalinrange(x) defval_in_xrange(x,val): returnvalinxrange(x) print('Python',python_version())assert(val_in_range(x,x/2)==True)assert(val_in_range(x,x//2)==True)%timeitval_in_range(x,x/2) %timeitval_in_range(x,x//2) |
123 |
Python 3.4.11 loops, best of 3: 742 ms per loop1000000 loops, best of 3: 1.19 µs per loop |
根据上面的timeit的结果,查找整数比查找浮点数要快大约6万倍。但由于Python 2.x中的range或xrange没有__contains__方法,所以在Python 2中的整数和浮点数的查找速度差别不大。
Python
12345678910111213 |
print'Python',python_version() assert(val_in_xrange(x,x/2.0)==True)assert(val_in_xrange(x,x/2)==True)assert(val_in_range(x,x/2)==True)assert(val_in_range(x,x//2)==True)%timeitval_in_xrange(x,x/2.0) %timeitval_in_xrange(x,x/2) %timeitval_in_range(x,x/2.0) %timeitval_in_range(x,x/2) |
12345 |
Python 2.7.71 loops, best of 3: 285 ms per loop1 loops, best of 3: 179 ms per loop1 loops, best of 3: 658 ms per loop1 loops, best of 3: 556 ms per loop |
下面的代码证明了Python 2.x中没有__contain__方法:
Python
12 |
print('Python',python_version())range.__contains__ |
12 |
Python 3.4.1<slot wrapper '__contains__' of 'range' objects |
Python
12 |
print('Python',python_version())range.__contains__ |
12345678 |
Python 2.7.7---------------------------------------------------------------------------AttributeError Traceback (most recent call last)<ipython-input-7-05327350dafb> in <module>()1 print 'Python', python_version()----> 2 range.__contains__ AttributeError: 'builtin_function_or_method' object has no attribute '__contains__' |
Python
12 |
print('Python',python_version())xrange.__contains__ |
123456789 |
Python 2.7.7 ---------------------------------------------------------------------------AttributeError Traceback (most recent call last)in ()1 print 'Python', python_version()----> 2 xrange.__contains__ AttributeError: type object 'xrange' has no attribute '__contains__' |
关于Python 2中xrange()与Python 3中range()之间的速度差异的一点说明:
有读者指出了Python 3中的range()和Python 2中xrange()执行速度有差异。由于这两者的实现方式相同,因此理论上执行速度应该也是相同的。这里的速度差别仅仅是因为Python 3的总体速度就比Python 2慢。
Python
12345 |
deftest_while(): i=0 whilei<20000: i+=1 return |
Python
12 |
print('Python', python_version())%timeit test_while() |
1234 |
Python3.4.1%timeittest_while() 100loops,bestof3:2.68msperloop |
Python
12 |
print 'Python', python_version()%timeit test_while() |
12 |
Python2.7.61000loops,bestof3:1.72msperloop |
触发异常
[回到目录]
Python 2支持新旧两种异常触发语法,而Python 3只接受带括号的的语法(不然会触发SyntaxError):
Python 2
Python
1 |
print 'Python', python_version() |
Python
1 |
raise IOError, "file error" |
123456 |
---------------------------------------------------------------------------IOErrorTraceback(mostrecentcalllast)<ipython-input-8-25f049caebb0>in<module>()---->1raiseIOError,"fileerror" IOError:fileerror |
Python
1 |
raise IOError("file error") |
123456 |
---------------------------------------------------------------------------IOErrorTraceback(mostrecentcalllast)<ipython-input-9-6f1c43f525b2>in<module>()---->1raiseIOError("fileerror") IOError:fileerror |
Python 3
Python
1 |
print('Python', python_version()) |
Python
1 |
raise IOError, "file error" |
12345 |
File"<ipython-input-10-25f049caebb0>",line1raiseIOError,"fileerror"^SyntaxError:invalidsyntaxTheproperwaytoraiseanexceptioninPython3: |
Python
12 |
print('Python', python_version())raise IOError("file error") |
123456789 |
Python3.4.1 ---------------------------------------------------------------------------OSErrorTraceback(mostrecentcalllast)<ipython-input-11-c350544d15da>in<module>()1print('Python', python_version())---->2raiseIOError("fileerror") OSError:fileerror |
异常处理
[回到目录]
Python 3中的异常处理也发生了一点变化。在Python 3中必须使用“as”关键字。
Python 2
Python
12345 |
print 'Python', python_version()try: let_us_cause_a_NameErrorexcept NameError, err: print err, '--> our error message' |
12 |
Python2.7.6name'let_us_cause_a_NameError' is not defined --> our error message |
Python 3
Python
12345 |
print('Python', python_version())try: let_us_cause_a_NameErrorexcept NameError as err: print(err, '--> our error message') |
12 |
Python3.4.1name'let_us_cause_a_NameError' is not defined --> our error message |
next()函数和.next()方法
[回到目录]
由于会经常用到next()(.next())函数(方法),所以还要提到另一个语法改动(实现方面也做了改动):在Python 2.7.5中,函数形式和方法形式都可以使用,而在Python 3中,只能使用next()函数(试图调用.next()方法会触发AttributeError)。
Python 2
Python
1234 |
print 'Python', python_version()my_generator = (letter for letter in 'abcdefg')next(my_generator)my_generator.next() |
12 |
Python2.7.6'b' |
Python 3
Python
123 |
print('Python', python_version())my_generator = (letter for letter in 'abcdefg')next(my_generator) |
12 |
Python3.4.1'a' |
Python
123456 |
---------------------------------------------------------------------------AttributeErrorTraceback(mostrecentcalllast)<ipython-input-14-125f388bb61b>in<module>()---->1my_generator.next() AttributeError:'generator' object has no attribute 'next' |
For循环变量与全局命名空间泄漏
[回到目录]
好消息是:在Python 3.x中,for循环中的变量不再会泄漏到全局命名空间中了!
这是Python 3.x中做的一个改动,在“What’s New In Python 3.0”中有如下描述:
“列表推导不再支持[… for var in item1, item2, …]这样的语法,使用[… for var in (item1, item2, …)]代替。还要注意列表推导有不同的语义:现在列表推导更接近list()构造器中的生成器表达式这样的语法糖,特别要注意的是,循环控制变量不会再泄漏到循环周围的空间中了。”
Python 2
Python
12345678 |
print 'Python', python_version() i = 1print 'before: i =', i print 'comprehension: ', [i for i in range(5)] print 'after: i =', i |
1234 |
Python2.7.6before:i=1comprehension:[0,1,2,3,4]after:i=4 |
Python 3
Python
12345678 |
print('Python', python_version()) i = 1print('before: i =', i) print('comprehension:', [i for i in range(5)]) print('after: i =', i) |
1234 |
Python3.4.1before:i=1comprehension:[0,1,2,3,4]after:i=1 |
比较无序类型
[回到目录]
Python 3中另一个优秀的改动是,如果我们试图比较无序类型,会触发一个TypeError。
Python 2
Python
1234 |
print 'Python', python_version()print "[1, 2] > 'foo' = ", [1, 2] > 'foo'print "(1, 2) > 'foo' = ", (1, 2) > 'foo'print "[1, 2] > (1, 2) = ", [1, 2] > (1, 2) |
1234 |
Python2.7.6[1,2]>'foo' = False(1,2)>'foo' = True[1,2]>(1,2)=False |
Python 3
Python
1234 |
print('Python', python_version())print("[1, 2] > 'foo' = ", [1, 2] > 'foo')print("(1, 2) > 'foo' = ", (1, 2) > 'foo')print("[1, 2] > (1, 2) = ", [1, 2] > (1, 2)) |
123456789 |
Python3.4.1---------------------------------------------------------------------------TypeErrorTraceback(mostrecentcalllast)<ipython-input-16-a9031729f4a0>in<module>()1print('Python', python_version())---->2print("[1,2]>'foo' = ", [1, 2] > 'foo')3print("(1,2)>'foo' = ", (1, 2) > 'foo')4print("[1,2]>(1,2)=",[1,2]>(1,2))TypeError:unorderabletypes:list()>str() |
[回到目录]
幸运的是,Python 3改进了input()函数,这样该函数就会总是将用户的输入存储为str对象。在Python 2中,为了避免读取非字符串类型会发生的一些危险行为,不得不使用raw_input()代替input()。
Python 2
Python
1234567891011121314151617 |
Python 2.7.6[GCC 4.0.1 (Apple Inc. build 5493)] on darwinType "help", "copyright", "credits" or "license" for more information. >>> my_input = input('enter a number: ') enter a number: 123 >>> type(my_input)<type 'int'> >>> my_input = raw_input('enter a number: ') enter a number: 123 >>> type(my_input)<type 'str'> |
Python 3
Python
12345678 |
Python3.4.1[GCC4.2.1(AppleInc.build5577)]ondarwinType"help","copyright","credits"or"license"formoreinformation. >>>my_input=input('enter a number: ')enteranumber:123>>>type(my_input)<class'str'> |
返回可迭代对象,而不是列表
[回到目录]
在xrange一节中可以看到,某些函数和方法在Python中返回的是可迭代对象,而不像在Python 2中返回列表。
由于通常对这些对象只遍历一次,所以这种方式会节省很多内存。然而,如果通过生成器来多次迭代这些对象,效率就不高了。
此时我们的确需要列表对象,可以通过list()函数简单的将可迭代对象转成列表。
Python 2
Python
1234 |
print 'Python', python_version() print range(3)print type(range(3)) |
123 |
Python2.7.6[0,1,2]<type'list'> |
Python 3
Python
1234 |
print('Python', python_version())print(range(3))print(type(range(3)))print(list(range(3))) |
1234 |
Python3.4.1range(0,3)<class'range'>[0,1,2] |
下面列出了Python 3中其他不再返回列表的常用函数和方法:
- zip()
- map()
- filter()
- 字典的.key()方法
- 字典的.value()方法
- 字典的.item()方法