python如今很火,最近花了些時間去了解了一下,最初瞭解的是2.7.x版本,感受,從書寫上是很不習慣,少了一雙大概號,取而代之的是縮進;而後跟kotlin和swift同樣省去了每行的分號,象咱們這種分號強迫症的人真心的不習慣;還有!True的條件改爲not True、while後面能夠跟else等等這些,真心不習慣啊!用2.7.x作了幾天的測試,基本慢慢算有個瞭解了,也試着爬了些行業網的數據,感受這個比PHP寫爬蟲方便不少。而後昨晚就在家裏裝了個3.X的版本,很悲催的發現,原來寫的有不少的錯誤,萬般無奈的檢查之下,發現語句上是沒什麼問題,只是3.X版本不兼容部分的語句,例如最經常使用的print,raw_input都不同了,今天花了些時間查一查,並總結了一下它們的區別。
python
Python 2中的print語句被Python 3中的print()函數取代,這意味着在Python 3中必須用括號將須要輸出的對象括起來。在Python 3中想以Python2的形式不帶括號調用print函數時,會觸發SyntaxError。
Python 2swift
print 'Python', python_version() print 'Hello, World!' print('Hello, World!') print "this line", ; print 'more text on the same line'
Python 2.7.6 app
Hello, World! ide
Hello, World! 函數
this line more text on the same line
oop
python3測試
print('Python', python_version()) print('Hello, World!') print("this line,", end="") print(' more text on the same line')
Python 3.4.1ui
Hello, World!this
this line, more text on the same linespa
print 'Hello, World!'
File "<ipython-input-3-139a7c5835bd>", line 1
print 'Hello, World!'
^
SyntaxError: invalid syntax
注意:
在Python中,帶不帶括號輸出」Hello World」都很正常。但若是在圓括號中同時輸出多個對象時,就會建立一個元組,這是由於在Python 2中,print是一個語句,而不是函數調用。
幸運的是,Python 3改進了input()函數,這樣該函數就會老是將用戶的輸入存儲爲str對象。在Python 2中,爲了不讀取非字符串類型會發生的一些危險行爲,不得不使用raw_input()代替input()。
Python 2
>>> my_input
=
input
(
'enter a number: '
)
enter a number:
123
>>>
type
(my_input)
<
type
'int'
>
>>> my_input
=
raw_input
(
'enter a number: '
)
enter a number:
123
>>>
type
(my_input)
<
type
'str'
>
Python 3
>>> my_input
=
input
(
'enter a number: '
)
enter a number:
123
>>>
type
(my_input)
<
class
'str'
>
因爲人們經常會忽視Python 3在整數除法上的改動(寫錯了也不會觸發Syntax Error),因此在移植代碼或在Python 2中執行Python 3的代碼時,須要特別注意這個改動。
因此,我仍是會在Python 3的腳本中嘗試用float(3)/2或 3/2.0代替3/2,以此來避免代碼在Python 2環境下可能致使的錯誤(或與之相反,在Python 2腳本中用from __future__ import division來使用Python 3的除法)。
Python 2
print 'Python', python_version() print '3 / 2 =', 3 / 2 print '3 // 2 =', 3 // 2 print '3 / 2.0 =', 3 / 2.0 print '3 // 2.0 =', 3 // 2.0
Python 2.7.6
3 / 2 = 1
3 // 2 = 1
3 / 2.0 = 1.5
3 // 2.0 = 1.0
Python 3
print('Python', python_version()) print('3 / 2 =', 3 / 2) print('3 // 2 =', 3 // 2) print('3 / 2.0 =', 3 / 2.0) print('3 // 2.0 =', 3 // 2.0)
Python 3.4.1
3 / 2 = 1.5
3 // 2 = 1
3 / 2.0 = 1.5
3 // 2.0 = 1.0
Python 3.x引入了一些與Python 2不兼容的關鍵字和特性,在Python 2中,能夠經過內置的__future__模塊導入這些新內容。若是你但願在Python 2環境下寫的代碼也能夠在Python 3.x中運行,那麼建議使用__future__模塊。例如,若是但願在Python 2中擁有Python 3.x的整數除法行爲,能夠經過下面的語句導入相應的模塊。
from
__future__
import
division
下表列出了__future__中其餘可導入的特性:
特性 | 可選版本 | 強制版本 | 效果 |
---|---|---|---|
nested_scopes | 2.1.0b1 | 2.2 | PEP 227: Statically Nested Scopes |
generators | 2.2.0a1 | 2.3 | PEP 255: Simple Generators |
division | 2.2.0a2 | 3.0 | PEP 238: Changing the Division Operator |
absolute_import | 2.5.0a1 | 3.0 | PEP 328: Imports: Multi-Line and Absolute/Relative |
with_statement | 2.5.0a1 | 2.6 | PEP 343: The 「with」 Statement |
print_function | 2.6.0a2 | 3.0 | PEP 3105: Make print a function |
unicode_literals | 2.6.0a2 | 3.0 | PEP 3112: Bytes literals in Python 3000 |
示例:
from
platform
import
python_version
Unicode
Python 2有基於ASCII的str()類型,其可經過單獨的unicode()函數轉成unicode類型,但沒有byte類型。而在Python 3中,終於有了Unicode(utf-8)字符串,以及兩個字節類:bytes和bytearrays。
Python 2
print type(unicode('this is like a python3 str type')) print type(b'byte type does not exist') print 'they are really'+b' the same' print type(bytearray(b'bytearray oddly does exist though'))
<type 'unicode'>
<type 'str'>
they are really the same
<type 'bytearray'>
Python 3
print
(
'Python'
, python_version(), end
=
"")
print
(
' has'
,
type
(b
' bytes for storing data'
))
print
(
'and Python'
, python_version(), end
=
"")
print
(
' also has'
,
type
(bytearray(b
'bytearrays'
)))
print 'note that we cannot add a string'
+
b
'bytes for data'
Python 3.4.1 has <class 'bytes'>
and Python 3.4.1 also has <class 'bytearray'>
---------------------------------------------------------------------------TypeError Traceback (most recent call last)<ipython-input-13-d3e8942ccf81> in <module>()----> 1 'note that we cannot add a string' + b'bytes for data' TypeError: Can't convert 'bytes' object to str implicitly
比較無序類型
Python 3中另外一個優秀的改動是,若是咱們試圖比較無序類型,會觸發一個TypeError。
Python 2
print "[1, 2] > 'foo' = ", [1, 2] > 'foo' print "(1, 2) > 'foo' = ", (1, 2) > 'foo' print "[1, 2] > (1, 2) = ", [1, 2] > (1, 2)
[1, 2] > 'foo' = False
(1, 2) > 'foo' = True
[1, 2] > (1, 2) = False
Python 3
print("[1, 2] > 'foo' = ", [1, 2] > 'foo') print("(1, 2) > 'foo' = ", (1, 2) > 'foo') print("[1, 2] > (1, 2) = ", [1, 2] > (1, 2))
---------------------------------------------------------------------------
TypeError Traceback (most recent call last)
<ipython-input-16-a9031729f4a0> in <module>()
1 print('Python', python_version())
----> 2 print("[1, 2] > 'foo' = ", [1, 2] > 'foo')
3 print("(1, 2) > 'foo' = ", (1, 2) > 'foo')
4 print("[1, 2] > (1, 2) = ", [1, 2] > (1, 2))
TypeError: unorderable types: list() > str()
在xrange一節中能夠看到,某些函數和方法在Python中返回的是可迭代對象,而不像在Python 2中返回列表。
因爲一般對這些對象只遍歷一次,因此這種方式會節省不少內存。然而,若是經過生成器來屢次迭代這些對象,效率就不高了。
此時咱們的確須要列表對象,能夠經過list()函數簡單的將可迭代對象轉成列表。
Python 2
print range(3) print type(range(3))
[0, 1, 2]
<type 'list'>
Python 3
print(range(3)) print(type(range(3))) print(list(range(3)))
range(0, 3)
<class 'range'>
[0, 1, 2]
下面列出了Python 3中其餘再也不返回列表的經常使用函數和方法:
zip()
map()
filter()
字典的.key()方法
字典的.value()方法
字典的.item()方法
在Python 2.x中,常常會用xrange()建立一個可迭代對象,一般出如今「for循環」或「列表/集合/字典推導式」中。這種行爲與生成器很是類似(如」惰性求值「),但這裏的xrange-iterable無盡的,意味着可能在這個xrange上無限迭代。因爲xrange的「惰性求知「特性,若是隻需迭代一次(如for循環中),range()一般比xrange()快一些。不過不建議在屢次迭代中使用range(),由於range()每次都會在內存中從新生成一個列表。在Python 3中,range()的實現方式與xrange()函數相同,因此就不存在專用的xrange()(在Python 3中使用xrange()會觸發NameError)。
import timeit n = 10000 def test_range(n): return for i in range(n): pass def test_xrange(n): for i in xrange(n): pass
Python 2
print 'Python', python_version() print 'ntiming range()' %timeit test_range(n) print 'nntiming xrange()' %timeit test_xrange(n)
Python 2.7.6
timing range()
1000 loops, best of 3: 433 s per loop
timing xrange()
1000 loops, best of 3: 350 s per loop
Python 3
print('Python', python_version()) print('ntiming range()') %timeit test_range(n)
Python 3.4.1
timing range()
1000 loops, best of 3: 520 s per loop
print
(
xrange
(
10
))
---------------------------------------------------------------------------NameError Traceback (most recent call last)in ()----> 1 print(xrange(10)) NameError: name 'xrange' is not defined
另外一個值得一提的是,在Python 3.x中,range有了一個新的__contains__方法。__contains__方法能夠有效的加快Python 3.x中整數和布爾型的「查找」速度。
x = 10000000 def val_in_range(x, val): return val in range(x) def val_in_xrange(x, val): return val in xrange(x) print('Python', python_version()) assert(val_in_range(x, x/2) == True) assert(val_in_range(x, x//2) == True) %timeit val_in_range(x, x/2) %timeit val_in_range(x, x//2)
Python 3.4.1
1 loops, best of 3: 742 ms per loop
1000000 loops, best of 3: 1.19 s per loop
根據上面的timeit的結果,查找整數比查找浮點數要快大約6萬倍。但因爲Python 2.x中的range或xrange沒有__contains__方法,因此在Python 2中的整數和浮點數的查找速度差異不大。
print 'Python', python_version() assert(val_in_xrange(x, x/2.0) == True) assert(val_in_xrange(x, x/2) == True) assert(val_in_range(x, x/2) == True) assert(val_in_range(x, x//2) == True) %timeit val_in_xrange(x, x/2.0) %timeit val_in_xrange(x, x/2) %timeit val_in_range(x, x/2.0) %timeit val_in_range(x, x/2)
Python 2.7.7
1 loops, best of 3: 285 ms per loop
1 loops, best of 3: 179 ms per loop
1 loops, best of 3: 658 ms per loop
1 loops, best of 3: 556 ms per loop
下面的代碼證實了Python 2.x中沒有__contain__方法:
print('Python', python_version()) range.__contains__ print('Python', python_version()) range.__contains__ print('Python', python_version()) xrange.__contains__
Python 3.4.1
<slot wrapper '__contains__' of 'range' objects
Python 2.7.7
---------------------------------------------------------------------------
AttributeError Traceback (most recent call last)<ipython-input-7-05327350dafb> in <module>()
1 print 'Python', python_version()
----> 2 range.__contains__
AttributeError: 'builtin_function_or_method' object has no attribute '__contains__'
Python 2.7.7
---------------------------------------------------------------------------AttributeError Traceback (most recent call last)in ()
print 'Python', python_version()
----> 2 xrange.__contains__
AttributeError: type object 'xrange' has no attribute '__contains__'
關於Python 2中xrange()與Python 3中range()之間的速度差別的一點說明:
有讀者指出了Python 3中的range()和Python 2中xrange()執行速度有差別。因爲這二者的實現方式相同,所以理論上執行速度應該也是相同的。這裏的速度差異僅僅是由於Python 3的整體速度就比Python 2慢。
def test_while(): i = 0 while i < 20000: i += 1 return print('Python', python_version()) %timeit test_while()
Python 3.4.1
%timeit test_while()
100 loops, best of 3: 2.68 ms per loop
print 'Python', python_version() %timeit test_while()
Python 2.7.6
1000 loops, best of 3: 1.72 ms per loop
Python 2支持新舊兩種異常觸發語法,而Python 3只接受帶括號的的語法(否則會觸發SyntaxError):
Python 2
raise IOError,"file error"
---------------------------------------------------------------------------
IOError Traceback (most recent call last)
<ipython-input-8-25f049caebb0> in <module>()
----> 1 raise IOError, "file error"
IOError: file error
raise IOError("file error")
---------------------------------------------------------------------------
IOError Traceback (most recent call last)
<ipython-input-9-6f1c43f525b2> in <module>()
----> 1 raise IOError("file error")
IOError: file error
Python 3
raise IOError, "file error"
File "<ipython-input-10-25f049caebb0>", line 1
raise IOError, "file error"
^
SyntaxError: invalid syntax
The proper way to raise an exception in Python 3:
raise IOError("file error")
Python 3.4.1
---------------------------------------------------------------------------
OSError Traceback (most recent call last)
<ipython-input-11-c350544d15da> in <module>()
1 print('Python', python_version())
----> 2 raise IOError("file error")
OSError: file error
Python 3中的異常處理也發生了一點變化。在Python 3中必須使用「as」關鍵字。
Python 2
try: let_us_cause_a_NameError except NameError, err: print err, '--> our error message'
name 'let_us_cause_a_NameError' is not defined --> our error message
Python 3
try: let_us_cause_a_NameError except NameError as err: print(err, '--> our error message')
name 'let_us_cause_a_NameError' is not defined --> our error message
因爲會常常用到next()(.next())函數(方法),因此還要提到另外一個語法改動(實現方面也作了改動):在Python 2.7.5中,函數形式和方法形式均可以使用,而在Python 3中,只能使用next()函數(試圖調用.next()方法會觸發AttributeError)。
Python 2
print 'Python', python_version() my_generator = (letter for letter in 'abcdefg') next(my_generator) my_generator.next()
Python 2.7.6
'b'
Python 3
print('Python', python_version()) my_generator = (letter for letter in 'abcdefg') next(my_generator)
Python 3.4.1
'a'
my_generator.next()
---------------------------------------------------------------------------
AttributeError Traceback (most recent call last)
<ipython-input-14-125f388bb61b> in <module>()
----> 1 my_generator.next()
AttributeError: 'generator' object has no attribute 'next'
好消息是:在Python 3.x中,for循環中的變量再也不會泄漏到全局命名空間中了!
這是Python 3.x中作的一個改動,在「What's New In Python 3.0」中有以下描述:
「列表推導再也不支持[... for var in item1, item2, ...]這樣的語法,使用[... for var in (item1, item2, ...)]代替。還要注意列表推導有不一樣的語義:如今列表推導更接近list()構造器中的生成器表達式這樣的語法糖,特別要注意的是,循環控制變量不會再泄漏到循環周圍的空間中了。」
Python 2
print 'Python', python_version() i = 1 print 'before: i =', i print 'comprehension: ', [i for i in range(5)] print 'after: i =', i
Python 2.7.6
before: i = 1
comprehension: [0, 1, 2, 3, 4]
after: i = 4
Python 3
print('Python', python_version()) i = 1 print('before: i =', i) print('comprehension:', [i for i in range(5)]) print('after: i =', i)
Python 3.4.1before: i = 1comprehension: [0, 1, 2, 3, 4]after: i = 1