在學習python初期,往往會犯一些錯誤,這些錯誤是不自知的,但是早早了解了這些,比犯了錯后才明白好的多。這裡就總結了python新手常常遇到的問題。
1.不知道Python版本
這是一個在StackOverflow上反覆出現的問題。許多人能寫出在某個版本上完美工作的代碼,但在他們在自己的系統上安裝有不同版本的Python。要確保你知道你正在使用的Python版本。
你可以通過下邊的代碼查看Python版本:
[pythontab@testServer]$ python --version
Python 2.7.10
[pythontab@testServer]$ python --V
Python 2.7.10
上面兩種方法都是可以的
2.不使用版本管理器
pyenv是一個極好的管理不同Python版本的工具,但很不幸,它只工作在*nix系統上。在Mac系統上,你可以簡單地通過brew install pyenv安裝它,在Linux上,也有一個自動安裝程序。
3.沉迷於一行程序
許多人熱衷於一行程序帶來的興奮感。即使他們的一行解決方案比一個多行解決方案低效,他們也會吹噓。
Python中的一行程序在本質上意味著具有多個表達式的複雜推導。例如:
l =[m fora, b inzip(this, that) ifb.method(a) !=b form inb ifnotm.method(a, b)
老實講,我編造了上面的例子。但我看到很多人都寫類似的代碼。這樣的代碼在一個星期後就會變得難以理解。如果你想做一些稍微複雜的事情,例如根據條件簡單地在一個列表或集合中添加一個元素,你可能就會犯錯誤。
單行代碼並不是什麼成就,是的,他們可能看起來很靈活,但不是什麼成就。想象一下,這就像是你在打掃房間時把所有的東西都塞進你的衣櫥。好的代碼應該是乾淨的,易於閱讀的和高效的。
4.利用錯誤的方式初始化一個集合
這是一個更微妙的問題,可能讓你措手不及。集合推導很像列表推導。
>>> { n forn inrange(10) ifn %2==0}
{0, 8, 2, 4, 6}
>>> type({ n forn inrange(10) ifn %2==0})
上面就是集合推導的一個例子。集合就像列表,也是一個容器。所不同的是,一個集合中不能有任何重複的值,而且是無序的。看到集合推導人們經常錯誤地認為{}能初始化一個空集合。但其實不然,它初始化一個空字典。
>>> {}
{}
>>> type({})
如果你想初始化一個空集合,可以簡單地調用set方法。
>>> set
set
>>> type(set)
注意一個空集合用set表示,但是一個包含一些元素的集合就就要用花括弧包圍元素來表示。
>>> s =set
>>> s
set
>>> s.add(1)
>>> s
{1}
>>> s.add(2)
>>> s
{1, 2}
這和直覺是相反的,因為你期望類似於set([1, 2])的一些東西。
5.誤解GIL
GIL(全局解釋器鎖)意味著在Python程序中,任意一個時間點只能有一個線程在運行。這意味著當我們創建一個線程並希望它并行運行時,它並不會那樣。Python解釋器實際的工作是在不同的運行線程之間快速進行切換。但這只是對實際發生事情的一個非常簡單的解釋,實際情況要複雜的多。有很多種并行運行的實例,例如使用本質為C擴展的各種庫。但運行Python代碼時,大部分時間裡它不會并行執行。換句話說,Python中的線程並不像Java或C++中的線程。
許多人會嘗試為Python辯解,說這些都是真正的線程。這確實是真的,但並不能改變這樣一個事實:Python處理線程的方式和你期望的方式是不同的。Ruby語言也有相同的情況(Ruby也有一個解釋器鎖)。
指定的解決方案是使用multiprocessing模塊。multiprocessing模塊提供Process類,它是一個對fork的很好的覆蓋。然而,fork過程比一個線程的代價高得多,所以你可能不會每次都能看到性能上的提升,因為不同的process之間需要做大量的工作來進行相互協調。
然而,這個問題並不存在於每一個Python的實現版本中。例如,Python的一個實現PyPy-stm就試圖擺脫GIL(仍未穩定)。建立在其他平台,如JVM(Jython)或CLR(IronPython),上的Python實現,也沒有GIL的問題。
總之,使用Thread類時要多加小心,你得到的可能不是你想要的。
6.使用舊式類
在Python 2中,有兩種類型的類,分別為「舊式」類和「新式」類。如果你使用Python 3,那麼你默認使用「新式」類。為了確保在Python2中使用「新式」類,你需要讓你新創建的每一個類都繼承object類,且類不能已繼承了內置類型,例如int或list。換句話說,你的基類、類如果不繼承其他類,就總是需要繼承object類。
classMyNewObject(object):
# stuff here
這些「新式」類解決一些老式類的根本缺陷,想要詳細了解新式類和舊式類請參見《python新式類和舊式類區別》《python2中的__new__與__init__,新式類和經典類》。
7.按錯誤的方式迭代
對於這門語言的新手來說,下邊的代碼是非常常見的:
forname_index inrange(len(names)):
print(names[name_index])
在上邊的例子中,沒有必須調用len函數,因為列表迭代實際上要簡單得多:
forname innames:
print(name)
此外,還有一大堆其他的工具幫助你簡化迭代。例如,可以使用zip同時遍歷兩個列表:
forcat, dog inzip(cats, dogs):
print(cat, dog)
如果你想同時考慮列表變數的索引和值,可以使用enumerate:
forindex, cat inenumerate(cats):
print(cat, index)
在itertools中也有很多有用的函數供你選擇。然而請注意,使用itertools函數並不總是正確的選擇。如果itertools中的一個函數為你試圖解決的問題提供了一個非常方便的解決辦法,例如鋪平一個列表或根據給定的列表創建一個其內容的排列,那就用它吧。但是不要僅僅因為你想要它而去適應你代碼的一部分。
濫用itertools引發的問題出現的過於頻繁,以至於在StackOverflow上一個德高望重的Python貢獻者已經貢獻他們資料的重要組成部分來解決這些問題。
8.使用可變的默認參數
我多次見到過如下的代碼:
deffoo(a, b, c=):
# append to c
# do some more stuff
永遠不要使用可變的默認參數,可以使用如下的代碼代替:
deffoo(a, b, c=None):
ifc isNone:
c =
# append to c
# do some more stuff
與其解釋這個問題是什麼,不如展示下使用可變默認參數的影響:
>>> deffoo(a, b, c=):
... c.append(a)
... c.append(b)
... print(c)
...
>>> foo(1, 1)
[1, 1]
>>> foo(1, 1)
[1, 1, 1, 1]
>>> foo(1, 1)
[1, 1, 1, 1, 1, 1]
同一個變數c在函數調用的每一次都被反覆引用。這可能有一些意想不到的後果。
以上這些問題都是新手常常會遇到的問題,但也並不僅僅只是這些,還有些人會用以前熟知的語言習慣來使用python,這也會造成很多問題。
Python新手交流群 463024091