本節內容html
1. 函數基本語法及特性python
2. 參數與局部變量linux
3. 返回值程序員
嵌套函數算法
4.遞歸編程
5.匿名函數服務器
6.函數式編程介紹數據結構
7.高階函數編程語言
8.內置函數函數式編程
溫故知新
1. 集合
主要做用:
- 去重
- 關係測試, 交集\差集\並集\反向(對稱)差集
2. 元組
只讀列表,只有count, index 2 個方法
做用:若是一些數據不想被人修改, 能夠存成元組,好比身份證列表
3. 字典
key-value對
- 特性:
- 無順序
- 去重
- 查詢速度快,比列表快多了
- 比list佔用內存多
爲何會查詢速度會快呢?由於他是hash類型的,那什麼是hash呢?
哈希算法將任意長度的二進制值映射爲較短的固定長度的二進制值,這個小的二進制值稱爲哈希值。哈希值是一段數據惟一且極其緊湊的數值表示形式。若是散列一段明文並且哪怕只更改該段落的一個字母,隨後的哈希都將產生不一樣的值。要找到散列爲同一個值的兩個不一樣的輸入,在計算上是不可能的,因此數據的哈希值能夠檢驗數據的完整性。通常用於快速查找和加密算法
dict會把全部的key變成hash 表,而後將這個表進行排序,這樣,你經過data[key]去查data字典中一個key的時候,python會先把這個key hash成一個數字,而後拿這個數字到hash表中看沒有這個數字, 若是有,拿到這個key在hash表中的索引,拿到這個索引去與此key對應的value的內存地址那取值就能夠了。
上面依然沒回答這樣作查找一個數據爲何會比列表快,對不對? 呵呵,等我課上揭曉。
4. 字符編碼
先說python2
- py2裏默認編碼是ascii
- 文件開頭那個編碼聲明是告訴解釋這個代碼的程序 以什麼編碼格式 把這段代碼讀入到內存,由於到了內存裏,這段代碼實際上是以bytes二進制格式存的,不過即便是2進制流,也能夠按不一樣的編碼格式轉成2進制流,你懂麼?
- 若是在文件頭聲明瞭#_*_coding:utf-8*_,就能夠寫中文了, 不聲明的話,python在處理這段代碼時按ascii,顯然會出錯, 加了這個聲明後,裏面的代碼就全是utf-8格式了
- 在有#_*_coding:utf-8*_的狀況下,你在聲明變量若是寫成name=u"大保健",那這個字符就是unicode格式,不加這個u,那你聲明的字符串就是utf-8格式
- utf-8 to gbk怎麼轉,utf8先decode成unicode,再encode成gbk
再說python3
- py3裏默認文件編碼就是utf-8,因此能夠直接寫中文,也不須要文件頭聲明編碼了,乾的漂亮
- 你聲明的變量默認是unicode編碼,不是utf-8, 由於默認便是unicode了(不像在py2裏,你想直接聲明成unicode還得在變量前加個u), 此時你想轉成gbk的話,直接your_str.encode("gbk")便可以
- 但py3裏,你在your_str.encode("gbk")時,感受好像還加了一個動做,就是就是encode的數據變成了bytes裏,我擦,這是怎麼個狀況,由於在py3裏,str and bytes作了明確的區分,你能夠理解爲bytes就是2進制流,你會說,我看到的不是010101這樣的2進制呀, 那是由於python爲了讓你能對數據進行操做而在內存級別又幫你作了一層封裝,不然讓你直接看到一堆2進制,你能看出哪一個字符對應哪段2進制麼?什麼?本身換算,得了吧,你連超過2位數的數字加減運算都費勁,還仍是省省心吧。
- 那你說,在py2裏好像也有bytes呀,是的,不過py2裏的bytes只是對str作了個別名(python2裏的str就是bytes, py3裏的str是unicode),沒有像py3同樣給你顯示的多出來一層封裝,但其實其內部仍是封裝了的。 這麼講吧, 不管是2仍是三, 從硬盤到內存,數據格式都是 010101二進制到-->b'\xe4\xbd\xa0\xe5\xa5\xbd' bytes類型-->按照指定編碼轉成你能看懂的文字
編碼應用比較多的場景應該是爬蟲了,互聯網上不少網站用的編碼格式很雜,雖然總體趨向都變成utf-8,但如今仍是很雜,因此爬網頁時就須要你進行各類編碼的轉換,不過生活正在變美好,期待一個不須要轉碼的世界。
最後,編碼is a piece of fucking shit, noboby likes it.
1.函數基本語法及特性
背景提要
如今老闆讓你寫一個監控程序,監控服務器的系統情況,當cpu\memory\disk等指標的使用量超過閥值時即發郵件報警,你掏空了全部的知識量,寫出瞭如下代碼
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
|
while
True
:
if
cpu利用率 >
90
%
:
#發送郵件提醒
鏈接郵箱服務器
發送郵件
關閉鏈接
if
硬盤使用空間 >
90
%
:
#發送郵件提醒
鏈接郵箱服務器
發送郵件
關閉鏈接
if
內存佔用 >
80
%
:
#發送郵件提醒
鏈接郵箱服務器
發送郵件
關閉鏈接
|
上面的代碼實現了功能,但即便是鄰居老王也看出了端倪,老王親切的摸了下你家兒子的臉蛋,說,你這個重複代碼太多了,每次報警都要重寫一段發郵件的代碼,太low了,這樣幹存在2個問題:
- 代碼重複過多,一個勁的copy and paste不符合高端程序員的氣質
- 若是往後須要修改發郵件的這段代碼,好比加入羣發功能,那你就須要在全部用到這段代碼的地方都修改一遍
你以爲老王說的對,你也不想寫重複代碼,但又不知道怎麼搞,老王好像看出了你的心思,此時他抱起你兒子,笑着說,其實很簡單,只須要把重複的代碼提取出來,放在一個公共的地方,起個名字,之後誰想用這段代碼,就經過這個名字調用就好了,以下
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
|
def
發送郵件(內容)
#發送郵件提醒
鏈接郵箱服務器
發送郵件
關閉鏈接
while
True
:
if
cpu利用率 >
90
%
:
發送郵件(
'CPU報警'
)
if
硬盤使用空間 >
90
%
:
發送郵件(
'硬盤報警'
)
if
內存佔用 >
80
%
:
發送郵件(
'內存報警'
)
|
你看着老王寫的代碼,氣勢恢宏、磅礴大氣,代碼裏透露着一股內斂的傲氣,心想,老王這我的真是不通常,忽然對他的背景更感興趣了,問老王,這些花式玩法你都是怎麼知道的? 老王親了一口你兒子,捋了捋不存在的鬍子,淡淡的講,「老夫,年少時,師從京西沙河淫魔銀角大王 」, 你一聽「銀角大王」這幾個字,不禁的嬌軀一震,心想,真nb,怪不得代碼寫的這麼6, 這「銀角大王」當年在江湖上但是數得着的響噹噹的名字,只惋惜後期縱慾過分,卒於公元2016年, 真是惋惜了,只留下其哥哥孤守當年兄弟倆一塊兒打下來的江山。 此時你看着的老王離開的身影,感受你兒子跟他愈來愈像了。。。
函數是什麼?
函數一詞來源於數學,但編程中的「函數」概念,與數學中的函數是有很大不一樣的,具體區別,咱們後面會講,編程中的函數在英文中也有不少不一樣的叫法。在BASIC中叫作subroutine(子過程或子程序),在Pascal中叫作procedure(過程)和function,在C中只有function,在Java裏面叫作method。
定義: 函數是指將一組語句的集合經過一個名字(函數名)封裝起來,要想執行這個函數,只需調用其函數名便可
特性:
- 減小重複代碼
- 使程序變的可擴展
- 使程序變得易維護
語法定義
1
2
3
4
|
def
sayhi():
#函數名
print
(
"Hello, I'm nobody!"
)
sayhi()
#調用函數
|
能夠帶參數
1
2
3
4
5
6
7
8
9
10
11
12
13
|
#下面這段代碼
a,b
=
5
,
8
c
=
a
*
*
b
print
(c)
#改爲用函數寫
def
calc(x,y):
res
=
x
*
*
y
return
res
#返回函數執行結果
c
=
calc(a,b) #結果賦值給c變量
print
(c)
|
2.函數參數與局部變量
形參變量只有在被調用時才分配內存單元,在調用結束時,即刻釋放所分配的內存單元。所以,形參只在函數內部有效。函數調用結束返回主調用函數後則不能再使用該形參變量
實參能夠是常量、變量、表達式、函數等,不管實參是何種類型的量,在進行函數調用時,它們都必須有肯定的值,以便把這些值傳送給形參。所以應預先用賦值,輸入等辦法使參數得到肯定值
默認參數
看下面代碼
1
2
3
4
5
6
7
8
9
10
|
def
stu_register(name,age,country,course):
print
(
"----註冊學生信息------"
)
print
(
"姓名:"
,name)
print
(
"age:"
,age)
print
(
"國籍:"
,country)
print
(
"課程:"
,course)
stu_register(
"王山炮"
,
22
,
"CN"
,
"python_devops"
)
stu_register(
"張叫春"
,
21
,
"CN"
,
"linux"
)
stu_register(
"劉老根"
,
25
,
"CN"
,
"linux"
)
|
發現 country 這個參數 基本都 是"CN", 就像咱們在網站上註冊用戶,像國籍這種信息,你不填寫,默認就會是 中國, 這就是經過默認參數實現的,把country變成默認參數很是簡單
1
|
def
stu_register(name,age,course,country
=
"CN"
):
|
這樣,這個參數在調用時不指定,那默認就是CN,指定了的話,就用你指定的值。
另外,你可能注意到了,在把country變成默認參數後,我同時把它的位置移到了最後面,爲何呢?
關鍵參數
正常狀況下,給函數傳參數要按順序,不想按順序就能夠用關鍵參數,只需指定參數名便可,但記住一個要求就是,關鍵參數必須放在位置參數以後。
1
|
stu_register(age
=
22
,name
=
'alex'
,course
=
"python"
,)
|
非固定參數
若你的函數在定義時不肯定用戶想傳入多少個參數,就可使用非固定參數
1
2
3
4
5
6
7
8
9
10
|
def
stu_register(name,age,
*
args):
# *args 會把多傳入的參數變成一個元組形式
print
(name,age,args)
stu_register(
"Alex"
,
22
)
#輸出
#Alex 22 () #後面這個()就是args,只是由於沒傳值,因此爲空
stu_register(
"Jack"
,
32
,
"CN"
,
"Python"
)
#輸出
# Jack 32 ('CN', 'Python')
|
還能夠有一個**kwargs
1
2
3
4
5
6
7
8
9
10
|
def
stu_register(name,age,
*
args,
*
*
kwargs):
# *kwargs 會把多傳入的參數變成一個dict形式
print
(name,age,args,kwargs)
stu_register(
"Alex"
,
22
)
#輸出
#Alex 22 () {}#後面這個{}就是kwargs,只是由於沒傳值,因此爲空
stu_register(
"Jack"
,
32
,
"CN"
,
"Python"
,sex
=
"Male"
,province
=
"ShanDong"
)
#輸出
# Jack 32 ('CN', 'Python') {'province': 'ShanDong', 'sex': 'Male'}
|
局部變量
1
2
3
4
5
6
7
8
9
10
11
|
name
=
"Alex Li"
def
change_name(name):
print
(
"before change:"
,name)
name
=
"金角大王,一個有Tesla的男人"
print
(
"after change"
, name)
change_name(name)
print
(
"在外面看看name改了麼?"
,name)
|
輸出
1
2
3
|
before change: Alex Li
after change 金角大王,一個有Tesla的男人
在外面看看name改了麼? Alex Li
|
全局與局部變量
3.返回值
要想獲取函數的執行結果,就能夠用return語句把結果返回
注意:
- 函數在執行過程當中只要遇到return語句,就會中止執行並返回結果,so 也能夠理解爲 return 語句表明着函數的結束
- 若是未在函數中指定return,那這個函數的返回值爲None
強行插入知識點: 嵌套函數
看上面的標題的意思是,函數還能套函數?of course
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
|
name
=
"Alex"
def
change_name():
name
=
"Alex2"
def
change_name2():
name
=
"Alex3"
print
(
"第3層打印"
,name)
change_name2()
#調用內層函數
print
(
"第2層打印"
,name)
change_name()
print
(
"最外層打印"
,name)
|
此時,在最外層調用change_name2()會出現什麼效果?
沒錯, 出錯了, 爲何呢?
嵌套函數的用法會了,但它有什麼用呢?下節課揭曉。。。
4. 遞歸
在函數內部,能夠調用其餘函數。若是一個函數在內部調用自身自己,這個函數就是遞歸函數。
1
2
3
4
5
6
7
8
9
10
11
12
13
|
def
calc(n):
print
(n)
if
int
(n
/
2
)
=
=
0
:
return
n
return
calc(
int
(n
/
2
))
calc(
10
)
輸出:
10
5
2
1
|
遞歸特性:
1. 必須有一個明確的結束條件
2. 每次進入更深一層遞歸時,問題規模相比上次遞歸都應有所減小
3. 遞歸效率不高,遞歸層次過多會致使棧溢出(在計算機中,函數調用是經過棧(stack)這種數據結構實現的,每當進入一個函數調用,棧就會加一層棧幀,每當函數返回,棧就會減一層棧幀。因爲棧的大小不是無限的,因此,遞歸調用的次數過多,會致使棧溢出)
堆棧掃盲http://www.cnblogs.com/lln7777/archive/2012/03/14/2396164.html
遞歸函數實際應用案例,二分查找
5. 匿名函數
匿名函數就是不須要顯式的指定函數
1
2
3
4
5
6
7
8
|
#這段代碼
def
calc(n):
return
n
*
*
n
print
(calc(
10
))
#換成匿名函數
calc
=
lambda
n:n
*
*
n
print
(calc(
10
))
|
你也許會說,用上這個東西沒感受有毛方便呀, 。。。。呵呵,若是是這麼用,確實沒毛線改進,不過匿名函數主要是和其它函數搭配使用的呢,以下
1
2
3
|
res
=
map
(
lambda
x:x
*
*
2
,[
1
,
5
,
7
,
4
,
8
])
for
i
in
res:
print
(i)
|
輸出
1
25
49
16
64
6.函數式編程介紹
函數是Python內建支持的一種封裝,咱們經過把大段代碼拆成函數,經過一層一層的函數調用,就能夠把複雜任務分解成簡單的任務,這種分解能夠稱之爲面向過程的程序設計。函數就是面向過程的程序設計的基本單元。
函數式編程中的函數這個術語不是指計算機中的函數(其實是Subroutine),而是指數學中的函數,即自變量的映射。也就是說一個函數的值僅決定於函數參數的值,不依賴其餘狀態。好比sqrt(x)函數計算x的平方根,只要x不變,不論何時調用,調用幾回,值都是不變的。
Python對函數式編程提供部分支持。因爲Python容許使用變量,所以,Python不是純函數式編程語言。
1、定義
簡單說,"函數式編程"是一種"編程範式"(programming paradigm),也就是如何編寫程序的方法論。
主要思想是把運算過程儘可能寫成一系列嵌套的函數調用。舉例來講,如今有這樣一個數學表達式:
(1 + 2) * 3 - 4
傳統的過程式編程,可能這樣寫:
var a = 1 + 2;
var b = a * 3;
var c = b - 4;
函數式編程要求使用函數,咱們能夠把運算過程定義爲不一樣的函數,而後寫成下面這樣:
var result = subtract(multiply(add(1,2), 3), 4);
這段代碼再演進如下,能夠變成這樣
add(1,2).multiply(3).subtract(4)
這基本就是天然語言的表達了。再看下面的代碼,你們應該一眼就能明白它的意思吧:
merge([1,2],[3,4]).sort().search("2")
所以,函數式編程的代碼更容易理解。
要想學好函數式編程,不要玩py,玩Erlang,Haskell, 好了,我只會這麼多了。。。
7.高階函數
變量能夠指向函數,函數的參數能接收變量,那麼一個函數就能夠接收另外一個函數做爲參數,這種函數就稱之爲高階函數。
1
2
3
4
5
6
|
def
add(x,y,f):
return
f(x)
+
f(y)
res
=
add(
3
,
-
6
,
abs
)
print
(res)
|
8. 內置參數
內置參數詳解 https://docs.python.org/3/library/functions.html?highlight=built#ascii
本節做業
有如下員工信息表
固然此表你在文件存儲時能夠這樣表示
1
|
1
,Alex Li,
22
,
13651054608
,IT,
2013
-
04
-
01
|
現須要對這個員工信息文件,實現增刪改查操做
- 可進行模糊查詢,語法至少支持下面3種:
- select name,age from staff_table where age > 22
- select * from staff_table where dept = "IT"
- select * from staff_table where enroll_date like "2013"
- 查到的信息,打印後,最後面還要顯示查到的條數
- 可建立新員工紀錄,以phone作惟一鍵,staff_id需自增
- 可刪除指定員工信息紀錄,輸入員工id,便可刪除
- 可修改員工信息,語法以下:
- UPDATE staff_table SET dept="Market" WHERE where dept = "IT"