Python高效編程技巧筆記(一)數據結構與算法

時間 2019-11-16

原文原文鏈接

1.如何在字典，序列，集合中根據條件篩選數據

實例案例：

過濾掉列表[3,9,-1...]中的負數

解決方案: 列表解析`[x for x in data if x >=0]`

l=[randint(-10,10) for _in range(10)]

[x for x in l if x>=0]
 
g=filter(lambda x:x>=0,l)
next(g)
list(g)
複製代碼

實例案例：

篩出字典{'LiLei'：79，'jim':88,'Lucy':92...}中值高於90的項

解決方案: 字典解析 `{k:v for k,v in d.items() if v >90}`

d={'student%d' % i:randint(50,100) for i in range(1,21)}
{k:v for k,v in d.items if v>=90}
g=filter(lambda item:item[1]>=90,d.items())
list(g)
dict(g)
複製代碼

實例案例：

篩出集合{77,89,32,20...}中能被3整除的元素
解決方案: 列表解析[x for x in data if x % 3==0]

s={randint(0,20) for _ in range(20)}
{x for x in s if x % 3==0}
複製代碼

2. 如何爲元組中的每一個元素命名提升程序的可讀性

實例案例：

學生系統中數據爲固定格式：(名字，年齡，性別，郵箱)python

('jim',16''male','jim8721@gmail.com')數據庫

('LiLei',17''male','leilei@qq.com')編程

('Lucy',16''female','lucy123@yahoo.com')瀏覽器

訪問時咱們使用索(index)訪問，大量索引下降程序可讀性.bash

解決方案：

方案1：定義一系列數值常量或枚舉類型app

方案2: 使用標準庫中collections.namedtuple替代內置tupledom

from enum import IntEnum
NAME,AGE,SEX,EMAIL=range(4)
s=('jim',16''male','jim8721@gmail.com')
class StudentEnum(IntEnum):
    NAME=0
    AGE=1
    SEX=2
    EMAIL=3
StudentEnum.NAME
s[StudentEnum.NAME]
isinstance(StudentEnum.NAME,int)
複製代碼

解決方案2：函數

from collections import namedtuple
Student=namedtuple('Student',['name','age','sex','email'])
s2=Student('jim',16''male','jim8721@gmail.com')
s2
Student(name='jim',age=16,sex='male',email='jim8721@gmail.com')
isinstance(s2,tuple)
複製代碼

3.如何根據字典中值得大小，對字典中的項排序

實例案例：

某班英語成績以字典形式存儲爲：ui

{
    'LiLei':79,
    'jim'  :88,
    'Lucy' :92,
    ..
}
複製代碼

如何根據成績高低，計算學生排名spa

解決方案：將字典中的各項轉換爲元組，使用內置函數sorted排序

方案1：將字典中的項轉化爲(值，鍵)元組.(列表解析或zip)

from random import randint
d={k:randint(60,100) for k in 'abcdefg'}
l=[(v,k) for k in d.items()]
sorted(l,reverse=True)
d.items()
p=sorted(d.items(),key=lambda item:item[1],reverse=True)
list(enumerate(p))
list(enumerate(p,1))
for i (k,v) item in enumerate(p,1):
    print(i,k,v)
    d[k]=(i,v)
字典解析：{k:(i,v) for i (k,v) item in enumerate(p,1)}
複製代碼

4.如何統計序列中元素出現的頻度

實例案例：

1.某隨機序列[12,5,6,4,6,5,5,7]中，找到出現次數最高的3個元素，它們出現次數是多少？

2.對於某英文文章，進行詞頻統計，找到出現次數最高的10個單詞，他們出現次數是多少？

解決方案：

方案1.將序列轉換成字典{元素：頻度}，根據字典中的值排序。

from random import randint
data=[randint(0,20) for _ in range(30)]
d=dict.fromkeys(data,0)
for x in data:
    d[x] +=1
sorted(((v,k) for k, v in d.items()),reverse=True)[:3]
import heapq
heapq.nlargest(3,(v,k) for k,v in d.items)
複製代碼

方案2：使用標準庫collections中的Counter對象

from collections import Counter 
data 
c=Counter(data)
c.most_common(3)

txt=open('example.txt').read()
import re
word_list=re.split('\W+',txt)
c2=Counter(word_list)
c2.most_common(10)
複製代碼

5.如何快速找到多個字典中的公共鍵

實例案例：

西班牙足球聯賽，每輪隊員進球統計：

第1輪：{'蘇亞雷斯':1,'梅西'：2,'本澤馬':1,...}

第1輪：{'蘇亞雷斯':2,'C羅'：1,'格里斯曼':2,...}

第1輪：{'蘇亞雷斯':1,'託雷斯'：2,'貝爾':1,...}

統計出前N輪每場比賽都有進球的球員.

解決方案：

方案1.

from random import randint,simple
simple('abcdefgh',3)
simple('abcdefgh',randint(3,6))
d1={k:randint(1,4) for k in sample('abcdefgh',randint(3,6))}
d1
d2={k:randint(1,4) for k in sample('abcdefgh',randint(3,6))}
d3={k:randint(1,4) for k in sample('abcdefgh',randint(3,6))}
for k in d1:
    if k in d2 and k in d3:
        print(k)
[k for k in d1 if k in d2 and k in d3]
d1=[d1,d2,d3]
[k for k in d1[0] if all(map(lambda d: k in d,d1[1:]))]

複製代碼

解決方案：

利用集合（set）的交集操做 step1:使用字典的keys()方法，獲得一個keys的集合 step2：使用map函數，獲得每一個字典的keys的集合 step3：使用reduce函數，取全部字典的keys集合的交集

s1=d1.keys()
s2=d2.keys()
s1 & s2
from functools import reduce 
reduce(lambda a,b:a*b,range(1,11))
map(dict.keys,d1)
reduce(lambda a,b:a&b map(dict.keys,d1)
複製代碼

6.如何讓字典保持有序

實例案例：

某編程比賽系統，對參賽選手編程解題進行計時，選手晚上比賽後，把該選手解題用時記錄到字典中，以便賽後按選手名查詢成績. {'LiLei'：(2,43),'HanMeiMei':(5,52),'jim':(1,39)...} 比賽結束後，需按排名順序依次打印選手成績，如何實現？

解決方案：

使用標準庫collection中的OrderedDict 以OrderedDict替代內置字典Dict,依次將選手成績存入OrderedDict

d={}
from collections import OrderdDict
od = OrderedDict()
od=['c']
od=['b']
od=['a']
od.keys()
players = list('abcdefgh')
from random import shuffle
shuffle(players)
players
od=OrderedDict()
for i, p in enumerate(players,1)
    od[p] = i0
od
def query_by_name(d,name):
    return d[name]
query_by_name(od,'c')

複製代碼

7.如何實現用戶的歷史記錄功能

研討問題：

如何實現用戶的歷史記錄功能(最多n條)？

實例案例：

不少應用程序都有瀏覽用戶的歷史記錄功能，例如：

1.瀏覽器能夠查看最近瀏覽的網頁

2.視頻播放器能夠查看最近播放過的視頻文件

3.Shell能夠查看用戶輸入過的命令

如今咱們製做了一個簡單的猜數字遊戲如何添加歷史記錄，顯示用戶最近猜過的數字？

from random import randint

def guess(n,k):
    if n ==K:
        print('猜對了，這個數字是%d.' %k)
        return True
        
    if n<k:
        print('猜大了，比%d小.' %k)
        elif n>k:
            print('猜小了，比%d大。'%k)
        return False
def main():
    n = randint(1,100)
    i =1
    while True:
        line= input('[%d] 請輸入一個數字：' %d)
        if line.isdight():
            k = int(line)
            i += 1
            if guess(n,k):
                break
            elif line == 'quit':
                break
if __name__=='__main__':
    main()

複製代碼

解決方案：

使用容量爲n的隊列存儲歷史記錄使用標準數據庫collections中的deque,它是一個雙端隊列使用pickle模塊將歷史記錄存儲到硬盤，以便下次啓動使用

from collections import deque
deque([],5)
q.append(1)
q.append(2)
q.append(3)
q.append(4)
q.append(5)
q
deque([1,2,3,4,5],maxlen=5)
q.append(6)
q
deque([2,3,4,5,6],maxlen=5)

from random import randint
from collections import deque

def guess(n,k):
    if n ==K:
        print('猜對了，這個數字是%d.' %k)
        return True
        
    if n<k:
        print('猜大了，比%d小.' %k)
        elif n>k:
            print('猜小了，比%d大。'%k)
        return False
def main():
    n = randint(1,100)
    i =1
    hq=deque([],5)
    while True:
        line= input('[%d] 請輸入一個數字：' %d)
        if line.isdight():
            k = int(line)
            hq.append(k)
            i += 1
            if guess(n,k):
                break
            elif line == 'quit':
                break
            elif line=='h?'
                print(list(hq))
                
if __name__=='__main__':
    main()

import pickle
pickle.dump
q
deque([2,3,4,5,6],maxlen=5)
pickle.dump(q,open('save.pkl','wb'))
ed save.pkl
q2=pickle.load(open('save.pk1','rb'))
複製代碼