Python高效編程技巧筆記(一)數據結構與算法

1.如何在字典,序列,集合中根據條件篩選數據

實例案例:

  • 過濾掉列表[3,9,-1...]中的負數

解決方案: 列表解析[x for x in data if x >=0]

l=[randint(-10,10) for _in range(10)]

[x for x in l if x>=0]
 
g=filter(lambda x:x>=0,l)
next(g)
list(g)
複製代碼

實例案例:

  • 篩出字典{'LiLei':79,'jim':88,'Lucy':92...}中值高於90的項

解決方案: 字典解析 {k:v for k,v in d.items() if v >90}

d={'student%d' % i:randint(50,100) for i in range(1,21)}
{k:v for k,v in d.items if v>=90}
g=filter(lambda item:item[1]>=90,d.items())
list(g)
dict(g)
複製代碼

實例案例:

  • 篩出集合{77,89,32,20...}中能被3整除的元素
  • 解決方案: 列表解析[x for x in data if x % 3==0]

s={randint(0,20) for _ in range(20)}
{x for x in s if x % 3==0}
複製代碼

2. 如何爲元組中的每一個元素命名提升程序的可讀性

實例案例:

學生系統中數據爲固定格式:(名字,年齡,性別,郵箱)python

('jim',16''male','jim8721@gmail.com')數據庫

('LiLei',17''male','leilei@qq.com')編程

('Lucy',16''female','lucy123@yahoo.com')瀏覽器

訪問時咱們使用索(index)訪問,大量索引下降程序可讀性.bash

解決方案:

方案1:定義一系列數值常量或枚舉類型app

方案2: 使用標準庫中collections.namedtuple替代內置tupledom

from enum import IntEnum
NAME,AGE,SEX,EMAIL=range(4)
s=('jim',16''male','jim8721@gmail.com')
class StudentEnum(IntEnum):
    NAME=0
    AGE=1
    SEX=2
    EMAIL=3
StudentEnum.NAME
s[StudentEnum.NAME]
isinstance(StudentEnum.NAME,int)
複製代碼

解決方案2:函數

from collections import namedtuple
Student=namedtuple('Student',['name','age','sex','email'])
s2=Student('jim',16''male','jim8721@gmail.com')
s2
Student(name='jim',age=16,sex='male',email='jim8721@gmail.com')
isinstance(s2,tuple)
複製代碼

3.如何根據字典中值得大小,對字典中的項排序

實例案例:

某班英語成績以字典形式存儲爲:ui

{
    'LiLei':79,
    'jim'  :88,
    'Lucy' :92,
    ..
}
複製代碼

如何根據成績高低,計算學生排名spa

解決方案:將字典中的各項轉換爲元組,使用內置函數sorted排序

方案1:將字典中的項轉化爲(值,鍵)元組.(列表解析或zip)

from random import randint
d={k:randint(60,100) for k in 'abcdefg'}
l=[(v,k) for k in d.items()]
sorted(l,reverse=True)
d.items()
p=sorted(d.items(),key=lambda item:item[1],reverse=True)
list(enumerate(p))
list(enumerate(p,1))
for i (k,v) item in enumerate(p,1):
    print(i,k,v)
    d[k]=(i,v)
字典解析:{k:(i,v) for i (k,v) item in enumerate(p,1)}
複製代碼

4.如何統計序列中元素出現的頻度

實例案例:

1.某隨機序列[12,5,6,4,6,5,5,7]中,找到出現次數最高的3個元素,它們出現次數是多少?

2.對於某英文文章,進行詞頻統計,找到出現次數最高的10個單詞,他們出現次數是多少?

解決方案:

方案1.將序列轉換成字典{元素:頻度},根據字典中的值排序。

from random import randint
data=[randint(0,20) for _ in range(30)]
d=dict.fromkeys(data,0)
for x in data:
    d[x] +=1
sorted(((v,k) for k, v in d.items()),reverse=True)[:3]
import heapq
heapq.nlargest(3,(v,k) for k,v in d.items)
複製代碼

方案2:使用標準庫collections中的Counter對象

from collections import Counter 
data 
c=Counter(data)
c.most_common(3)

txt=open('example.txt').read()
import re
word_list=re.split('\W+',txt)
c2=Counter(word_list)
c2.most_common(10)
複製代碼

5.如何快速找到多個字典中的公共鍵

實例案例:

西班牙足球聯賽,每輪隊員進球統計:

第1輪:{'蘇亞雷斯':1,'梅西':2,'本澤馬':1,...}

第1輪:{'蘇亞雷斯':2,'C羅':1,'格里斯曼':2,...}

第1輪:{'蘇亞雷斯':1,'託雷斯':2,'貝爾':1,...}

統計出前N輪每場比賽都有進球的球員.

解決方案:

方案1.

from random import randint,simple
simple('abcdefgh',3)
simple('abcdefgh',randint(3,6))
d1={k:randint(1,4) for k in sample('abcdefgh',randint(3,6))}
d1
d2={k:randint(1,4) for k in sample('abcdefgh',randint(3,6))}
d3={k:randint(1,4) for k in sample('abcdefgh',randint(3,6))}
for k in d1:
    if k in d2 and k in d3:
        print(k)
[k for k in d1 if k in d2 and k in d3]
d1=[d1,d2,d3]
[k for k in d1[0] if all(map(lambda d: k in d,d1[1:]))]

複製代碼

解決方案:

利用集合(set)的交集操做 step1:使用字典的keys()方法,獲得一個keys的集合 step2:使用map函數,獲得每一個字典的keys的集合 step3:使用reduce函數,取全部字典的keys集合的交集

s1=d1.keys()
s2=d2.keys()
s1 & s2
from functools import reduce 
reduce(lambda a,b:a*b,range(1,11))
map(dict.keys,d1)
reduce(lambda a,b:a&b map(dict.keys,d1)
複製代碼

6.如何讓字典保持有序

實例案例:

某編程比賽系統, 對參賽選手編程解題進行計時,選手晚上比賽後,把該選手解題用時記錄到字典中,以便賽後按選手名查詢成績. {'LiLei':(2,43),'HanMeiMei':(5,52),'jim':(1,39)...} 比賽結束後,需按排名順序依次打印選手成績,如何實現?

解決方案:

使用標準庫collection中的OrderedDict 以OrderedDict替代內置字典Dict,依次將選手成績存入OrderedDict

d={}
from collections import OrderdDict
od = OrderedDict()
od=['c']
od=['b']
od=['a']
od.keys()
players = list('abcdefgh')
from random import shuffle
shuffle(players)
players
od=OrderedDict()
for i, p in enumerate(players,1)
    od[p] = i0
od
def query_by_name(d,name):
    return d[name]
query_by_name(od,'c')

複製代碼

7.如何實現用戶的歷史記錄功能

研討問題:

如何實現用戶的歷史記錄功能(最多n條)?

實例案例:

不少應用程序都有瀏覽用戶的歷史記錄功能,例如:

1.瀏覽器能夠查看最近瀏覽的網頁

2.視頻播放器能夠查看最近播放過的視頻文件

3.Shell能夠查看用戶輸入過的命令

如今咱們製做了一個簡單的猜數字遊戲 如何添加歷史記錄,顯示用戶最近猜過的數字?

from random import randint

def guess(n,k):
    if n ==K:
        print('猜對了,這個數字是%d.' %k)
        return True
        
    if n<k:
        print('猜大了,比%d小.' %k)
        elif n>k:
            print('猜小了,比%d大。'%k)
        return False
def main():
    n = randint(1,100)
    i =1
    while True:
        line= input('[%d] 請輸入一個數字:' %d)
        if line.isdight():
            k = int(line)
            i += 1
            if guess(n,k):
                break
            elif line == 'quit':
                break
if __name__=='__main__':
    main()

複製代碼

解決方案:

使用容量爲n的隊列存儲歷史記錄 使用標準數據庫collections中的deque,它是一個雙端隊列 使用pickle模塊將歷史記錄存儲到硬盤,以便下次啓動使用

from collections import deque
deque([],5)
q.append(1)
q.append(2)
q.append(3)
q.append(4)
q.append(5)
q
deque([1,2,3,4,5],maxlen=5)
q.append(6)
q
deque([2,3,4,5,6],maxlen=5)

from random import randint
from collections import deque

def guess(n,k):
    if n ==K:
        print('猜對了,這個數字是%d.' %k)
        return True
        
    if n<k:
        print('猜大了,比%d小.' %k)
        elif n>k:
            print('猜小了,比%d大。'%k)
        return False
def main():
    n = randint(1,100)
    i =1
    hq=deque([],5)
    while True:
        line= input('[%d] 請輸入一個數字:' %d)
        if line.isdight():
            k = int(line)
            hq.append(k)
            i += 1
            if guess(n,k):
                break
            elif line == 'quit':
                break
            elif line=='h?'
                print(list(hq))
                
if __name__=='__main__':
    main()

import pickle
pickle.dump
q
deque([2,3,4,5,6],maxlen=5)
pickle.dump(q,open('save.pkl','wb'))
ed save.pkl
q2=pickle.load(open('save.pk1','rb'))
複製代碼

本文講解了列表,字典集合根據條件篩選數據,根據字典的值得大小進行排序,統計序列中出現元素的頻度,如何實現用戶的歷史記錄功能。

相關文章
相關標籤/搜索