隨機數模塊python
randint:獲得一個隨機數mysql
import random # 導入一個模塊 v = random.randint(起始,終止) # 獲得一個隨機數 #示例:生成隨機驗證碼 import random def get_random_code(length=6): data = [] for i in range(length): v = random.randint(65,90) data.append(chr(v)) return ''.join(data) code = get_random_code() print(code)
# 將指定的 「字符串」 進行 加密 import hashlib # 導入一個模塊 def get_md5(data): # md5 加密函數 obj = hashlib.md5() obj.update(data.encode('utf-8')) result = obj.hexdigest() return result val = get_md5('123') print(val) # 加鹽 import hashlib def get_md5(data): obj = hashlib.md5("sidrsdxff123ad".encode('utf-8')) # 加鹽 obj.update(data.encode('utf-8')) result = obj.hexdigest() return result val = get_md5('123') print(val)
# 應用:用戶註冊+用戶登陸 import hashlib USER_LIST = [] def get_md5(data): # md5 加密函數 obj = hashlib.md5("12:;idrsicxwersdfsaersdfs123ad".encode('utf-8')) # 加鹽 obj.update(data.encode('utf-8')) result = obj.hexdigest() return result def register(): # 用戶註冊函數 print('**************用戶註冊**************') while True: user = input('請輸入用戶名:') if user == 'N': return pwd = input('請輸入密碼:') temp = {'username':user,'password':get_md5(pwd)} USER_LIST.append(temp) def login(): # 用戶登陸函數 print('**************用戶登錄**************') user = input('請輸入用戶名:') pwd = input('請輸入密碼:') for item in USER_LIST: if item['username'] == user and item['password'] == get_md5(pwd): return True register() result = login() if result: print('登錄成功') else: print('登錄失敗')
sha程序員
import hashlib md5 = hashlib.sha1('鹽'.encode()) md5.update(b'str') print(md5.hexdigest())
只能在終端運行web
getpass.getpass:輸入密碼時不顯示正則表達式
import getpass # 導入一個模塊 pwd = getpass.getpass('請輸入密碼:') if pwd == '123': print('輸入正確')
時間模塊redis
time.time:時間戳(從1970年到如今經歷的秒數)算法
# https://login.wx.qq.com/cgi-bin/mmwebwx-bin/login?loginicon=true&uuid=4ZwIFHM6iw==&tip=1&r=-781028520&_=1555559189206
time.sleep:等待的秒數sql
time.timezonejson
示例app
# 計算函數執行時間 import time def wrapper(func): def inner(): start_time = time.time() v = func() end_time = time.time() print(end_time-start_time) return v return inner @wrapper def func1(): time.sleep(2) print(123) func1()
時間模塊
datetime.now():當前本地時間
datetime.utcnow():當前UTC時間
import time from datetime import datetime,timezone,timedelta # 獲取datetime格式時間 # 當前本地時間 v1 = datetime.now() # 當前東7區時間 tz = timezone(timedelta(hours=7)) v2 = datetime.now(tz) # 當前UTC時間 v3 = datetime.utcnow() print(v3)
相互轉換
import time from datetime import datetime,timedelta # 1.datetime格式和字符串的相互轉換 # 把datetime格式轉換成字符串:strftime v1 = datetime.now() val = v1.strftime("%Y-%m-%d %H:%M:%S") # 字符串轉成datetime格式:strptime v1 = datetime.strptime('2011-11-11','%Y-%m-%d') # 2.datetime時間的加減 v1 = datetime.strptime('2011-11-11','%Y-%m-%d') v2 = v1 - timedelta(days=140) # 再轉換成字符串 date = v2.strftime('%Y-%m-%d') # 3.時間戳和datetime的相互轉換 # 時間戳轉換成datetime格式:fromtimestamp ctime = time.time() v1 = datetime.fromtimestamp(ctime) # datetime格式轉換成時間戳:timestamp v1 = datetime.now() val = v1.timestamp()
python解釋器相關數據
sys.getrefcount:獲取一個值的應用計數
sys.getrecursionlimit:python默認支持的遞歸數量
sys.stdout.write:輸入輸出
補充:\n:換行 \t:製表符 \r:回到當前行的起始位置
import time for i in range(1,101): msg = "%s%%\r" %i print(msg,end='') time.sleep(0.05)
示例:讀取文件的進度條
import os # 1. 讀取文件大小(字節) file_size = os.stat('20190409_192149.mp4').st_size # 2.一點一點的讀取文件 read_size = 0 with open('20190409_192149.mp4',mode='rb') as f1,open('a.mp4',mode='wb') as f2: while read_size < file_size: chunk = f1.read(1024) # 每次最多去讀取1024字節 f2.write(chunk) read_size += len(chunk) val = int(read_size / file_size * 100) print('%s%%\r' %val ,end='')
sys.argv:獲取用戶執行腳本時,傳入的參數
""" 讓用戶執行腳本傳入要刪除的文件路徑,在內部幫助用將目錄刪除。 C:\Python36\python36.exe D:/code/s21day14/7.模塊傳參.py D:/test C:\Python36\python36.exe D:/code/s21day14/7.模塊傳參.py """ import sys # 獲取用戶執行腳本時,傳入的參數。 # C:\Python36\python36.exe D:/code/s21day14/7.模塊傳參.py D:/test # sys.argv = [D:/code/s21day14/7.模塊傳參.py, D:/test] path = sys.argv[1] # 刪除目錄 import shutil shutil.rmtree(path)
sys.exit(0):程序終止,0表明正常終止
sys.path:默認python去導入模塊時,會按照sys.path中的路徑
import sys sys.path.append('D:\\')
sys.modules:存儲了當前程序中用到的全部模塊,反射本文件中的內容
和操做系統相關的數據
os.path.exists(path):若是path存在,返回True;若是path不存在,返回False
os.stat('文件路徑').st_size:獲取文件大小
os.path.abspath():獲取一個文件的絕對路徑
import os v1 = os.path.abspath(path) print(v1)
os.path.dirname():獲取路徑的上級目錄
import os v = r"D:\code\s21day14\20190409_192149.mp4" print(os.path.dirname(v))
補充:轉義
v1 = r"D:\code\s21day14\n1.mp4" (推薦) v2 = "D:\\code\\s21day14\\n1.mp4"
os.path.join:路徑的拼接
import os path = "D:\code\s21day14" # user/index/inx/fasd/ v = 'n.txt' result = os.path.join(path,v) print(result)
os.listdir:查看一個目錄下全部的文件【第一層】
import os result = os.listdir(r'D:\code\s21day14') for path in result: print(path)
os.walk:查看一個目錄下全部的文件【全部層】
import os result = os.walk(r'D:\code\s21day14') for a,b,c in result: # a,正在查看的目錄 b,此目錄下的文件夾 c,此目錄下的文件 for item in c: path = os.path.join(a,item) print(path)
os.makedir:建立目錄,只能生產一層目錄(基本不用這個)
os.makedirs:建立目錄及其子目錄(推薦使用)
# 將內容寫入指定文件中 import os file_path = r'db\xx\xo\xxxxx.txt' file_folder = os.path.dirname(file_path) if not os.path.exists(file_folder): os.makedirs(file_folder) with open(file_path,mode='w',encoding='utf-8') as f: f.write('asdf')
os.rename:重命名
# 將db重命名爲sb import os os.rename('db','sb')
os.path.isdir:判斷是不是文件夾
os.path.isfile:判斷是不是文件
用途:刪除、重命名、壓縮、解壓等
shutil.rmtree(path):刪除目錄
# 刪除目錄 import shutil shutil.rmtree(path)
shutil.move:重命名
# 重命名 import shutil shutil.move('test','ttt')
shutil.make_archive:壓縮文件
# 壓縮文件 import shutil shutil.make_archive('zzh','zip','D:\code\s21day16\lizhong')
shutil.unpack_archive:解壓文件
# 解壓文件 import shutil shutil.unpack_archive('zzh.zip',extract_dir=r'D:\code\xxxxxx\xxxx',format='zip')
示例
import os import shutil from datetime import datetime ctime = datetime.now().strftime('%Y-%m-%d-%H-%M-%S') # 1.壓縮lizhongwei文件夾 zip # 2.放到到 code 目錄(默認不存在) # 3.將文件解壓到D:\x1目錄中。 if not os.path.exists('code'): os.makedirs('code') shutil.make_archive(os.path.join('code',ctime),'zip','D:\code\s21day16\lizhongwei') file_path = os.path.join('code',ctime) + '.zip' shutil.unpack_archive(file_path,r'D:\x1','zip')
json.dumps():序列化
import json v = {'k1':'alex','k2':'李傑'} val = json.dumps(v,ensure_ascii = False)
json.loads():反序列化
import json # 序列化,將python的值轉換爲json格式的字符串。 v = [12,3,4,{'k1':'v1'},True,'asdf'] v1 = json.dumps(v) print(v1) # 反序列化,將json格式的字符串轉換成python的數據類型 v2 = '["alex",123]' print(type(v2)) v3 = json.loads(v2) print(v3,type(v3))
json.dump:打開文件,序列化後,寫入文件
import json v = {'k1':'alex','k2':'李傑'} f = open('x.txt',mode='w',encoding='utf-8') val = json.dump(v,f) print(val) f.close()
json.load:打開文件,讀取文件內容
import json v = {'k1':'alex','k2':'李傑'} f = open('x.txt',mode='r',encoding='utf-8') data = json.load(f) f.close() print(data,type(data))
pickle.dumps:序列化
pickle.loads:反序列化
import pickle # 序列化 v = {1,2,3,4} val = pickle.dumps(v) print(val) # 反序列化 data = pickle.loads(val) print(data,type(data))
pickle.dump:寫入文件(注意:mode='wb')
pickle.load:讀取文件(注意:mode='rb')
import pickle # 寫入文件 v = {1,2,3,4} f = open('x.txt',mode='wb') val = pickle.dump(v,f) f.close() # 讀取文件 f = open('x.txt',mode='rb') data = pickle.load(f) f.close() print(data)
拷貝模塊
copy.copy:淺拷貝
copy.deepcopy:深拷貝
import copy v1 = [1,2,3] v2 = copy.copy(v1) #淺拷貝 v3 = copy.deepcopy(v1) #深拷貝
importlib.import_module:經過字符串的形式導入模塊
#示例一: import importlib # 用字符串的形式導入模塊。 redis = importlib.import_module('utils.redis') # 用字符串的形式去對象(模塊)找到他的成員。 getattr(redis,'func')() #示例二: import importlib middleware_classes = [ 'utils.redis.Redis', # 'utils.mysql.MySQL', 'utils.mongo.Mongo' ] for path in middleware_classes: module_path,class_name = path.rsplit('.',maxsplit=1) module_object = importlib.import_module(module_path)# from utils import redis cls = getattr(module_object,class_name) obj = cls() obj.connect()
日誌模塊:記錄日誌的
日誌處理本質:Logger / FileHandler / Formatter
兩種配置方式:
basicConfig
logger對象
import logging # 建立一個logger對象 logger = logging.getLogger() # 建立一個文件操做符 fh = logging.FileHandler('log.log') # 建立一個屏幕操做符 sh = logging.StreamHandler() # 給logger對象綁定 文件操做符 logger.addHandler(fh) # 給logger對象綁定 屏幕操做符 logger.addHandler(sh) # 建立一個格式 formatter = logging.Formatter('%(asctime)s - %(name)s - %(levelname)s - %(message)s') # 給文件操做符 設定格式 fh.setFormatter(formatter) # 給屏幕操做符 設定格式 sh.setFormatter(formatter) # 用logger對象來操做 logger.warning('message')
日誌異常級別
CRITICAL = 50 # 崩潰 FATAL = CRITICAL ERROR = 40 # 錯誤 WARNING = 30 WARN = WARNING INFO = 20 DEBUG = 10 NOTSET = 0
推薦處理日誌方式
import logging file_handler = logging.FileHandler(filename='x1.log', mode='a', encoding='utf-8',) logging.basicConfig( format='%(asctime)s - %(name)s - %(levelname)s -%(module)s: %(message)s', datefmt='%Y-%m-%d %H:%M:%S %p', handlers=[file_handler,], level=logging.ERROR ) logging.error('你好')
推薦處理日誌方式 + 日誌分割
import time import logging from logging import handlers # file_handler = logging.FileHandler(filename='x1.log', mode='a', encoding='utf-8',) file_handler = handlers.TimedRotatingFileHandler(filename='x3.log', when='s', interval=5, encoding='utf-8') logging.basicConfig( format='%(asctime)s - %(name)s - %(levelname)s -%(module)s: %(message)s', datefmt='%Y-%m-%d %H:%M:%S %p', handlers=[file_handler,], level=logging.ERROR ) for i in range(1,100000): time.sleep(1) logging.error(str(i))
注意事項:
# 在應用日誌時,若是想要保留異常的堆棧信息。 import logging import requests logging.basicConfig( filename='wf.log', format='%(asctime)s - %(name)s - %(levelname)s -%(module)s: %(message)s', datefmt='%Y-%m-%d %H:%M:%S %p', level=logging.ERROR ) try: requests.get('http://www.xxx.com') except Exception as e: msg = str(e) # 調用e.__str__方法 logging.error(msg,exc_info=True)
OrderedDict:有序字典
from collections import OrderedDict odic = OrderedDict([('a', 1), ('b', 2), ('c', 3)]) print(odic) for k in odic: print(k,odic[k])
defaultdict:默認字典
deque:雙端隊列
namedtuple:可命名元組
# 建立一個類,這個類沒有方法,全部屬性的值都不能修改 from collections import namedtuple # 可命名元組 Course = namedtuple('Course',['name','price','teacher']) python = Course('python',19800,'alex') print(python) print(python.name) print(python.price)
定義
正則規則
元字符
量詞
+
:表示匹配1次或屢次*
:表示匹配0次或屢次,表示無關緊要,可是有能夠有多個好比小數點後n位貪婪匹配
而後只須要在正則和待匹配的字符串外面都加r便可
郵箱規則 @以前必須有內容且只能是字母(大小寫)、數字、下劃線(_)、減號(-)、點(.) @和最後一個點(.)之間必須有內容且只能是字母(大小寫)、數字、點(.)、減號(-),且兩個點不能挨着 最後一個點(.)以後必須有內容且內容只能是字母(大小寫)、數字且長度爲大於等於2個字節,小於等於6個字節 郵箱驗證的正則表達式: ^[a-zA-Z0-9_.-]+@[a-zA-Z0-9-]+(\.[a-zA-Z0-9-]+)*\.[a-zA-Z0-9]{2,6}$
re.findall:會匹配字符串中全部符合規則的項,並返回一個列表,若是沒匹配到,返回空列表
import re ret = re.findall('\d+','alex83') print(ret) # findall 會匹配字符串中全部符合規則的項 # 並返回一個列表 # 若是未匹配到返回空列表
re.search:若是匹配到,返回一個對象,用group取值,若是沒匹配到,返回None,不能用group
import re ret = re.search('\d+','alex83') print(ret) # 若是能匹配上返回一個對象,若是不能匹配上返回None if ret: print(ret.group()) # 若是是對象,那麼這個對象內部實現了group,因此能夠取值 # 若是是None,那麼這個對象不可能實現了group方法,因此報錯 # 會從頭至尾從帶匹配匹配字符串中取出第一個符合條件的項 # 若是匹配到了,返回一個對象,用group取值 # 若是沒匹配到,返回None,不能用group
re.match:match = search + ^正則
import re ret = re.match('\d','alex83') == re.match('^\d','alex83') print(ret) # 會從頭匹配字符串,從第一個字符開始是否符合規則 # 若是符合,就返回對象,用group取值 # 若是不符合,就返回None
re.finditer:在查詢的結果超過1個的狀況下,可以有效的節省內存,下降空間複雜度,從而也下降了時間複雜度
import re ret = re.finditer('\d','safhl02urhefy023908'*20000000) # ret是迭代器 for i in ret: # 迭代出來的每一項都是一個對象 print(i.group()) # 經過group取值便可
re.compile:在同一個正則表達式重複使用屢次的時候使用可以減小時間的開銷
import re ret = re.compile('\d+') r1 = ret.search('alex83') r2 = ret.findall('wusir74') r3 = ret.finditer('taibai40') for i in r3: print(i.group())
re.split:利用正則規則進行切割
import re ret = re.split('\d(\d)','alex83wusir74taibai') # 默認自動保留分組中的內容 print(ret)
re.sub / re.subn:利用正則規則進行替換
import re ret = re.sub('\d','D','alex83wusir74taibai',1) print(ret) # 'alexD3wusir74taibai' ret = re.subn('\d','D','alex83wusir74taibai') print(ret) # ('alexDDwusirDDtaibai', 4)
分組和re模塊
關於group取值
import re ret = re.search('<(\w+)>(.*?)</\w+>',s1) print(ret) print(ret.group(0)) # group參數默認爲0 表示取整個正則匹配的結果 print(ret.group(1)) # 取第一個分組中的內容 print(ret.group(2)) # 取第二個分組中的內容
分組命名:(?P <名字> 正則表達式)
import re ret = re.search('<(?P<tag>\w+)>(?P<cont>.*?)</\w+>',s1) print(ret) print(ret.group('tag')) # 取tag分組中的內容 print(ret.group('cont')) # 取cont分組中的內容
引用分組:(?P=組名) 這個組中的內容必須徹底和以前已經存在的組匹配到的內容如出一轍
import re # 方法一: s = '<h1>wahaha</h1>' ret = re.search('<(?P<tag>\w+)>.*?</(?P=tag)>',s) print(ret.group('tag')) # 'h1' # 方法二: s = '<h1>wahaha</h1>' ret = re.search(r'<(\w+)>.*?</\1>',s) print(ret.group(1)) # 'h1'
分組和findall:默認findall 優先顯示分組內的內容,取消分組優先顯示 :(?:正則)
import re ret = re.findall('\d(\d)','aa1alex83') # findall遇到正則表達式中的分組,會優先顯示分組中的內容 print(ret) # 取消分組優先顯示: ret = re.findall('\d+(?:\.\d+)?','1.234+2') print(ret)
有的時候咱們想匹配的內容包含在不相匹配的內容當中,這個時候只須要把不想匹配的先匹配出來,再經過手段去掉
import re ret=re.findall(r"\d+\.\d+|(\d+)","1-2*(60+(-40.35/5)-(-4*3))") print(ret) # ['1', '2', '60', '', '5', '4', '3'] ret.remove('') print(ret) # ['1', '2', '60', '5', '4', '3']
爬蟲示例
# 方法一: import re import json import requests def parser_page(par,content): res = par.finditer(content) for i in res: yield {'id': i.group('id'), 'title': i.group('title'), 'score': i.group('score'), 'com_num': i.group('comment_num')} def get_page(url): ret = requests.get(url) return ret.text pattern = '<div class="item">.*?<em class="">(?P<id>\d+)</em>.*?<span class="title">(?P<title>.*?)</span>.*?' \ '<span class="rating_num".*?>(?P<score>.*?)</span>.*?<span>(?P<comment_num>.*?)人評價</span>' par = re.compile(pattern,flags=re.S) num = 0 with open('movie_info',mode = 'w',encoding='utf-8') as f: for i in range(10): content = get_page('https://movie.douban.com/top250?start=%s&filter=' % num) g = parser_page(par,content) for dic in g: f.write('%s\n'%json.dumps(dic,ensure_ascii=False)) num += 25
# 方法二:進階 import re import json import requests def parser_page(par,content): res = par.finditer(content) for i in res: yield {'id': i.group('id'), 'title': i.group('title'), 'score': i.group('score'), 'com_num': i.group('comment_num')} def get_page(url): ret = requests.get(url) return ret.text def write_file(file_name): with open(file_name,mode = 'w',encoding='utf-8') as f: while True: dic = yield f.write('%s\n' % json.dumps(dic, ensure_ascii=False)) pattern = '<div class="item">.*?<em class="">(?P<id>\d+)</em>.*?<span class="title">(?P<title>.*?)</span>.*?' \ '<span class="rating_num".*?>(?P<score>.*?)</span>.*?<span>(?P<comment_num>.*?)人評價</span>' par = re.compile(pattern,flags=re.S) num = 0 f = write_file('move2') next(f) for i in range(10): content = get_page('https://movie.douban.com/top250?start=%s&filter=' % num) g = parser_page(par,content) for dic in g: f.send(dic) num += 25 f.close()