目錄
0 引言
1 環境
2 需求分析
3 代碼實現
4 後記html
上週被一則新聞震驚到了,《2454萬元大獎無人認領!福彩史上第二大棄獎在廣東中山產生 》,在2019年5月2日開獎的雙色球中,廣東中山一位彩民博中2454萬元,兌獎時間截至2019年7月1日。python
使人遺憾的是,中獎者最終未現身領獎,2454萬元大獎成爲棄獎。經中山市福彩中心查證,這是中國福彩史上金額第二大的棄獎。根據《彩票管理條例實施細則》的有關規定,此次的2454萬元棄獎獎金將被歸入彩票公益金。git
一直在爲福彩作貢獻的我,啥時候能攤上這樣的好事啊。因而我用Python生成了一組雙色球的號碼……github
操做系統:Windowsapp
Python版本:3.7.3dom
隨機生成一組雙色球的號碼,咱們能夠藉助random函數,以下:函數
import random def ball(): ball_list=[] while 1: a=random.randint(1,33) if a not in ball_list: ball_list.append(a) if len(ball_list)==6: break ball_list.sort() ball_list.append(random.randint(1,16)) print(ball_list) ball()
但要知道,這麼搞的話,絲絕不會有什麼中獎的,由於太隨機了……工具
經歷太高考的人,確定都知道三年模擬五年高考。要知道彩票中獎機率很低的,因此咱們在這裏先分析下歷年的數據,藉助往年的數據來「精準」地推算下一期中獎號碼。網站
咱們經過這個網站來查詢彩票的歷史開獎信息。url
http://kaijiang.zhcw.com/zhcw...
咱們點擊下一頁,看看網址連接是否有規律
http://kaijiang.zhcw.com/zhcw...
http://kaijiang.zhcw.com/zhcw...
http://kaijiang.zhcw.com/zhcw...
http://kaijiang.zhcw.com/zhcw...
http://kaijiang.zhcw.com/zhcw...
不難發現,能夠將目標網址拆分以下:
url_part = 'http://kaijiang.zhcw.com/zhcw/html/ssq/list' url = url_part + '_' + str(i) + '.html'
而 i 對應的正好是頁碼信息,咱們藉助<F12>開發調試工具,來看看頁數的信息怎麼獲取:
記錄下這裏的元素信息。
接下來,咱們須要抓取每一頁中的具體開獎信息。咱們繼續經過開發者工具分析出每期開獎信息。
咱們依次記錄下每期的開獎日期對應的元素信息:
開獎的批次對應的元素信息:
中獎號碼對應的元素信息:
有了這些元素信息以後,接下來就是代碼的具體實現。
在這裏,咱們獲取網頁的請求使用 requests 模塊;解析網址藉助 beautifulsoup4 模塊。由於都是第三方模塊,如環境中沒有可使用 pip 進行安裝。
pip install requests pip install beautifulsoup4 pip install lxml
模塊安裝好以後,進行導入
import requests from bs4 import BeautifulSoup
咱們須要先在首頁中,拿到頁數信息
# 發起請求 basic_url = 'http://kaijiang.zhcw.com/zhcw/html/ssq/list_1.html' headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/75.0.3770.100 Safari/537.36' } response = requests.get(basic_url, headers=headers, timeout=10) response.encoding = 'utf-8' htm = response.text # 解析內容 soup = BeautifulSoup(htm, 'html.parser') # 獲取頁數信息 page = int(soup.find('p', attrs={"class": "pg"}).find_all('strong')[0].text) 接下來,咱們就能夠根據規律組裝好咱們的URL: url_part = 'http://kaijiang.zhcw.com/zhcw/html/ssq/list' for i in range(1, page+1): url = url_part + '_' + str(i) + '.html'
拿組裝後的url發起請求,並獲取每頁中各期的開獎信息:
res = requests.get(url, headers=headers, timeout=10) res.encoding = 'utf-8' context = res.text soups = BeautifulSoup(context, 'html.parser') if soups.table is None: continue elif soups.table: table_rows = soups.table.find_all('tr') for row_num in range(2, len(table_rows)-1): row_tds = table_rows[row_num].find_all('td') ems = row_tds[2].find_all('em') result = row_tds[0].string +', '+ row_tds[1].string +', '+ems[0].string+' '+ems[1].string+' '+ems[2].string+' '+ems[3].string+' '+ems[4].string+' '+ems[5].string+', '+ems[6].string print(result)
這樣,咱們就完成了對每一頁中各期開獎數據的獲取。獲取的數據能夠保存在本地。
def save_to_file(content): with open('ssq.txt', 'a', encoding='utf-8') as f: f.write(content + '\n')
咱們在獲取每期的開獎數據的同時,記錄下紅藍球出現的號碼信息。
# 定義兩個變量, 用於記錄歷史開獎信息中的紅球、藍球號碼信息 red_num = [] blue_num = [] red_num.append(ems[0].string) # 紅色球1 red_num.append(ems[1].string) # 紅色球2 red_num.append(ems[2].string) # 紅色球3 red_num.append(ems[3].string) # 紅色球4 red_num.append(ems[4].string) # 紅色球5 red_num.append(ems[5].string) # 紅色球6 blue_num.append(ems[6].string) # 藍色球
統計出各個號碼出現次數信息:
red_count = Counter(red_num) blue_count = Counter(blue_num)
接下來咱們能夠根據紅藍號碼出現的頻率進行排序,並推測出幾組雙色球號碼信息:
# 按照出現頻率順序 red_sorted = sorted(red_count.items(), key=lambda x: x[1], reverse=False) blue_sorted = sorted(blue_count.items(), key=lambda x: x[1], reverse=False) red = red_sorted[0:6] blue = blue_sorted[0:3] red = list(map(lambda x:x[0], red)) blue = list(map(lambda x:x[0], blue)) red.sort() blue.sort() print('號碼高頻-1注:'+str(red)+' | '+blue[0]) print('號碼高頻-2注:'+str(red)+' | '+blue[1]) print('號碼高頻-3注:'+str(red)+' | '+blue[2])
固然了,也能夠輸出反序輸出,中獎號碼出現頻率較低的幾組,只須要設置 reverse=True 便可。
這裏根據藍色球各號碼出現的次數,做了張直方圖,能夠很直觀到藍色球各號碼出現的頻率。
有人會問了,這樣預測出的中獎號碼,中獎機率究竟有多大呢?
這個,我可說不清楚,只有買了纔會知道……當心錯過一個億喲!
好了,以上就是本篇所有內容。
關注公衆號「Python專欄」,更多有趣好玩的Python等着你~
本文全套代碼已上傳至Github:https://github.com/MiracleYou...