團隊任務 | 預估時間 | 實際時間 | 完成日期 |
---|---|---|---|
新增其餘學院的爬蟲 | 180 | 130 | 11.30 |
新增其餘學院的數據庫字段修改 | 180 | 160 | 12.1 |
新增其餘學院的數據庫部署到es | 180 | —— | —— |
前端和新增學院數據的交互 | 300 | —— | —— |
實現網站的定時爬取以及es的自動同步(絕對路徑版) | 200 | 180 | 11.30 |
實現網站的定時爬取以及es的自動同步(相對路徑版) | 60 | 120 | 12.1 |
主界面設置最新通知播報欄樣式 | 300 | —— | —— |
將項目部署到服務器 | 200 | —— | —— |
擴大使用範圍至移動端 | 100 | —— | —— |
前端界面的美化 | 100 | —— | —— |
需求說明書的調整 | 60 | —— | —— |
搜索引擎測試 | 80 | —— | —— |
用戶使用調查 | 100 | —— | —— |
Beta階段發佈說明 | 200 | —— | —— |
成員 | 任務安排 | 預期任務量/小時 |
---|---|---|
秦玉(組長) | 修改計算機工程學院字段內容並同步到es、編寫博客園 | 180 |
陳曉菲 | 修改計算機工程學院字段內容並同步到es、編寫博客園 | 180 |
韓燁 | 新增其餘學院的數據庫字段修改 | 180 |
姚雯婷 | 新增其餘學院的數據庫字段修改 | 180 |
羅佳 | 實現網站的定時爬取以及es的自動同步(相對路徑版) | 180 |
高天 | 申請服務器的域名 | 180 |
新增的輪機工程學院的搜索引擎,在後端同步mysql到es上之後,在前端上的頁面上還須要新增輪機工程學院的搜索選項,可是不瞭解前端向es傳遞參數時怎麼分別判斷讀取哪個索引。javascript
在申請域名時十分的艱難,手續極其複雜,首先要購買支付雲空間,而且上傳我的信息,上傳以後騰訊在四個工做日內完成審覈,審覈經過後相關信息材料由騰訊提交到管局,管局須要二十個工做日進行審覈。html
參考百度的抖索引擎後發現,它能夠在輸入關鍵字以後直接回車進行搜索,而咱們的抖索引擎還沒辦法這樣,只能點擊鼠標才能夠。考慮到從鍵盤進行輸入後,直接按回車比較方便,因此咱們在html里加入了這一段代碼,就實現了回車搜索。前端
<script type="text/javascript" language="javascript"> document.onkeydown =cdk; function cdk(){ if(event.keyCode==13) add_search() } </script>
由於新增了文章建立時間的字段,因此須要新爬取網頁中的建立時間數據。但因爲輪機工程學院的文章網頁中建立時間只包括年月日,而計算機的精確到了時分秒,因此爲了統一格式,須要對輪機工程學院爬取到的建立時間數據進行處理。
經過正則表達式將建立時間數據按年月日進行分割,分別賦值給三個相應變量,使用datetime.datetime()函數將三個變量串起來,再使用strftime(SQL_DATETIME_FORMAT)函數定義其格式。java
因以前提到使用批處理文件自動處理,在衝刺一時已經實現了,可是因爲是絕對路徑,不具備特別好的可移植性,因此在本次衝刺中特地將實現網站的定時爬取以及es的自動同步的bat文件升級爲相對路徑版本,具備良好的可移植性,只須要將整個項目打包過去,在其餘電腦上就能夠一鍵爬取網站並部署到es,直到最後的網頁自動彈開。mysql
https://www.leangoo.com/kanban/board/go/2565273正則表達式