張逸傑:複製監督整個編程任務的進程以及協助組員編程
黃智鋒、劉汪洋:負責UI設計
蘇凱婷、鮑冰如:爬取數據並負責測評出福州最受歡迎的商圈
陳榮傑、楊錦鑌:爬取數據並負責測評出福州人均消費50如下,50-100、100-200、200以上最佳(性價比最高)的前五家美食餐廳
王嶔、林家偉:爬取數據並負責測評出測評出福州最佳美食彙集地
吳智勇、黃彬煌:爬取數據並負責測評出福州服飾類綜合評分最高的商圈html
統一運用windows操做系統、python語言、pycharm程序編程。python
首先分別用爬蟲對美團網的各個所需數據進行爬取。例如:要測出福州最受歡迎的商圈,就在美團網上搜索範圍福州並進行篩選最後將數據爬取下來.而後再編寫算法對數據進行篩選,最後作成圖展現。
git
測評出福州各個消費等級的休閒娛樂場所前五名github
楊錦鑌:昨晚在晚上看了一下有關爬蟲的知識,一看就會,一作就廢,早上具體實現的時候卻一直提取不出所想的信息。
黃智鋒:困難:作UI的困難主要是選背景和排版上面,要選出符合主題的圖片,而後還要根據要插入的內容合理修改圖片
劉汪洋:我以爲作UI找合適的圖挺難的,其餘的不是特別難,主要是煩,個人隊友就深有體會。
蘇凱婷:一開始在作的時候比較迷茫,不知道應該爬取那個網頁比較合適,因此浪費了大量的時間,在糾結應該使用哪一個app對應的網頁。致使浪費了一些時間,第二就是關於工具的安裝,昨晚將大量的時間花費在對於爬蟲的學習,只是看過去,並無親自去嘗試實踐,然而今天好像沒有用到不少很難的爬蟲的操做,第三,最近對python的使用頻率比較低,因此早上在寫的時候卡卡的,很容易出現報錯,而後心態就爆炸,總的來講仍是挺糟糕的。
鮑冰如:首先是技術和知識方面,沒有實現瞭解更多的爬蟲知識,實戰的時候一邊擔憂本身會拖後腿一邊學習爬蟲一邊運用到這次的任務裏,就很難,太難了,一開始不肯定商圈的定義,計劃爬取美團和百度地圖和高德地圖對商圈的信息,but技術硬傷搞好久也沒搞出來,心態很崩。
張逸傑:爬取數據的時候一直爬不到某個數據,搞得有些心煩,耽誤了其餘工做的進展。
陳榮傑:在用etree解碼時,pycham報錯,顯示沒有這個模塊
王嶔:不會爬蟲
黃彬煌:一開始瀏覽了關於福州有幾個商圈的問題,獲得的都是模糊的概念,沒有具體定案。而後嘗試在口碑,淘寶,美團幾個網站尋找關於服飾類的商品,但願能獲得相似於商家發佈地的篩選,而後再經過發佈地反推歸類到幾個模糊的商圈地,最後再完成最佳服飾類商圈統計等操做。可是,找不到關於服飾類的分類。最後,經過對服飾類關鍵字的搜索,成功在美團上找到商品,更喜人的是,美團還有自帶對商圈的劃分。可是在用爬蟲技術對網站進行操做時,由於對爬蟲知識的不熟悉,幾乎是遇到一個問題便解決一個,但最後卡在了python裏的html模塊的fromstring函數顯示沒有此函數。
吳智勇:1.口碑api彷佛是爲了給加入商戶使用的,不夠友好。2.lxmlstring函數使用中遇到了困難3.對於同一界面的不一樣選項,對於網頁屬性來講彷佛沒有任何改變
林家偉:1.在爬?取美團美食網頁數據時,用python的lxml庫一直沒法定位到標籤獲取店鋪連接2.講爬取到的數據分類保存到本地t?xt文件,python讀取文件數據出現許多格式問題正則表達式
楊錦鑌:問同窗,百度,勉強可以提取出部分信息。
黃智鋒:網上閱覽圖片,找出清晰度較高且符合主題的圖片,修改圖片主要是利用ps反覆配色,尋找最適合的修改方案。
劉汪洋:互相討論商量,找到都以爲好的共識。
蘇凱婷:工具在一開始就進行了及時安裝,隊友很快告訴我能夠經過直接在美團上搜索商圈得到信息,對於程序出現的報錯以及暫時性的語法的遺忘,經過查看本身第一次編程的做業獲得了很好的解決。
鮑冰如:後來以爲百度地圖的商圈信息比較符合要求,而後開始瘋狂嘗試爬取,kt是個人救星,坐在我旁邊,給我分享她搜索到的有用的網站,還會給我解釋一些技術問題,在必定程度上解決了個人技術方面的問題,雖然最後仍是沒搞出來,可是kt完成了,不要臉地說一句Kt完成了就是咱們完成了。
張逸傑:最終仍是百度了報錯而後修改爲功,改用正則匹配的形式爬取。
陳榮傑:lxml版本下錯了了,更新一下就好
王嶔:上網百度
黃彬煌:只能另尋其餘方法模板去爬取網站上的信息。
吳智勇:沒解決
林家偉:1.因爲實在找不到緣由,因此放棄使用lxml,利用正則表達式提取所需數據2.利用eval(),split?(),強制轉換等方式,在提取數據後,對數據進行字符串,字典,列表的轉換算法
楊錦鑌:若是之前的空閒時間能拿來學習,那麼今天我必定能作出來。
黃智鋒:若是這蛇皮機房電腦網速不那麼慢那麼卡,那麼這背景圖也不會那麼醜
劉汪洋:若是我會爬蟲,那麼可能能給他們幫上點忙。
蘇凱婷:若是沒有那麼菜那麼就不會這麼慘了
鮑冰如:若是沒有kt,那麼我會更菜
張逸傑:若是個人組織和領導能力再強一點,編碼能力再強一點,咱們組必定可以作完,沒作完很惋惜。
陳榮傑:若是我會爬蟲,那麼我就能按時完成
王嶔:若是我前一天晚上好好準備一下 今天也就至於這麼廢物
黃彬煌:若是很早的時候就掌握了爬蟲,那麼就沒那麼多事了
吳智勇:若是團隊協做交流能更加緊密,那麼過程因該會更加順利
林家偉:若是我能再強一點,就可以帶zyj飛編程
組員名字 | 張逸傑 | 黃彬煌 | 吳智勇 | 蘇凱婷 | 鮑冰如 | 黃智鋒 | 陳榮傑 | 楊錦鑌 | 王嶔 | 林家偉 | 劉汪洋 |
---|---|---|---|---|---|---|---|---|---|---|---|
貢獻比例 | 12 | 10 | 8 | 10 | 10 | 10 | 8 | 8 | 7 | 9 | 8 |
PSP2.1 | Personal Software Process Stages | 預估耗時(分鐘) | 實際耗時(分鐘) |
---|---|---|---|
Planning | 計劃 | 10 | 20 |
Estimate | 估計這個任務須要多少時間 | 5 | 5 |
Development | 開發 | 10 | 10 |
Analysis | 需求分析 (包括學習新技術) | 60 | 50 |
Design Spec | 生成設計文檔 | 0 | 0 |
Design Review | 設計複審 | 0 | 0 |
Coding Standard | 代碼規範 (爲目前的開發制定合適的規範) | 10 | 10 |
Design | 具體設計 | 10 | 15 |
Coding | 具體編碼 | 60 | 140 |
Code Review | 代碼複審 | 10 | 10 |
Test | 測試(自我測試,修改代碼,提交修改) | 30 | 20 |
Reporting | 報告 | 0 | 0 |
Test Repor | 測試報告 | 0 | 0 |
Size Measurement | 計算工做量 | 0 | 0 |
Postmortem & Process Improvement Plan | 過後總結, 並提出過程改進計劃 | 10 | 10 |
合計 | 215 | 300 |
第N周 | 新增代碼(行) | 累計代碼(行) | 本週學習耗時(小時) | 累計學習耗時(小時) | 重要成長 |
---|---|---|---|---|---|
9 | 100 | 1800 | 20 | 100 | 學會了一些簡單的爬蟲知識 |