M2 終審

 一、團隊成員簡介html


 

  

  左邊:馬騰躍 右邊:陳謀android

  

  左上:李劍鋒  左下:仉伯龍 右:盧惠明數據庫

團隊成員及博客:後端

    李劍鋒:        Blog:      http://www.cnblogs.com/Power-Byte/api

    陳謀:            Blog:        http://www.cnblogs.com/13061176Terry/服務器

    馬騰躍:         Blog:        http://www.cnblogs.com/summerMTY/
app

    盧惠民:         Blog:        http://www.cnblogs.com/lhm924/框架

    仉伯龍:         Blog:        http://www.cnblogs.com/zhangbolong/post

二、軟件工程介紹單元測試


 

項目目標:

    在線問答網站中散落着許多有價值的知識和有借鑑意義的經驗,然而對於一個不精通於信息檢索的人來講要尋找這些有價值的信息每每要耗費大量時間,甚至根本不能找到,故而本軟件在此需求的基礎上進行開發,以知足用戶對於信息檢索,信息篩選,信息翻譯,信息可視化等方面的需求。

預期的典型用戶:

  軟件的用戶方一方面是學霸在線教學問答系統後臺的開發人員,開發人員能夠經過軟件提供的接口來直接對於數據進行處理,開發人員具備專業計算機水平,

  軟件的用戶方另外一方面是普通用戶,本軟件將功能性的模塊進行集成與封裝而且提供UI接口服務於普通用戶對於信息檢索,信息篩選,信息翻譯,信息可視化等方面的需求。

預期的功能描述:

  軟件產品功能主要包括定義在線教學問答網站的內容結構,可以從爬到的內容中抽取元數據並將其歸入到既定的組織結構中,在用戶查詢時可以給予快速準確的響應,而且支持標籤,翻譯的功能。

  • 在線問答網站的內容結構定義;

    主要是對在線問答網站的組織進行格式化提取,(包括網站的用戶提出的問題,以及其餘用戶給出的相應的解決方式),而後按照既定的格式整理而且存儲到數據庫中。

  • 增量式的數據處理;

    對於後續爬取獲得的最新數據,可以按照定義好的內容結構準確地合併到已有的內容中。

  • 文本標籤;

    對於用戶提出的問題所屬的類別使用標籤進行分類。

  • 文本關鍵詞提取;

    對於問題中所涉及的主要內容以及術語進行分類提取。

  • 文本內容翻譯;

    知足基於不一樣語言背景的用戶蒐集檢索資料的需求。

  • 用戶界面與用戶進行交互。

    知足界面友好的要求,對於用戶來講易於上手,易於使用。

  • 給在線組和app手機客戶端組上傳數據

    當有需求的時候,咱們會給在線組上傳必定量的數據,因爲給網站上傳大量數據的時候會給網站服務器增長負擔,有時網站拒絕訪問,有時網站崩潰,因此每次咱們只上傳必定量的數據,從而讓上傳數據變得穩定。

預期用戶

  • 因爲咱們的應用是給學霸客戶端和在線系統使用,因此的目標就是給他們定時提供數據。

三、產品需求及反饋


 

 

需求

反饋
1.上傳數據(在線組、手機app組)

1.定義Json規格,定義上傳文件類型

2.經過Json向Solr這個搜索引擎後臺上傳數據

2.視頻文件(在線組)

1.向爬蟲組提出要求,而且定時進行交流。

2.效果不盡如人意

3.問答(在線組、手機app組)

1.剛開始用Stackoverflow的數據進行測試上傳

2.實現搜搜問問、百度知道、德問、cnblogs數據處理

4.對標籤進行定義(在線組)

1.經過stackoverflow的api對相應的標籤進行定義。

2.其餘標籤從文章中抽取。

5.標籤、關鍵詞結果分析(老師)

1.與學長的進行了相應的對比,從F值來看,咱們的測試效果比學長高17.8個百分點左右

6.兩個後端(老師)

1.將處理數據和上傳數據分紅兩部分,不一樣用戶能夠登錄不一樣後端進行相應的操做。

 

用戶評價:

在線組 數據可以用,可是上傳的數據太少
app組 數據如今能用的太少

 

四、預期目標以及實際狀況


 

預期目標

1.處理數量 60000條 上傳數量8000條

2.可以處理pdf、ppt、視頻、doc

3.問答網站:搜搜問問、百度知道、德問、cnblogs、stackoverflow、知乎

實際狀況

1.實際處理數量 55308條 上傳數量240條

2.實際能處理的文件pdf、ppt、小部分視頻

3.實際問答網站:搜搜問問、百度知道、德問、cnblogs、stackoverflow

 

  因爲後期時間緣由,咱們與在線組和app組的交流比較少,致使咱們在Json格式定義、測試方面比較緩慢;

視頻部分可以處理是由於咱們得到的文件不都是特別好,有些是由於視頻的相關文本數據太少,因此無法給其

添加標籤、關鍵字等重要搜索關鍵字。

五、分工協做


 

  我以爲一個PM在擔當總的設計、構建是不太好的,我真心的認爲兩個規劃能力好的同窗共同擔當效果會更好。

由於我在統籌規劃的同時真心地以爲自身能力的不足,沒法完美地擔任這個職責,因此我以爲至少有一我的監督會更好。

 

六、平衡 時間/質量/資源


 

時間
數據庫構建 陳謀 5
爬取Tags 陳謀 3
完成txt、html、pdf、ppt、doc(x)、xls(x)等常見文本的挖掘 陳謀 20
完成在線系統的需求分析及解答 馬騰躍 5
測試不一樣問答網站分析的結果 馬騰躍 12
UI 李劍鋒 8
完成stackoverflow網站的數據挖掘工做 李劍鋒 8
完成知乎網站的數據挖掘工做 李劍鋒 8
視頻連接挖掘 盧惠民 6
測試Tags的正確率、召回率、F值等 盧惠民 14
產品說明書 仉伯龍 8
與爬蟲組進行溝通交流分析 仉伯龍 8
完成與手機客戶端的需求交流,並實時更新需求 劉夕霆 6
對軟件進行詳細的功能測試 劉夕霆 16
質量 進行了單元測試
資源 咱們人力資源、物力資源都比較充足

 

七、軟件質量


 

 

對每個功能都進行了單元測試,雖然有些測試並不是徹底覆蓋,可是整體來講咱們的功能比較完善,並且bug比較少

 

 

八、M2階段的實際進展


 

九、團隊成員在M2的角色和具體貢獻


 

名字

角色

具體的可衡量的可驗證的貢獻

得分

陳謀

PM & Dev

寫了10篇博客,屢次和爬蟲組、客戶端、在線系統進行溝通,寫了 3213行代碼

90

李劍鋒

Dev & Test

寫了823行代碼,  200行註釋, 1篇博客 

60

盧惠明

Dev & Test

完成關鍵詞抽取,寫了495行代碼,並完成相應的測試,2篇博客

40

仉伯龍

 Dev & Test

 測試了關鍵詞抽取代碼,寫了235行代碼,測試其結果等

37

 劉夕霆

Dev & Test

 與android客戶端組進行溝通,寫了276行代碼,測試最終版本

35

 馬騰躍

 Dev & Test

 寫了276行代碼,與在線組進行溝通、交流

38

 

十、成果展現


 

  • 登錄界面

 

  • 主界面:

    

  • 添加文本:

  • 原始數據:

  • 去噪:

  • 分詞:

  • 翻譯原文本:(API)

  • 翻譯譯文:

  • 中英對照:

  • 最終結果:

 

  • 上傳數據

 

十一、軟件Bug


 

  咱們的軟件管理中遇到的Bug基本上在http://www.cnblogs.com/cheneygroup/p/5117810.html

 

十二、我的總結


 

    1. 李劍鋒:在Beta階段咱們完成了既定的目標,並且咱們經過不斷溝通,與另外三組一同構建了完整的框架,從而在工做的開展過程當中非常愉快。可是因爲時間的緣由,咱們沒可以完成既定的目標,這是咱們的遺憾!
    2. 陳謀:知識和能力都是在不斷地學習和鍛鍊中累積的,咱們在Beta階段這種高壓狀態下,仍堅持進行各項任務,咱們確實付出了,也確實收穫了,感謝軟工給予咱們不斷超越自個人。
    3. 盧惠明:這一階段我主要負責測試,雖然測試比較枯燥無味,可是確實是一項頗有用的技能。
    4. 劉夕霆:軟工,我實在不敢恭維。太累了,但願老師減負!。。。不過,我在這幾回團隊做業中收穫了不少不少,謝謝老師。
    5. 仉伯龍:我處理很多事情,可是我感受學的不是特別多。我相信只要咱們不斷進取,不斷探索,我必定可以學到更多,明白更多,最後在理論知識、實踐知識方面有了更高的認識。
    6. 馬騰躍:我是這組裏惟一的女生,交流起來真的不是特別方便,可是我仍然在盡職盡責地完成PM佈置下來的任務,總的來講這階段我測試任務不少,實質性的開發並非特別多。
相關文章
相關標籤/搜索