Alpha衝刺-第三天

1.1 今日完成任務狀況以及遇到的問題。

完成任務狀況

  • 杜世康:使用正則表達式對於彈幕文本中的數字,字母,符號,非法字符等過濾。
  • 劉丹,李玉瑩:實現主播管理功能
    正則表達式

  • 曹瑩雯,尹楠: 調用NLPIR/ICTCLAS分詞系統的Java API嘗試對彈幕進行分詞
  • 王靜雅 :管理員管理的實現
    blog

遇到的問題

  • 簡單的正則不能過濾色情,不文明用語等。如「臥槽」、「SB」、「草泥馬」等。

1.2 明天任務安排

截至目前已爬取彈幕11萬餘條數據,接下來的重點是對於彈幕文本的分析及及結果可視化table

  • 杜世康:垃圾彈幕的過濾處理
  • 劉丹:NLPIR/ICTCLAS分詞系統對於彈幕文本的處理
  • 李玉瑩:NLPIR/ICTCLAS分詞系統對於彈幕文本的處理
  • 曹瑩雯:NLPIR/ICTCLAS分詞系統對於彈幕文本的處理
  • 尹楠: NLPIR/ICTCLAS分詞系統對於彈幕文本的處理
  • 王靜雅:NLPIR/ICTCLAS分詞系統對於彈幕文本的處理,並撰寫明日Alpha衝刺博文

1.3 成員貢獻時間

任務 成員 任務量 完成時間
彈幕文本內容的過濾 杜世康 20% 4h
實現主播管理功能 劉丹 15% 2h
實現主播管理功能 李玉瑩 15% 2h
NLPIR/ICTCLAS分詞系統進行分詞 曹瑩雯 15% 2h
NLPIR/ICTCLAS分詞系統進行分詞 尹楠 15% 2h
管理員管理的實現 王靜雅 20% 2h

1.4 站立會議照片

相關文章
相關標籤/搜索