1.1 今日完成任務狀況以及遇到的問題。
完成任務狀況
- 杜世康:使用正則表達式對於彈幕文本中的數字,字母,符號,非法字符等過濾。
劉丹,李玉瑩:實現主播管理功能
正則表達式
- 曹瑩雯,尹楠: 調用NLPIR/ICTCLAS分詞系統的Java API嘗試對彈幕進行分詞
王靜雅 :管理員管理的實現
blog
遇到的問題
- 簡單的正則不能過濾色情,不文明用語等。如「臥槽」、「SB」、「草泥馬」等。

1.2 明天任務安排
截至目前已爬取彈幕11萬餘條數據,接下來的重點是對於彈幕文本的分析及及結果可視化table
- 杜世康:垃圾彈幕的過濾處理
- 劉丹:NLPIR/ICTCLAS分詞系統對於彈幕文本的處理
- 李玉瑩:NLPIR/ICTCLAS分詞系統對於彈幕文本的處理
- 曹瑩雯:NLPIR/ICTCLAS分詞系統對於彈幕文本的處理
- 尹楠: NLPIR/ICTCLAS分詞系統對於彈幕文本的處理
- 王靜雅:NLPIR/ICTCLAS分詞系統對於彈幕文本的處理,並撰寫明日Alpha衝刺博文
1.3 成員貢獻時間
彈幕文本內容的過濾 |
杜世康 |
20% |
4h |
實現主播管理功能 |
劉丹 |
15% |
2h |
實現主播管理功能 |
李玉瑩 |
15% |
2h |
NLPIR/ICTCLAS分詞系統進行分詞 |
曹瑩雯 |
15% |
2h |
NLPIR/ICTCLAS分詞系統進行分詞 |
尹楠 |
15% |
2h |
管理員管理的實現 |
王靜雅 |
20% |
2h |
1.4 站立會議照片
