互聯網時代,人們天天都會經過網絡獲取大量信息。微信、微博、各類新聞客戶端......咱們不只在這些 APP 上瀏覽新聞,有時也會發表本身的看法。微信
做爲最受歡迎的社交應用之一,微博是不少人獲取信息的重要渠道,不少用戶天天在上面發表大量言論。一般狀況下,這些言論分爲兩類,一類是對客觀事件的描述,另外一類是主觀性描述。主觀性文本帶有做者的喜愛、厭惡等情感傾向。網絡
微博上的大量用戶積累豐富的語料數據。近年來,隨着天然語言處理技術的發展,利用海量的微博數據進行情感分析已成爲一項重要的研究課題。iphone
情感分析技術測試
情感分析(Sentiment Analysis)的研究始於 2003 年 Nasukawa 和 Yi 兩位學者關於商品評論的論文,其目標是從文本中分析出人們對於實體及其屬性所表達的情感傾向以及觀點,帶有強烈的我的主觀因素。編碼
做爲天然語言處理的子任務,根據處理文本粒度的不一樣,情感分析能夠分爲篇章級、句子級、詞語級 3 個研究層次:spa
篇章級:獲取整個文檔或者段落的情感。篇章級的情感分析有一個前提假設,那就是全篇所表達的觀點僅針對一個單獨的實體,且只包含一個觀點持有者的觀點。3d
句子級:得到單個句子的情緒。句子級分析與篇章級存在一樣的前提假設,也就是說一個句子只表達了一個觀點和一種情感,而且只有一個觀點持有人。blog
詞語級:得到句子中,詞語表達的情感。在實際的語言表達中,一個句子中可能包含了多個不一樣情感傾向的觀點,此時就須要進行詞語級分析。事件
情感分析有多種類型和風格,範圍從專一於極性(正面,負面,中立)到檢測情感和情緒(憤怒,快樂,悲傷等)或識別意圖(感興趣、不感興趣)。ip
據估計,世界上 80% 的數據都是非結構化的,沒有以預先定義的方式組織。 其中,大部分數據來自文本數據,如電子郵件、社交媒體、調查、文檔等。 這些文本一般難以分析、理解和分類。經過情感分析技術,能夠自動處理這些數據,提升團隊效率。所以,情感分析技術有着重要的研究價值。
情感分析應用普遍。在商品零售領域,經過對海量用戶的評價進行情感分析,能夠了解用戶訴求,及時進行反饋和改進;在輿情領域,分析人們對熱點事件的點評,有助於掌握輿論走向;在金融領域,對交易者對於股票等產品的態度進行情感分析,能夠爲交易行情提供參考。
微博立場檢測大賽
立場檢測是情感分析技術的熱門方向之一。近年來,微博立場檢測做爲一個有着極大研究價值的新興課題,引發了普遍的關注。爲了幫助同窗們提升本身,近日,AI 研習社微博立場檢測挑戰賽上線啦!
比賽簡介
本次微博立場檢測挑戰賽爲單人賽,比賽時間爲 3 月 13日—4 月 12 日。
比賽網址:https://god.yanxishe.com/44
參賽者的任務是判斷微博做者對某個話題是持何種立場。也就是說,參賽者須要對微博做者的立場進行分類,共有 3 種立場:FAVOR 支持,AGAINST 反對,NONE 二者都不是。
數據集
比賽數據集下載連接:https://static.leiphone.com/wb.zip
結果文件以下所示:
第一個字段位:測試集 ID(注意 ID 從 0 開始)
第二個字段:立場類別(FAVOR、AGAINST、NONE)
結果文件建議使用 UTF-8(BOM)編碼。
評分標準&獎金
AI 研習社將會對比選手提交的 csv 文件,確認正確識別樣本數。
True:模型分類正確數量
Total :測試集樣本總數量
本次比賽共設置 3 種獎項,獎金池 3000 元。獎金將在比賽後提現時發放到微信零錢。
參與獎(Participation Award)
金額:佔總獎金的 30%
獲獎人數:全部人(每人僅能得到一次參與獎)
獲獎條件:提交結果大於標準分,標準分=60
突破獎(Prizes)
金額:佔總獎金 20%
獲獎人數:全部人
排名獎(Ranking Award)
金額:佔總獎金 50%
獲獎人數:得分前 5 名
特別提醒:3 種獎項能夠同時帶回家!越早提交,突破分數越大,獎金越多哦~
獲取更多信息,能夠添加慕慕微信號:AIMOOC-XM,或者掃下面的二維碼:
再次敲黑板:報名網址是 https://god.yanxishe.com/44 。快來報名吧!
雷鋒網雷鋒網(公衆號:雷鋒網)雷鋒網
雷鋒網版權文章,未經受權禁止轉載。詳情見轉載須知。