綜述:情感分析領域介紹及將來趨勢 - 知乎

本文提煉自「Beneath the Tip of the Iceberg: Current Challenges and New Directions in Sentiment Analysis Research」,做者:Soujanya Poria, Devamanyu Hazarika, Navonil Majumder, Rada Mihalcea
原文連接: https://arxiv.org/pdf/2005.00357

前言

情感分析的研究已經走過了近20年,它在市場,風險管理,市場研究和政治等各個領域都有普遍的商業應用。鑑於其在特定子任務(如情感極性分類)和數據集中的飽和度,人們有一個潛在的認識,即該領域已經成熟。本文討論了該領域現存的問題和還沒有發掘的研究方向,爲該領域將來的發展提供一些新思路。app

領域介紹

情感分析(也稱爲觀點挖掘)是一個旨在瞭解非結構化內容基本情感的研究領域。舉個例子,「John dislikes the camera of iPhone 7」[1],在這句話中John是一位觀點持有者,而且經過這句話反映了他對這個iphone相機的負面評價。情感分析經歷了很長的一個發展歷程,以下圖 Fig 3 所示。早期的情感分析首先是 Wiebe 等人[2, 3]對於句子中人爲主觀臆斷的分析,以後詞袋模型的思想出現以後,Turney[4]開創性地提出人們的文字評價內容根據其中的情感分爲不一樣的類別,其中他設計了幾種句法規則,以便處理。dom

事實上,情感分析領域也就是2000年左右的時候開始變得熱門的,由於領域裏相關任務逐漸被定義,人們受啓發想出了更多的處理方法,而且評價方法和細節也變多了。可是,人們後來發現,簡單地統計情感極性詞彙效果並很差,由於來自同一我的的情緒每每會有變化,可是常識上來講,咱們都會以最新的爲主,而詞袋模型相關方法忽略了這個。所以Polanyi等人[5, 6]提出了基於考慮上下文的情感分析方法,使得用戶的觀點情感變化軌跡獲得追蹤。以後,SentiWordNet[7]的提出給咱們提供了大量肯定情感極性的關鍵詞,這個字典裏的每一個詞彙都對應一種情感極性,積極或是消極,還有積極度和消極度的一個打分。再日後是情感特定的wording embedding[8, 9],這些都用到了機器學習的一些思想。以後就是深度學習的時代了,基於CNN, RNN還有BERT等技術,情感分析進入了新的時代,也遭遇了新的瓶頸。其中一方面是,不少情感分析任務及數據集的SOTA方法都已經達到了很是極高的效果,提高空間變得有限,情感分析的基礎任務已經沒有多大變化了。iphone


Fig 1 展現了目前SOTA方法在幾種熱門數據集中的效果。機器學習

展望將來

回顧過去的研究,主要是基於規則的、基於詞法的、藉助機器學習和深度學習的情感分析。咱們更感興趣的是將來還有什麼可挖掘的方向,可以繼續推進情感分析的發展。Fig 2 經過一個圖表,展現了本文做者猜測的將來可嘗試的方向。在此,咱們選擇其中幾個簡單提一提,第一個是把情感分析放到多模態處理任務之中,比方說文字結合圖像,文字結合視頻分析,經過圖像和視頻,咱們能察覺到人物的表情和神態,這些都提供了生動的情感態度。第二個是情感推理,好比找出情感態度相關的人物,而且考慮人物之間的相互做用。另外一個就是情感文字生成了,比方說共情對話系統,facebook近年恰好也提供了高質量的數據集[10]。第三個是對情感要素進行更細粒度的分析理解,以及提出這些新的情感分析評價方法。Fig 4和Fig 5舉出了幾個對話情感分析的例子。雖然情感分析做爲基礎任務已經顯得過期了,可是融入到近年熱門的對話系統、推薦系統中,有助於開發出更加智能化和人性化的服務產品。學習


總結

本文中做者總結了情感分析20多年來的發展歷程,提到了現存任務中遭遇的瓶頸,而且詳細討論了將來能夠進一步研究的新思路。本文認爲,情感分析還有不少有待解決的問題,當下對領域已經飽和的見解主要是過多的出版物體現的,目前的情感分析都還停留在表面,有待進一步研究。隨着時代的變化和技術的進步,將來有待進一步將情感分析研究落實到實際產品和科技服務之中。ui


參考資料

[1] Liu, B. Sentiment Analysis and Opinion Mining. Synthesis Lectures on Human Language Technologies. Morgan & Claypool Publishers, 2012.lua

[2] Wiebe, J. M. Tracking point of view in narrative. Computational Linguistics, 20(2):233–287, 1994.url

[3] Wiebe, J. M., Bruce, R. F., and O’Hara, T. P. Development and use of a gold-standard data set for subjectivity clas- sifications. In Proceedings of the 37th annual meeting of the Association for Computational Linguistics on Computational Linguistics, pp. 246–253. Association for Computational Linguistics, 1999.spa

[4] Turney, P. D. Thumbs up or thumbs down? semantic orien- tation applied to unsupervised classification of reviews. In Proceedings of the 40th Annual Meeting of the Association for Computational Linguistics, July 6-12, 2002, Philadelphia, PA, USA, pp. 417–424. ACL, 2002..net

[5] Polanyi, L. and Zaenen, A. Contextual valence shifters. In Computing attitude and affect in text: Theory and applications, pp. 1–10. Springer, 2006.

[6] Hu, M. and Liu, B. Mining and summarizing customer reviews. In Proceedings of the tenth ACM SIGKDD international conference on Knowledge discovery and data mining, pp. 168–177. ACM, 2004b.

[7] Esuli, A. and Sebastiani, F. SENTIWORDNET: A publicly available lexical resource for opinion mining. In Proceedings of the Fifth International Conference on Language Resources and Evaluation, LREC 2006, Genoa, Italy, May 22-28, 2006, pp. 417–422. European Language Resources Association (ELRA), 2006.

[8] Tang, D., Wei, F., Yang, N., Zhou, M., Liu, T., and Qin, B. Learning sentiment-specific word embedding for twitter sentiment classification. In Proceedings of the 52nd Annual Meeting of the Association for Computational Linguistics (Vol- ume 1: Long Papers), volume 1, pp. 1555–1565, 2014.

[9] Maas, A. L., Daly, R. E., Pham, P. T., Huang, D., Ng, A. Y., and Potts, C. Learning word vectors for sentiment analysis. In Proceedings of the 49th annual meeting of the association for computational linguistics: Human language technologies- volume 1, pp. 142–150. Association for Computational Linguistics, 2011.

[10] Hannah Rashkin, Eric Michael Smith, Margaret Li, and Y-Lan Boureau. 2019. Towards empathetic open-domain conversation models: A new benchmark and dataset. In Proceedings of the 57th Annual Meeting of the Association for Computational Linguis- tics, pages 5370–5381, Florence, Italy. Association for Computational Linguistics.

相關文章
相關標籤/搜索