ref:https://www.zhihu.com/question/19895141html
何晗入門NLP,讀過的經典書有:《統計天然語言處理》(宗成慶 著)(對應語言學知識)、《統計學習方法》(李航 著)(對應人工智能知識),《挑戰程序設計競賽》(秋葉拓哉、鹽田陽1、北川宜稔 著)(對應計算機算法知識)。不過,在看經典書籍的過程當中,他發現,學習天然語言處理並不須要徹底把這幾本書看透,最好是能夠邊看書邊作項目。這些書都是很是牛的好書,然而惋惜的是,看完書中的章節,不知該如何應用其中的知識點,即便實現了文章中提到的模型,也很難直接將其運用於工程項目。想必不少初學者都面臨相似的學習困惑。爲了解決這個問題,何晗動手寫了《天然語言處理入門》,目的就是但願學習者看完一章後,即可以將知識點直接用於項目,適合NLP初學者入門並快速佈置到生產環境中。成效快,痛苦小,疑問少。何晗在《天然語言處理入門》一書中,以本身的HanLP開源項目爲案例,代碼對照公式講解每個算法每個模型,讓入門者帶着工程思惟理解NLP的知識要點,試圖在目前市面上艱深晦澀的教科書和簡單的入門書之間做出平衡。python
https://github.com/hankcs/HanLP
1)《數學之美》(吳軍)
這是我看的第一本關於NLP的書。如今第二版出來了,貌似新增了兩章內容,還沒看過。初版寫的挺好,科普性質。看完對於nlp的許多技術原理都有了一點初步認識。如今沒事還會翻翻的。
2)《天然語言處理簡明教程》(馮志偉)
馮志偉老師這本書,偏向於語言學,書略厚。關於語言學的東西不少。都是很容易理解的東西。建議沒有學過理工科們翻一翻,畢竟nlp這東西將來趨勢可能會融合很多語言學的東西。
3)《天然語言處理綜論》(Daniel Jurafsky)
這本書也是馮志偉老師翻譯的,翻譯的挺棒,看了差很少一半。綜論性質的,選感興趣的章節翻翻就行。做者是Daniel Jurafsky,在coursera上面有他的課程,後面視頻篇裏集中談。
4)《天然語言處理的形式模型》(馮志偉)
這本書仍是馮志偉老師寫的。很佩服馮志偉老師,文理兼修,並且都很厲害。內允許可能是從他之前的著做裏面摘取的。算是一本各類語言模型和統計模型的大集合吧。放在桌面,沒事翻翻也能是極好的。
5)《統計天然語言處理(第2版)》(宗成慶)
這本書我以爲寫的不錯。雖然我是語言學背景,但讀起來也沒有太吃力。它也是綜論性質的,能夠跳着看。
6)《統計學習方法》(李航)
天然語言處理須要些機器學習的知識。我數學基礎仍是太薄弱,有的內容仍是有些吃力和困惑的。
7)《機器學習實戰》哈林頓 (Peter Harrington)、
《Python天然語言處理》 、
《集體智慧編程》這些書都是python相關的。中間那本就是將NLTK的。網上都有電子版,須要的時候翻一番看一看就行。