上一章節就是NLP的背景,內容比較骨感,其實寫出來的每一個小標題,都是樹幹,值得去深刻學習,發展實戰,這樣也能夠枝繁葉茂。html
附註:如何打開ipynb後綴的文件,親測有效。https://www.jianshu.com/p/89999a6b2028git
一:安裝環境。函數
1.安裝Anaconda,說是Python的全家桶,但我不太明白和Python.exe的區別,感受像個文件夾,或者多功能包。學習
https://www.anaconda.com/distribution/ 下載最新的版本。測試
安裝步驟:https://blog.csdn.net/ITLearnHall/article/details/81708148.net
2.安裝IDE,能夠用ecilpse或者pycharm。(安裝pycharm不作介紹了,實在是安裝太多遍了)htm
3.須要將pycharm裏的編譯器什麼的設置成Anaconda。對象
具體步驟參考如下連接:https://www.cnblogs.com/pejsidney/p/9216470.htmlblog
二:按照上面的步驟和連接,我成功安裝了Anaconda和pycharm。ip
三字符串處理
1.strip()處理字符串左邊和右邊。rstrip()、lstrip()、strip(’特殊字符’)、find()、isalpha()、isdigit()這兩個是判斷某個字符串是否是全是字母或者全是數字。,這裏測試的時候碰見一個問題哈,對字符串的操做都不起做用,還覺得是少調用了某些包,致使函數沒有加載進來。後來發現不是。
緣由以下:
Python中的字符串爲不可變類型,則你對msg自己作strip()都是沒法更改的期原來的值,可是strip()會返回一個新的值,須要再次保存才能夠體現!
2.字符串的分割和聯合操做。
str.split( )切割完成後獲得一個list
str.join()按照特定符號拼接字符串中的各個元組的內容。
若是正式使用的時候,想知道針對於某個對象的全部函數,用help(str)能夠顯示全部的操做函數。