1、什麼是gensim
gensim是一個python的科學庫,gensim包含了TF-IDF、隨機投影、word2vec和document2vec算法的實現,分層Dirchlet過程(HDP),潛在語義分析(LSA)和潛在Dirichlet分配(LDA),包括分佈式並行版本。主要是用來主題建模、文檔索引以及使用大規模語料數據的類似性檢索,被做者稱爲「根據純文本進行監督性建模最健壯、最有效的、最讓人放心的軟件」。
2、gensim安裝的注意事項
gensim能夠安裝在Windows、Linux和Mac OS以及其餘的平臺,可是它須要依賴python和numpy以及scipy,以下圖
至於numpy和scipy的安裝咱們能夠直接安裝一個anaconda就能夠了,它也是python的一個科學計算庫,它包含了python經常使用的科學計算庫。
3、安裝步驟
一、在安裝anaconda以後,找到anaconda的安裝路徑,將anaconda下的scripts目錄添加到,計算機-->屬性-->高級系統設置-->高級-->環境變量-->系統變量-->找到path變量,將C:\Users\15053\Anaconda3\Scripts添加到path中,這個目錄是我安裝anaconda的目錄,根據本身電腦的安裝目錄進行配置。
二、windows+r-->輸入cmd-->輸入python,若是出現以下圖的提示說明配置成功了
三、找到anaconda的安裝目錄,在箭頭指示的欄中輸入cmd,而後打開命令提示符界面以後,輸入pip install gensim安裝gensimpython
四、輸入命令能夠安裝gensim,發現出現異常,緣由爲pip版本不正常,按照提示升級算法
五、從新安裝gensimwindows
六、驗證gensim是否安裝成功,打開cmd輸入python以後,而後在輸入import gensim,出現下圖同樣,就表示安裝成功了
特別提醒:若是,安裝完成以後發現import gensim沒有問題,可是使用from gensim import word2vec時報錯時,這裏有點疑問。安裝成功的標誌是你能夠在代碼裏作下面的import而不出錯:from gensim.models import word2vec
分佈式