一、要用python作數據分析,先得對python語言熟悉,推薦一本入門書 :笨方法學python (learn python the hard way),這本書用很是有趣的講述方式介紹了python的基本語法,很是適合非計算機專業做爲入門書來看。python
二、用python作數據分析的話,推薦用 anaconda,地址https://www.anaconda.com/download/ ,能夠根據須要選擇版本算法
三、後面須要添加各類包的時候,在開始-全部程序,打開Anaconda prompt,輸入 pip install package_name 命令,運行,就能夠完成安裝,這裏的package_name是須要安裝的包的名稱,好比,須要安裝 numpy ,能夠輸入 pip install numpy,點回車,就能夠了。機器學習
今天遇到一個問題,若是提示 :ide
You are using pip version 10.0.1, however version 18.0 is available.
You should consider upgrading via the 'python -m pip install --upgrade pip' command.學習
則說明pip版本過低,先按照提示輸入 python -m pip install --upgrade pip 升級pip,而後再次安裝所須要的包就行了。大數據
四、學完入門書以後,就須要針對性的學習如何用python作數據分析了,推薦一本書:利用python進行數據分析 ,這本書主要介紹了數據分析經常使用的幾個模塊:numpy、pandas、matplotlib,以及數據預處理須要的數據加載、清理、轉換、合併、重塑等等,建議從第4章開始看,看完後,再接着看前3章。不少新接觸的人從頭開始看容易一頭霧水,看不下去,接着就放棄了。ip
五、作數據挖掘必需要懂機器學習的各類算法,我比較推薦的一本也是很是有名的一本書:機器學習(周志華著、清華大學出版社),由於封皮和書中的例子多以西瓜爲例,因此別名西瓜書。數據分析
六、關於文本分析的一本很是好的書:數學之美,寫的很棒。數學
七、白話大數據與機器學習,剛讀完,通俗易懂。pandas
八、Python數據分析與數據化運營(宋天龍著),實例豐富,附代碼。