本次入門系列將使用Python做爲開發語言。要使用Python語言,咱們先來搭建Python開發平臺。咱們將基於Python 2.7版本、以及Python的開發發行版本Anaconda版原本開發。python
Anaconda指的是一個開源的Python發行版本,其包含了conda、Python等180多個科學包及其依賴項。編程
下載地址:數組
https://www.anaconda.com/distribution/,注意要下載2.7版本函數式編程
下載好Anaconda安裝包後,便可安裝,安裝好後,咱們能夠來測試下Python環境是否已經搭建好。函數
本小節將簡單介紹Python語言,此處不會涉及過多的Python語言細節。例如:面向對象之類。此處主要介紹後續學習數據挖掘過程當中會使用到的語法。工具
此案例將在控制檯上打印 Hello, Python。學習
一、建立一個文本文件,並命名爲hello_python.py測試
二、編寫如下內容spa
# 打印字符串 print 'hello, python'
三、在命令行中執行命令 python hello_python.py命令行
Python中支持多重賦值
# -*- coding: utf-8 -* # 多重賦值 zhangsan, lisi, wangwu = u'張三', u'李四', u'王五' print zhangsan, lisi, wangwu
注意:
- 在python中要使用中文,須要在文件頭上加入 # -*- coding: utf-8 –*
- 字符串應該使用 u開頭
python條件判斷可使用 if …. elif … else,但邏輯條件使用 and、or。Python通常不使用花括號,而使用縮進對齊來做爲區分。參考如下代碼:
''' 案例三: 定義變量 username 和 password 1. 若是 username 爲 abc,且password爲 123, 打印 正確 2. 若是 username 不爲 abc,打印用戶名錯誤 3. 若是 password 不爲 123,打印密碼錯誤 ''' username = 'abc' password = '123' if username == 'abc' and password == '123': print u'正確' else: if username != 'abc': print u'用戶名錯誤' else: print u'密碼錯誤'
# 打印 1-10之間的數字 for i in range(1, 11): print i
在Python可使用def或者lambda表達式來定義函數:
# 定義一個函數計算兩個數字的和 def add(a, b): return a + b # 調用函數 print add(1, 1) print '==' * 10 # 使用 lambda表達式定義函數 add_lambda = lambda x,y: x + y print add_lambda(1, 1)
如下代碼演示列表、元組、字典的使用
# 定義列表 list1 = [1,2,3,4,5] # 定義元組 tuple1 = (1,2,3,4) # 定義字典 dict1 = {'zhangsan':20, 'lisi': 30} print list1 print tuple1 print dict1
注意:元組的元素是不能夠被修改的。
可使用 []來訪問集合的元素
Python支持函數式編程,編寫起來也很方便
# 函數式編程 # 1. 初始化一個集合,包含數字從1-10 list2 = range(1, 11) # 2. 對每個數字 +1 list3 = map(lambda n:n+1, list2) print list3 # 3. 過濾集合中全部可以整除2的數字 list4 = filter(lambda n: n%2==0, list2) print list4
Python中須要使用到外部的函數,可使用import關鍵字來導入庫函數
# 導入庫 import math print math.pi print math.sin(1) # 給math庫取一個別名 import math as m print m.pi
要使用Python進行數據挖掘開發,須要提早安裝第三方庫。Python中有很是豐富的第三方庫。使用如下方式能夠很是簡便地安裝第三方庫。
使用pip安裝。如下將演示使用pip來安裝各種數據分析工具。
Numpy
Numpy實現了真正的數組功能。不少高級的庫都依賴該庫。咱們可使用pip來安裝它。
pip install numpy