以下,chapter4 是個概覽,以後纔是具體講解。html
Python programs can be decomposed into modules, statements, expressions, and objects, as follows: express
1. Programs are composed of modules. 數組
2. Modules contain statements. app
3. Statements contain expressions. dom
4. Expressions create and process objects.ide
Python’s Core Data Types函數
from enum import Enum
# 定義 Month = Enum('Month', ('Jan', 'Feb', 'Mar', 'Apr', 'May', 'Jun', 'Jul', 'Aug', 'Sep', 'Oct', 'Nov', 'Dec'))
# 遍歷 for name, member in Month.__members__.items(): print(name, '=>', member, ',', member.value)
from enum import Enum, unique @unique class Weekday(Enum): Sun = 0 # Sun的value被設定爲0 Mon = 1 Tue = 2 Wed = 3 Thu = 4 Fri = 5 Sat = 6
Python 3.5.2 |Anaconda custom (64-bit)| (default, Jul 2 2016, 17:53:06)
[GCC 4.4.7 20120313 (Red Hat 4.4.7-1)] on linux
Type "help", "copyright", "credits" or "license" for more information.
>>> len(str(2**1000))
>>> 2**1000
>>> 2**10000 # Are you serious?
In [92]: decimal.Decimal(str(1/3)) Out[92]: Decimal('0.3333333333333333') In [93]: decimal.Decimal(1/3) Out[93]: Decimal('0.333333333333333314829616256247390992939472198486328125')
>>> 1 / 3 # Floating-point (add a .0 in Python 2.X) 0.3333333333333333 >>> (2/3) + (1/2) 1.1666666666666665
>>> import decimal # Decimals: fixed precision >>> d = decimal.Decimal('3.141') >>> d + 1 Decimal('4.141')
>>> decimal.getcontext().prec = 2 // 精度設置 >>> decimal.Decimal('1.00') / decimal.Decimal('3.00') // 小數計算 Decimal('0.33')
>>> from fractions import Fraction # Fractions: numerator+denominator >>> f = Fraction(2, 3) >>> f + 1 Fraction(5, 3) >>> f + Fraction(1, 2) Fraction(7, 6)
In [2]: (2.55).as_integer_ratio() Out[2]: (2871044762448691, 1125899906842624) # 精算?哈哈~
更是有專業的庫提供方案 純數計算,可能有必要單獨篇章總結。
import math import random
import statistics
import numpy as np
The math
module gives access to the underlying C library functions for floating point math:
>>> import math >>> math.cos(math.pi / 4) 0.70710678118654757 >>> math.log(1024, 2) 10.0
The random
module provides tools for making random selections:
>>> import random >>> random.choice(['apple', 'pear', 'banana']) 'apple' >>> random.sample(range(100), 10) # sampling without replacement [30, 83, 16, 4, 8, 81, 41, 50, 18, 33] >>> random.random() # random float 0.17970987693706186 >>> random.randrange(6) # random integer chosen from range(6) 4
The statistics
module calculates basic statistical properties (the mean, median, variance, etc.) of numeric data:
>>> import statistics >>> data = [2.75, 1.75, 1.25, 0.25, 0.5, 1.25, 3.5] >>> statistics.mean(data) 1.6071428571428572 >>> statistics.median(data) 1.25 >>> statistics.variance(data) 1.3720238095238095
NumPy’s array class is called ndarray. 若干例子:
# 初始化
>>> import numpy as np
# (1) 描述型初始化 >>> a = np.arange(15).reshape(3, 5) >>> a array([[ 0, 1, 2, 3, 4], [ 5, 6, 7, 8, 9], [10, 11, 12, 13, 14]])
# (2) 直接賦值初始化
a = np.array([2,3,4]) # 一維
b = np.array([(1.5,2,3), (4,5,6)]) # 多維
# (3) 制定初始化
np.zeros( (3,4) ) # 多維
np.ones( (2,3,4), dtype=np.int16 ) # 多維
np.empty( (2,3) ) # 多維
np.arange( 10, 30, 5 ) # 一維:均勻點-間隔法
np.linspace( 0, 2, 9 ) # 一維:均勻點-個數法
# 形狀和維度
>>>a.shape (3, 5) >>>a.ndim 2
>>> a.size 15
# 內部成員屬性
>>> type(a) <type 'numpy.ndarray'>
>>> a.dtype.name
>>> a.itemsize
>>> import numpy as np >>> a = np.arange(15).reshape(3,5) >>> a array([[ 0, 1, 2, 3, 4], [ 5, 6, 7, 8, 9], [10, 11, 12, 13, 14]]) >>> b = np.arange(15).reshape(3,5) >>> a*b array([[ 0, 1, 4, 9, 16], [ 25, 36, 49, 64, 81], [100, 121, 144, 169, 196]])
all, any, apply_along_axis, | 矩陣對比,元素全同樣 | 只要有一個同樣 | lamdba 處理某維元素 | ||
argmax, argmin, argsort, average, bincount, | 第幾維的最大值 | 第幾維的最小值 | 某一維排序 | 某一維均值 | 基數排序 |
ceil, clip, conj, corrcoef, cov, | 取右 "天花板" | 設置「左右天花板」 | 求共軛 | 協方差[-1, 1] | 協方差 |
cross, cumprod, cumsum, diff, dot, | 向量積 | 累積乘 | 累計加 | 相鄰元素差值 | 點積 |
floor, inner, inv, lexsort, max, | 取左 "地板」 | 相似「點積」 | 逆矩陣 | 向量排序 | 向量中的最大值 |
maximum, mean, median, min, minimum, | 向量中元素與一個值的最大值 | mean |
median | 向量中的最小值 | 向量中元素與一個值的最小值 |
nonzero, outer, prod, re, round, | 非零元素的全部座標 | 向量1的各元素與向量2相乘 | 元素的乘積 | 正則 | 四捨五入 |
sort, std, sum, trace, transpose, | 按照某一個維度排序 | 計算全局標準差 | 某維度求和 | 對角線元素的和 | 矩陣轉置 |
var, vdot, vectorize, where | 方差 | 點積 | 將函數向量化: lamdba | 符合某一條件的下標函數 |
Here is a list of some useful NumPy functions and methods names ordered in categories. See Routines for the full list.
Array Creation | arange, array, copy, empty, empty_like, eye, fromfile, fromfunction, identity, linspace, logspace, mgrid, ogrid, ones, ones_like, r, zeros, zeros_like |
Conversions | ndarray.astype, atleast_1d, atleast_2d, atleast_3d, mat |
Manipulations | array_split, column_stack, concatenate, diagonal, dsplit, dstack, hsplit, hstack, ndarray.item, newaxis, ravel, repeat, reshape, resize, squeeze, swapaxes, take, transpose, vsplit,vstack |
Questions | all, any, nonzero, where |
Ordering | argmax, argmin, argsort, max, min, ptp, searchsorted, sort |
Operations | choose, compress, cumprod, cumsum, inner, ndarray.fill, imag, prod, put, putmask, real, sum |
Basic Statistics | cov, mean, std, var |
Basic Linear Algebra | cross, dot, outer, linalg.svd, vdot |
#coding:utf-8 import numpy as np a=np.array([[1,2,3],[4,5,6]]) print(a.shape) #(2,3) print(a[:][0]) #這樣寫,不管先後,只遍歷第一行 print(a[0][:]) print(a[:][1]) print(a[1][:]) ############################ print(a[:,0]) #這樣寫纔是遍歷第一列,先後有區別 print(a[0,:]) print(a[:,1]) print(a[1,:]) print(a[:,2]) ############################ print(a[0:3][0]) #[:]範圍明明是3個,拆開寫就不對,要符合實際狀況 print(a[0][0]) print(a[1][0])
>>> a[:6:2] = -1000 # equivalent to a[0:6:2] = -1000; from start to position 6, exclusive, set every 2nd element to -1000 >>> a array([-1000, 1, -1000, 27, -1000, 125, 216, 343, 512, 729])
list2d = [[1,2,3],[4,5,6]] sum = 0 for i in range(len(list2d)): for j in range(len(list2d[0])): sum += list2d[i][j]
list2d = [[1,2,3],[4,5]] sum = 0 for i in list2d: for j in i: sum += j
# np.floor取整
>>> a = np.floor(10*np.random.random((3,4))) >>> a array([[ 2., 8., 0., 6.], [ 4., 5., 1., 1.], [ 8., 9., 3., 6.]]) >>> a.shape (3, 4)
math.trunc(-2.5) 更人性化,return -2; 而不是floor的-3。
>>> a.ravel() # returns the array, flattened array([ 2., 8., 0., 6., 4., 5., 1., 1., 8., 9., 3., 6.])
>>> a.reshape(6,2) # returns the array with a modified shape array([[ 2., 8.], [ 0., 6.], [ 4., 5.], [ 1., 1.], [ 8., 9.], [ 3., 6.]]) ----------------------------------------------------------------------- >>> a.resize((2,6)) # this method modifies the array itself! >>> a array([[ 2., 8., 0., 6., 4., 5.], [ 1., 1., 8., 9., 3., 6.]])
>>> a.T # returns the array, transposed array([[ 2., 4., 8.], [ 8., 5., 9.], [ 0., 1., 3.], [ 6., 1., 6.]]) >>> a.T.shape (4, 3) >>> a.shape (3, 4)
Stacking together different arrays.
>>> a = np.floor(10*np.random.random((2,2))) >>> a array([[ 8., 8.], [ 0., 0.]]) >>> b = np.floor(10*np.random.random((2,2))) >>> b array([[ 1., 8.], [ 0., 4.]])
>>> np.vstack((a,b)) # 第一維度的粘結,更深 array([[ 8., 8.], [ 0., 0.], [ 1., 8.], [ 0., 4.]])
>>> np.hstack((a,b)) # 第二維度的對接,更寬 array([[ 8., 8., 1., 8.], [ 0., 0., 0., 4.]])
column_stack & row_stack.
>>> np.hstack([np.array([1, 2, 3]), np.array([4, 5, 6])]) array([1, 2, 3, 4, 5, 6]) >>> np.column_stack([np.array([1, 2, 3]), np.array([4, 5, 6])]) # 按照列的順序,各自拿出一個,組合在一塊兒 array([[1, 4], [2, 5], [3, 6]])
>>> np.vstack([np.array([1, 2, 3]), np.array([4, 5, 6])]) array([[1, 2, 3], [4, 5, 6]]) >>> np.row_stack([np.array([1, 2, 3]), np.array([4, 5, 6])]) # 按照行的順序,各自拿出一個,組合在一塊兒 array([[1, 2, 3], [4, 5, 6]])
>>> from numpy import newaxis
>>> a = np.array([4.,2.]) >>> b = np.array([2.,8.])
>>> a[: ,newaxis] # This allows to have a 2D columns vector array([[ 4.], [ 2.]]) # 可見,自增長了維度的效果
>>> np.column_stack((a[:,newaxis],b[:,newaxis])) // 兩個一維數組的合併和兩個數字合併,本質上是同樣的:由於一個數字其實就是「默認一維」 array([[ 4., 2.], [ 2., 8.]])
>>> np.vstack((a[:,newaxis],b[:,newaxis])) # The behavior of vstack is different array([[ 4.], [ 2.], [ 2.], [ 8.]])
注意:能夠經過定義 「分割點」 來分割高維矩陣。
Splitting one array into several smaller ones.
>>> a = np.floor(10*np.random.random((2,12))) >>> a array([[ 9., 5., 6., 3., 6., 8., 0., 7., 9., 7., 2., 7.], [ 1., 4., 9., 2., 2., 1., 0., 6., 2., 2., 4., 0.]]) >>> np.hsplit(a,3) # Split a into 3 [array([[ 9., 5., 6., 3.], [ 1., 4., 9., 2.]]),
array([[ 6., 8., 0., 7.], [ 2., 1., 0., 6.]]),
array([[ 9., 7., 2., 7.], [ 2., 2., 4., 0.]])]
>>> np.hsplit(a, (3,4)) # Split a after the third and the fourth column 看樣子像是"分割點" [array([[ 9., 5., 6.], [ 1., 4., 9.]]), array([[ 3.], [ 2.]] ), array([[ 6., 8., 0., 7., 9., 7., 2., 7.], [ 2., 1., 0., 6., 2., 2., 4., 0.]])] >>> np.vsplit(a,(3,4)) [array([[ 2., 9., 0., 4., 3., 2., 8., 0., 6., 2., 0., 4.], [ 8., 0., 5., 3., 4., 9., 5., 0., 3., 4., 4., 5.]]), array([], shape=(0, 12), dtype=float64), array([], shape=(0, 12), dtype=float64)]
>>> x = np.arange(8.0)
>>> np.split(x, [3, 5, 6, 10]) [array([ 0., 1., 2.]), array([ 3., 4.]), array([ 5.]), array([ 6., 7.]), array([], dtype=float64)]
其餘:numpy.array_split 【彷佛用處不大】
No Copy at All, 引用
>>> b = a # no new object is created >>> id(a) # id is a unique identifier of an object
雖 id 不一樣,但base指向對方。
>>> c = a.view() >>> c is a False >>> c.base is a # c is a view of the data owned by a <---- 理解這句話! True
>>> c.flags.owndata False
>>> c.shape = 2,6 # a's shape doesn't change >>> a.shape (3, 4) >>> c[0,4] = 1234 # a's data changes >>> a array([[ 0, 1, 2, 3], [1234, 5, 6, 7], [ 8, 9, 10, 11]])
>>> d = a.copy() # a new array object with new data is created >>> d is a False >>> d.base is a # d doesn't share anything with a False >>> d[0,0] = 9999 >>> a array([[ 0, 10, 10, 3], [1234, 10, 10, 7], [ 8, 10, 10, 11]])
#均勻分佈 np.random.rand(2,5) // shape #正態分佈 np.random.randn(1,10) // shape #均勻分佈 - 半開半閉區間 - 整數 【nice】 np.random.randint(2, 5, 10) // interval np.random.randint(2, 5, (6,6)) // interval #均勻分佈 - 閉區間 - 整數 【nice】 np.random.random_integers(2, 5, 10) #均勻分佈 - 半開半閉區間 - 百分比 np.random.random_sample((6,6)) #均勻分佈 - 閉區間 - 整數 np.random.choice(10, 5)
random.beta(a,b,size):從 Beta 分佈中生成隨機數。 random.binomial(n, p, size):從二項分佈中生成隨機數。 random.chisquare(df,size):從卡方分佈中生成隨機數。 random.dirichlet(alpha,size):從 Dirichlet 分佈中生成隨機數。 random.exponential(scale,size):從指數分佈中生成隨機數。 random.f(dfnum,dfden,size):從 F 分佈中生成隨機數。 random.gamma(shape,scale,size):從 Gamma 分佈中生成隨機數。 random.geometric(p,size):從幾何分佈中生成隨機數。 random.gumbel(loc,scale,size):從 Gumbel 分佈中生成隨機數。 random.hypergeometric(ngood, nbad, nsample, size):從超幾何分佈中生成隨機數。 random.laplace(loc,scale,size):從拉普拉斯雙指數分佈中生成隨機數。 random.logistic(loc,scale,size):從邏輯分佈中生成隨機數。 random.lognormal(mean,sigma,size):從對數正態分佈中生成隨機數。 random.logseries(p,size):從對數系列分佈中生成隨機數。 random.multinomial(n,pvals,size):從多項分佈中生成隨機數。 random.multivariate_normal(mean, cov, size):從多變量正態分佈繪製隨機樣本。 random.negative_binomial(n, p, size):從負二項分佈中生成隨機數。 random.noncentral_chisquare(df,nonc,size):從非中心卡方分佈中生成隨機數。 random.noncentral_f(dfnum, dfden, nonc, size):從非中心 F 分佈中抽取樣本。 random.normal(loc,scale,size):從正態分佈繪製隨機樣本。 random.pareto(a,size):從具備指定形狀的 Pareto II 或 Lomax 分佈中生成隨機數。 random.poisson(lam,size):從泊松分佈中生成隨機數。 random.power(a,size):從具備正指數 a-1 的功率分佈中在 0,1 中生成隨機數。 random.rayleigh(scale,size):從瑞利分佈中生成隨機數。 random.standard_cauchy(size):從標準 Cauchy 分佈中生成隨機數。 random.standard_exponential(size):從標準指數分佈中生成隨機數。 random.standard_gamma(shape,size):從標準 Gamma 分佈中生成隨機數。 random.standard_normal(size):從標準正態分佈中生成隨機數。 random.standard_t(df,size):從具備 df 自由度的標準學生 t 分佈中生成隨機數。 random.triangular(left,mode,right,size):從三角分佈中生成隨機數。 random.uniform(low,high,size):從均勻分佈中生成隨機數。 random.vonmises(mu,kappa,size):從 von Mises 分佈中生成隨機數。 random.wald(mean,scale,size):從 Wald 或反高斯分佈中生成隨機數。 random.weibull(a,size):從威布爾分佈中生成隨機數。 random.zipf(a,size):從 Zipf 分佈中生成隨機數。