https://study.163.com/course/courseMain.htm?courseId=1006383008&share=2&shareId=400000000398149(博主錄製)數組
1 數據切片選取
1.1 pandas.DataFrame.sample 隨機選取若干行
1.1.1 功能說明
有時候咱們只須要數據集中的一部分,並不須要所有的數據。這個時候咱們就要對數據集進行隨機的抽樣。pandas中自帶有抽樣的方法。dom
功能類似:numpy.random.choice
Generates a random sample from a given 1-D numpy array.ide
1.1.2 使用說明
1. 函數名及功能
DataFrame.sample(n=None, frac=None, replace=False, weights=None, random_state=None, axis=None)[source]函數
2. 輸入參數說明視頻
參數名稱 參數說明 舉例說明
n 要抽取的行數
df.sample(n=3,random_state=1)
提取3行數據列表
注意,使用random_state,以確保可重複性的例子。htm
frac
抽取行的比例
例如frac=0.8,就是抽取其中80%。對象
df.sample(frac=0.8, replace=True, random_state=1)
replace
是否爲有放回抽樣,
True:有放回抽樣
False:未放回抽樣blog
True:取行數據後,能夠重複放回後再取
False:取行數據後不放回,下次取其它行數據
注意:當N>總數據容量,replace設置爲值時有效索引
weights
字符索引或機率數組get
axis=0:爲行字符索引或機率數組
axis=1:爲列字符索引或機率數組
random_state
int: 隨機數發生器種子
或numpy.random.RandomState
random_state=None,取得數據不重複
random_state=1,能夠取得重複數據
axis
選擇抽取數據的行仍是列
axis=0:抽取行
axis=1:抽取列
也就是說axis=1時,在列中隨機抽取n列,在axis=0時,在行中隨機抽取n行。
3. 返回值說明
返回選擇的N行元素的DataFrame對象。
https://study.163.com/provider/400000000398149/index.htm?share=2&shareId=400000000398149(博主視頻教學主頁)