【譯】技能測試解決方案:Python中的數據科學(三)

本文是譯文,能夠轉載,但需註明出處,點擊這裏能夠獲取原文,有刪減。
本系列博文包含四篇文章:
【譯】技能測試解決方案:Python中的數據科學(一)——Q1-Q15
【譯】技能測試解決方案:Python中的數據科學(二)——Q16-Q30
【譯】技能測試解決方案:Python中的數據科學(三)——Q31-Q45
【譯】技能測試解決方案:Python中的數據科學(四)——A1-A45及其解釋segmentfault

Q31
圖片描述
下列哪行代碼能夠把 「Date_time_of_event」 變量中的日期替換爲當月第一天的日期?app

A - train['Date_time_of_event'] = train.Date_time_of_event.apply(lambda x: x.replace(day=1))
B - >>> train['month'] = train.Date_time_of_event.dt.month; train['year'] = train.Date_time_of_event.dt.year
    >>> train['day'] = 1
    >>> train['Date_time_of_event'] = train.apply(lambda x:pd.datetime.strptime("{0} {1} {2}".format(x['year'],x['month'], x['day']), "%Y %m %d"),axis=1)
C - A和B都可以
D - 以上選項都不能

Q32
圖片描述
上述數據集提供每日必需品費用,下列哪行代碼能夠彙總出天天的累計成本?測試

A - a.sumcum(axis=0)
B - a.cumsum(axis=1)
C - a.sumcum(axis=1)
D - a.cumsum(axis=0)

Q33
圖片描述
圖片描述spa

給定訓練集,學生集和實習集3個數據集,咱們須要合併這些數據集,使得合併後的訓練數據必須具備來自學生集的學生信息和來自實習集的實習信息。3d

train=pd.merge(train,internship,on=’_____’,how=’____’)
train=pd.merge(train,student,on=’_____’,how=’____’)

爲了實現上述需求,須要補充以下代碼:rest

A - Student_ID, outer, Internship_ID, inner
B - Internship_ID, right, Student_ID, inner
C - Internship_ID, inner, Student_ID, under
D - Internship_ID, inner, Student_ID, inner

Q34
圖片描述
上述數據集中,存在重複行。在關聯該數據集時,重複行會帶來必定的困擾,爲了不這個困擾,咱們只保留重複數據第一個出現的樣本。code

student.______(subset=[‘Student_ID’],keep=_____,inplace=____)

爲了實現上述需求,須要補充哪些代碼?orm

A - drop_same, first, True
B - drop_duplicates, first, False
C - drop_same, last, True
D - drop_duplicates, first, True

Q35
圖片描述blog

下列哪行代碼能夠提取上述字符串中的郵箱地址?圖片

A - match=re.search(r"\w+@\w+",string)
B - match=re.findall(r"[\w._]+@[\w.]+",string)
C - match=re.purge(r"[\w._]+@[\w.__]+",string)
D - match=re.compile(r"[\w._]@[\w.]",string)

Q36
圖片描述

下列哪行代碼能夠刪除「sleep」行的數據?

A - train.drop("sleep", axis=1)
B - train.dropna("sleep", axis=1)
C - train.drop("sleep", axis=0)
D - 以上選項都不能

Q37
圖片描述

train=train.drop(['Preferred_location','Minimum_Duration'],___________)

上述代碼須要添加哪些代碼才能實現把'Preferred_location'變量和'Minimum_Duration'變量從測試集中刪除?

A - axis=0
B - axis=1
C - inplace=True
D - inplace=False

Q38
圖片描述
圖片描述
上述數據集是San Fransisco地區不一樣犯罪類型的訓練數據集。
下列哪行代碼能夠繪製不一樣類型犯罪總數的直方圖?

A - train.Category.plot(kind='bar')
B - train.Category.hist()
C - train.Category.value_counts().plot(kind='bar')
D - 以上選項都不能

Q39
圖片描述
下列哪行代碼能夠繪製出上述數據集中「Credit_History」變量和「Loan_Status」變量的堆疊條形圖?

A - train.unstack().plot(kind='bar',stacked=True, color=['red','blue'], grid=False)
B - train.restack().plot(kind='bar',stacked=True, color=['red','blue'], grid=False)
C - train.restack().plot(kind='bar',stacked=False, color=['red','blue'], grid=False)
D - 以上選項都不能

Q40
圖片描述

下列代碼能夠繪製出「temp」變量和「atemp」變量之間的散點圖:

plt.scatter(train.temp,train.atemp,alpha=1,c='b',s=20)

如何修改上述代碼,以實現總數越多,顏色則越深?

A - plt.scatter(train.temp,train.atemp,alpha=1,c=train.Count.value_counts,s=20)
B - plt.scatter(train.temp,train.atemp,alpha=1,c=train.Count,s=20)
C - plt.scatter(train.temp,train.atemp,alpha=1,s=20,color=train.Count)
D - plt.scatter(train.temp,train.atemp,alpha=1,s=20,c=w)

Q41
圖片描述
上述數據集中,咱們假設「temp」變量的季節性變化可能會影響「Count」變量,繪製二者的箱型圖能夠檢驗這個假設。
下列哪行代碼能夠實現這個需求?

A - train.boxplot(column='season', by='temp')
B - train.boxplot(ax='temp', by='season')
C - train.boxplot(ax='temp', column='season')
D - train.boxplot(column='temp', by='season')

Q42
圖片描述
繪製直方圖是觀察變量頻率的一種可視化方法,下列哪行代碼能夠實現繪製‘temp’ 變量分箱爲50的直方圖?

A - train.hist(column='temp')
B - train.hist(column='temp', bin_size=50)
C - train.hist(column='temp', bins=50)
D - 以上選項都不能

Q43
圖片描述
繪製自相關圖,能夠讓你看到uf時間序列是非隨機的,則一個或多個自相關將顯着非零。
下列哪行代碼能夠繪製「temp」 變量的自相關圖?

A - pd.tools.plotting.autocorr(train.temp)
B - pd.tools.plot.autocorr(train.temp)
C - pd.tools.plotting.autocorrelation_plot(train.temp)
D - 以上選項都不能

Q44
圖片描述
圖片描述
圖片描述
上述圖形展現了週一到週日天天每一個小時房屋出租的數量。

>>> fig=plt.figure()
>>> for i in range(0,7):
>>>     fig.add_subplot(3,3,____)
>>>     t1=train[train['______']==i] 
>>>     t1.________(['hour'])['count'].sum().plot(kind='bar')

根據已知的數據集,上述代碼須要添加哪些代碼才能繪製出如上的圖形?

A - i+1, day, groupby
B - i, day, groupby
C - i, Count, groupby
D - i, day, value_counts

Q45
圖片描述

>>> train.________(['Year','Gender']).size()._____[1880]

若是須要彙總出1880年男孩和女孩的數量,上述代碼須要添加哪些代碼?

A - groupby, idx
B - groupby, loc
C - groupby, iloc
D - value_counts, iloc

友情連接:
【譯】技能測試解決方案:Python中的數據科學(一)——Q1-Q15
【譯】技能測試解決方案:Python中的數據科學(二)——Q16-Q30
【譯】技能測試解決方案:Python中的數據科學(四)——A1-A45及其解釋

相關文章
相關標籤/搜索