應用統計學與R語言實現學習筆記(十四)——案例與實踐

Chapter 14 Case and Practice

本篇是第十四章,內容是案例與實踐。這裏實際上是對我公選課的做業作了個彙總。網絡

1 描述性統計與抽樣分佈

1.一種袋裝食品用生產線自動裝填,每袋重量大約爲50g,但因爲某些緣由,每袋重量不會剛好是50g。下面是隨機抽取的100袋食品,測得的重量數據見附錄。 (1)構建這些數據的頻數分佈表。 (2)繪製頻數分佈的直方圖。 (3)說明數據分佈的特徵。框架

2.甲乙兩個班各有40名學生,期末統計學考試成績的分佈見附錄。 (1)根據上面的數據,畫出兩個班考試成績的複合柱形圖、環形圖和圖餅圖。 (2)比較兩個班考試成績分佈的特色。 (3)畫出雷達圖,比較兩個班考試成績的分佈是否類似。設計

3.隨機抽取25個網絡用戶,獲得他們的年齡數據(單位:週歲)見附錄。 (1)計算衆數、中位數。 (2)根據定義公式計算四分位數。 (3)計算平均數和標準差。 (4)計算偏態係數和峯態係數。 (5)對網民年齡的分佈特徵進行綜合分析。隊列

4.某銀行爲縮短顧客到銀行辦理業務等待的時間,準備採用兩種排隊方式進行試驗:一種是全部顧客都進入一個等待隊列;另外一種是顧客在三個業務窗口處列隊三排等待。爲比較哪一種排隊方式使顧客等待的時間更短,兩種排隊方式各隨機抽取的9名顧客,獲得第一中排隊方式的平均等待時間爲7.2分鐘,標準差爲,1.97分鐘,第二種排隊方式的等待時間(單位:min)見附錄。 (1)畫出第二種排隊方式等待時間的莖葉圖。 (2)計算第二種排隊方式等待時間的平均數和標準差。 (3)比較兩種排隊方式等待時間的離散程度。 (4)若是讓你選擇一種排隊方式,你會選擇哪種?試說明理由。文檔

5.從均值爲200、標準差爲50的整體中,抽取n=100的簡單隨機樣本,用樣本均值`x估計整體均值。 a)描述重複抽樣的樣本均值的抽樣分佈。 b)不重複抽樣,整體單位數分別爲10000、1000時的樣本均值的抽樣分佈。產品

2 參數估計與假設檢驗

1.某大學爲了解學生天天上網的時間,在全校7500名學生中採起不重複抽樣方法隨機抽取36人,調查他們天天上網的時間(單位:小時) ,獲得的數據見附錄。求該校大學平生均上網時間的置信區間,置信機率分別爲90%、95%和99%。基礎

2.假定兩個整體的標準差分別爲:σ1=12,σ2=15,若要求偏差範圍不超過5,相應的置信水平爲95%,假定n1=n2,估計兩個整體均值之差m1-m2時所需的樣本容量爲多大?方法

3.經驗代表,一個矩形的寬與長之比等於0.618的時候會給人們比較良好的感受。某工藝品工廠生產的矩形工藝品框架的寬與長要求也按這一比例設計,假定其整體服從正態分佈,現隨機抽取了20個框架測得比值見附錄。在顯著性水平 =0.05時,可否認爲該廠生產的工藝品框架寬與長的平均比例爲0.618?。im

4.一家大型超市連鎖店上個月接到許多消費者投訴某種品牌炸土豆片中60克一袋的那種土豆片的重量不符。店方猜測引發這些投訴的緣由是運輸過程當中沉積在食品袋底部的土豆片碎屑,但爲了使顧客們對花錢買到的土豆片感到物有所值,店方仍然決定對來自於一家最大的供應商的下一批袋裝炸土豆片的平均重量(克)進行檢驗,假設陳述以下: H0: μ≥ 60 H1:μ<60 若是有證據能夠拒絕原假設,店方就拒收這批炸土豆片並向供應商提出投訴。 (1)與這一假設檢驗問題相關聯的第一類錯誤是什麼? (2)與這一假設檢驗問題相關聯的第二類錯誤是什麼? (3)你認爲連鎖店的顧客們會將哪類錯誤看得較爲嚴重?而供應商會將哪類錯誤看得較爲嚴重?統計

3 方差分析與迴歸分析

1.某家電製造公司準備購進一批5#電池,現有A、B、C三個電池生產企業願意供貨,爲比較它們生產的電池質量,從每一個企業各隨機抽取5只電池,經試驗得其壽命(單位:h)數據見附錄。試分析三個企業生產的電池的平均壽命之間有無顯著差別(α=0.05)。若是有差別,用LSD方法檢驗哪些企業之間有差別?

2.一家超市連鎖店的老闆進行一項研究,肯定超市所在的位置和競爭者的數量對銷售額是否有顯著影響。得到的月銷售額數據(單位:萬元)見附錄。取顯著性水平α=0.01,檢驗: (1)競爭者的數量對銷售額是否有顯著影響。 (2)超市的位置對銷售額是否有顯著影響。 (3)競爭者的數量和超市的位置對銷售額是否有交互影響。

3.附錄中有隨機抽取的15家大型商場銷售的同類產品的有關數據(單位:元)。 (1)計算y與x1 、y與x2之間的相關係數,是否有證據代表銷售價格與購進價格、銷售價格與銷售費用之間存在線性關係? (2)根據上述結果,你認爲用購進價格和銷售費用來預測銷售價格是否有用? (3)用Excel進行迴歸,並檢驗模型的線性關係是否顯著(α=0.05)。 (4)解釋斷定係數R2,所得結論與問題(2)中是否一致? (5)計算x1與x2之間的相關係數,所得結果意味着什麼? (6)模型中是否存在多重共線性?你對模型有何建議?

4.附錄中有32名美士足球運動員的rating及其餘相關信息。請創建一個迴歸模型以預測一位美士足球運動員的rating。提交報告包括:使用什麼方法創建的模型,該方法的運行結果,最終模型的解釋(擬合程度、預測偏差)。

這一份做業彙總從最原始的描述統計、參數估計、假設檢驗到基礎的方差分析與迴歸分析均有了。根據這裏的習題便可對前面的內容再次熟悉。 這裏就很少說了,我有一份比較完整的文檔針對這分內容。這裏先給出節選部分的截圖。具體地址再給出。

相關文章
相關標籤/搜索