數學 必修三 第二章 統計

數學 必修三  第二章 統計  linux

一:隨機抽樣ios

  從元素個數爲N的整體中不放回地抽取容量爲n的楊被,若是每一次抽取時整體中的各個個體有相同的可能性被抽到,這樣抽樣方法叫作簡單隨機抽樣,這樣抽取的樣本,叫作簡單隨機樣本。c++

  6個一樣質地的小球,從中不放回地抽取3個小球:算法

  第一次抽取,6箇中抽取1個 ,每一個球的被抽取的可能性是1/6     而且是相等的數組

  第二次抽取,5箇中抽取1個,每一個球被抽取的可能性都是1/5;dom

  第三次抽取,4箇中抽取1個,每一個球被抽取的可能性都是1/4;ide

  

  常喲昂的簡單隨機抽樣方法有抽籤法隨機數表示函數

  1.抽籤法測試

  100個燈管壽命     不放回的抽取10個燈管的壽命構成簡單的隨機樣本spa

  方法:給100個燈管壽命編號,每一隻燈管壽命對應1-100中的惟一一個數,再把這100個號碼分別寫道紙上,而後抽取 10個號碼   ,和這10個號碼對應的日光燈管壽命就構成了一個簡單隨機樣本。

  抽籤法  比較簡單    可是當整體的容量很是大時,並不適用,同時   整體要攪拌均勻。

  2.隨機數表法

  隨機數表   是由0,1,2,3,4...9這10個數字組成的鼠標,而且表中的每一位置出現各個數字的可能性相同。程序可生成隨機數表,由5個數組成一組   ,而後經過隨機數表來抽取樣本。

  案例:850顆種子的發芽率   從中抽取50顆種子進行實驗   使用隨機數表來抽取

  步驟:

  1.編號從001   002  ...850

  2.給出的隨機數是5位數一組 ,使用各個5位數組的前3位,從各組數中任選一個前3爲小於或等於850的數做爲起始號碼。例如從第一行第7組數字開始,取530做爲抽取的50顆種子中的第1個的代號。接着繼續向右讀取   若是遇到大於850的數字  則跳過,取到50個數字便可。

            隨機數表例子   

 

  數字隨機數生成: c++          dev c++編譯器        linux系統    如下程序能夠生成上面的圖片

#include <iostream>

#include <cstdlib>
#include <ctime>

#define random(a,b) (rand()%(b-a)+a)    //宏定義 用於擴展

using namespace std;

int main()
{
  srand((unsigned ) time(NULL));      //隨機數種子
  for(int i=0;i<85;i++)          //共850個數字
  {
    for(int j=0;j<10;j++)
      {
        cout<<random(10000,99999)<<" ";   //random   產生  10000到99999之間的隨機數
      }
    cout<<"\n";              //10個數一行  以後換行   
  }
  return 0;
}

  c++沒有自帶的random函數,要實現隨機數的生成就須要使用rand和srand 

  1.rand()   僅僅返回一個0至RAND_MAX之間的隨機數 ,而RAND_MAX的值與int位數有關,最小是32767.不過rand()是一次性的,由於系統默認的隨機數種子爲1,只要隨機數種子不變,其生成的水技術序列就不會改變。

  2.srand()   能夠用來設置rand()產生隨機數時的隨機數種子。經過設置不一樣的種子以得到不一樣的隨機數序列。

  產生不一樣隨機數種子的方法:srand( unsigned int ) ( time(NULL))   利用系統的時鐘  來產生不一樣的隨機數種子

    調用time()  須要加入頭文件  <ctime>

#include<iostream>

#include<cstdlib>
#include<ctime>
 using namespace std;
int main()
{
  srand((unsigned)time(NULL));  //生成種子
  for(int i=0;i<10;i++)
    cout<<rand()<<' ';         //產生隨機數
  return 0;
}

通式

產生必定範圍隨機數的通用表示公式是:

  • 取得(0,x)的隨機整數:rand()%x;
  • 取得(a,b)的隨機整數:rand()%(b-a);
  • 取得[a,b)的隨機整數:rand()%(b-a)+a;
  • 取得[a,b]的隨機整數:rand()%(b-a+1)+a
  • 取得(a,b]的隨機整數:rand()%(b-a)+a+1;
  • 取得0-1之間的浮點數:rand()/double(RAND_MAX)。

 練習A

  全班同窗愛聽數學課的比例  計劃抽取8名同窗作調查,請你用抽籤法抽取一個樣本。

  假設共50名學生   從1-50編號 貼紙條或小球,而後每次從整體中抽取一個,直到取第8個時中止,在抽取的過程當中,每一個小球被抽取的可能性都是1/當時的總數,以後再查看這8名學生愛聽數學課成爲樣本。

練習B1

  某居民區有730戶居民,居民會計劃從中抽取25戶調查其家庭收入情況,利用簡單隨機樣原本統計。

  730戶居民編號000-730;

  隨機生成730個數字,每一個數字由5個個位數組合而成。取後3位數爲整數,大於730的數須要跳過,共取25個。

練習B2

  製做1000個一位數的隨機數表,並檢查0-9這10個數在表中出現的可能性是否相同?

  代碼:

// 生成1000個0-3的數字組成的隨機數表 

#include <iostream>
#include <cstdlib>
#include <ctime>

#define random(a,b) (rand()%(b-a+1)+a) //宏定義

  using namespace std;

int main()
{
  srand((unsigned ) time(NULL));
   int cn0=0;
   int cn1=0;
   int cn2=0;
     int cn3=0;
     int number=0;
  for(int i=0;i<100;i++)
  {
    for(int j=0;j<10;j++)
    {
      number=random(0,3);
      if(number==0)
      {
        cn0++; //0的數字個數
      }
      else if(number==1)
      {
        cn1++; //1的數字個數
      }
      else if(number==2)
      {
        cn2++; //2的數字個數
      }
      else if(number==3)
      {
        cn3++; //3的數字個數
      }
        cout<<number<<" ";
    }  
      cout<<"\n";
  }
    cout<<"0的個數爲:"<<cn0<<";;;1的個數爲:"<<cn1<<";;2的個數爲:"<<cn2<<";;3的個數爲:"<<cn3<<endl;
    cout<<"總數爲:"<<cn0+cn1+cn2+cn3<<endl;
    return 0;
}

     0-3  之間選擇隨機數    事實是相同的   

 

二.系統抽樣  

  當整體數量很是大的時候,樣本容量就不宜過小,採用簡單隨機抽樣,就顯得費事,可將整體分紅均衡的若干部分,而後按照預先指定的規則,從每一部分抽取一個個體,獲得所須要的樣本,這種抽樣的方法叫作系統抽樣。

  案例1:高一學生期末考試數學成績統計,從參加考試的15000名學生的數學成績中抽取容量爲150的樣本。對全體學生的數學成績進行編號。號碼從1-15000。

樣本容量爲150,整體容量爲15000  這樣兩個的比例爲150:15000=1:100。     

  將整體平均分紅150個部分,其中每一個部分包含100個號碼;在1-100中抽取一個號碼假設爲56,則第二個數爲156,之後的一次遞增100 即25六、356...

  直到取得150個號碼爲止:序列爲:56,156,256,356,456,....

  獲得150個號碼學生的成績爲樣本

  

  從元素個數爲N的整體中抽取容量爲n的樣本,若是整體容量能被樣本容量整除,設定k=N/n,先從數字1到k中隨機地抽取一個數s做爲起始數,而後順次抽取第s+k,s+2k,...,s+(n-1)k個數,這樣就獲得容量爲n的樣本。若是整體容量不能被樣本容量整除。可隨機地從整體中剔除餘數,而後再按照系統抽樣方法進行抽樣。

  進行大規模的抽樣調查時,系統抽樣比簡單隨機抽樣要方便得多,於是應用的範圍很廣。因爲抽樣的間隔相等,所以系統抽樣也被稱爲等距抽樣

練習A:1563個產品中   抽取15件產品作檢測    給出系統抽樣方案

  1.1-1563編號        1563/15=104.2   四捨五入  取104

  2.1-104中取1個數字  假設爲87    以後取87+1*104=191        再以後是87+2*104=295     再以後是87+3*104   等等  一直取15個數

  3.此15個數字組成樣本空間

練習B:

  總數爲365天  

  編號從1-365

  365/52=7.01        約等於7

  因此1-7中任選一個數字  假設爲5   則第2個數爲5+7=12     第3個數爲5+14=19     第4個數爲5+3*7=26    一直取滿52個數。

  這52個數字組成樣本空間。

  案例代碼:

  

//系統抽樣     生成52個隨機數

#include <iostream>
#include <cstdlib>
#include <ctime>

#define random(a,b) (rand()%(b-a+1)+a)

using namespace std;

int main()
{
srand((unsigned)time(NULL)); //生成種子
int number=365;
int parts=52;
int n=number/parts;
int c=0;
int a=random(1,7);

for(int i=0;i<52;i++)
{
cout<<a+c*n<<endl;
c++;
}
// cout<<n<<"\n";

return 0;
}

分層抽樣

  當整體由明顯差異的幾部分組成時,爲了使抽取的樣本更好地反映整體的狀況,經常採起分層抽樣,將整體中各個個體按某種特徵分紅若干個互不重疊的幾部分,每一部分叫作層,在各層中按層在整體中所佔比例進行簡單隨機抽樣或系統抽樣,這種抽樣方法叫作分層抽樣

  案例:某高中900名學生  考察體重,抽取45名學生的體重組成的樣本,由於各個年級的學生隨着年齡的增加體重不一樣,因此分三層來抽取

  高一學生共400名;高二學生300名;高三學生200名; 

  樣本容量與整體容量的比爲45:900=1:20

  因此45=900*1/20=(400+300+200)*1/20=400*1/20+300*1/20+200*1/20=20+15+10=45

  因此高一,高二,高三3個層面上取的學生數分別爲:20     15     10

  而後再分別對各層進行簡單隨機抽樣;分層的優勢是  具備較強的表明性   並且在各層抽樣時能夠靈活地選用不一樣的抽樣法

練習1:

  500名學生  喜歡數學的學生佔30%,不喜歡數學的佔40%,介於二者之間的學生佔30%,爲了考查學生的其中考試的數學成績,如何用分層抽樣來抽取一個容量爲50個樣本。

  成績高的(喜歡數學)  500*30%=150

  成績中等的       500*30%=150

  成績低的        500*40%=200

  樣本爲50:整體500=1:10

  因此分層抽取的數量爲:150/10=15;150/10=15;200/10=20    

  分別爲成績高的      成績中等的     成績低的     總數爲50

  而後再分別對各層進行簡單隨機抽樣   

練習2:某公司500人,其中不到35的125人,35-49的280人      50歲以上的95人   爲了調查員工的身體健康情況 樣本爲100名 分層抽取的方法

  100/500=1/5

  35歲的抽取      125/5=25人  再簡單隨機抽取

  35-49歲的抽取   280/5=56人  

  50歲以上       95/5=19人  

練習3:飲食習慣   1500爲總數,抽取200名進行調查

  南方人500名      北方人800名    西部地區200名

  方法:

  200/1500=2/15

  南方人抽樣爲500*2/15=66.6=67人

  北方人抽樣爲800*2/15=106人

  西部地區的人抽樣爲200*2/15=26.6=27人

  合計共200人

練習B:

  12000 分別來自四個城區   其中東城區2400人,西城區4605人,南城區3795人,北城區1200人

  從中抽取60人

  方法以下:

  1.計算比例

    60/12000=1/200

  2.分別計算

    2400/200=12

    4605/200=23

    3795/200=19

    1200/200=6

  合計12+23+19+6=60

  3.而後分別對四個城區進行簡單的隨機抽樣 統計

上題中的程序代碼:

1.simplesample.h    頭文件

class randsample
{
public:
randsample();
randsample(int _s,int _n);
void sample();
void print();
private:
int num;//樣本容量
int sum;//總量
int samples[];
};

 2.simplesample_class_implement.cpp

//simplesample類的實現

//implement simple_sample

#include <iostream>
#include <ctime>
#include <cstdlib>
#include "simplesample.h" //用戶自定義的文件

#define random(a,b) (rand()%(b-a+1)+a) //宏定義

using namespace std;

randsample::randsample()
{

cout<<"default"<<"\n";
sum=0;
num=0;
samples[0]={0};
}

randsample::randsample(int _s,int _n)//形參爲總量和樣本數量
{
sum=_s;
num=_n;

}
void randsample::print()
{
int count=0;
cout<<"樣品容量爲:"<<num<<"\n";
cout<<"總量爲:"<<sum<<"\n";
sample();
cout<<"抽取的樣品編號分別爲:\n";
for(int i=0;i<num;i++)
{
count++;
cout<<"第"<<i+1<<"個:"<<samples[i]<<" ";
if(count%5==0)
cout<<"\n";
}
}
void randsample::sample()
{
for(int i=0;i<num;i++)
samples[i]=random(0,sum);
}
int main()
{
srand((unsigned)time(NULL));//產生隨機數種子,若是不設置 則rand()值始終爲1 則每次生成的隨機數都是相同的
randsample dongcheng(2400,12);
dongcheng.print();
cout<<"\n";
cout<<"\n";
randsample xicheng(4605,23);
xicheng.print();
cout<<"\n";
cout<<"\n";
randsample nancheng(3795,19);
nancheng.print();
cout<<"\n";
cout<<"\n";
randsample beicheng(1200,6);
beicheng.print();
cout<<"\n";
cout<<"\n";
return 0;
}

2.1.4  數據的收藏

   在實際統計時  要肯定調查的目的、對象   即統計調查要解決的問題和須要調查的整體;

  要肯定好調查的項目,也就是要統計的變量,接下來就能夠開始收集數據了

  1.試驗

  可以直接得到樣本數據     例如投骰子  

  2.查閱資料  

  查閱理念文獻  統計年鑑等    例如  全國曆次人口普查的數據

  3.設計調查問卷

  由一組有目的,有系統,有順序的題目組成。

  問題要具體,有針對性   

  避免通常性或者不具體的問題

  語言簡單、準確、含義清楚  避免出現有歧義或意思含混的句子

  不能出現引導受調查者答題傾向的語句

 

彙總練習題

  習題2-1_A

  1.某地10000名高一學生的體重   抽取200名雪深更調查

    整體:10000名學生的體重狀況

    個體:每名學生的體重

    樣本:是10000名中抽取的200名學生的體重狀況

    整體容量:10000

    樣本容量:200

  2.編號爲1-100的100道題中隨機抽取20道題組成考卷

    整體:100

    編號1-100

    樣本爲20

    不放回地每次抽取1個標籤  紙條   組成樣本 直到抽出20個紙條

  3.590件貨物   從中選出50件貨物    用隨機數表示法給出抽樣方案

    數字00100-99999   爲範圍

    #define  random(a,b)  (rand()%(b-a+1)+a)

    random(100,99999)

    取得出的隨機數   取每組數字的高三位  大於590的跳過

    int num[50]={0};

    int count=0;

    for(int i=0;i<50;i++)

    {

      num[i]=random(0,999);

      cout<<num[i];

      count++;

      if(count%7==0)

      cout<<"\n";

    }

  4. 10000人     編號0-9999   從這些遊客當中隨機選出10名幸運遊客   用系統抽樣的方式給出遊客的編號    等距離抽取

     k=10000/10=1000;

     int n=random(0,1000);

     int m[10]={0};

     m[0]=n;

      cout<<"第1次抽取的樣本爲:"<<m[0]<<"\n";

     for(int i=1;i<10;i++)

     {

      m[i]=n+i*k;

      cout<<"第"<<i+1<<"次抽取的樣本爲:"<<m[i]<<"\n";

     }

      

代碼示例:

//習題4 統計與抽樣
#include <iostream>
#include <ctime>
#include <cstdlib>
#define random(a,b) (rand()%(b-a+1)+a)
using namespace std;
int main()
{
srand((unsigned)time(NULL));
cout<<"請輸入整體容量:"<<endl;
int n1;
cin>>n1;
cout<<"請輸入樣本容量:"<<endl;
int n2;
cin>>n2;
int k=n1/n2;
int n=random(0,k);//calculate
int m[n2]={0};//initial set
m[0]=n;
cout<<"the first sample:"<<m[0]<<"\n";
for(int i=1;i<n2;i++)
{
m[i]=n+i*k;
cout<<i+1<<"th sample:"<<m[i]<<"\n";//輸出全部的樣品值
}
return 0;
}

 

 

5.

//simplesample 聲明
/* 僅聲明
*/


class randsample
{
public:
randsample();
randsample(int _s,int _n);
void sample();
void print();
private:
int num;//樣本容量
int sum;//總量
int samples[];
};

class dividefun
{
public:
dividefun();//constructor default
dividefun(int _num,int _sum_samplenum); //初始化分層整體數組
void calculate();//計算分層樣本的容量 並存入對應數組中
private:
int sample_num[]; //用來存儲各個分層的樣本容量的數組
int sum_num[]; //用來存儲各個分層的整體容量的數組
int dividenum;//層數
int sum_samplenum;
};

 

 

 

//simplesample類的實現    未完成

//implement simple_sample

#include <iostream>
#include <ctime>
#include <cstdlib>
#include "simplesample.h" //用戶自定義的文件

#define random(a,b) (rand()%(b-a+1)+a) //宏定義

using namespace std;

randsample::randsample()
{
cout<<"default"<<"\n";
sum=0;
num=0;
samples[0]={0};
}
randsample::randsample(int _s,int _n)//形參爲總量和樣本數量
{
sum=_s;
num=_n;
}
void randsample::print()
{
int count=0;
cout<<"樣品容量爲:"<<num<<"\n";
cout<<"總量爲:"<<sum<<"\n";
sample();
cout<<"抽取的樣品編號分別爲:\n";
for(int i=0;i<num;i++)
{
count++;
cout<<"第"<<i+1<<"個:"<<samples[i]<<" ";
if(count%5==0)
cout<<"\n";
}
}
void randsample::sample()
{
for(int i=0;i<num;i++)
samples[i]=random(0,sum);
}


//class dividefun implement

dividefun::dividefun(){
cout<<"default"<<endl;
sum_num[0]={0};
sample_num[0]={0};
dividenum=0;
}
dividefun::dividefun(int _num,int _sum_samplenum){
//int num=0;
sum_samplenum=_sum_samplenum;
dividenum=_num;
cout<<"請輸入"<<dividenum<<"個數字:"<<endl;
for(int i=0;i<_num;i++)
{
cin>>sum_num[i];//初始化分層總量數組
}
}

void dividefun::calculate()//計算
{
int sum;
int k;
if(dividenum==0)
exit(1);
else
{
//計算整體抽樣的比例
for(int i=0;i<dividenum;i++)
sum+=sum_num[i];
k=sum_samplenum/sum; //計算比例
for(int i=0;i<dividenum;i++)
{
sample_num[i]=sum_num[i]*k;//初始化分層樣本數組
}
}
}

int main()
{
srand((unsigned)time(NULL));//產生隨機數種子,若是不設置 則rand()值始終爲1 則每次生成的隨機數都是相同的
randsample dongcheng(2400,12);
dongcheng.print();
cout<<"\n";
cout<<"\n";
randsample xicheng(4605,23);
xicheng.print();
cout<<"\n";
cout<<"\n";
randsample nancheng(3795,19);
nancheng.print();
cout<<"\n";
cout<<"\n";
randsample beicheng(1200,6);
beicheng.print();
cout<<"\n";
cout<<"\n";
return 0;
}

 

 

2.2用樣本估計整體

  隨機抽樣的方法在整體中抽取樣本   獲得一組數據    能夠用樣本的頻率分佈估計整體的分佈,能夠用樣本的數字特徵(如平均數、標準差)估計整體的數字特徵。

2.2.1用樣本的頻率分佈估計整體的分佈

  將大量的數據樣本,造成頻數分佈或者頻率分佈  能夠比較清楚地看出樣本數據的特徵,從而估計整體的分佈的狀況。

  製做頻率分佈表、頻率分佈直方圖

  1.計算極差

   極差是最大值與最小值的差   反映了一組數據變化的幅度  又叫全距

     將樣本數據存入數組   ,設定temp臨時值

   求出數組中的最大值==》max

   求出數組中的最小值==》min

   極差=max-min

  2.決定組數與組距

  樣本數據有100個,能夠分紅8-12組   這裏取11組   假設極差爲0.32

  因此  組距=極差/組數=0.32/11=0.03

  3.決定分點

  將第一組的起點定位25.235     組距爲0.03    這樣所分的11組分別是

  1.       25.235~(25.235+0.03=25.265)

     2.  25.265~25.295

  ...

  11.  25.535-25.565

  極差=最大-最小=25.565-25.235=0.33(約)

   4.列頻率分佈表

   對落在各個小組內數據的個數進行累計,這個累計數叫作各個小組的頻數,各個小組的頻數除以樣本容量,得各小組的頻率。

  求各小組頻數的算法

  第一步:設B(j) 爲落在第j個小組內的數據個數,且B(j)=0(j=1,2,...,11);     B爲分組的數組

  第二步:逐一判斷A(i)(i=1,2,...,100)落入哪個小組,若落入第j個小組,則B(j)=B(j)+1  A數組爲樣本數據

  頻率分佈圖以下:

  

  第三步  繪製頻率分佈直方圖

    在直角座標系中,用橫軸表示產品內徑尺寸,縱軸表示頻率與組距的比值,獲得頻率分佈直方圖。

    

     在圖中能夠看出:

      小長方形面積=組距*頻率/組距=頻率

      各個小長方形的面積等於相應各組的頻率,全部長方形面積之和等於1

    優等品所佔比例,能夠統計出內徑尺寸在區間25.325~25.475內的個體數在樣本容量中所佔的比例,也就是它的頻率。

    0.12+0.18+0.25+0.16+0.13=0.84

    能夠估算優等品比例爲84%

    頻率分佈折線圖   將上圖中的各個長方形上邊的重點用線段鏈接起來  就獲得頻率分佈折線圖

     樣本容量不斷增大,分組的組距不斷縮小,則頻率分佈直方圖實際上愈來愈接近於整體的分佈,它能夠用一條y=f(x)來描繪

    這條光滑的曲線就叫作整體密度曲線。

     整體密度曲線精確地反映了一個整體在各個區域內取值的規律,產品尺寸落在(a,b)內的百分率就是圖中帶斜線部分的面積。

    

     經常使用的統計圖表  還有莖葉圖

     案例:某賽季甲,乙兩名籃球運動員每場比賽的得分狀況以下:

    甲得分:12,15,24,25,......

    乙得分:8,13,14,16,23...

    

     中間的主幹(莖)表示得分的十位上的數字     外面的表示各位上的數字

    例如346就表明 13      14    16   三個得分

    左邊的爲甲的得分               右邊的爲乙的得分

    優勢是沒有原始信息的丟失

    

練習A

  1.一批燈泡中抽取50只壽命測試

    

 2.2.2  用樣本的數字特徵估計整體的數字特徵

  一般每每不須要了解整體的分佈形態,而是更加關心整體的某一數字特徵。

    例如燈泡的壽命,瞭解一批燈泡的平均使用壽命。

  把這批燈泡壽命看作整體,從中隨機取出若干個個體做爲樣本,算出樣本的數字特徵,用樣本的數字特徵(如平均數)來估計整體的數字特徵

  1.用樣本的平均數估計整體平均數

  2.用樣本標準差估計整體標準差

    數據的離散程度能夠用極差、方差或標準差來描述。

    樣本方差描述了一組數據圍繞平均數波動的大小     樣本方差的算術平方根。

    

     極差爲最大值減最小值

     方差的平方根爲樣本的標準差

     例5  甲乙 射擊比賽

    

#include <iostream>
#include <math.h>

using namespace std;

float bzc(int * group,int n,float &average);

int main()
{
    int A[]={7,8,6,8,6,5,9,10,7,4};
    int B[]={9,5,7,8,7,6,8,6,7,7};
    int sum=0;
    float Baverage,Aaverage;
    float Abzc,Bbzc;
    Abzc=bzc(A,10,Aaverage);
    Bbzc=bzc(B,10,Baverage);
    cout<<Aaverage<<":::::"<<Baverage<<endl;
    cout<<Bbzc<<"::::::"<<Abzc<<endl;
    return 0;
}
float bzc(int * group,int n,float &average)
{
    int C[n];
    int sum=0;
    for(int i=0;i<n;i++)
    {
        sum+=group[i];
    }
    average=sum/n;
    for(int i=0;i<n;i++)
    {
        C[i]=group[i]-average;
        C[i]*=C[i];
    }
    sum=0;
    for(int i=0;i<n;i++)
    {
        sum+=C[i];
    }
    float bzc=sqrt(sum/n);
    return bzc;
}

 

2.3變量的相關性

  2.3.1  變量間的相關關係

  一類是肯定性的函數關係       例如邊長與面積   正方形

  另外一類是有關係,可是並非相似函數在的那種肯定性       而是隨機的   例如人的身高和體重

  

  散點圖  :y隨x的增大而增大    這種相關性叫作正相關      反之  叫作負相關

2.3.2  兩個變量的線性相關

  6天 熱茶杯數與當每天氣溫度的對比圖表

  

   近似的直線,圖a爲鏈接兩個端點      圖b爲讓這些點位於直線的上下的數目相等,

   根據不一樣的標準分配的      找出最佳的近似直線  (最優擬合直線)

   假設2-11 最標準,記   y'=a+bx ..........1       此時y'是爲了區分Y實際的y值,

  當x(i=1,2,3...6)時,Y的相應觀察值爲yi,    而直線上對應的xi的縱座標是y'i=a+bxi       

    1式叫作Y對x的迴歸直線方程,b叫作迴歸係數

          肯定方程    只要肯定a與迴歸係數b便可。

  如何證明最小二乘法中  a和b的公式    ?????

   

 

 

 

 

習題:

  1.採用簡單隨機抽樣從含10個個體的整體中抽取一個容量爲4的樣本,個體a前兩次未被抽到,第三次被抽到的機率爲______

    答:第一次沒有抽到的機率是9/10,第一次沒有抽到且第二次也沒有抽到的機率是9/10*8/9

    第一次  第二次沒抽到且第三次抽到的機率是9/10   *8/9   *1/10=1/10

   特色:

    1.簡單隨機抽樣從含有N個個體的整體中抽取一個容量爲n的樣本時,每次抽取一個個體時任一個個體被抽到的機率爲1/N(N是變化的);

     在整個抽樣過程當中各個個體被抽到的機率爲n/N;

    2.逐個抽取,且各個個體被抽到的機率相等。

    3.不放回抽樣;逐個地進行抽取;它是一種等機率抽樣

相關文章
相關標籤/搜索