C++中的頭文件和源文件

1、C++編譯模式
一般,在一個C++程序中,只包含兩類文件——.cpp文件和.h文件。其中,.cpp文件被稱做C++源文件,裏面放的都是C++的源代碼;而.h文件則被稱做C++頭文件,裏面放的也是C++的源代碼。
C+ +語言支持「分別編譯」(separate compilation)。也就是說,一個程序全部的內容,能夠分紅不一樣的部分分別放在不一樣的.cpp文件裏。.cpp文件裏的東西都是相對獨立的,在編 譯(compile)時不須要與其餘文件互通,只須要在編譯成目標文件後再與其餘的目標文件作一次連接(link)就好了。好比,在文件a.cpp中定義 了一個全局函數「void a() {}」,而在文件b.cpp中須要調用這個函數。即便這樣,文件a.cpp和文件b.cpp並不須要相互知道對方的存在,而是能夠分別地對它們進行編譯, 編譯成目標文件以後再連接,整個程序就能夠運行了。
這是怎麼實現的呢?從寫程序的角度來說,很簡單。在文件b.cpp中,在調用 「void a()」函數以前,先聲明一下這個函數「void a();」,就能夠了。這是由於編譯器在編譯b.cpp的時候會生成一個符號表(symbol table),像「void a()」這樣的看不到定義的符號,就會被存放在這個表中。再進行連接的時候,編譯器就會在別的目標文件中去尋找這個符號的定義。一旦找到了,程序也就能夠 順利地生成了。
注意這裏提到了兩個概念,一個是「定義」,一個是「聲明」。簡單地說,「定義」就是把一個符號完完整整地描述出來:它是變 量仍是函數,返回什麼類型,須要什麼參數等等。而「聲明」則只是聲明這個符號的存在,即告訴編譯器,這個符號是在其餘文件中定義的,我這裏先用着,你連接 的時候再到別的地方去找找看它究竟是什麼吧。定義的時候要按C++語法完整地定義一個符號(變量或者函數),而聲明的時候就只須要寫出這個符號的原型了。 須要注意的是,一個符號,在整個程序中能夠被聲明屢次,但卻要且僅要被定義一次。試想,若是一個符號出現了兩種不一樣的定義,編譯器該聽誰的?
這 種機制給C++程序員們帶來了不少好處,同時也引出了一種編寫程序的方法。考慮一下,若是有一個很經常使用的函數「void f() {}」,在整個程序中的許多.cpp文件中都會被調用,那麼,咱們就只須要在一個文件中定義這個函數,而在其餘的文件中聲明這個函數就能夠了。一個函數還 好對付,聲明起來也就一句話。可是,若是函數多了,好比是一大堆的數學函數,有好幾百個,那怎麼辦?能保證每一個程序員均可以完徹底全地把全部函數的形式都 準確地記下來並寫出來嗎?
2、什麼是頭文件
很顯然,答案是不可能。可是有一個很簡單地辦法,能夠幫助程序員們省去記住那麼多函數原型的麻煩:咱們能夠把那幾百個函數的聲明語句全都先寫好,放在一個文件裏,等到程序員須要它們的時候,就把這些東西所有copy進他的源代碼中。
這 個方法當然可行,但仍是太麻煩,並且還顯得很笨拙。因而,頭文件即可以發揮它的做用了。所謂的頭文件,其實它的內容跟.cpp文件中的內容是同樣的,都是 C++的源代碼。但頭文件不用被編譯。咱們把全部的函數聲明所有放進一個頭文件中,當某一個.cpp源文件須要它們時,它們就能夠經過一個宏命令 「#include」包含進這個.cpp文件中,從而把它們的內容合併到.cpp文件中去。當.cpp文件被編譯時,這些被包含進去的.h文件的做用便發 揮了。
舉一個例子吧,假設全部的數學函數只有兩個:f1和f2,那麼咱們把它們的定義放在math.cpp裏:程序員

/* math.cpp */
double f1()
{
    //do something here....
    return;
}
double f2(double a)
{
    //do something here...
    return a * a;
}
/* end of math.cpp */

並把「這些」函數的聲明放在一個頭文件math.h中:函數

/* math.h */
double f1();
double f2(double);
/* end of math.h */

 在另外一個文件main.cpp中,我要調用這兩個函數,那麼就只須要把頭文件包含進來:佈局

/* main.cpp */
#include "math.h"
main()
{
    int number1 = f1();
    int number2 = f2(number1);
}
/* end of main.cpp */

這 樣,即是一個完整的程序了。須要注意的是,.h文件不用寫在編譯器的命令以後,但它必需要在編譯器找獲得的地方(好比跟main.cpp在一個目錄下)。 main.cpp和math.cpp均可以分別經過編譯,生成main.o和math.o,而後再把這兩個目標文件進行連接,程序就能夠運行了。
3、#include
#include 是一個來自C語言的宏命令,它在編譯器進行編譯以前,即在預編譯的時候就會起做用。#include的做用是把它後面所寫的那個文件的內容,完完整整地、 一字不改地包含到當前的文件中來。值得一提的是,它自己是沒有其它任何做用與副功能的,它的做用就是把每個它出現的地方,替換成它後面所寫的那個文件的 內容。簡單的文本替換,別無其餘。所以,main.cpp文件中的第一句(#include "math.h"),在編譯以前就會被替換成math.h文件的內容。即在編譯過程將要開始的時候,main.cpp的內容已經發生了改變:code

/* ~main.cpp */
double f1();
double f2(double);
main()
{
    int number1 = f1();
    int number2 = f2(number1);
}
/* end of ~main.cpp */

很少很多,剛恰好。同理可知,若是咱們除了main.cpp之外,還有其餘的不少.cpp文件也用到了f1和f2函數的話,那麼它們也統統只須要在使用這兩個函數前寫上一句#include "math.h"就好了。
4、頭文件中應該寫什麼
通 過上面的討論,咱們能夠了解到,頭文件的做用就是被其餘的.cpp包含進去的。它們自己並不參與編譯,但實際上,它們的內容卻在多個.cpp文件中獲得了 編譯。經過「定義只能有一次」的規則,咱們很容易能夠得出,頭文件中應該只放變量和函數的聲明,而不能放它們的定義。由於一個頭文件的內容其實是會被引 入到多個不一樣的.cpp文件中的,而且它們都會被編譯。放聲明固然沒事,若是放了定義,那麼也就至關於在多個文件中出現了對於一個符號(變量或函數)的定 義,縱然這些定義都是相同的,但對於編譯器來講,這樣作不合法。
因此,應該記住的一點就是,.h頭文件中,只能存在變量或者函數的聲明, 而不要放定義。即,只能在頭文件中寫形如:extern int a;和void f();的句子。這些纔是聲明。若是寫上int a;或者void f() {}這樣的句子,那麼一旦這個頭文件被兩個或兩個以上的.cpp文件包含的話,編譯器會立馬報錯。(關於extern,前面有討論過,這裏再也不討論定義跟 聲明的區別了。)
可是,這個規則是有三個例外的。
一,頭文件中能夠寫const對象的定義。由於全局的const對象默 認是沒有extern的聲明的,因此它只在當前文件中有效。把這樣的對象寫進頭文件中,即便它被包含到其餘多個.cpp文件中,這個對象也都只在包含它的 那個文件中有效,對其餘文件來講是不可見的,因此便不會致使多重定義。同時,由於這些.cpp文件中的該對象都是從一個頭文件中包含進去的,這樣也就保證 了這些.cpp文件中的這個const對象的值是相同的,可謂一箭雙鵰。同理,static對象的定義也能夠放進頭文件。
二,頭文件中可 以寫內聯函數(inline)的定義。由於inline函數是須要編譯器在遇到它的地方根據它的定義把它內聯展開的,而並不是是普通函數那樣能夠先聲明再鏈 接的(內聯函數不會連接),因此編譯器就須要在編譯時看到內聯函數的完整定義才行。若是內聯函數像普通函數同樣只能定義一次的話,這事兒就難辦了。由於在 一個文件中還好,我能夠把內聯函數的定義寫在最開始,這樣能夠保證後面使用的時候均可以見到定義;可是,若是我在其餘的文件中還使用到了這個函數那怎麼辦 呢?這幾乎沒什麼太好的解決辦法,所以C++規定,內聯函數能夠在程序中定義屢次,只要內聯函數在一個.cpp文件中只出現一次,而且在全部的.cpp文 件中,這個內聯函數的定義是同樣的,就能經過編譯。那麼顯然,把內聯函數的定義放進一個頭文件中是很是明智的作法。
三,頭文件中能夠寫類 (class)的定義。由於在程序中建立一個類的對象時,編譯器只有在這個類的定義徹底可見的狀況下,才能知道這個類的對象應該如何佈局,因此,關於類的 定義的要求,跟內聯函數是基本同樣的。因此把類的定義放進頭文件,在使用到這個類的.cpp文件中去包含這個頭文件,是一個很好的作法。在這裏,值得一提 的是,類的定義中包含着數據成員和函數成員。數據成員是要等到具體的對象被建立時纔會被定義(分配空間),但函數成員倒是須要在一開始就被定義的,這也就 是咱們一般所說的類的實現。通常,咱們的作法是,把類的定義放在頭文件中,而把函數成員的實現代碼放在一個.cpp文件中。這是能夠的,也是很好的辦法。 不過,還有另外一種辦法。那就是直接把函數成員的實現代碼也寫進類定義裏面。在C++的類中,若是函數成員在類的定義體中被定義,那麼編譯器會視這個函數爲 內聯的。所以,把函數成員的定義寫進類定義體,一塊兒放進頭文件中,是合法的。注意一下,若是把函數成員的定義寫在類定義的頭文件中,而沒有寫進類定義中, 這是不合法的,由於這個函數成員此時就不是內聯的了。一旦頭文件被兩個或兩個以上的.cpp文件包含,這個函數成員就被重定義了。
5、頭文件中的保護措施
考 慮一下,若是頭文件中只包含聲明語句的話,它被同一個.cpp文件包含再屢次都沒問題——由於聲明語句的出現是不受限制的。然而,上面討論到的頭文件中的 三個例外也是頭文件很經常使用的一個用處。那麼,一旦一個頭文件中出現了上面三個例外中的任何一個,它再被一個.cpp包含屢次的話,問題就大了。由於這三個 例外中的語法元素雖然「能夠定義在多個源文件中」,可是「在一個源文件中只能出現一次」。設想一下,若是a.h中含有類A的定義,b.h中含有類B的定 義,因爲類B的定義依賴了類A,因此b.h中也#include了a.h。如今有一個源文件,它同時用到了類A和類B,因而程序員在這個源文件中既把 a.h包含進來了,也把b.h包含進來了。這時,問題就來了:類A的定義在這個源文件中出現了兩次!因而整個程序就不能經過編譯了。你也許會認爲這是程序 員的失誤——他應該知道b.h包含了a.h——但事實上他不該該知道。
使用"#define"配合條件編譯能夠很好地解決這個問題。在一 個頭文件中,經過#define定義一個名字,而且經過條件編譯#ifndef...#endif使得編譯器能夠根據這個名字是否被定義,再決定要不要繼 續編譯該頭文中後續的內容。這個方法雖然簡單,可是寫頭文件時必定記得寫進去。對象

相關文章
相關標籤/搜索