C++中的頭文件和源文件

時間 2019-11-10

標籤 c++ 文件欄目 C&C++ 简体版

原文原文鏈接

1、C++編譯模式
一般，在一個C++程序中，只包含兩類文件——.cpp文件和.h文件。其中，.cpp文件被稱做C++源文件，裏面放的都是C++的源代碼；而.h文件則被稱做C++頭文件，裏面放的也是C++的源代碼。
C+ +語言支持「分別編譯」（separate compilation）。也就是說，一個程序全部的內容，能夠分紅不一樣的部分分別放在不一樣的.cpp文件裏。.cpp文件裏的東西都是相對獨立的，在編譯（compile）時不須要與其餘文件互通，只須要在編譯成目標文件後再與其餘的目標文件作一次連接（link）就好了。好比，在文件a.cpp中定義了一個全局函數「void a() {}」，而在文件b.cpp中須要調用這個函數。即便這樣，文件a.cpp和文件b.cpp並不須要相互知道對方的存在，而是能夠分別地對它們進行編譯，編譯成目標文件以後再連接，整個程序就能夠運行了。
這是怎麼實現的呢？從寫程序的角度來說，很簡單。在文件b.cpp中，在調用「void a()」函數以前，先聲明一下這個函數「void a();」，就能夠了。這是由於編譯器在編譯b.cpp的時候會生成一個符號表（symbol table），像「void a()」這樣的看不到定義的符號，就會被存放在這個表中。再進行連接的時候，編譯器就會在別的目標文件中去尋找這個符號的定義。一旦找到了，程序也就能夠順利地生成了。
注意這裏提到了兩個概念，一個是「定義」，一個是「聲明」。簡單地說，「定義」就是把一個符號完完整整地描述出來：它是變量仍是函數，返回什麼類型，須要什麼參數等等。而「聲明」則只是聲明這個符號的存在，即告訴編譯器，這個符號是在其餘文件中定義的，我這裏先用着，你連接的時候再到別的地方去找找看它究竟是什麼吧。定義的時候要按C++語法完整地定義一個符號（變量或者函數），而聲明的時候就只須要寫出這個符號的原型了。須要注意的是，一個符號，在整個程序中能夠被聲明屢次，但卻要且僅要被定義一次。試想，若是一個符號出現了兩種不一樣的定義，編譯器該聽誰的？
這種機制給C++程序員們帶來了不少好處，同時也引出了一種編寫程序的方法。考慮一下，若是有一個很經常使用的函數「void f() {}」，在整個程序中的許多.cpp文件中都會被調用，那麼，咱們就只須要在一個文件中定義這個函數，而在其餘的文件中聲明這個函數就能夠了。一個函數還好對付，聲明起來也就一句話。可是，若是函數多了，好比是一大堆的數學函數，有好幾百個，那怎麼辦？能保證每一個程序員均可以完徹底全地把全部函數的形式都準確地記下來並寫出來嗎？
2、什麼是頭文件
很顯然，答案是不可能。可是有一個很簡單地辦法，能夠幫助程序員們省去記住那麼多函數原型的麻煩：咱們能夠把那幾百個函數的聲明語句全都先寫好，放在一個文件裏，等到程序員須要它們的時候，就把這些東西所有copy進他的源代碼中。
這個方法當然可行，但仍是太麻煩，並且還顯得很笨拙。因而，頭文件即可以發揮它的做用了。所謂的頭文件，其實它的內容跟.cpp文件中的內容是同樣的，都是 C++的源代碼。但頭文件不用被編譯。咱們把全部的函數聲明所有放進一個頭文件中，當某一個.cpp源文件須要它們時，它們就能夠經過一個宏命令「#include」包含進這個.cpp文件中，從而把它們的內容合併到.cpp文件中去。當.cpp文件被編譯時，這些被包含進去的.h文件的做用便發揮了。
舉一個例子吧，假設全部的數學函數只有兩個：f1和f2，那麼咱們把它們的定義放在math.cpp裏：程序員

/* math.cpp */
double f1()
{
    //do something here....
    return;
}
double f2(double a)
{
    //do something here...
    return a * a;
}
/* end of math.cpp */

並把「這些」函數的聲明放在一個頭文件math.h中：函數

/* math.h */
double f1();
double f2(double);
/* end of math.h */

在另外一個文件main.cpp中，我要調用這兩個函數，那麼就只須要把頭文件包含進來：佈局

/* main.cpp */
#include "math.h"
main()
{
    int number1 = f1();
    int number2 = f2(number1);
}
/* end of main.cpp */

這樣，即是一個完整的程序了。須要注意的是，.h文件不用寫在編譯器的命令以後，但它必需要在編譯器找獲得的地方（好比跟main.cpp在一個目錄下）。 main.cpp和math.cpp均可以分別經過編譯，生成main.o和math.o，而後再把這兩個目標文件進行連接，程序就能夠運行了。
3、#include
#include 是一個來自C語言的宏命令，它在編譯器進行編譯以前，即在預編譯的時候就會起做用。#include的做用是把它後面所寫的那個文件的內容，完完整整地、一字不改地包含到當前的文件中來。值得一提的是，它自己是沒有其它任何做用與副功能的，它的做用就是把每個它出現的地方，替換成它後面所寫的那個文件的內容。簡單的文本替換，別無其餘。所以，main.cpp文件中的第一句（#include "math.h"），在編譯以前就會被替換成math.h文件的內容。即在編譯過程將要開始的時候，main.cpp的內容已經發生了改變：code

/* ~main.cpp */
double f1();
double f2(double);
main()
{
    int number1 = f1();
    int number2 = f2(number1);
}
/* end of ~main.cpp */

很少很多，剛恰好。同理可知，若是咱們除了main.cpp之外，還有其餘的不少.cpp文件也用到了f1和f2函數的話，那麼它們也統統只須要在使用這兩個函數前寫上一句#include "math.h"就好了。
4、頭文件中應該寫什麼
通過上面的討論，咱們能夠了解到，頭文件的做用就是被其餘的.cpp包含進去的。它們自己並不參與編譯，但實際上，它們的內容卻在多個.cpp文件中獲得了編譯。經過「定義只能有一次」的規則，咱們很容易能夠得出，頭文件中應該只放變量和函數的聲明，而不能放它們的定義。由於一個頭文件的內容其實是會被引入到多個不一樣的.cpp文件中的，而且它們都會被編譯。放聲明固然沒事，若是放了定義，那麼也就至關於在多個文件中出現了對於一個符號（變量或函數）的定義，縱然這些定義都是相同的，但對於編譯器來講，這樣作不合法。
因此，應該記住的一點就是，.h頭文件中，只能存在變量或者函數的聲明，而不要放定義。即，只能在頭文件中寫形如：extern int a;和void f();的句子。這些纔是聲明。若是寫上int a;或者void f() {}這樣的句子，那麼一旦這個頭文件被兩個或兩個以上的.cpp文件包含的話，編譯器會立馬報錯。（關於extern，前面有討論過，這裏再也不討論定義跟聲明的區別了。）
可是，這個規則是有三個例外的。
一，頭文件中能夠寫const對象的定義。由於全局的const對象默認是沒有extern的聲明的，因此它只在當前文件中有效。把這樣的對象寫進頭文件中，即便它被包含到其餘多個.cpp文件中，這個對象也都只在包含它的那個文件中有效，對其餘文件來講是不可見的，因此便不會致使多重定義。同時，由於這些.cpp文件中的該對象都是從一個頭文件中包含進去的，這樣也就保證了這些.cpp文件中的這個const對象的值是相同的，可謂一箭雙鵰。同理，static對象的定義也能夠放進頭文件。
二，頭文件中可以寫內聯函數（inline）的定義。由於inline函數是須要編譯器在遇到它的地方根據它的定義把它內聯展開的，而並不是是普通函數那樣能夠先聲明再鏈接的（內聯函數不會連接），因此編譯器就須要在編譯時看到內聯函數的完整定義才行。若是內聯函數像普通函數同樣只能定義一次的話，這事兒就難辦了。由於在一個文件中還好，我能夠把內聯函數的定義寫在最開始，這樣能夠保證後面使用的時候均可以見到定義；可是，若是我在其餘的文件中還使用到了這個函數那怎麼辦呢？這幾乎沒什麼太好的解決辦法，所以C++規定，內聯函數能夠在程序中定義屢次，只要內聯函數在一個.cpp文件中只出現一次，而且在全部的.cpp文件中，這個內聯函數的定義是同樣的，就能經過編譯。那麼顯然，把內聯函數的定義放進一個頭文件中是很是明智的作法。
三，頭文件中能夠寫類（class）的定義。由於在程序中建立一個類的對象時，編譯器只有在這個類的定義徹底可見的狀況下，才能知道這個類的對象應該如何佈局，因此，關於類的定義的要求，跟內聯函數是基本同樣的。因此把類的定義放進頭文件，在使用到這個類的.cpp文件中去包含這個頭文件，是一個很好的作法。在這裏，值得一提的是，類的定義中包含着數據成員和函數成員。數據成員是要等到具體的對象被建立時纔會被定義（分配空間），但函數成員倒是須要在一開始就被定義的，這也就是咱們一般所說的類的實現。通常，咱們的作法是，把類的定義放在頭文件中，而把函數成員的實現代碼放在一個.cpp文件中。這是能夠的，也是很好的辦法。不過，還有另外一種辦法。那就是直接把函數成員的實現代碼也寫進類定義裏面。在C++的類中，若是函數成員在類的定義體中被定義，那麼編譯器會視這個函數爲內聯的。所以，把函數成員的定義寫進類定義體，一塊兒放進頭文件中，是合法的。注意一下，若是把函數成員的定義寫在類定義的頭文件中，而沒有寫進類定義中，這是不合法的，由於這個函數成員此時就不是內聯的了。一旦頭文件被兩個或兩個以上的.cpp文件包含，這個函數成員就被重定義了。
5、頭文件中的保護措施
考慮一下，若是頭文件中只包含聲明語句的話，它被同一個.cpp文件包含再屢次都沒問題——由於聲明語句的出現是不受限制的。然而，上面討論到的頭文件中的三個例外也是頭文件很經常使用的一個用處。那麼，一旦一個頭文件中出現了上面三個例外中的任何一個，它再被一個.cpp包含屢次的話，問題就大了。由於這三個例外中的語法元素雖然「能夠定義在多個源文件中」，可是「在一個源文件中只能出現一次」。設想一下，若是a.h中含有類A的定義，b.h中含有類B的定義，因爲類B的定義依賴了類A，因此b.h中也#include了a.h。如今有一個源文件，它同時用到了類A和類B，因而程序員在這個源文件中既把 a.h包含進來了，也把b.h包含進來了。這時，問題就來了：類A的定義在這個源文件中出現了兩次！因而整個程序就不能經過編譯了。你也許會認爲這是程序員的失誤——他應該知道b.h包含了a.h——但事實上他不該該知道。
使用"#define"配合條件編譯能夠很好地解決這個問題。在一個頭文件中，經過#define定義一個名字，而且經過條件編譯#ifndef...#endif使得編譯器能夠根據這個名字是否被定義，再決定要不要繼續編譯該頭文中後續的內容。這個方法雖然簡單，可是寫頭文件時必定記得寫進去。對象

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。