原文地址:http://embed.21ic.com/softwar...html
當一個程序開始執行後,在開始執行到執行完畢退出這段時間內,它在內存中的部分就叫稱做一個進程。linux
Linux 是一個多任務的操做系統,也就是說,在同一時間內,能夠有多個進程同時執行。咱們你們經常使用的單CPU計算機實際上在一個時間片斷內只能執行一條指令。那麼Linux是如何實現多進程的同時執行的呢?原來Linux使用了一種稱爲」 進程調度 「的手段,首先,爲每一個進程指派必定的運行時間,這個時間一般很短,短到以毫秒爲單位,而後依照某種規則,從衆多的進程中挑選一個投入運行,其餘進程暫時等待,當正在運行的那個進程時間耗盡,或者執行完畢退出,或因某種緣由暫停,Linux就會從新調度,挑選一個進程投入運行,由於每一個進程佔用的時間片斷都很短,從使用者的角度來看,就好像多個進程同時運行同樣。程序員
在Linux中,每一個進程在建立的時都會被分配一個數據結構,稱爲進程控制塊(PCB)。PCB中包含了不少重要的信息,供系統調度和進程本事執行使用,其中最重要的莫過於進程的ID,進程的ID也被稱爲進程標示符,是一個非負的整數,在Linux操做性系統中惟一的標誌一個進程。在最常使用的I386架構上,一個非負的整數的取值是0~32767,這也是咱們所可能取到的進程ID,它就是進程的身份證號碼。編程
殭屍進程的產生數據結構
殭屍進程就是已經結束的進程,可是尚未從進程表中刪除。殭屍進程太多會致使進程表裏麪條目滿了,進而致使系統崩潰,卻是不佔用系統資源。多線程
在進程的狀態中,殭屍進程是很是特殊的一種,它已經放棄了幾乎全部的內存空間,沒有任何可執行代碼,也不能被調度,僅僅在進程列表中保留一個爲位置,記載該進程的退出狀態等信息供其餘進程收集,除此以外,殭屍進程再也不佔用任何內存空間,它須要它的父進程來給它收屍,若是父進程沒安裝SIGCHLD信號處理函數調用wait或waitpid()等待子進程結束,又沒有顯示的忽略該信號,那麼它就一直處於殭屍狀態。若是父進程結束了,那麼init進程會自動接手這個子進程,爲它收屍,他仍是可以被清除的。可是若是父進程是一個循環,不會結束,那麼子進程就一直處於殭屍狀態。架構
殭屍進程產生的緣由:併發
每一個Linux進程在進程表中都有一個進入點(Entry),核心程序在執行該進程時使用到的一切信息都存儲在進入點。當使用ps命令查看系統中的進程信息時,看到的就是進程表中的相關數據。當fork系統調用創建一個新的進程之後,核心進程就會在進程表中給這個新進程分配一個進入點,而後將相關信息存儲在該進入點所對應的進程表中,這些信息中有一項是父進程的識別碼。當這個進程走完了本身的生命週期後,它會執行exit()系統調用,此時原來進程表中的數據會被該進程的退出碼、執行時所用的CPU時間等數據所取代,這些數據會一直保留到系統將它傳遞給它的父進程爲止。因而可知,殭屍進程的出現時間實在子程序終止後,可是父進程還沒有讀取這些數據以前。框架
如何避免殭屍進程函數
一、父進程經過wait和waitpid等函數等待子進程結束,這會致使父進程掛起
二、若是父進程很忙,那麼能夠用signal函數爲SIGCHLD安裝handler,由於子進程結束後,父進程會收到該信號,能夠在handler中調用wait回收。
三、若是父進程不關心子進程何時結束,那麼能夠用「singal(SIGCHLD),SIG_IGN」通知內核,本身對子進程的結束不感興趣,那麼子進程結束後,內核會回收,並再也不給父進程發送信號。
四、還有一些技巧,就是fork()兩次,父進程fork一個子進程,而後繼續工做,子進程fork一個孫進程後退出,那麼孫進程被init接管,孫進程結束後,init會回收,不過子進程回收還要本身作。
進程 PK 線程
咱們先打個比方,多線程是十字路口多線程是平面交通系統,造價低,可是紅綠燈多,老堵車,而多進程是則是立交橋,雖然造價高,上下坡多耗油,可是不堵車。這是一個抽象的概念。相信你們看完會有這種感受。
進程和線程是兩個相對的概念,一般來講,一個進程能夠定義程序的一個實例(Instance)。在Win32中,進程並不執行什麼,它只是佔據應用程序所使用的地址空間。爲了讓進程完成必定的工做,進程必須至少佔有一個線程,正是這個線程負責包含進程地址空間中的代碼。實際上,一個進程能夠包含幾個線程,它們能夠同時執行進程地址空間中的代碼。爲了作到這一點,每一個線程有本身的一組CPU寄存器和堆棧。每一個進程中至少有 一個線程在執行其地址空間中的代碼。若是沒有線程執行進程地址空間中的代碼,進程也就沒有繼續存在的理由,系統將自動清除進程及其地址空間。
多線程的實現原理
建立一個進程時,它的第一個線程稱爲主線程(Primary thread),由系統自動生成。而後能夠由這個主線程生成額外的線程,而這些線程,又能夠生成更多的線程。在運行一個多線程的程序時,從表面上看,這些線程彷佛在同時運行。而實際狀況並不是如此,爲了運行全部的這些線程,操做系統爲每一個獨立線程安排一些CPU時間。單CPU操做系統以時間片輪轉方式向線程提供時間片(Quantum),每一個線程在使用完時間片後交出控制,系統再將CPU時間片分配給下一個線程。因爲每一個時間片足夠的短,這樣就給人一種假象,好像這些線程在同時運行。建立額外線程的惟一目的就是儘量地利用CPU時間。
多線程的問題
使用多線程編程能夠給程序員帶來很大的靈活性,同時也使原來須要複雜技巧才能解決的問題變得容易起來。可是,不該該人爲地將編寫的程序分紅一些碎片,讓這些碎片按各自的線程執行,這不是開發應用程序的正確方法。線程頗有用,但當使用線程時,可能會在解決老問題的同時產生新問題。例如要開發一個字處理程序,並想讓打印功能做爲單獨的線程本身執行。這聽起來是很好的主意,由於在打印時,用戶可當即返回,開始編輯文檔。但這樣一來,在該文檔被打印時文檔中的數據就有可能被修改,打印的結果就再也不是所指望的內容。也許最好不要把打印功能放在單獨的線程中,不過若是必定要用多線程的話,也能夠考慮用下面的方法解決:第一種方法是鎖定正在打印的文檔,讓用戶編輯其餘的文檔,這樣在結束打印以前,該文檔不會做任何修改;另外一個方法可能更有效一些,便可以把該文檔拷貝到一個臨時文件中,打印這個臨時文件的內容,同時容許用戶對原來的文檔進行修改。當包含文檔的臨時文件打印完成時,再刪去這個臨時文件。經過上面的分析能夠看出,多線程在幫助解決問題的同時也可能帶來新問題。所以有必要弄清楚,何時須要建立多線程,何時不須要多線程。總的來講,多線程每每用於在前臺操做的同時還須要進行後臺的計算或邏輯判斷的狀況。
線程的分類
在MFC中,線程被分爲兩類,即工做線程和用戶界面線程。若是一個線程只完成後臺計算,不須要和用戶交互,那麼可使用工做線程;若是須要建立一個處理用戶界面的線程,則應使用用戶界面線程。這二者的主要區別在於,MFC框架會給用戶界面線程增長一個消息循環,這樣用戶界面線程就能夠處理本身消息隊列中的消息。這樣看來,若是須要在後臺做一些簡單的計算(如對電子表格的重算),則首先應考慮使用工做線程,而當 後臺線程須要處理比較複雜的任務,確切地說,當後臺線程的執行過程會隨着實際狀況的不一樣而改變時,就應該使用用戶界面線程,以便能對不一樣的消息做出響應。
線程的優先級
當系統須要同時執行多個進程或多個線程時,有時會須要指定線程的優先級。線程的優先級通常是指這個線程的基優先級,即線程相對於本進程的相對優先級和包含此線程的進程的優先級的結合。操做系統以優先級爲基礎安排全部的活動線程,系統的每個線程都被分配了一個優先級,優先級的範圍從0到31。運行時,系統簡單地給第一個優先級爲31的線程分配CPU時間,在該線程的時間片結束後,系統給下一個優先級爲31的線程分配CPU時間。當沒有優先級爲31的線程時,系統將開始給優先級爲30的線程分配CPU時間,以此類推。除了程序員在程序中改變線程的優先級外,有時程序在執行過程當中系統也會自動地動態改變線程的優先級,這是爲了保證系統對終端用戶的高度響應性。好比用戶按了鍵盤上的某個鍵時,系統就會臨時將處理WM_KEYDOWN消息的線程的優先級提升2到3。CPU按一個完整的時間片執行線程,當時間片執行完畢後,系統將該線程的優先級減1。
線程的同步
在使用多線程編程時,還有一個很是重要的問題就是線程同步。所謂線程同步是指線程之間在相互通訊時避免破壞各自數據的能力。同步問題是由前面說到的Win32系統的CPU時間片分配方式引發的。雖然在某一時刻,只有一個線程佔用CPU(單CPU時)時間,可是沒有辦法知道在何時,在什麼地方線程被打斷,這樣如何保證線程之間不破壞彼此的數據就顯得格外重要。在MFC中,可使用4個同步對象來保證多線程同時運行。它們分別是臨界區對象(CCriticalSection)、互斥量對象(CMutex)、信號量對象(CS emaphore)和事件對象(CEvent)。在這些對象中,臨界區對象使用起來最簡單,它的缺點是隻能同步同一個進程中的線程。另外,還有一種基本的方法,本文稱爲線性化方法,即在編程過程當中對必定數據的寫操做都在一個線程中完成。這樣,因爲同一線程中的代碼老是按順序執行的,就不可能出現同時改寫數據的狀況。
總結:
在線程中(相對與進程而言),線程是一個更加接近執行體的概念,它能夠與同進程的其餘線程共享數據,但擁有本身的棧空間,擁有獨立的執行序列。這二者均可以提升程序的併發度,提升程序運行的效率和響應的時間。線程和進程在使用上各有優缺點:線程執行開銷小,但不利於資源管理和保護;而進程正好相反。根本的區別就一點:用多進程每一個進程有本身的地址空間,線程則共享地址空間,在速度方面:線程產生的速度快,線程間的通信快,切換快等,由於他們在同一地址空間內。在資源利用率方面:線程的資源率比較好也是由於他們在同一地址空間內。 在同步方面:線程使用公共變量/內存時須要使用同步機制,由於他們在同一地址空間內進程中:子進程是父進程的複製品,子進程得到父進程數據空間、堆和棧的複製品。