多線程形成的資源以及系統狀態問題 ==> 多線程形成狀態混亂 :參考文章

時間 2019-11-17

原文原文鏈接

在 Java 程序中使用多線程要比在 C 或 C++ 中容易得多，這是由於 Java 編程語言提供了語言級的支持。本文經過簡單的編程示例來講明 Java 程序中的多線程是多麼直觀。讀完本文之後，用戶應該可以編寫簡單的多線程程序。

爲何會排隊等待?html

下面的這個簡單的 Java 程序完成四項不相關的任務。這樣的程序有單個控制線程，控制在這四個任務之間線性地移動。此外，由於所需的資源 ? 打印機、磁盤、數據庫和顯示屏 -- 因爲硬件和軟件的限制都有內在的潛伏時間，因此每項任務都包含明顯的等待時間。所以，程序在訪問數據庫以前必須等待打印機完成打印文件的任務，等等。若是您正在等待程序的完成，則這是對計算資源和您的時間的一種拙劣使用。改進此程序的一種方法是使它成爲多線程的。java

四項不相關的任務程序員

class myclass {
static public void main(String args[]) {
print_a_file();
manipulate_another_file();
access_database();
draw_picture_on_screen();
}
}

在本例中，每項任務在開始以前必須等待前一項任務完成，即便所涉及的任務絕不相關也是這樣。可是，在現實生活中，咱們常用多線程模型。咱們在處理某些任務的同時也可讓孩子、配偶和父母完成別的任務。例如，我在寫信的同時可能打發個人兒子去郵局買郵票。用軟件術語來講，這稱爲多個控制(或執行)線程。算法

能夠用兩種不一樣的方法來得到多個控制線程：數據庫

多個進程編程

在大多數操做系統中均可以建立多個進程。當一個程序啓動時，它能夠爲即將開始的每項任務建立一個進程，並容許它們同時運行。當一個程序因等待網絡訪問或用戶輸入而被阻塞時，另外一個程序還能夠運行，這樣就增長了資源利用率。可是，按照這種方式建立每一個進程要付出必定的代價：設置一個進程要佔用至關一部分處理器時間和內存資源。並且，大多數操做系統不容許進程訪問其餘進程的內存空間。所以，進程間的通訊很不方便，而且也不會將它本身提供給容易的編程模型。服務器

線程網絡

線程也稱爲輕型進程 (LWP)。由於線程只能在單個進程的做用域內活動，因此建立線程比建立進程要廉價得多。這樣，由於線程容許協做和數據交換，而且在計算資源方面很是廉價，因此線程比進程更可取。線程須要操做系統的支持，所以不是全部的機器都提供線程。Java 編程語言，做爲至關新的一種語言，已將線程支持與語言自己合爲一體，這樣就對線程提供了強健的支持。多線程

使用 Java 編程語言實現線程併發

Java編程語言使多線程如此簡單有效，以至於某些程序員說它其實是天然的。儘管在 Java 中使用線程比在其餘語言中要容易得多，仍然有一些概念須要掌握。要記住的一件重要的事情是 main() 函數也是一個線程，並可用來作有用的工做。程序員只有在須要多個線程時才須要建立新的線程。

Thread 類

Thread 類是一個具體的類，即不是抽象類，該類封裝了線程的行爲。要建立一個線程，程序員必須建立一個從 Thread 類導出的新類。程序員必須覆蓋 Thread 的 run() 函數來完成有用的工做。用戶並不直接調用此函數;而是必須調用 Thread 的 start() 函數，該函數再調用 run()。下面的代碼說明了它的用法：

建立兩個新線程

import java.util.*;
class TimePrinter extends Thread {
int pauseTime;
String name;
public TimePrinter(int x, String n) {
pauseTime = x;
name = n;
}
public void run() {
while(true) {
try {
System.out.println(name + ":" + new
Date(System.currentTimeMillis()));
Thread.sleep(pauseTime);
} catch(Exception e) {
System.out.println(e);
}
}
}
static public void main(String args[]) {
TimePrinter tp1 = new TimePrinter(1000, "Fast Guy");
tp1.start();
TimePrinter tp2 = new TimePrinter(3000, "Slow Guy");
tp2.start();
}
}

在本例中，咱們能夠看到一個簡單的程序，它按兩個不一樣的時間間隔(1 秒和 3 秒)在屏幕上顯示當前時間。這是經過建立兩個新線程來完成的，包括 main() 共三個線程。可是，由於有時要做爲線程運行的類可能已是某個類層次的一部分，因此就不能再按這種機制建立線程。雖然在同一個類中能夠實現任意數量的接口，但 Java 編程語言只容許一個類有一個父類。同時，某些程序員避免從 Thread 類導出，由於它強加了類層次。對於這種狀況，就要 runnable 接口。
Runnable 接口

此接口只有一個函數，run()，此函數必須由實現了此接口的類實現。可是，就運行這個類而論，其語義與前一個示例稍有不一樣。咱們能夠用 runnable 接口改寫前一個示例。(不一樣的部分用黑體表示。)

建立兩個新線程而不強加類層次

import java.util.*;
class TimePrinter implements Runnable {
int pauseTime;
String name;
public TimePrinter(int x, String n) {
pauseTime = x;
name = n;
}
public void run() {
while(true) {
try {
System.out.println(name + ":" + new
Date(System.currentTimeMillis()));
Thread.sleep(pauseTime);
} catch(Exception e) {
System.out.println(e);
}
}
}
static public void main(String args[]) {
Thread t1 = new Thread(new TimePrinter(1000, "Fast Guy"));
t1.start();
Thread t2 = new Thread(new TimePrinter(3000, "Slow Guy"));
t2.start();
}
}

請注意，當使用 runnable 接口時，您不能直接建立所需類的對象並運行它;必須從 Thread 類的一個實例內部運行它。許多程序員更喜歡 runnable 接口，由於從 Thread 類繼承會強加類層次。

synchronized 關鍵字

到目前爲止，咱們看到的示例都只是以很是簡單的方式來利用線程。只有最小的數據流，並且不會出現兩個線程訪問同一個對象的狀況。可是，在大多數有用的程序中，線程之間一般有信息流。試考慮一個金融應用程序，它有一個 Account 對象，以下例中所示：

一個銀行中的多項活動

public class Account {
String holderName;
float amount;
public Account(String name, float amt) {
holderName = name;
amount = amt;
}
public void deposit(float amt) {
amount += amt;
}
public void withdraw(float amt) {
amount -= amt;
}
public float checkBalance() {
return amount;
}
}

在此代碼樣例中潛伏着一個錯誤。若是此類用於單線程應用程序，不會有任何問題。可是，在多線程應用程序的狀況中，不一樣的線程就有可能同時訪問同一個 Account 對象，好比說一個聯合賬戶的全部者在不一樣的 ATM 上同時進行訪問。在這種狀況下，存入和支出就可能以這樣的方式發生：一個事務被另外一個事務覆蓋。這種狀況將是災難性的。可是，Java 編程語言提供了一種簡單的機制來防止發生這種覆蓋。每一個對象在運行時都有一個關聯的鎖。這個鎖可經過爲方法添加關鍵字 synchronized 來得到。這樣，修訂過的 Account 對象(以下所示)將不會遭受像數據損壞這樣的錯誤：

對一個銀行中的多項活動進行同步處理

public class Account {
String holderName;
float amount;
public Account(String name, float amt) {
holderName = name;
amount = amt;
}
public synchronized void deposit(float amt) {
amount += amt;
}
public synchronized void withdraw(float amt) {
amount -= amt;
}
public float checkBalance() {
return amount;
}
}

deposit() 和 withdraw() 函數都須要這個鎖來進行操做，因此當一個函數運行時，另外一個函數就被阻塞。請注意， checkBalance() 未做更改，它嚴格是一個讀函數。由於 checkBalance() 未做同步處理，因此任何其餘方法都不會阻塞它，它也不會阻塞任何其餘方法，無論那些方法是否進行了同步處理。

Java 編程語言中的高級多線程支持

線程組

線程是被個別建立的，但能夠將它們歸類到線程組中，以便於調試和監視。只能在建立線程的同時將它與一個線程組相關聯。在使用大量線程的程序中，使用線程組組織線程可能頗有幫助。能夠將它們看做是計算機上的目錄和文件結構。

線程間發信

當線程在繼續執行前須要等待一個條件時，僅有 synchronized 關鍵字是不夠的。雖然 synchronized 關鍵字阻止併發更新一個對象，但它沒有實現線程間發信。Object 類爲此提供了三個函數：wait()、notify() 和 notifyAll()。以全球氣候預測程序爲例。這些程序經過將地球分爲許多單元，在每一個循環中，每一個單元的計算都是隔離進行的，直到這些值趨於穩定，而後相鄰單元之間就會交換一些數據。因此，從本質上講，在每一個循環中各個線程都必須等待全部線程完成各自的任務之後才能進入下一個循環。這個模型稱爲屏蔽同步，下例說明了這個模型：

屏蔽同步

public class BSync {
int totalThreads;
int currentThreads;
public BSync(int x) {
totalThreads = x;
currentThreads = 0;
}
public synchronized void waitForAll() {
currentThreads++;
if(currentThreads < totalThreads) {
try {
wait();
} catch (Exception e) {}
}
else {
currentThreads = 0;
notifyAll();
}
}
}

當對一個線程調用 wait() 時，該線程就被有效阻塞，只到另外一個線程對同一個對象調用 notify() 或 notifyAll() 爲止。所以，在前一個示例中，不一樣的線程在完成它們的工做之後將調用 waitForAll() 函數，最後一個線程將觸發 notifyAll() 函數，該函數將釋放全部的線程。第三個函數 notify() 只通知一個正在等待的線程，當對每次只能由一個線程使用的資源進行訪問限制時，這個函數頗有用。可是，不可能預知哪一個線程會得到這個通知，由於這取決於 Java 虛擬機 (JVM) 調度算法。

將 CPU 讓給另外一個線程

當線程放棄某個稀有的資源(如數據庫鏈接或網絡端口)時，它可能調用 yield() 函數臨時下降本身的優先級，以便某個其餘線程可以運行。

守護線程

有兩類線程：用戶線程和守護線程。用戶線程是那些完成有用工做的線程。守護線程是那些僅提供輔助功能的線程。Thread 類提供了 setDaemon() 函數。Java 程序將運行到全部用戶線程終止，而後它將破壞全部的守護線程。在 Java 虛擬機 (JVM) 中，即便在 main 結束之後，若是另外一個用戶線程仍在運行，則程序仍然能夠繼續運行。

避免不提倡使用的方法

不提倡使用的方法是爲支持向後兼容性而保留的那些方法，它們在之後的版本中可能出現，也可能不出現。Java 多線程支持在版本 1.1 和版本 1.2 中作了重大修訂，stop()、suspend() 和 resume() 函數已不提倡使用。這些函數在 JVM 中可能引入微妙的錯誤。雖然函數名可能聽起來很誘人，但請抵制誘惑不要使用它們。

調試線程化的程序

在線程化的程序中，可能發生的某些常見而討厭的狀況是死鎖、活鎖、內存損壞和資源耗盡。

死鎖

死鎖多是多線程程序最多見的問題。當一個線程須要一個資源而另外一個線程持有該資源的鎖時，就會發生死鎖。這種狀況一般很難檢測。可是，解決方案卻至關好：在全部的線程中按相同的次序獲取全部資源鎖。例如，若是有四個資源 ?A、B、C 和 D ? 而且一個線程可能要獲取四個資源中任何一個資源的鎖，則請確保在獲取對 B 的鎖以前首先獲取對 A 的鎖，依此類推。若是「線程 1」但願獲取對 B 和 C 的鎖，而「線程 2」獲取了 A、C 和 D 的鎖，則這一技術可能致使阻塞，但它永遠不會在這四個鎖上形成死鎖。

活鎖

當一個線程忙於接受新任務以至它永遠沒有機會完成任何任務時，就會發生活鎖。這個線程最終將超出緩衝區並致使程序崩潰。試想一個祕書須要錄入一封信，但她一直在忙於接電話，因此這封信永遠不會被錄入。

內存損壞

若是明智地使用 synchronized 關鍵字，則徹底能夠避免內存錯誤這種氣死人的問題。

資源耗盡

某些系統資源是有限的，如文件描述符。多線程程序可能耗盡資源，由於每一個線程均可能但願有一個這樣的資源。若是線程數至關大，或者某個資源的侯選線程數遠遠超過了可用的資源數，則最好使用資源池。一個最好的示例是數據庫鏈接池。只要線程須要使用一個數據庫鏈接，它就從池中取出一個，使用之後再將它返回池中。資源池也稱爲資源庫。

調試大量的線程

有時一個程序由於有大量的線程在運行而極難調試。在這種狀況下，下面的這個類可能會派上用場：

public class Probe extends Thread {
public Probe() {}
public void run() {
while(true) {
Thread[] x = new Thread[100];
Thread.enumerate(x);
for(int i=0; i<100; i++) {
Thread t = x[i];
if(t == null)
break;
else
System.out.println(t.getName() + "\t" + t.getPriority()
+ "\t" + t.isAlive() + "\t" + t.isDaemon());
}
}
}
}

限制線程優先級和調度

Java 線程模型涉及能夠動態更改的線程優先級。本質上，線程的優先級是從 1 到 10 之間的一個數字，數字越大代表任務越緊急。JVM 標準首先調用優先級較高的線程，而後才調用優先級較低的線程。可是，該標準對具備相同優先級的線程的處理是隨機的。如何處理這些線程取決於基層的操做系統策略。在某些狀況下，優先級相同的線程分時運行;在另外一些狀況下，線程將一直運行到結束。請記住，Java 支持 10 個優先級，基層操做系統支持的優先級可能要少得多，這樣會形成一些混亂。所以，只能將優先級做爲一種很粗略的工具使用。最後的控制能夠經過明智地使用 yield() 函數來完成。一般狀況下，請不要依靠線程優先級來控制線程的狀態。

小結

本文說明了在 Java 程序中如何使用線程。像是否應該使用線程這樣的更重要的問題在很大程序上取決於手頭的應用程序。決定是否在應用程序中使用多線程的一種方法是，估計能夠並行運行的代碼量。並記住如下幾點：

使用多線程不會增長 CPU 的能力。可是若是使用 JVM 的本地線程實現，則不一樣的線程能夠在不一樣的處理器上同時運行(在多 CPU 的機器中)，從而使多 CPU 機器獲得充分利用。

若是應用程序是計算密集型的，並受 CPU 功能的制約，則只有多 CPU 機器可以從更多的線程中受益。

當應用程序必須等待緩慢的資源(如網絡鏈接或數據庫鏈接)時，或者當應用程序是非交互式的時，多線程一般是有利的。

基於 Internet 的軟件有必要是多線程的;不然，用戶將感受應用程序反映遲鈍。例如，當開發要支持大量客戶機的服務器時，多線程可使編程較爲容易。在這種狀況下，每一個線程能夠爲不一樣的客戶或客戶組服務，從而縮短了響應時間。

某些程序員可能在 C 和其餘語言中使用過線程，在那些語言中對線程沒有語言支持。這些程序員可能一般都被搞得對線程失去了信心。