在本系列中,個人我的看法將使用斜體標註。因爲時間關係,移除了例題部分,可參考答案連接,若有疑問,可在評論區處留言。因爲文章是我獨自整理的,缺少審閱,不免出現錯誤,若有發現歡迎在評論區中指正。spa
本節含有許多實用性的結果,而且證實手段每每不惟一,應當認真體會一下不一樣證實方法之間的異同。get
本徵值的存在性 有限維非零復向量空間上,每一個算子均有本徵值。數學
注意,這裏並無涉及本徵值的個數,也不涉及重特徵值問題。class
設\(\dim V=n>0\),\(T\in\mathcal L(V)\)。取\(v\in V\)且\(v\ne 0\),\(n+1\)個向量\(v,Tv,\cdots,T^nv\)線性相關,故存在不全爲0的實數\(a_0,a_1,\cdots,a_n\),使得angular
\[0=a_0v+a_1Tv+\cdots+a_nT^nv. \]若是\(a_1=\cdots=a_n=0\),則因爲\(v\ne 0\)必有\(a_0=0\),這與線性相關矛盾。令基礎
\[p(z)=a_0+a_1z+\cdots+a_nz^n, \]由上面的分析,它不是一個常值多項式,故存在\(\lambda_1,\cdots,\lambda_m\in\mathbb{C}\),使得lambda
\[p(z)=a_0+a_1z+\cdots+a_nz^n=c(z-\lambda_1)\cdots(z-\lambda_m) \]因此方法
\[0=p(T)v=c(T-\lambda_1I)\cdots(T-\lambda_mI)v \]至少存在一個\(j\),使得\(T-\lambda_jI\)不可逆(不然容易得出\(v=0\)),故找到了\(T\)的一個本徵值\(\lambda_j\)。im
習題1六、17分別利用線性映射證實本徵值的存在性,下面給出證實。集合
對於\(T\in\mathcal L(V)\),構造線性映射\(f\in\mathcal L(\mathcal P_n(\mathbb{C}),V)\),其中\(\forall p\in\mathcal P_n(\mathbb{C})\),有
\[f(p)=p(T)v\in V. \]因爲\(\dim\mathcal P_n(\mathbb{C})=n+1>n=\dim V\),因此\(f\)不是單射,存在\(p\ne 0\)使得
\[p(T)v=0. \]顯然\(p(z)\)不能是非零常數,由代數基本定理,能夠分解爲
\[c(T-\lambda_1I)\cdots(T-\lambda_mI)=0, \]因此存在一個\(\lambda_j\)是\(T\)的特徵值。
對於\(T\in\mathcal L(V)\),構造線性映射\(g\in\mathcal L(P_{n^2}(\mathbb{C}),\mathcal L(V))\),其中\(\forall p\in\mathcal P_{n^2}(\mathbb{C})\),有
\[g(p)=p(T), \]因爲\(\dim\mathcal P_{n^2}(C)=n^2+1>n^2=\dim\mathcal L(V)\),因此\(g\)不是單射,存在\(p\ne 0\)使得
\[p(T)=0 \]顯然\(p(z)\)不能使非零常數,故依舊有如上的分解。
算子的矩陣(matrix of an operator) 設\(T\in\mathcal L(V)\),並設\(v_1,\cdots,v_n\)是\(V\)的基,\(T\)關於該基的矩陣定義爲\(\mathcal M(T)=(A_{i,k})_{n\times n}\),其元素定義爲
在討論線性映射的矩陣時,爲\(V,W\)都找了一組基;而進入到算子的矩陣,因爲線性空間只有一個,因此只使用\(V\)的一組基,而且通常使用標準基。
矩陣的對角線(diagonal of a matrix) 方陣的對角線由位於左上角到右下角的直線上的元素組成。
上三角矩陣(upper-triangular matrix) 若是位於方陣對角線下方的元素都是0,則這個方陣稱爲上三角矩陣。
上三角矩陣與不變子空間之間存在聯繫,若\(T\in\mathcal L(V)\),且\(v_1,\cdots,v_n\)是\(V\)的基,則如下三個說法等價:
上三角矩陣的存在性 在\(V(\mathbb{C})\)上,每一個算子\(T\in\mathcal L(V)\)均有上三角矩陣。
這個定理的實用之處在於,將特徵值關聯到了線性映射上。而且,書上給出的兩個證實,一個基於限制算子,一個基於商算子,因爲商算子咱們平時不經常使用,所以更應該注意商算子的用法。
限制算子:使用數學概括法,若\(\dim V=1\),則結論顯然成立。
現設\(\dim V>1\),且對於全部維數比\(V\)小的復向量空間都成立這樣的結論。設\(\lambda\)是\(T\)的任意本徵值,\(U=\mathrm{range}(T-\lambda I)\),則因爲\(T-\lambda I\)不是滿射,有\(\dim U<\dim V\)。下證實\(U\)是\(T\)下的不變子空間,\(\forall u\in U\),有
\[Tu=(T-\lambda I+\lambda I)u=(T-\lambda I)u+\lambda u\in U. \]故\(T|_U\)是\(U\)上的算子,由概括假設,\(U\)有基\(u_1,\cdots,u_m\)使得\(T|_U\)關於這個基有上三角矩陣,所以對每一個\(j=1,\cdots,m\)都有
\[Tu_j=T|_U (u_j)\in\mathrm{span}(u_1,\cdots,u_j). \]將\(u_1,\cdots,u_m\)擴充成\(V\)的基\(u_1,\cdots,u_m,v_1,\cdots,v_n\),對每一個\(k\),都有
\[Tv_k=(T-\lambda I)v_k+\lambda v_k, \]因爲\((T-\lambda I)v_k\in U\),\(\lambda v_k\in\mathrm{span}(v_k)\subset\mathrm{span}(v_1,\cdots,v_k)\),因此
\[Tv_k\in\mathrm{span}(u_1,\cdots,u_m,v_1,\cdots,v_k), \]故\(T\)關於基\(u_1,\cdots,u_m,v_1,\cdots,v_n\)有上三角矩陣。
商算子:使用數學概括法,若\(\dim V=1\),則結論顯然成立。
現設\(\dim V=n>1\),並設對於全部\(n-1\)維復向量空間都成立這樣的結論。設\(v_1\)是\(T\)的任意一個本徵向量,\(U=\mathrm{span}(v_1)\),則\(U\)是\(T\)下的不變子空間,且\(\dim U=1\),故\(\dim V/U=n-1\)。
對\(V/U\),由概括假設,存在一組基\(v_2+U,\cdots,v_n+U\),使得\(T/U\)關於該基有上三角矩陣,即\(\forall j=2,\cdots,v_n\)有
\[(T/U)(v_j+U)\in\mathrm{span}(v_2+U,\cdots,v_j+U), \]即
\[Tv_j+U=a_2v_2+\cdots+a_jv_j+U, \]因此
\[Tv_j-(a_2v_2+\cdots+a_jv_j)=a_1v_1, \]故
\[Tv_j\in\mathrm{span}(v_1,\cdots,v_j). \]這就證實\(T\)關於\(v_1,\cdots,v_n\)這組基(這一組確實是基)存在上三角矩陣。
上三角矩陣與可逆性 若\(T\in\mathcal L(V)\)關於\(V\)的某個基有上三角矩陣,則\(T\)是可逆的當且僅當這個上三角矩陣對角線上的元素都不是0。
這是一個基礎定理,由此能夠很容易獲得其餘推論。
設\(v_1,\cdots,v_n\)是\(V\)的基,\(T\)關於這組基存在上三角矩陣:
\[\mathcal M(T)=\begin{pmatrix} \lambda_1 & & & * \\ \vdots & \lambda _2 & & \\ 0 & 0 & \ddots & \\ 0 & 0 & \cdots & \lambda_n \end{pmatrix}. \]先證充分性。上面的矩陣代表\(Tv_1=\lambda_1v_1\),因爲\(\lambda_1\ne 0\),因此\(T(v_1/\lambda_1)=v_1\),即\(v_1\in\mathrm{range}T\)。從而
\[T(v_2/\lambda_2)=a_1v_1+v_2,\quad v_2\in\mathrm{range}T,\\ T(v_3/\lambda_3)=b_1v_1+b_2v_2+v_3,\quad v_3\in\mathrm{range}T,\\ \vdots \]以此類推,\(v_1,\cdots,v_n\in\mathrm{range}T\),故\(T\)是滿的,等價於\(T\)是可逆的。
再證必要性。\(T\)是可逆的故\(\mathrm{null}T=\{0\}\),因此\(Tv_1=\lambda_1v_1\ne 0\),\(\lambda_1\ne 0\)。若是存在某個\(\lambda_j=0\),且\(\forall k<j\)都有\(\lambda_k\ne 0\),則
\[Tv_j\in\mathrm{span}(v_1,\cdots,v_{j-1}), \]同時\(T\)將\(\mathrm{span}(v_1,\cdots,v_{j})\)映射到\(\mathrm{span}(v_1,\cdots,v_{j-1})\)上,即\(T\)在子空間\(\mathrm{span}(v_1,\cdots,v_{j-1})\)上不是單射,存在某個\(v\in\mathrm{span}(v_1,\cdots,v_j)\)使得\(v\ne 0\)且\(Tv=0\),這與\(T\)的可逆性矛盾。
上三角矩陣的特徵值 設\(T\in\mathcal L(V)\)關於\(V\)的某個基有上三角矩陣,則\(T\)的本徵值恰爲這個上三角矩陣對角線上的元素。
設\(\lambda \in\mathbb{F}\),則
\[\mathcal M(T-\lambda I)=\begin{pmatrix} \lambda_1-\lambda & & & * \\ \vdots & \lambda _2-\lambda & & \\ 0 & 0 & \ddots & \\ 0 & 0 & \cdots & \lambda_n-\lambda \end{pmatrix}. \]爲使得\(T-\lambda I\)可逆,必有\(\lambda\)等於\(\lambda_1,\cdots,\lambda_n\)中的某一個,即\(\lambda_1,\cdots,\lambda_n\)是\(T\)的所有特徵值。
對角矩陣(diagonal matrix) 對角矩陣是對角線之外的元素全是0的方陣。
本徵空間(eigenspace) 設\(T\in\mathcal L(V)\)且\(\lambda \in \mathbb{F}\),則\(T\)相應於\(\lambda\)的本徵空間定義爲
本徵空間的和是直和 設\(V\)是有限維的,\(T\in\mathcal L(V)\),且\(\lambda_1\cdots,\lambda_m\)是\(T\)的互異本徵值,則
是直和,且
這說明,不一樣本徵空間是互不相交的(除了\(0\))。這裏用的是小於等於號,說明\(V\)中並不是全部向量都是特徵向量。
假設\(u_j\in E(\lambda_j,T)\),且\(u_1+\cdots+u_m=0\)。因爲相應於不一樣本徵值的本徵向量線性無關,因此\(u_j=0,\forall j\),這說明
\[E(\lambda_1,T)+\cdots+E(\lambda_m,T) \]是直和,天然成立下方的不等式。
可對角化(diagonalizable) 若是算子\(T\)關於\(V\)的某個基有對角矩陣,則\(T\)是可對角化的。
可對角化的算子具備很簡潔的表達形式,若是要計算\(Tv\),只要將\(v\)關於對角基分解便可。
如下說法等價:
以上五點,\(1\Leftrightarrow 2\Leftrightarrow 3\)和\(4\Leftrightarrow 5\)都是顯然的,下證\(2\Leftrightarrow 4\)。
先證\(2\Rightarrow 4\),若\(V\)有\(T\)的本徵向量構成的基,則顯然
\[V=E(\lambda_1,T)+\cdots+E(\lambda_m,T). \]又由於不一樣本徵值對應的本徵空間是直和,因此
\[V=E(\lambda_1,T)\oplus\cdots\oplus E(\lambda_m,T). \]最後證\(4\Rightarrow 2\),在每一個\(E(\lambda_j,T)\)內取一組基,將其合在一塊兒就獲得\(V\)的本徵向量構成的基。
本徵值足夠多則可對角化 若\(T\in\mathcal L(V)\)有\(\dim V\)個互異的本徵值,則\(T\)可對角化。
設\(\dim V=n\),\(\lambda_1,\cdots,\lambda_n\)是\(T\)的\(n\)個互異本徵值,對應的本徵向量爲\(v_j\),則這些\(v_j\)是線性無關的,因爲長度爲\(n\)的線性無關組是\(V\)的基,因此\(v_1,\cdots,v_j\)是\(V\)的一組基,故\(T\)可對角化。
事實上,因爲不一樣本徵空間都是\(T\)下的不變子空間,因此將不一樣本徵空間的基組成整個\(V\)上的一組線性無關向量,對應的矩陣是一個對角子矩陣;進而將這個向量組擴充成一組基。