2019/07/23 2次正方行列のジョルダンの標準形
本日のお題
「次の行列について,対角化行列を求めて対角化しなさい。対角化できないときは \(\pmatrix{\lambda & 1 \cr 0 & \lambda}\) の形にするための変換行列を求めなさい。」
という問いに対して,固有値を2つもつ行列の対角化はできたのですが,
\[A = \pmatrix{5 & 1 \cr -4 & 1}\]
のように固有値が1つだけの行列はどのようにすればよいか分かりません。考え方を教えてください。
承知しました。やってみましょ~!! ただし,ここでは2行2列の正方行列についてのみ解説します。
まず,このことを覚えておいてください。
固有値が1つだけの行列は対角化することができません。
その代わり問題文にあるように,変換行列 \(P\) を使って \(P^{-1}AP = \pmatrix{\lambda & 1 \cr 0 & \lambda}\) と変形することができます。2行2列の正方行列の場合,二つの固有値を用いた対角行列 \(\pmatrix{\lambda_1 & 0 \cr 0 & \lambda_2}\) と \(\pmatrix{\lambda & 1 \cr 0 & \lambda}\) の形の行列とを合わせて ジョルダンの標準形 と呼びます。\(\lambda_1\),\(\lambda_2\) 及び \(\lambda\) は行列 \(A\) の固有値です。そうそう,行列 \(A\) の階数が \(2\) 以外の場合を忘れていました。ジョルダンの標準形には零行列及び \(\pmatrix{\lambda & 0 \cr 0 & 0}\) も含まれますね。
さて,このお題に対する解説ですが,まず,固有値が一つの場合の変換行列 \(P\) の作り方を示します。その後で,そのように作った \(P\) によって行列 \(A\) が行列 \(\pmatrix{\lambda & 1 \cr 0 & \lambda}\) に変換できることを一般的に証明します。
まず,\(A = \pmatrix{5 & 1 \cr -4 & 1}\) の固有値と固有ベクトルを求めましょう。
特性方程式 \(\left|\matrix{4 - \lambda & 1 \cr -4 & 1 - \lambda}\right| = 0\) を解くと \[\begin{eqnarray} && (5 - \lambda)(1 - \lambda) - 1\cdot(-4) = 0 \\ && \lambda^2 - 6\lambda + 9 = 0 \\ && \left(\lambda - 3\right)^2 = 0 \\ && ∴\quad \lambda = 3 \end{eqnarray}\] 確かに特性方程式の解が重解となっていますから,固有値は \(3\) が一つあるだけです。固有値 \(3\) に対する固有ベクトル \(\boldsymbol{v} = \pmatrix{x \cr y}\) は,次の式を満たします。 \[\begin{eqnarray} && \left(A - \lambda E\right)\boldsymbol{v} = \boldsymbol{o} \tag{1}\\[4px] && \left\{\pmatrix{5 & 1 \cr -4 & 1} - 3\pmatrix{1 & 0 \cr 0 & 1}\right\}\pmatrix{x \cr y} = \pmatrix{0 \cr 0} \\[2px] && \pmatrix{2 & 1 \cr -4 & -2}\pmatrix{x \cr y} = \pmatrix{0 \cr 0} \\[2px] && ∴\quad 2x + y = 0 \end{eqnarray}\] そこで,行列 \(A\) の固有値 \(3\) に対する固有ベクトルとして \(\boldsymbol{v} = \pmatrix{1 \cr -2}\) をとることにします。
ここで,上の \((1)\) 式によく似た式を作ります。 \[\left(A - \lambda E \right)\boldsymbol{u} = \boldsymbol{v} \tag{2}\] \((2)\) 式に \(\lambda = 3\) と \(\boldsymbol{v} = \pmatrix{1 \cr -2}\),そして \(\boldsymbol{u} = \pmatrix{x \cr y}\) を代入します。すると \[\begin{array}{l} \pmatrix{2 & 1 \cr -4 & 2}\pmatrix{x \cr y} = \pmatrix{1 \cr -2} \\[4px] ∴ \quad 2x + y = 1 \end{array}\] よって,\(\boldsymbol{u}\) として \(\boldsymbol{u} = \pmatrix{0 \cr 1}\) をとることができます。実は,このような \(\boldsymbol{u}\) をとることができるのは,特性方程式の解が重解になっている行列に限られます。このことは後ほど示すことにしましょう。
さて,このように選んだ2つのベクトル \(\boldsymbol{v}\) と \(\boldsymbol{u}\) を使って,行列 \(P = \left(\boldsymbol{v},\ \boldsymbol{u}\right)\) を作ります。(列ベクトルである \(\boldsymbol{v}\) と \(\boldsymbol{u}\) とを2つ並べて作った行列です。)このとき,\(\boldsymbol{v}\) と \(\boldsymbol{u}\) の順序も重要です。この場合 \[\displaystyle P = \pmatrix{1 & 0 \cr -2 & 1}\ ,\quad P^{-1} = \frac{1}{1}\cdot\pmatrix{1 & 0 \cr 2 & 1} = \pmatrix{1 & 0 \cr 2 & 1}\] となるので \[P^{-1}AP\begin{array}[t]{l} = \pmatrix{1 & 0 \cr 2 & 1}\pmatrix{5 & 1 \cr -4 & 1}\pmatrix{1 & 0 \cr -2 & 1} \\ = \pmatrix{5 & 1 \cr 6 & 3}\pmatrix{1 & 0 \cr -2 & 1} \\ = \pmatrix{3 & 1 \cr 0 & 3} \end{array}\] となって,目的の式が得られました。以上から \(P = \pmatrix{1 & 0 \cr -2 & 1}\) が変換行列の一つであることを確かめられました。
ここからが本番ですね。なぜ,このような方法で行列 \(A\) を行列 \(\pmatrix{\lambda & 1 \cr 0 & \lambda}\) に変換することができるか? です。できるだけ難しくならないように考えていきましょう。
まず,上の操作でキーになる \((2)\) 式を見ましょう。異なる固有値が二つある場合に \((2)\) を満たすベクトル \(\boldsymbol{u}\) は存在しないのでしょうか? 固有値がただ一つの場合には,必ず \((2)\) を満たすベクトル \(\boldsymbol{u}\) が存在するのでしょうか?
1つ目の疑問です。行列 \(A\) に固有値が二つあるとき \[(A - \lambda E)\boldsymbol{u} = \boldsymbol{v}\] を満たすベクトル \(\boldsymbol{u}\) は存在しません。今,行列 \(A\) の二つの固有値を \(\lambda_1\) と \(\lambda_2\) とし,それぞれの固有値に対する固有ベクトルを \(\boldsymbol{v}_1\) と \(\boldsymbol{v}_2\) とします。つまり \[A\boldsymbol{v}_1 = \lambda_1 \boldsymbol{v}_1\ ,\quad A\boldsymbol{v}_2 = \lambda_2 \boldsymbol{v}_2\] が成り立っています。異なる固有値に対する固有ベクトルは線形独立(これは証明なしで使わせてください)ですから,任意のベクトル \(\boldsymbol{u}\) は \(k_1\boldsymbol{v}_1 + k_2\boldsymbol{v}_2\) と表すことができます。 \[\left(A - \lambda_1 E\right)\boldsymbol{u}\begin{array}[t]{l} = A\left(k_1\boldsymbol{v}_1 + k_2\boldsymbol{v}_2\right) - \lambda_1 k_1 \boldsymbol{v}_1 - \lambda_1k_2\boldsymbol{v}_2 \\ = \lambda_1 k_1 \boldsymbol{v}_1 + \lambda_2 k_2 \boldsymbol{v}_2 - \lambda_1 k_1 \boldsymbol{v}_1 - \lambda_1k_2\boldsymbol{v}_2 \\ = \left(\lambda_2 - \lambda_1\right)k_2 \boldsymbol{v}_2 \end{array}\] よって,\(\left(A - \lambda_1 E\right)\boldsymbol{u} = \boldsymbol{v}_1\) を満たすベクトル \(\boldsymbol{u}\) は存在しません。\(\left(A - \lambda_2 E\right)\boldsymbol{u} = \boldsymbol{v}_2\) を満たすベクトル \(\boldsymbol{u}\) が存在しないことも同様に示せます。
2つ目の疑問に答えましょう。関係なさそうに思えますが・・・,固有値が一つだけの行列 \(A\) について固有値を \(\lambda\) として \[\left(A - \lambda E\right)^2 = \boldsymbol{O}\] が成り立つことを示します。\(A = \pmatrix{a & b \cr c & d}\) とすると \(\lambda\) は方程式 \[x^2 - (a + d)x + ad - bc = 0\] の解です。重解をもちますから \(D = (a + d)^2 - 4(ad - bc) = 0\) であり,\(a + d = 2\lambda\),\(ad - bc = \lambda^2\) が成り立っています。併せてケーリー・ハミルトンの公式を用いて \[\left(A - \lambda E\right)^2 \begin{array}[t]{l} = A^2 - 2\lambda A + \lambda^2 E \\ = (a + d)A - (ad - bc)E - 2\lambda A + \lambda^2 E \\ = 2\lambda A - \lambda^2 E - 2\lambda A + \lambda^2 E \\ = \boldsymbol{O} \end{array}\] したがって,任意のベクトル \(\boldsymbol{u}\) について \(\left(A - \lambda E\right)^2\boldsymbol{u} = \boldsymbol{o}\) が成り立ちます。この式を \[\left(A - \lambda E\right)\left\{\left(A - \lambda E\right)\boldsymbol{u}\right\} = \boldsymbol{o}\] と見ると,ベクトル \(\left(A - \lambda E\right)\boldsymbol{u}\) が行列 \(A\) の固有値 \(\lambda\) に対する固有ベクトルであることを示しています。すなわち,行列 \(A - \lambda E\) による平面全体の像が行列 \(A\) の固有値 \(\lambda\) に対する固有ベクトルの集合(空間)に一致しているということになります。これで,固有値が一つの行列 \(A\) について \((2)\) 式を満たすベクトル \(\boldsymbol{u}\) の存在が保証されました。このベクトル \(u\) を 一般化された固有ベクトル といいます。
証明の最終段階です。\(\left(A - \lambda E\right)\boldsymbol{u} = \boldsymbol{v}\) を満たす二つのベクトル \(\boldsymbol{u}\) と \(\boldsymbol{v}\) を用いて行列 \(P = \left(\boldsymbol{v},\ \boldsymbol{u}\right)\) を作ります。つまり、固有ベクトルと一般化された固有ベクトルとを左右に並べた行列を作るということです。 \[AP - P\pmatrix{\lambda & 1 \cr 0 & \lambda}\begin{array}[t]{l} = A\left(\boldsymbol{v},\ \boldsymbol{u}\right) - \left(\boldsymbol{v},\ \boldsymbol{u}\right)\pmatrix{\lambda & 1 \cr 0 & \lambda} \\ = \left(\lambda\boldsymbol{v},\ A\boldsymbol{u}\right) - \left(\lambda\boldsymbol{v},\ \boldsymbol{v} + \lambda\boldsymbol{u}\right) \\ = \left(\boldsymbol{o},\ \left(A - \lambda E\right)\boldsymbol{u} - \boldsymbol{v}\right) \\ = \left(\boldsymbol{o},\ \boldsymbol{o}\right) \end{array}\] よって,\(AP = P\pmatrix{\lambda & 1 \cr 0 & \lambda}\) ∴ \(P^{-1}AP = \pmatrix{\lambda & 1 \cr 0 & \lambda}\)
以上で証明は終了です・・・終了なのですが,証明の過程で一つ気づいてしまいました。
要するに,\(\left(A - \lambda E\right)\boldsymbol{u} = \boldsymbol{v}\) を満たす \(\boldsymbol{v}\) と \(\boldsymbol{u}\) を決められれば \(\mbox{OK}\) なのですよネ。固有ベクトル \(\boldsymbol{v}\) から決めなければならないという法はありません。任意である \(\boldsymbol{u}\) から決めた方が断然早いのです。
具体的に説明するために,最初に扱った行列 \(A = \pmatrix{5 & 1 \cr -4 & 1}\) に再び登場願います。\(\boldsymbol{u} = \pmatrix{1 \cr 0}\) とします。すると \(\boldsymbol{v} = \pmatrix{2 & 1 \cr -4 & -2}\pmatrix{1 \cr 0} = \pmatrix{2 \cr -4}\) ですから,ジョルダンの標準形への変換行列として \(P = \pmatrix{2 & 1 \cr -4 & 0}\) をとることができます。実際 \[\pmatrix{2 & 1 \cr -4 & 0}^{-1}\pmatrix{5 & 1 \cr -4 & 1}\pmatrix{2 & 1 \cr -4 & 0} = \pmatrix{3 & 1 \cr 0 & 3}\]
が成り立ちます。何てこった f^^;