7. Формулировка теоремы о жордановой нормальной форме. Сведение доказательства существования к случаю одного собственного значения
$\DeclareMathOperator{\diag}{diag} \DeclareMathOperator{\Ker}{Ker}$
Жорданова нормальная форма
Определение. Жордановой клеткой размера $m \times m$, соответствующей собственному значению $\lambda$, называется матрица:
$J_m(\lambda)= \begin{pmatrix} \lambda & 1 & 0 & \dots & 0 & 0 \\ 0 & \lambda & 1 & \dots & 0 & 0 \\ & & & \dots & & \\ 0 & 0 & 0 & \dots & \lambda & 1 \\ 0 & 0 & 0 & \dots & 0 & \lambda \\ \end{pmatrix}$
Определение. Жордановой матрицей называется матрица, состоящая из диагональных блоков $J_{m_i}(\lambda_i)$ и нулей вне этих блоков:
$\begin{pmatrix} J_{m_1}(\lambda_1) & &\huge 0 \\ & \ddots & \\ \huge 0& & J_{m_s}(\lambda_s) \\ \end{pmatrix}$
Определение. Жордановым базисом для оператора $A:V \rightarrow V$ называется такой базис пространства $V$, в котором матрица оператора $A$ жорданова, или, как говорят, имеет жорданову нормальную форму (ЖНФ) $J(A)$.
Определение. Приведением квадратной матрицы $A$ к жордановой нормальной форме называется решение уравнения в матрицах вида $X^{-1}AX=J(A)$, где $X$ – (неизвестная) невырожденная матрица, а $J(A)$ – (неизвестная) жорданова матрица.
Теорема (основная). Каждая квадратная матрица над $\mathbb{C}$ приводится к жордановой нормальной форме, т.е. существует невырожденная матрица $C$, для которой $C^{-1}AC=J(A)=J$ – жорданова матрица. С точностью до перестановки клеток жорданова нормальная форма матрицы единственна.
Следствие. Квадратная матрица $A$ над $C$ диагонализируема тогда и только тогда, когда её минимальный многочлен $\mu_A(t)$ не имеет кратных корней.
$\blacktriangle~ A= \begin{pmatrix} J_{m_1}(\lambda_1) & &\huge 0 \\ & \ddots & \\ \huge 0& & J_{m_s}(\lambda_s) \\ \end{pmatrix}~~~\mu_A(t)=(t-\lambda_1)^{m_1}...(t-\lambda_p)^{m_p}$,
где $\{ \lambda_1,...,\lambda_p \}$ – попарно различные собственные значения, $m_i$ – максимальный порядок жордановой клетки, отвечающий собственному значению $\lambda_i$.
Необходимым и достаточным условием диагонализируемости матрицы $A$ (т.е. ее подобия матрицы $\diag(\lambda_1,...\lambda_n)$) является отсутствие в $J_A$ клеток порядка $>1$. Учитывая предыдущие рассуждения, получаем утверждение следствия. $\blacksquare$
##Корневые подпространства
$A:V \rightarrow V$
Определение. Множество векторов
$$V(\lambda)=\{ v \in V ~|~ (A-\lambda E)^kv=0 ~для~ некоторого~ k \}$$
называется корневым подпространством, соответствующим собственному значению $\lambda$.
Корректность определения.
$\blacktriangle$ Пусть $u \in V(\lambda),~v \in V(\lambda)$
$(A-\lambda E)^su=0, (A-\lambda E)^tv=0$
$m=\max \{ s,t \}$
Тогда
$$(A- \lambda E)^m(\alpha u+\beta v)=\alpha (A-\lambda E)^m u+\beta (A-\lambda E)^m v=0 \Rightarrow \alpha u+\beta v \in V(\lambda)$$
$\dim V=n$, тогда $\dim V(\lambda) \leqslant n$ и $A-\lambda E|_{V(\lambda)}$ – нильпотентный оператор. Тогда
$$V(\lambda)=\{ v \in V ~|~ (A-\lambda E)^n=0 \} ~\blacksquare$$
Теорема. $A:V \rightarrow V$ – линейный оператор с характеристическим многочленом $\chi_A(t)=\prod\limits_{i=1}^p (t-\lambda_i)^{m_i},~\lambda_i \neq \lambda_j,~i \neq j$
Тогда $V=V(\lambda_1) \oplus ... \oplus V(\lambda_p)$, где $V_i$ инвариантно относительно $A,~\dim V(\lambda_i)=m_i$
Оператор $A-\lambda_i E$ – нильпотентный на $V(\lambda_i)$ и действует невырожденно на $V(\lambda_1) \oplus ... \oplus V(\lambda_{i-1}) \oplus V(\lambda_{i+1}) \oplus ... \oplus V(\lambda_p)$
$\lambda_i$ – единственное собственное значение $A|_{V(\lambda_i)}$.
$\blacktriangle$ Ни один из простых множителей $t-\lambda_k$ не может быть делителем одновременно всех многочленов $\chi_i(t)=\prod\limits_{j \neq i} (t-\lambda_j)^{m_j},~i=1,...,p \Rightarrow$ НОД$(\chi_1(t),...,\chi_p(t))=1$.
Тогда найдутся многочлены $f_1(t),...,f_p(t) \in \mathbb{C}[t]:$
$$\begin{equation} \sum\limits \chi_i(t)f_i(t)=1 \end{equation}$$
$AW_i=A\chi_i(A)f_i(A)V=\chi_i(A)f_i(A)AV \subseteq \chi_i(A)f_i(A)V = W_i \Rightarrow$ подпространства $W_i$ инвариантны относительно $A$.
$(A-\lambda_i E)^{m_i}W_i=(A-\lambda_i E)^{m_i}\chi_i(A)f_i(A)V=\chi_A(A)f_i(A)V=0$
(т.к. по теореме Гамильтона-Кэли $\chi_A(A)=O$)
Поэтому
$$\begin{equation} W_i \subseteq V(\lambda_i) \end{equation}$$
Перепишем (1) в виде $\sum\limits_{i=1}^{p} \chi_i(A)f_i(A)=E$ и получим $\sum\limits_{i=1}^p W_i=V=\sum\limits_{i=1}^p V(\lambda_i)$
Предположим, что $v \in V(\lambda_i) \cap V_i$, где $V_i=\sum\limits_{j \neq i} V(\lambda_j)$
Тогда $(A-\lambda E)^{m_i}v=0$
Т.к. $v=\sum\limits_{j \neq i} v_j$ и $(A-\lambda_j E)^mv_j=0$, то и $( \prod\limits_{j \neq i} (A-\lambda_j E)^m)v=0$
Т.к. $(t-\lambda_i)^m,~ \prod\limits_{j \neq i} (t-\lambda_j)^m$ – взаимно простые, то
$$\exists a(t),~b(t): a(t)(t-\lambda_i)^m+b(t)\prod\limits_{j \neq i} (t-\lambda_j)^m=1$$
$$0=a(A)(A-\lambda_i E)^mv+b(A)\prod\limits_{j \neq i} (A-\lambda_i E)^mv=Ev=v \Rightarrow v=0$$
Поэтому $V(\lambda_i)$ и $V_i$ не пересекаются. Получаем разложение:
$$V=V(\lambda_1) \oplus ... \oplus V(\lambda_p)$$
Из (2) и (3) вытекает, что $W_i=V(\lambda_i)$
Таким образом, получено выражение:
$$V(\lambda_i)=\chi_i(A)f_i(A)V,$$
где $\chi_i(t)$ и $f_i(t)$ – многочлены из (1). В частности, $(A-\lambda_i E)^mV(\lambda_i)=0$.
Минимальным многочленом для $A$ на $V_i$ будет некоторый делитель многочлена $(t-\lambda_i)^{m_i} \Rightarrow \lambda_i$ – единственное собственное значение оператора $A|_{V(\lambda_i)}$.
Выберем базис в каждом из $V(\lambda_i)$. Объединяя, получим:
$\begin{pmatrix} A_1 & &\huge 0 \\ & \ddots & \\ \huge 0& & A_p \\ \end{pmatrix}~~~$ где $A_i$ – матрица порядка $\dim V(\lambda_i)=m'_i$ с единственным собственным значением $\lambda_i$ и характеристическим многочленом $\chi_{A_i}(t)=(t-\lambda_i)^{m'_i},~m'_i \leqslant m_i$
$\chi_A(t)=\prod\limits_{i=1}^p\chi_{A_i}(t) \Rightarrow n=n'_1+...+n'_p$ и $n'_i=n_i$
Докажем невырожденность оператора $(A-\lambda_i E)|_{V_i}$
Предположим противное, тогда $\{ \Ker(A-\lambda_i E) \} \cap V_i \neq 0$ и $Av-\lambda_iv=0$ для некоторого $0 \neq v \in V_i$, но характеристическим многочленом для $A$ является $\chi_i(t)=\prod\limits_{j \neq i} (t-\lambda_j)^{n_j}$, и $\lambda_i$ собственным значением быть не может. Противоречие $\Rightarrow$ оператор невырожден. $\blacksquare$
Таким образом, мы свели доказательство основной теоремы к случаю, когда $A$ имеет единственное собственное значение $\lambda$ и $(A-\lambda E)^m=O,~m \leqslant \dim V$.