7. Формулировка теоремы о жордановой нормальной форме. Сведение доказательства существования к случаю одного собственного значения
Жорданова нормальная форма
Определение. Жордановой клеткой размера m×m, соответствующей собственному значению λ, называется матрица:
Jm(λ)=(λ10…000λ1…00…000…λ1000…0λ)
Определение. Жордановой матрицей называется матрица, состоящая из диагональных блоков Jmi(λi) и нулей вне этих блоков:
(Jm1(λ1)0⋱0Jms(λs))
Определение. Жордановым базисом для оператора A:V→V называется такой базис пространства V, в котором матрица оператора A жорданова, или, как говорят, имеет жорданову нормальную форму (ЖНФ) J(A).
Определение. Приведением квадратной матрицы A к жордановой нормальной форме называется решение уравнения в матрицах вида X−1AX=J(A), где X – (неизвестная) невырожденная матрица, а J(A) – (неизвестная) жорданова матрица.
Теорема (основная). Каждая квадратная матрица над C приводится к жордановой нормальной форме, т.е. существует невырожденная матрица C, для которой C−1AC=J(A)=J – жорданова матрица. С точностью до перестановки клеток жорданова нормальная форма матрицы единственна.
Следствие. Квадратная матрица A над C диагонализируема тогда и только тогда, когда её минимальный многочлен μA(t) не имеет кратных корней.
▴ A=(Jm1(λ1)0⋱0Jms(λs)) μA(t)=(t−λ1)m1...(t−λp)mp,
где {λ1,...,λp} – попарно различные собственные значения, mi – максимальный порядок жордановой клетки, отвечающий собственному значению λi.
Необходимым и достаточным условием диагонализируемости матрицы A (т.е. ее подобия матрицы diag(λ1,...λn)) является отсутствие в JA клеток порядка >1. Учитывая предыдущие рассуждения, получаем утверждение следствия. ◼
##Корневые подпространства
A:V→V
Определение. Множество векторов
V(λ)={v∈V | (A−λE)kv=0 для некоторого k}
называется корневым подпространством, соответствующим собственному значению λ.
Корректность определения.
▴ Пусть u∈V(λ), v∈V(λ)
(A−λE)su=0,(A−λE)tv=0
m=max
Тогда
(A- \lambda E)^m(\alpha u+\beta v)=\alpha (A-\lambda E)^m u+\beta (A-\lambda E)^m v=0 \Rightarrow \alpha u+\beta v \in V(\lambda)
\dim V=n, тогда \dim V(\lambda) \leqslant n и A-\lambda E|_{V(\lambda)} – нильпотентный оператор. Тогда
V(\lambda)=\{ v \in V ~|~ (A-\lambda E)^n=0 \} ~\blacksquare
Теорема. A:V \rightarrow V – линейный оператор с характеристическим многочленом \chi_A(t)=\prod\limits_{i=1}^p (t-\lambda_i)^{m_i},~\lambda_i \neq \lambda_j,~i \neq j
Тогда V=V(\lambda_1) \oplus ... \oplus V(\lambda_p), где V_i инвариантно относительно A,~\dim V(\lambda_i)=m_i
Оператор A-\lambda_i E – нильпотентный на V(\lambda_i) и действует невырожденно на V(\lambda_1) \oplus ... \oplus V(\lambda_{i-1}) \oplus V(\lambda_{i+1}) \oplus ... \oplus V(\lambda_p)
\lambda_i – единственное собственное значение A|_{V(\lambda_i)}.
\blacktriangle Ни один из простых множителей t-\lambda_k не может быть делителем одновременно всех многочленов \chi_i(t)=\prod\limits_{j \neq i} (t-\lambda_j)^{m_j},~i=1,...,p \Rightarrow НОД(\chi_1(t),...,\chi_p(t))=1.
Тогда найдутся многочлены f_1(t),...,f_p(t) \in \mathbb{C}[t]:
\begin{equation} \sum\limits \chi_i(t)f_i(t)=1 \end{equation}
AW_i=A\chi_i(A)f_i(A)V=\chi_i(A)f_i(A)AV \subseteq \chi_i(A)f_i(A)V = W_i \Rightarrow подпространства W_i инвариантны относительно A.
(A-\lambda_i E)^{m_i}W_i=(A-\lambda_i E)^{m_i}\chi_i(A)f_i(A)V=\chi_A(A)f_i(A)V=0
(т.к. по теореме Гамильтона-Кэли \chi_A(A)=O)
Поэтому
\begin{equation} W_i \subseteq V(\lambda_i) \end{equation}
Перепишем (1) в виде \sum\limits_{i=1}^{p} \chi_i(A)f_i(A)=E и получим \sum\limits_{i=1}^p W_i=V=\sum\limits_{i=1}^p V(\lambda_i)
Предположим, что v \in V(\lambda_i) \cap V_i, где V_i=\sum\limits_{j \neq i} V(\lambda_j)
Тогда (A-\lambda E)^{m_i}v=0
Т.к. v=\sum\limits_{j \neq i} v_j и (A-\lambda_j E)^mv_j=0, то и ( \prod\limits_{j \neq i} (A-\lambda_j E)^m)v=0
Т.к. (t-\lambda_i)^m,~ \prod\limits_{j \neq i} (t-\lambda_j)^m – взаимно простые, то
\exists a(t),~b(t): a(t)(t-\lambda_i)^m+b(t)\prod\limits_{j \neq i} (t-\lambda_j)^m=1
0=a(A)(A-\lambda_i E)^mv+b(A)\prod\limits_{j \neq i} (A-\lambda_i E)^mv=Ev=v \Rightarrow v=0
Поэтому V(\lambda_i) и V_i не пересекаются. Получаем разложение:
V=V(\lambda_1) \oplus ... \oplus V(\lambda_p)
Из (2) и (3) вытекает, что W_i=V(\lambda_i)
Таким образом, получено выражение:
V(\lambda_i)=\chi_i(A)f_i(A)V,
где \chi_i(t) и f_i(t) – многочлены из (1). В частности, (A-\lambda_i E)^mV(\lambda_i)=0.
Минимальным многочленом для A на V_i будет некоторый делитель многочлена (t-\lambda_i)^{m_i} \Rightarrow \lambda_i – единственное собственное значение оператора A|_{V(\lambda_i)}.
Выберем базис в каждом из V(\lambda_i). Объединяя, получим:
\begin{pmatrix} A_1 & &\huge 0 \\ & \ddots & \\ \huge 0& & A_p \\ \end{pmatrix}~~~ где A_i – матрица порядка \dim V(\lambda_i)=m'_i с единственным собственным значением \lambda_i и характеристическим многочленом \chi_{A_i}(t)=(t-\lambda_i)^{m'_i},~m'_i \leqslant m_i
\chi_A(t)=\prod\limits_{i=1}^p\chi_{A_i}(t) \Rightarrow n=n'_1+...+n'_p и n'_i=n_i
Докажем невырожденность оператора (A-\lambda_i E)|_{V_i}
Предположим противное, тогда \{ \Ker(A-\lambda_i E) \} \cap V_i \neq 0 и Av-\lambda_iv=0 для некоторого 0 \neq v \in V_i, но характеристическим многочленом для A является \chi_i(t)=\prod\limits_{j \neq i} (t-\lambda_j)^{n_j}, и \lambda_i собственным значением быть не может. Противоречие \Rightarrow оператор невырожден. \blacksquare
Таким образом, мы свели доказательство основной теоремы к случаю, когда A имеет единственное собственное значение \lambda и (A-\lambda E)^m=O,~m \leqslant \dim V.