QR-розклад матриці

QR-розклад матриці — представлення матриці у вигляді добутку унітарної та правої трикутної матриці.

Матриця A розміру m×n може бути представлена у вигляді

\ A=QR,

де Q — унітарна матриця розміру m×m, R — верхня трикутна матриця розміру m×n.

Також можливі представлення QL, RQ, та LQ (де L — нижня трикутна матриця).

Для m×n матриці A, з m ≥ n нижні (m−n) рядків m×n верхньої трикутної матриці усі нульові, тому часто буває корисно розбити R, або R і Q:

A=QR=Q{\begin{bmatrix}R_{1}\\0\end{bmatrix}}={\begin{bmatrix}Q_{1},Q_{2}\end{bmatrix}}{\begin{bmatrix}R_{1}\\0\end{bmatrix}}=Q_{1}R_{1},

де R₁ — це n×n верхня трикутна матриця, 0 — це (m − n)×n нульова матриця, Q₁ — це m×n, Q₂ — це m×(m − n) і Q₁ та Q₂ обидві мають ортогональні стовпчики.

Обчислення

Розклад матриці може отримуватись за допомогою різних методів:

Використовуючи процес Грама — Шмідта

Розглянемо процес Грама — Шмідта застосований до стовпчиків матриці $A=[\mathbf {a} _{1},\cdots ,\mathbf {a} _{n}]$ з повним стовпчиковим рангом, де $\langle \mathbf {v} ,\mathbf {w} \rangle =\mathbf {v} ^{\top }\mathbf {w}$ (або $\langle \mathbf {v} ,\mathbf {w} \rangle =\mathbf {v} ^{*}\mathbf {w}$ у комплексному випадку).

Визначимо проєкцію вектора як:

\mathrm {proj} _{\mathbf {e} }\mathbf {a} ={\frac {\left\langle \mathbf {e} ,\mathbf {a} \right\rangle }{\left\langle \mathbf {e} ,\mathbf {e} \right\rangle }}\mathbf {e}

тоді:

{\begin{aligned}\mathbf {u} _{1}&=\mathbf {a} _{1},&\mathbf {e} _{1}&={\mathbf {u} _{1} \over \|\mathbf {u} _{1}\|}\\\mathbf {u} _{2}&=\mathbf {a} _{2}-\mathrm {proj} _{\mathbf {u} _{1}}\,\mathbf {a} _{2},&\mathbf {e} _{2}&={\mathbf {u} _{2} \over \|\mathbf {u} _{2}\|}\\\mathbf {u} _{3}&=\mathbf {a} _{3}-\mathrm {proj} _{\mathbf {u} _{1}}\,\mathbf {a} _{3}-\mathrm {proj} _{\mathbf {u} _{2}}\,\mathbf {a} _{3},&\mathbf {e} _{3}&={\mathbf {u} _{3} \over \|\mathbf {u} _{3}\|}\\&\vdots &&\vdots \\\mathbf {u} _{k}&=\mathbf {a} _{k}-\sum _{j=1}^{k-1}\mathrm {proj} _{\mathbf {u} _{j}}\,\mathbf {a} _{k},&\mathbf {e} _{k}&={\mathbf {u} _{k} \over \|\mathbf {u} _{k}\|}\end{aligned}}

Тепер ми можемо виразити $\mathbf {a} _{i}$ через ново обчислений ортонормальний базис:

{\begin{aligned}\mathbf {a} _{1}&=\langle \mathbf {e} _{1},\mathbf {a} _{1}\rangle \mathbf {e} _{1}\\\mathbf {a} _{2}&=\langle \mathbf {e} _{1},\mathbf {a} _{2}\rangle \mathbf {e} _{1}+\langle \mathbf {e} _{2},\mathbf {a} _{2}\rangle \mathbf {e} _{2}\\\mathbf {a} _{3}&=\langle \mathbf {e} _{1},\mathbf {a} _{3}\rangle \mathbf {e} _{1}+\langle \mathbf {e} _{2},\mathbf {a} _{3}\rangle \mathbf {e} _{2}+\langle \mathbf {e} _{3},\mathbf {a} _{3}\rangle \mathbf {e} _{3}\\&\vdots \\\mathbf {a} _{k}&=\sum _{j=1}^{k}\langle \mathbf {e} _{j},\mathbf {a} _{k}\rangle \mathbf {e} _{j}\end{aligned}}

де $\langle \mathbf {e} _{i},\mathbf {a} _{i}\rangle =\|\mathbf {u} _{i}\|$ . Це можна записати у матричній формі:

A=QR

де:

Q=\left[\mathbf {e} _{1},\cdots ,\mathbf {e} _{n}\right]\qquad {\text{and}}\qquad R={\begin{pmatrix}\langle \mathbf {e} _{1},\mathbf {a} _{1}\rangle &\langle \mathbf {e} _{1},\mathbf {a} _{2}\rangle &\langle \mathbf {e} _{1},\mathbf {a} _{3}\rangle &\ldots \\0&\langle \mathbf {e} _{2},\mathbf {a} _{2}\rangle &\langle \mathbf {e} _{2},\mathbf {a} _{3}\rangle &\ldots \\0&0&\langle \mathbf {e} _{3},\mathbf {a} _{3}\rangle &\ldots \\\vdots &\vdots &\vdots &\ddots \end{pmatrix}}.

Приклад

Розглянемо декомпозицію

A={\begin{pmatrix}12&-51&4\\6&167&-68\\-4&24&-41\end{pmatrix}}.

Згадаймо, що ортонормальна матриця $Q$ має таку властивість

{\begin{matrix}Q^{T}\,Q=I.\end{matrix}}

Тоді, ми можемо обчислити $Q$ із застосувавши процес Грама — Шмідта так:

U={\begin{pmatrix}\mathbf {u} _{1}&\mathbf {u} _{2}&\mathbf {u} _{3}\end{pmatrix}}={\begin{pmatrix}12&-69&-58/5\\6&158&6/5\\-4&30&-33\end{pmatrix}};

Q={\begin{pmatrix}{\frac {\mathbf {u} _{1}}{\|\mathbf {u} _{1}\|}}&{\frac {\mathbf {u} _{2}}{\|\mathbf {u} _{2}\|}}&{\frac {\mathbf {u} _{3}}{\|\mathbf {u} _{3}\|}}\end{pmatrix}}={\begin{pmatrix}6/7&-69/175&-58/175\\3/7&158/175&6/175\\-2/7&6/35&-33/35\end{pmatrix}}.

Отже, ми маємо

{\begin{matrix}Q^{T}A=Q^{T}Q\,R=R;\end{matrix}}

{\begin{matrix}R=Q^{T}A=\end{matrix}}{\begin{pmatrix}14&21&-14\\0&175&-70\\0&0&35\end{pmatrix}}.

Використовуючи перетворення Хаусхолдера

Відбиття Хаусхалдера для QR-розкладу: Ціллю є знаходження лінійного перетворення, що переводить вектор $x$ у вектор такої ж довжини колінеарний з $e_{1}$ . Ми могли б використати ортогональну проєкцію (Грам-Шмідт), але це було б чисельно нестабільно якщо вектори $x$ і $e_{1}$ майже ортогональні. Натомість, відбиття Хаусхолдера віддзеркалює щодо пунктирної лінії (обраної так, щоб розсікати навпіл кут між $x$ і $e_{1}$ ). Найбільший можливий кут у такій трансформації становить 45 градусів.

{\displaystyle x} — Відбиття Хаусхалдера для QR-розкладу: Ціллю є знаходження лінійного перетворення, що переводить вектор $x$ у вектор такої ж довжини колінеарний з $e_{1}$ . Ми могли б використати ортогональну проєкцію (Грам-Шмідт), але це було б чисельно нестабільно якщо вектори $x$ і $e_{1}$ майже ортогональні. Натомість, відбиття Хаусхолдера віддзеркалює щодо пунктирної лінії (обраної так, щоб розсікати навпіл кут між $x$ і $e_{1}$ ). Найбільший можливий кут у такій трансформації становить 45 градусів.

Перетворення Хаусхолдера — це трансформація, яка приймає вектор і відбиває його від певної площини або гіперплощини. Ми можемо використати цю операцію для обчислення QR-розкладу m-на-n матриці $A$ з m ≥ n.

Q можна використати, щоб відбивати вектор таким чином, щоб всі координати окрім однієї зникали.

Нехай $\mathbf {x}$ буде довільним дійсним m-вимірним вектором стовпчиком $A$ таким, що $\|\mathbf {x} \|=|\alpha |$ для скаляра α. Якщо алгоритм втілюється із використанням арифметики з рухомою комою, тоді потрібно надати α знак протилежний до знаку k-ї координати $\mathbf {x}$ , де $x_{k}$ є опорною координатою після якої усі елементи дорівнюють нулю в кінцевій верхній трикутній формі матриці A, задля уникнення втрати розрядів. У комплексному випадку, встановіть

\alpha =-\mathrm {e} ^{\mathrm {i} \arg x_{k}}\|\mathbf {x} \|

і замініть транспонування на спряжене транспонування під час побудови Q далі.

Тоді, $\mathbf {e} _{1}$ є вектором (1,0,...,0)^T, ||·|| є Евклідовою нормою і $I$ є m-by-m одиничною матрицею, встановимо

\mathbf {u} =\mathbf {x} -\alpha \mathbf {e} _{1},

\mathbf {v} ={\mathbf {u} \over \|\mathbf {u} \|},

Q=I-2\mathbf {v} \mathbf {v} ^{T}.

Або, якщо $A$ комплексна

Q=I-(1+w)\mathbf {v} \mathbf {v} ^{H}

, де

w=\mathbf {x} ^{H}\mathbf {v} \mathbf {/} \mathbf {v} ^{H}\mathbf {x}

де

\mathbf {x} ^{H}

— це ермітово-спряжений

\mathbf {x}

$Q$ є m-на-m матриця Хаусхолдера і

Q\mathbf {x} =(\alpha ,0,\cdots ,0)^{T}.\,

Це можна використати, щоб поступово трансформувати m-на-n матрицю A у верхню трикутну форму. Спершу ми множимо A на матрицю Хаусхолдера Q₁ яку ми отримали для першого стовпчика. Це нам дає матрицю Q₁A з нулями в першому стовпчику окрім першого рядка.

Q_{1}A={\begin{bmatrix}\alpha _{1}&\star &\dots &\star \\0&&&\\\vdots &&A'&\\0&&&\end{bmatrix}}

Це можна повторити для A′ (Q₁A без першого рядка і першого стовпчика), в результаті маємо матрицю Хаусхолдера Q′₂. Зауважте, що Q′₂ менше ніж Q₁. Оскільки ми бажаємо, щоб вона діяла на Q₁A, а не на A′ нам потрібно розширити її додавши у верхній лівий кут 1, узагальнюючи:

Q_{k}={\begin{pmatrix}I_{k-1}&0\\0&Q_{k}'\end{pmatrix}}.

Після $t$ ітерацій цього процесу, $t=\min(m-1,n)$ ,

R=Q_{t}\cdots Q_{2}Q_{1}A

є верхньою трикутною матрицею. Отже, з

Q=Q_{1}^{T}Q_{2}^{T}\cdots Q_{t}^{T},

$A=QR$ є QR-розкладом $A$ .

Цей метод має більшу числову стійкість ніж метод Грама-Шмідта.

Наступна таблиця наводить кількість операцій на k-му кроці QR-розкладення із використанням перетворення Хаусхолдера, припускаючи квадратну матрицю розміру n.

Операція	Кількість на k-му кроці
множення	$2(n-k+1)^{2}$
додавання	$(n-k+1)^{2}+(n-k+1)(n-k)+2$
ділення	$1$
взяття кореня	$1$

Додаючи ці числа для усіх n − 1 кроків (для квадратної матриці розміру n), складність алгоритму (кількість множень з рухомою комою) задається

{\frac {2}{3}}n^{3}+n^{2}+{\frac {1}{3}}n-2=O(n^{3}).

Приклад

Обчислимо розклад для

A={\begin{pmatrix}12&-51&4\\6&167&-68\\-4&24&-41\end{pmatrix}}.

Перше, нам потрібно знайти відбиття, що перетворює перший стовпчик матриці A, вектор $\mathbf {a} _{1}=(12,6,-4)^{T}$ , у $\|\mathbf {a} _{1}\|\;\mathrm {e} _{1}=(14,0,0)^{T}.$