Apéndice E — Formas Cuadráticas
E.1 Definiciones y Resultados Básicos
Definición E.1 (Formas Cuadráticas) Sean \(\boldsymbol{x}\in \mathbb{R}^n\), \(A=[a_{ij}]\), \(n\times n\), matriz. Definimos \(f:\mathbb{R}^n\rightarrow \mathbb{R}\) como \[ \boldsymbol{x}^{\top}A\boldsymbol{x}=\sum_i\sum_j x_ia_{ij}x_j. \] \(f\) se denomina forma cuadrática.
Proposición E.1 (Unicidad) Si \(A\) y \(B\) son matrices \(n\times, n\), simétricas y \(\boldsymbol{x}^{\top}A\boldsymbol{x}=\boldsymbol{x}^{\top}B\boldsymbol{x}\), para todo \(\boldsymbol{x}\in \mathbb{R}^n\), entonces \(A=B\).
Teorema E.1 (Media de formas cuadráticas) Sea \(\boldsymbol{X}=(X_1,\ldots, X_n)^{\top}\) un vector aleatorio y \(A\) una matriz simétrica de \(n\times n\). Si \(\mathbb{E}(X)=\boldsymbol{\mu}\) y \(\operatorname{Var}(X)=\Sigma,\) entonces \[ \mathbb{E}(\boldsymbol{X}^{\top} A \boldsymbol{X})=\operatorname{tr}(A\Sigma)+\boldsymbol{\mu}^{\top}A\boldsymbol{\mu}. \]
Un caso particular es cuando \(\sigma=\sigma^2I_n\), donde tenemos \(\operatorname{tr}(A\Sigma)=\sigma^2\operatorname{tr}(A)\).
Teorema E.2 (Varianza de formas cuadráticas) Si \(X_1,X_2,\ldots, X_n\) son v.a.i. con medias \(\mu_1,\mu_2,\ldots,\mu_n\), varianza común \(\sigma_2\) y tercer y cuarto momentos centrales \(m_3=\mathbb{E}[(X_i-\mu_i)^3]\) y \(m_4=\mathbb{E}[(X_i-\mu_i)^4]\). Si \(A\) es una matriz simétrica \(n\times n\) con \(\boldsymbol{a}=\operatorname{diag}(A)\), entonces \[ \operatorname{Var}(\boldsymbol{X}^{\top} A \boldsymbol{X})=(m_4-3\sigma^4)\boldsymbol{a}^{\top}\boldsymbol{a}+2\sigma^4\operatorname{tr}(A^2)+4\sigma^2\boldsymbol{\mu}^{\top}A^2\boldsymbol{\mu}+4m_3\boldsymbol{\mu}^{\top}A\boldsymbol{a}. \]
E.2 Funciones cuadráticas de distribuciones Normales
Nos interesa conocer la distribución de expresiones del tipo \[ \boldsymbol{Y}^{\top}A\boldsymbol{Y} = \sum_{i=1}^n \sum_{j=1}^n Y_ia_{ij}Y_j, \] donde \(\boldsymbol{Y}\sim N_n(\boldsymbol{\mu}, \Sigma)\).
Proposición E.2 Podemos asumir que \(A\) es simétrica ya si definimos \(A^*\) con \(a^*_{ij}=(a_{ij}+a_{ji})/2\) (ie \(A^*=AA^{\top}/2\)), entonces \(\boldsymbol{Y}^{\top}A^*\boldsymbol{Y}=\boldsymbol{Y}^{\top}A\boldsymbol{Y}\).
Teorema E.3 (Varianza de formas cuadráticas caso Normal) Si \(\boldsymbol{Y} \sim N_n(\boldsymbol{\mu}, \Sigma)\), \[ \operatorname{Var}\left[\mathbf{Y}^{\top} A \boldsymbol{Y}\right]=2 \operatorname{tr}(A \Sigma A \Sigma)+4 \boldsymbol{\mu}^{\top} A \Sigma A \boldsymbol{\mu}. \]
Para cualquier vector \(\boldsymbol{g}\) y cualquier matriz \(W\) definida postiva, podemos expresar la exponencial de la función cuadrática como proporcional a la integral del kernel Normal Multivariado.
Proposición E.3 Si \(\boldsymbol{g}\) es un vector de longitud \(n\) y \(W\) es una matriz \(n \times n\) definida positiva, entonces \[ (2 \pi)^{n/2}|W|^{1/2} \exp\left(\frac{1}{2} \boldsymbol{g}^{\top}W\boldsymbol{g}\right)=\int_{-\infty}^{\infty} \cdots \int_{-\infty}^{\infty} \exp \left(-\frac{1}{2} \boldsymbol{Y}^{\top} W^{-1} \boldsymbol{Y}+\boldsymbol{g}^{\top} \boldsymbol{Y}\right) dY_1 \ldots dY_n. \]
Proposición E.4 Sea \(\boldsymbol{Z}\sim N_n(\boldsymbol{0}, I_n)\). Si \(T\) es ortogonal entonces \(\boldsymbol{Y}=T^{\top}\boldsymbol{Z}\) tiene distribución \(N_n(\boldsymbol{0}, I_n)\).
No es trivial encontrar la distribución precisa para valores arbitrarios de los coeficientes, pero si los eigenvalores son 0’s o 1’s y \(r\) de ellos son 1’s, entonces la distribución de \(\boldsymbol{Y}^{\top}A\boldsymbol{Y}\) es \(\chi^2(r)\). Esto motiva los siguientes resultados.
Teorema E.4 Sea \(Y\sim N_n(\boldsymbol{0},I_n)\) y sea \(A\) una matriz simétrica. Entonces \[ \boldsymbol{Y}^{\top}A\boldsymbol{Y}\sim \chi^2(r) \] ssi \(A\) es idempotente y de rango igual a \(r\).
Teorema E.5 Sea \(Y\sim N_n(\boldsymbol{0}, \Sigma)\) y sea \(A\) una matriz simétrica. Entonces \[ \boldsymbol{Y}^{\top}A\boldsymbol{Y}\sim \chi_r^2 \] ssi \(r\) de los eigenvalores de \(A\Sigma\) son 1’s y los restantes son 0’s.
Corolario E.1 Sea \(Y\sim N_n(\boldsymbol{0}, \Sigma)\) y sea \(A\) una matriz simétrica. Entonces \[ \boldsymbol{Y}^{\top}A\boldsymbol{Y}\sim \chi^2(r) \] ssi \(A\Sigma\) es idempotente y tiene rango r.
Teorema E.6 Sea \(Y\sim N_n(\boldsymbol{\mu}, \Sigma)\), entonces \[ \left(\boldsymbol{Y}-\boldsymbol{\mu}\right)^{\top}\Sigma^{-1}\left(\boldsymbol{Y}-\boldsymbol{\mu}\right)\sim \chi^2(n). \]
Este teorema generaliza el teorema Teorema D.2 ya que no requiere que las variables aleatorias sean independientes.
Teorema E.7 Sea \(Y\sim N_n(\boldsymbol{\mu}, \Sigma)\), entonces \[ \boldsymbol{Y}^{\top}A\boldsymbol{Y}\sim \chi^2(r,\gamma), \] donde \(r=\operatorname{rango}(A)\) y \(\gamma=\boldsymbol{\mu}^{\top}A\boldsymbol{\mu}/2\), ssi \(A\Sigma\) es idempotente.
Corolario E.2
- Si \(Y \sim N_n(\boldsymbol{0}, I_n)\) entonces \(\boldsymbol{Y}^{\top}A\boldsymbol{Y}\sim \chi^2(r)\) ssi \(A\) es idempotente y de rango \(r\).
- Si \(Y \sim N_n(\boldsymbol{0}, \Sigma)\) entonces \(\boldsymbol{Y}^{\top}A\boldsymbol{Y}\sim \chi^2(r)\) ssi \(A\Sigma\) es idempotente y de rango \(r\).
- Si \(Y \sim N_n(\boldsymbol{\mu}, \sigma^2I_n)\) entonces \(\boldsymbol{Y}^{\top}\boldsymbol{Y}/\sigma^2 \sim \chi^2(n, \ \boldsymbol{\mu}^{\top}\boldsymbol{\mu}/(2\sigma^2))\).
- Si \(Y \sim N_n(\boldsymbol{\mu}, I_n)\) entonces \(\boldsymbol{Y}^{\top}A\boldsymbol{Y}\sim \chi^2(r,\ \boldsymbol{\mu}^{\top}A\boldsymbol{\mu}/2)\) ssi \(A\) es idempotente y de rango \(r\).
Proposición E.5 Si \(\boldsymbol{Y} \sim N_n(\boldsymbol{\mu},\Sigma)\) entonces \(\operatorname{Cov}(\boldsymbol{Y}, \boldsymbol{Y}^{\top}A\boldsymbol{Y})=2\Sigma A \boldsymbol{\mu}\).
Teorema E.8 (Indepndencia forma cuadrática y lineal) Si \(\boldsymbol{Y} \sim N_n(\boldsymbol{\mu},\Sigma)\) entonces \(\boldsymbol{Y}^{\top}A\boldsymbol{Y}\) y \(B\boldsymbol{Y}\) son independientes ssi \(B\Sigma A=0\).
Teorema E.9 (Independencia de formas cuadráticas) Sea \(\boldsymbol{Y} \sim N_n(\boldsymbol{\mu}, \Sigma)\). Las dos forma cuadráticas \(\boldsymbol{Y}^{\top} A \boldsymbol{Y}\) y \(\boldsymbol{Y}^{\top} B\boldsymbol{Y}\) son independientes ssi \[ A \Sigma B=0,\qquad (\text{que equivale a }\ B\, \Sigma A= 0). \]
Para los siguientes resulatados, en analogía a un subespacio y su complemento, consideramos la descomposición del espacio en subespacios \(\mathcal{V}_1, \mathcal{V}_2, \ldots, \mathcal{V}_k\). La suma \(\mathcal{V}_1+\) \(\mathcal{V}_2+\cdots+\mathcal{V}_k\) se denomina como la suma directa si cualquier vector en \(\mathcal{V}_1+\mathcal{V}_2+\cdots+\mathcal{V}_k\) se puede expresar en forma única como \(\boldsymbol{x}_1+\boldsymbol{x}_2+\cdots+\boldsymbol{x}_k\) con \(\boldsymbol{x}_i \in \mathcal{V}_i\) para cada \(i=1,2, \ldots, k\). En esta caso escribimos \(\mathcal{V}_1 \oplus \mathcal{V}_2 \oplus \cdots \oplus \mathcal{V}_k\).
Teorema E.10 (Fisher-Cochran 1) Si \(\boldsymbol{Y} \sim N_n(\boldsymbol{0}, I_n)\) y \(A_i \ (i=1, \ldots, k)\) son matrices simétricas e idempotentes con \(\operatorname{rango}\left(A_i\right)=n_i\) y \(\sum_{i=1}^k n_i=n\) entonces las siguientes afirmaciones son equivalentes:
- \(A_i A_j=0 \quad(i \neq j)\).
- Las formas cuadráticas \(\{\boldsymbol{Y}^{\top} A_i \boldsymbol{Y} \}_{i=1}^k\) son v.a.’s independientes con distribución \(\chi^2(n_i)\).
Proposición E.6 (Fisher-Cochran 2) Si \(\boldsymbol{Y} \sim N_n(\boldsymbol{\mu}, I_n)\) y \(A_i \ (i=1, \ldots, k)\) con \(\operatorname{rango}\left(A_i\right)=n_i\) y \(\sum_{i=1}^k n_i=n\) entonces
Las proyecciones ortogonales de \(Y\) en \(\mathcal{C}(A_i)\), \(i=1,\ldots,k\), \(\{A_i\boldsymbol{Y}\}\), son vectores aleatorios independientes y \(A_i\boldsymbol{Y} \sim N_{n_i}(A_i\boldsymbol{\mu},\ I_{n_i}\ )\)
Las formas cuadráticas \(\{\boldsymbol{Y}^{\top} A_i \boldsymbol{Y} \}_{i=1}^k\) son v.a.’s independientes con distribución \(\chi^2(n_i,\boldsymbol{\mu}^{\top}A_i\boldsymbol{\mu})\).
Bibliografía:
- Christensen, R. (2011). Plane answers to complex questions: The Theory of Linear Models. 4th Ed. New York: Springer.
- Searle, S.R. (1997). Linear models. John Wiley & Sons.
- Chaves, L.M., & de Souza, D.J. (2019). An Elementary Proof o the Fisher-Cochran Theorem using a Geometrical Approach. Brazilian Journal of Biometrics, 37(3), 372-377.