Los seguidores de Manolo

Pitágoras y Normas de dimensión mayor

In Álgebra Lineal on Viernes 8, mayo, 2009 at 2:38 pm

por Pablo Lessa

Introducción.

En este artículo se demuestran dos resultados:

  1. Una versión del teorema de pitágoras para áreas k-dimensionales (generalizando el teorema de pitágoras para longitudes de vectores)
  2. Que el máximo estiramiento que produce una transformación lineal sobre el área de un paralelogramo de dimensión k está dada por el producto de los k valores singulares más grandes (generalizando el hecho de que la norma de una transformación, coincide con el máximo valor singular).

En ambos casos la demostración muestra que la generalización, es simplemente un caso particular de lo que está generalizando (i.e. el pitágoras de áreas se deduce del pitágoras común, el resultado para la norma k-dimensional se deduce del resultado para la norma usual).

Para hacer las demostraciones de estos dos hechos a mano, habría que hacer un montón de cuentas y probar una desigualdad que involcraría determinantes.

La demostración que doy evita esto a expensas de tener que construir un formalismo algebraico medio pesado.

Lo bueno es que este formalismo (el producto exterior) sirve para otras cosas (por ejemplo para estudiar las variedades grasmanianas y los espacios de banderas como se discute en este artículo del sambita).

Mi motivación original para tratar de entender todo esto es que estoy estudiando una demostración del teorema de Oseledets que utiliza este formalismo como herramienta.

Pitágoras de Áreas

El teorema de pitágoras dice que en \mathbb{R}^3 si tenés un vector v y tomás sus proyecciones sobre los ejes coordenados v_1,v_2 y v_3 entonces:

\|v\|^2 = \|v_1\|^2 +\|v_2\|^2 +\|v_3\|^2.

Supongamos ahora que tenés un par de vectores v,w \in \mathbb{R}^3 y sea A el área del paralelogramo bidimensional que forman.  Sean ahora A_1, A_2, A_3 las areas de los paralelogramos que se obtienen proyectando sobre los tres planos que forman los ejes coordenados.  Se tiene entonces la siguiente igualdad:

A^2 = A_1^2 + A_2^2 + A_3^2

La demostración es la siguiente, descomponemos v = v_1 + v_2 + v_3 y w = w_1 + w_2 + w_3 donde los v_i, w_i son las proyecciones ortogonales sobre los ejes coordenados.  Se tiene entonces:

A^2 = \|v\times w\|^2 = \|(v_1 + v_2 + v_3) \times (w_1 + w_2 + w_3)\|^2

Haciendo las distributivas en el producto cruz (y usando que para vectores colineales vale cero) se verifica que:

v\times w= (v_1 + v_2)\times (w_1 + w_2) + (v_2 + v_3)\times(w_2 + w_3) + (v_3+v_1)\times(w_3 + w_1)

donde los tres sumandos son otrogonales.

El teorema de pitágoras aplicado a estos vectores nos da:

A^2 = A_1^2 + A_2^2 + A_3^2

Norma bidimensional de una Transformación Lineal

Supongamos ahora que tenemos una transformación lineal T: \mathbb{R}^3 \to \mathbb{R}^3 la norma de T se define como:

\text{max}\{\|Tv\|: \|v\| = 1\}

Esta definición mide el máximo estiramiendo que efectua T sobre las longitudes de segmentos de recta.

El estiramiento que efectua T sobre los volúmenes está dado por el valor absoluto del determinante de T:

|\text{det}(T)|

¿Cual es el análogo para áreas de dimensión 2?

Definamos \tilde{T} mediante la siguiente fórmula:

\tilde{T}x = Tv \times Tw\text{ donde }x = v\times w

Suponiendo por ahora que \tilde{T}: \mathbb{R}^3 \to \mathbb{R}^3 está bien definida y es una transformación lineal, notemos que la norma de \tilde{T} nos da:

\|\tilde{T}\| = \text{max}\{\text{Area de }TP\text{ donde }P\text{ es un paralelogramo de area }1\}

Que es una definición muy razonable para medir el estiramiendo de dimensión 2 que produce T.

Para ver que esta definición está bien provisoriamente definimos \tilde{T} como la transformación lineal que cumple:

\tilde{T}e_1 = Te_2\times Te_3

\tilde{T}e_2 = Te_3\times Te_1

\tilde{T}e_3 = Te_1\times Te_2

Luego notamos que tanto (v,w) \mapsto Tv\times Tw como el mapa (v,w) \mapsto \tilde{T}(v\times w) son bilineales y alternados.  Como coinciden en los pares (e_1,e_2), (e_2,e_3), (e_3,e_1) obtenemos que coinciden en todas partes lo cual implica que:

\tilde{T}(v\times w) = Tv\times Tw\text{ para todo }v,w \in \mathbb{R}^3

que era la definición original que buscabamos.

Como adelantamos antes la norma \|\tilde{T}\| es el producto de los dos valores singulares más grandes de T.  La demostración se basa en la descomposición polar de T que afirma que T = OP donde O es ortogonal mientras que P se diagonaliza en una base ortonormal y tiene valores propios positivos.

Si e_1,e_2,e_3 es la base ortonormal donde se diagonliza P y \lambda_1\ge\lambda_2\ge\lambda_3\ge 0 son los valores propios correspondientes se ve que:

\tilde{T}e_1 = Te_2\times Te_3 = \lambda_2\lambda_3 Oe_2\times Oe_3 = \lambda_2\lambda_3 Oe_1

\tilde{T}e_2 = Te_3\times Te_1 = \lambda_3\lambda_1 Oe_3\times Oe_1 = \lambda_3\lambda_1 Oe_2

\tilde{T}e_3 = Te_1\times Te_2 = \lambda_1\lambda_2 Oe_1\times Oe_2 = \lambda_1\lambda_2Oe_3

Por lo tanto la imágen por \tilde{T} de e_1,e_2,e_3 también es un conjunto ortogonal, y podemos conluir que:

\|\tilde{T}\| = \lambda_1\lambda_2

Producto Exterior

En dimensión mayor que 3 el substituto del producto vectorial es la siguiente construcción:

Definición (Producto Exterior).

Dado un espacio vectorial V definimos el k-ésimo producto exterior como un espacio vectorial \bigwedge^kV dotado de un mapa \wedge: V^k \to \bigwedge^kV que es k-lineal y alternado y que cumple que dado cualquier mapa \phi: V^k \to Z k-lineal y alternado existe un único mapa lineal \tilde{\phi} tal que el siguiente diagrama (trucho, porque wordpress no soporta diagramas, pero ta imaginenselo) conmuta:\begin{array}{ccc}V^k&\stackrel{\phi}{\longmapsto}&Z\\\text{Id}\downarrow&&\downarrow\text{Id}\\V^k &\stackrel{\wedge}{\mapsto}\bigwedge^kV\stackrel{\tilde{\phi}}{\mapsto}&Z\end{array}

En general se denota \wedge(v_1,\ldots,v_k) = v_1\wedge\cdots\wedge v_k.

Anteriormente estuvimos estudiando el caso de \mathbb{R}^3 en el cual se puede fijar \bigwedge^2\mathbb{R}^3 = \mathbb{R}^3 y v\wedge w = v\times w.

La situación en \mathbb{R}^4 y en dimensión mayor es más complicada. Por ejemplo, puede demostrarse que:

e_1\wedge e_2 + e_3\wedge e_4 \in \bigwedge^2\mathbb{R}^4

no es igual a v\wedge w para ningun par de vectores v,w\in \mathbb{R}^4.

No me voy a molestar en demostrar las siguientes propiedades:

  • El espacio \bigwedge^kV existe y es único a menos de isomorfismos.
  • Si \text{dim}(V) = n entonces \text{dim}(\bigwedge^kV) = \left(\begin{array}{c}n\\k\end{array}\right).
  • Si \{v_1, \ldots, v_n\} es base de V entonces \{v_{i1}\wedge\cdots\wedge v_{ik}: i_1 < \cdots < i_k\} es base de \bigwedge^kV.

Si me voy a molestar en demostrar lo siguiente:

Teorema.

Si T: V \to V es una transformación lineal, existe una única transformación lineal T^{\wedge k}: \bigwedge^k V \to \bigwedge^k V tal que:

T^{\wedge k}v_1\wedge\cdots\wedge v_k = Tv_1\wedge\cdots\wedge Tv_k\text{ para todo }v_1,\ldots,v_k\in V

Demostración. El mapa f: V^k \to \bigwedge^k V definido mediante:

f(v_1,\ldots,v_k) = Tv_1\wedge\cdots\wedge Tv_k

es k lineal y alternado, y por lo tanto T^{\wedge k} existe y es único por la propiedad universal que define el espacio \bigwedge^kV\Box

Interpretación para los productos elementales

En \mathbb{R}^3 el vector v\times w es normal al plano generado por v y w, le da una orientación al plano (que es la que tienen v y w, y tiene una norma que es el área del paralelogramo.  Si bien conociendo v\times w no podemos recuperar v,w, si podemos recuperar esas tres cosas.

Hay una interpretación geométrica análoga de aquellos elementos de \bigwedge^k\mathbb{R}^n que son de la forma v_1\wedge\cdots\wedge v_k.  Un elemento de este tipo define un subespacio de dimensión k en V, tiene una “norma” (por que luego formalizaremos) que es el área del paralelogramo generado por los v_i, y le da una orientación al subespacio.

En efecto, si elegimos e_1,\ldots,e_k una base otronormal del subespacio que generan los v_i, y escribimos cada v_i en esta base, obtenemos:

v_1\wedge\cdots\wedge v_k = \text{det}((a_{ij}))e_1\wedge\cdots\wedge e_k\text{ donde } a_{ij} = \langle e_i,v_j\rangle

las columna i de la matriz a_{ij} son las coordenadas de v_i en la base ortogonal, lo cual nos hace ver que el coeficiente que se obtiene coincide con la definición usual de área k-dimensional.  Además el signo será positivo o negativo según los v_i tengan la misma orientación que los e_i o la contraria en el subespacio.

Con esta interpretación es razonable suponer que \|T^{\wedge k}\| sea la definición que estamos buscando del estiramiento k-dimensional que produce T.  Pero hace falta definir un producto interno en \bigwedge^k\mathbb{R}^n para que esta norma tenga sentido.

Matriz de Gram

Si el espacio V tiene un producto interno, podemos definir la siguiente función bilineal en V^k:

\langle v,w\rangle = \text{det}((a_{ij}))\text{ donde }v = (v_1,\ldots,v_k), w=(w_1,\ldots,w_k)\text{ y }a_{ij} = \langle v_i,w_j\rangle

La función bilineal es simétrica y no negativa.  Pero no es un producto interno porque \langle v,v\rangle vale cero si v = (v_1,\ldots,v_k) y los v_i son linealmente dependientes en V.  Por lo tanto en lugar de una norma define una pseudo-norma.

Se observa de la definición que si sumamos a w_1 un vector perpendicular a todos los v_i no se altera el resultado.  Por lo tanto se pueden proyectar todos los w_i al subespacio generado por los v_i sin alterar el resultado.

Una vez que están todos en el mismo subespacio se ve, a partir de la discusión de la sección anterior (fijando una base ortonormal del subespacio) vemos que el determinante nos da el producto de las áreas de los paralelogramos generados por los v_i y los w_i.

En particular la pseudo-norma inducida por esta función bilineal nos da:

\|(v_1,\ldots,v_k)\| =\text{ area }k\text{ dimensional del parelelogramo generado por }(v_1,\ldots,v_k)\text{ en }V

la matriz a_{ij} que se obtiene cuando v=w \in V^k se llama la matriz de Gram.

Producto Interno en \bigwedge^k V

Utilizaremos ahora la función bilineal de la sección anterior para definir un producto interno en \bigwedge^kV.  La clave es el siguiente teorema que utiliza la propiedad universal del producto exterior y el hecho de que las funciones bilineales de un espacio X son naturalmente isomorfas a las funciones lineales entre X y X^*:

Teorema.

Si f: V^k\times V^k \to \mathbb{R} es una función bilineal, que además es k-lineal y alternada en cada coordenada (esto significa que los mapas f(v,\cdot) yf(\cdot,w) son k-lineales y alternados para cada v y w fijo) entonces existe una única función bilineal \tilde{f}:\bigwedge^kV\times\bigwedge^kV \to \mathbb{R} tal que:

\tilde{f}(\wedge v, \wedge w) = f(v,w)\text{ para todo }v,w \in V^k

Demostración. Para cada v \in V definimos f_v = f(v,\cdot).  Como f_v:V^k \to \mathbb{R} es multilineal alternada, tiene asociada un mapa lineal \tilde{f_v}:\bigwedge^kV \to \mathbb{R} que cumple f_v(w) = \tilde{f_v}(\wedge w) para todo w \in V^k.

Ahora el mapa g: V \to (\bigwedge^kV)^* dado por:

g(v) = \tilde{f_v}

también es multilineal y alternado (esta vez usamos que f(\cdot,w) multilineal alternada para todo w) y por lo tanto tiene asociado:

\tilde{g}: \bigwedge^kV\mapsto (\bigwedge^kV)^*

Que cumple \tilde{g}(\wedge v) = \tilde{f_v}.

Por construcción se cumple \tilde{g}(\wedge v)(\wedge w) = f(v,w) para todo v,w \in V^k.  El lado izquierdo es la función bilineal que se buscaba\Box

Al aplicar este teorema a la función bilineal de la sección anterior obtenemos un producto interno en \bigwedge^kV (la simetría se hereda, y la función se vuelve no degenerada gracias a que los vectores l.d. van al cero por el producto exterior).  Esto se puede verificar en dimensión finita fijando una base ortonormal de V y notando que en la base que genera en \bigwedge^kV se cumplen las propiedades de simetría, positividad, y no degeneración… de hecho la base en \bigwedge^kV también es ortonormal.

Con este producto el área de un paralelogramo k dimensional generado por v_1,\ldots,v_k \in V es simplemente \|v_1\wedge\cdots\wedge v_k\|.  Esto generaliza la propiedad muy utilizada del producto cruz en \mathbb{R}^3 a los otros \mathbb{R}^n y para otros k.

Tenemos en particular el siguiente teorema:

Teorema de Pitágoras k-dimensional en \mathbb{R}^n.

Sean v_1,\ldots,v_k \in \mathbb{R}^n y A el área k dimensional del paralelogramo que generan.  Sean A_1, \ldots, A_l las aréas k-dimensionales de los paralelogramos que se obtienen proyectando sobre los \left(\begin{array}{c}n\\k\end{array}\right) = l subespacios de dimensión k que generan los vectores de la base canónica.  Entonces se cumple que:

A^2 = A_1^2 + \cdots + A_l^2

La demostración es exáctamente igual a la del pitágoras de áreas en \mathbb{R}^3, reemplazando el producto cruz por el producto exterior, y utilizando el producto interno.

Forma Polar y Normas k-dimensionales

T: \mathbb{R}^n\to\mathbb{R}^n una transformación lineal.  El famoso teorema de descomposición polar afirma lo siguiente:

Teorema de Descomposición Polar.

T = O\sqrt{T^tT} donde O es ortogonal y T^tT se diagonaliza en una base ortonormal y todos sus valores propios son no-negativos.

Supongamos que e_1,\ldots,e_n es la base ortonormal donde se diagonaliza \sqrt{T^tT}, y sean \lambda_1 \ge \lambda_2 \ge\cdots\ge\lambda_n los valores propios correspondientes (que se llaman valores singulares de T).  Se tiene que:

\|Te_i\| = \|\lambda_iOe_i\| = \lambda_i

Y además \{Te_i\} es un conjunto ortogonal.  Por lo tanto si tomamos v = \sum_i\alpha_ie_i con norma 1 se obtiene:

\|Tv\|^2 = \sum_i\alpha_i^2\lambda_i^2 \le \lambda_1^2

Esto implica que la norma de T está dada por el máximo valor singular:

\|T\| = \lambda_1

Calcularemos ahora la norma de T^{\wedge k}.

Utilizando la descomposición polar de T vemos que se puede escribir:

T^{\wedge k} = O^{\wedge k}\sqrt{T^tT}^{\wedge k}

Además O^{\wedge k} preserva el producto interno por lo cual no afecta el cálculo de la norma.

Como \sqrt{T^tT}^{\wedge k} se diagonaliza en la base ortonormal dada por:

\{e_{i1}\wedge\cdots\wedge e_{ik}: i_1 < \cdots<i_k\}

podemos calcular el máximo valor singular y obtenemos:

\|T^{\wedge k}\| = \lambda_1\cdots\lambda_k = \text{max}\{\text{area de }TP\text{ donde }P\text{ es un paralelogramo }k\text{-dimensional en }V\}

  1. Una frase que esta buena que tiene que ver con lo que estas probando es la siguente:

    “Para conocer los valores singulares de una matriz basta conocer su norma en diferentes representaciones.”

  2. agradezco esta informacion publicada, ya que me ayudo bastante para librarme de un extra, espero que pueda ayudar a alguien mas y actualicen el articulo y felicidades por el traabjo

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s

A %d blogueros les gusta esto: