Variété de Stiefel

En mathématiques, les différentes variétés de Stiefel V k ( R n ) {\displaystyle V_{k}(\mathbb {R} ^{n})} sont les espaces obtenus en considérant comme des points l'ensemble des familles orthonormales de k vecteurs de l'espace euclidien de dimension n. Ils possèdent une structure naturelle de variété ce qui permet de donner leurs propriétés au plan de la topologie globale, de la géométrie ou des aspects algébriques.

Ce sont des exemples d'espace homogène sous l'action des groupes classiques de la géométrie. Leur étude est alors étroitement reliée à celle des grassmanniennes (ensemble des sous-espaces de dimension k d'un espace de dimension n). Les variétés de Stiefel fournissent également un cadre utile pour donner une interprétation géométrique globale d'un certain nombre d'algorithmes d'analyse numérique[1] ou d'analyse de données[2].

Il en existe des variantes complexes, quaternioniques, et de dimension infinie. Ces dernières interviennent en topologie différentielle pour donner corps à la notion d'espace classifiant et définir les classes caractéristiques de façon systématique.

Définition

Variété réelle

L'espace sous-jacent à la variété de Stiefel peut être décrit comme l'ensemble des familles orthonormales (ordonnées) de k vecteurs de l'espace euclidien R n {\displaystyle \mathbb {R} ^{n}} , donc d'un sous-espace du produit de k copies de la sphère de dimension n. On peut préférer une description matricielle[3]

V k ( R n ) = { A M n , k ( R ) , A T A = I } {\displaystyle V_{k}(\mathbb {R} ^{n})=\left\{A\in {\cal {M}}_{n,k}(\mathbb {R} ),A^{\mathsf {T}}A={\mathsf {I}}\right\}}

On peut citer des particuliers simples :

  • si k = 1, il s'agit de la sphère unité de l'espace euclidien,
  • si k = n la variété de Stiefel n'est autre que le groupe orthogonal d'indice n,
  • si k = n–1, comme une famille orthonormale de n–1 vecteurs n'admet qu'une complétion en base orthonormale directe, la variété de Stiefel est le groupe spécial orthogonal d'indice n.

De façon générale, la variété de Stiefel est une variété différentielle compacte quand on la munit de la topologie tirée de l'une ou l'autre de ces définitions. Les variétés correspondant à des valeurs de n successives sont incluses les unes dans les autres, ce qui permet de considérer leur réunion V k ( R ) {\displaystyle V_{k}(\mathbb {R} ^{\infty })} [4].

Une autre description possible de la variété de Stiefel, souvent utile, est de la faire apparaître comme un espace homogène, quotient du groupe O(n). Pour cela on considère l'action du sous-groupe O(n – k) qui suit :

M O ( n ) , U O ( n k ) , U M = M × ( I k 0 0 U ) {\displaystyle \forall M\in O(n),\forall U\in O(n-k),\qquad U\cdot M=M\times {\begin{pmatrix}\mathrm {I} _{k}&0\\0&U\end{pmatrix}}}

On peut donc écrire V k ( R n ) O ( n ) / O ( n k ) {\displaystyle V_{k}(\mathbb {R} ^{n})\sim O(n)/O(n-k)} [5].

Lien avec la grassmannienne

La grassmannienne G k ( R n ) {\displaystyle G_{k}(\mathbb {R} ^{n})} est l'ensemble des k-plans (sous-espaces vectoriels de dimension k) de l'espace euclidien de dimension n. Or chaque élément de la variété de Stiefel, vu comme famille de vecteurs, engendre un espace vectoriel de dimension k. Ceci permet de décrire la grassmannienne comme un quotient de la variété de Stiefel et confère à l'ensemble une structure d'espace fibré[6] :

O ( k ) V k ( R n ) G k ( R n ) {\displaystyle O(k)\longrightarrow V_{k}(\mathbb {R} ^{n})\longrightarrow G_{k}(\mathbb {R} ^{n})} .

On peut comprendre le lien entre la topologie de cette structure et la situation géométrique : chaque fibre au dessus d'un point de la grassmannienne, donc d'un k-plan P, est formée des bases orthonormées de P. Une telle base étant fixée, on peut s'en servir comme référence pour caractériser la variation continue d'une base de cette fibre à une fibre voisine (au-dessus d'un autre k-plan Q). Concrètement cela peut se faire en exigeant une variation continue des vecteurs de la base relativement à P, puis en appliquant le procédé d'orthonormalisation de Schmidt, dont l'expression est continue[4]. On obtient en fait ainsi une structure de fibré principal de groupe structural O(k).

Autres corps de base

Cette section est vide, insuffisamment détaillée ou incomplète. Votre aide est la bienvenue ! Comment faire ?

Géométrie de la variété de Stiefel

La description la plus féconde pour formuler les propriétés géométriques d'une variété de Stiefel est de la voir comme l'espace quotient O ( n ) / O ( n k ) {\displaystyle O(n)/O(n-k)} , même si cela demande de considérer chaque point comme une classe d'équivalence pour l'action par multiplication à droite évoquée ci-dessus.

Espace tangent

On s'intéresse à un point de la variété ; en notant Q O ( n ) {\displaystyle Q\in O(n)} l'un de ses représentants, cette classe d'équivalence s'écrit donc

[ Q ] = { Q × ( I k 0 0 U ) , U O ( n k ) } = Q × [ I n ] V k ( R n ) {\displaystyle [Q]=\left\{Q\times {\begin{pmatrix}\mathrm {I} _{k}&0\\0&U\end{pmatrix}},U\in O(n-k)\right\}=Q\times [\mathrm {I} _{n}]\in V_{k}(\mathbb {R} ^{n})}

Les décompositions par blocs qui suivront reprendront les mêmes tailles k et n – k.

On connaît l'espace tangent à O(n) (c'est l'algèbre de Lie de ce groupe, formée des matrices antisymétriques) et parmi les vecteurs tangents ceux qui sont « verticaux » c'est-à-dire tangents aux éléments du sous-groupe identifié à O(n – k). L'espace tangent à la variété de Stiefel est formé des vecteurs horizontaux, c'est-à-dire orthogonaux à ces vecteurs verticaux :

T [ I n ] V k ( R n ) = { Δ = ( A B T B 0 ) , A T = A } , T [ Q ] V k ( R n ) = Q × T [ I n ] V k ( R n ) {\displaystyle T_{[\mathrm {I} _{n}]}V_{k}(\mathbb {R} ^{n})=\left\{\Delta ={\begin{pmatrix}A&-B^{\mathsf {T}}\\B&0\end{pmatrix}},\qquad A^{\mathsf {T}}=-A\right\},\qquad T_{[Q]}V_{k}(\mathbb {R} ^{n})=Q\times T_{[\mathrm {I} _{n}]}V_{k}(\mathbb {R} ^{n})}

ce qui donne notamment la dimension de l'espace tangent, donc de la variété[5]

dim V k ( R n ) = n k 1 2 k ( k + 1 ) {\displaystyle \dim V_{k}(\mathbb {R} ^{n})=nk-{\frac {1}{2}}k(k+1)}

Métrique canonique

Le groupe orthogonal est muni de la norme héritée de la norme canonique sur l'espace des matrices (ou norme de Frobenius). On appelle structure riemannienne canonique sur la variété de Stiefel la structure qui fait de la projection O ( n ) O ( n k ) {\displaystyle O(n)\longrightarrow O(n-k)} une submersion riemannienne. Elle est définie par le produit scalaire

( Q × ( A 1 B 1 T B 1 0 ) | Q × ( A 2 B 2 T B 2 0 ) ) = 1 2 ( A 1 | A 2 ) + ( B 1 | B 2 ) {\displaystyle \left(Q\times {\begin{pmatrix}A_{1}&-B_{1}^{\mathsf {T}}\\B_{1}&0\end{pmatrix}}{\Big |}Q\times {\begin{pmatrix}A_{2}&-B_{2}^{\mathsf {T}}\\B_{2}&0\end{pmatrix}}\right)={\frac {1}{2}}(A_{1}|A_{2})+(B_{1}|B_{2})}

dont on voit qu'il ne coïncide pas avec la métrique induite par la norme canonique sur V k ( R n ) {\displaystyle V_{k}(\mathbb {R} ^{n})} vu comme sous-espace de l'espace des matrices rectangulaires, puisque cette dernière ne ferait pas apparaître le facteur 1/2[7].

L'application exponentielle au point I est l'exponentielle de matrice ordinaire. Au point [Q], en notant toujours Δ = ( A B T B 0 ) {\displaystyle \Delta ={\begin{pmatrix}A&-B^{\mathsf {T}}\\B&0\end{pmatrix}}} , elle est donnée par Q Δ Q e Δ {\displaystyle Q\Delta \mapsto Q\mathrm {e} ^{\Delta }}  ; cela permet la détermination des géodésiques t Q e t Δ {\displaystyle t\mapsto Q\mathrm {e} ^{t\Delta }} [8].

Homotopie des variétés de Stiefel

En ne retenant que les j premiers vecteurs parmi k, on obtient une application de projection p d'une variété de Stiefel sur une autre, qui donne une structure d'espace fibré

j < k n , V k j ( R n j ) V k ( R n ) p V j ( R n ) {\displaystyle \forall j<k\leq n,\qquad V_{k-j}(\mathbb {R} ^{n-j})\longrightarrow V_{k}(\mathbb {R} ^{n}){\overset {p}{\longrightarrow }}V_{j}(\mathbb {R} ^{n})}

Et notamment pour j = 1

V k 1 ( R n 1 ) V k ( R n ) p S n 1 {\displaystyle V_{k-1}(\mathbb {R} ^{n-1})\longrightarrow V_{k}(\mathbb {R} ^{n}){\overset {p}{\longrightarrow }}\mathbb {S} ^{n-1}}

Il en résulte que tous les groupes d'homotopie de V k ( R n ) {\displaystyle V_{k}(\mathbb {R} ^{n})} jusqu'à l'ordre n – k – 1 sont nuls[9].

Notes et références

  1. Voir l'introduction de Edelman, Arias et Smith 1998
  2. Par exemple (en) Stephane Chretien et Benjamin Guedj, « Revisiting clustering as matrix factorisation on the Stiefel manifolds », (consulté le ).
  3. [Jean-Pierre Dedieu], Points Fixes, Zéros et la Méthode de Newton, p. 68-69.
  4. a et b (en) Allen Hatcher, Algebraic Topology, CUP, (ISBN 978-0-521-79540-1, lire en ligne), Exemple 4.53. p.382.
  5. a et b Cantarella, section 2.
  6. Hatcher 2001, Exemple 4.53. p.381.
  7. Voir Edelman, Arias et Smith 1998, où les deux métriques sont étudiées en détail, sections 2.2 à 2.4.
  8. Cantarella, section 3.
  9. Hatcher 2001, Exemple 4.54.

Bibliographie

  • icône décorative Portail de la géométrie