Lemme de Schur

Page d’aide sur l’homonymie

Cet article concerne le cas particulier des représentations de groupe. Pour une version plus générale, voir le lemme de Schur pour les modules.

En mathématiques et plus précisément en algèbre linéaire, le lemme de Schur est un lemme technique utilisé particulièrement dans la théorie de la représentation des groupes.

Il a été démontré en 1907 par Issai Schur dans le cadre de ses travaux sur la théorie des représentations d'un groupe fini[1].

Ce lemme est à la base de l'analyse d'un caractère d'une représentation d'un groupe fini ; il permet, par exemple, de caractériser les groupes abéliens finis.

Contexte

Le lemme de Schur représente l'un des fondements de la théorie des représentations d'un groupe fini et de l'analyse de l'algèbre des modules semi-simples.

Une représentation d'un groupe G dans un espace vectoriel E de dimension finie n est la donnée d'un morphisme ρ de G dans le groupe linéaire GL(E) des automorphismes de E. Cette approche initiée par Ferdinand Georg Frobenius dans un article[2] de 1896 s'avère fructueuse.

Trois ans plus tard, Heinrich Maschke démontre[3] que toute représentation est somme directe de représentations irréductibles. Une représentation (E, ρ) est dite irréductible si les sous-espaces E et {0} sont distincts et sont les deux seuls sous-espaces stables par les automorphismes ρ(g), g décrivant G. Le théorème de Maschke énonce que, si la caractéristique de K ne divise pas l'ordre de G, alors toute représentation de G est somme directe de représentations irréductibles. Connaître toutes les représentations d'un groupe fini revient donc à connaître ses représentations irréductibles, les autres s'obtiennent par somme directe.

Le lemme de Schur est un lemme technique essentiel pour la démonstration d'un résultat majeur : les représentations irréductibles s'identifient par leur caractère, et ces caractères sont orthogonaux deux à deux. Cette approche apporte des résultats importants pour la théorie des groupes finis. Elle a finalement permis la classification des groupes simples, mais aussi la démonstration de résultats comme une conjecture de William Burnside stipulant que tout groupe fini d'ordre impair est résoluble. Ce résultat est à l'origine de la médaille Fields de Thompson en 1970.

Si ce lemme est aussi utilisé dans d'autres contextes, celui de la représentation est néanmoins le plus important.

Le lemme de Schur

Soit U une partie de l'ensemble des endomorphismes L(E) d'un espace vectoriel E. On dit que U est irréductible si les deux seuls sous-espaces de E stables par tout élément de U sont E et {0}.

Le lemme de Schur s'énonce alors sous la forme suivante :

Lemme de Schur — Soient E et F deux K espaces vectoriels et ϕ une application linéaire non nulle de E dans F.

  1. S'il existe une partie irréductible U de L(E) telle que
    u U v L ( F ) ϕ u = v ϕ , {\displaystyle \forall u\in U\quad \exists v\in L(F)\quad \phi \circ u=v\circ \phi ,}
    alors ϕ est injective.
  2. S'il existe une partie irréductible V de L(F) telle que
    v V u L ( E ) ϕ u = v ϕ , {\displaystyle \forall v\in V\quad \exists u\in L(E)\quad \phi \circ u=v\circ \phi ,}
    alors ϕ est surjective.
Démonstration
  1. Soit N le noyau de ϕ. Ce sous-espace n'est pas E tout entier car ϕ est non nulle. Il est stable par toute application u de U car
    u U v L ( F ) ϕ u ( N ) = v ϕ ( N ) = { 0 } {\displaystyle \forall u\in U\quad \exists v\in L(F)\quad \phi \circ u(N)=v\circ \phi (N)=\{0\}}
    donc u(N) est inclus dans N. Par irréductibilité de U, N est donc réduit à {0}.
  2. Soit M l'image de ϕ. Ce sous-espace de F n'est pas réduit à {0} car ϕ est non nulle. Il est stable par toute application v de V car
    v V u L ( E ) v ϕ ( E ) = ϕ u ( E ) ϕ ( E ) {\displaystyle \forall v\in V\quad \exists u\in L(E)\quad v\circ \phi (E)=\phi \circ u(E)\subset \phi (E)}
    donc v(M) est inclus dans M. Par irréductibilité de V, M est donc égal à F.

Corollaires

Corollaire 1

Soient E un espace vectoriel de dimension finie sur un corps K algébriquement clos et U une partie irréductible de L(E). Si un endomorphisme ϕ de E commute avec tout élément de U, alors ϕ est une homothétie.

Démonstration

Si Id désigne l'application identité, on a :

λ K u U ( ϕ λ I d ) u = u ( ϕ λ I d ) . {\displaystyle \quad \forall \lambda \in K\quad \forall u\in U\quad (\phi -\lambda {\rm {Id}})\circ u=u\circ (\phi -\lambda {\rm {Id}}).}

On en déduit par application du lemme de Schur que ϕ – λ Id est un automorphisme ou est nulle. Soit λ* une valeur propre de ϕ, alors ϕ – λ* Id n'est pas un automorphisme, donc est l'application nulle, ce qui démontre le corollaire.

Dans le cas de la représentation d'un groupe d'exposant fini e, alors tout automorphisme de l'image possède pour polynôme annulateur Xe – 1. En conséquence, si ce polynôme est scindé sur K, le corollaire s'applique encore.

Corollaire 2

Toute représentation irréductible d'un groupe abélien dans un espace de dimension finie sur un corps algébriquement clos est de degré 1.

En effet, soient (E, ρ) une telle représentation et D une droite de E. Quel que soit l'élément s du groupe, ρs commute avec tous les endomorphismes de la représentation. D'après le corollaire 1, ρs est une homothétie. Ainsi, D est invariante donc égale à E.

Cas des groupes finis

Corollaire 3

Soient (E, ρE) et (F, ρF) deux représentations de G irréductibles sur un corps K dont la caractéristique ne divise pas l'ordre g du groupe et sur lequel le polynôme Xg – 1 est scindé[4], et ψ une application linéaire de E dans F, on définit l'application linéaire φ de E dans F par :

φ = 1 g s G ρ F ( s ) ψ ρ E ( s ) 1 . {\displaystyle \varphi ={\frac {1}{g}}\sum _{s\in G}\rho _{F}(s)\circ \psi \circ \rho _{E}(s)^{-1}.}
  1. Si les représentations ne sont pas isomorphes, alors φ est nulle.
  2. Si les représentations sont égales, alors φ est une homothétie de rapport (1/n)Tr(ψ).
Démonstration

Vérifions dans un premier temps que φ satisfait la propriété suivante :

t G φ ρ E ( t ) = ρ F ( t ) φ o u   e n c o r e φ = ρ F ( t ) φ ρ E ( t ) 1 {\displaystyle \forall t\in G\quad \varphi \circ \rho _{E}(t)=\rho _{F}(t)\circ \varphi \quad \mathrm {ou~encore} \quad \varphi =\rho _{F}(t)\circ \varphi \circ \rho _{E}(t)^{-1}\;}

Remarquons tout d'abord que, si t est un élément de G, l'application de G dans G qui à s associe ts est une permutation de G, . On en déduit que :

t G ρ F ( t ) φ ρ E ( t ) 1 = 1 g s G ρ F ( t ) ρ F ( s ) ψ ρ E ( s ) 1 ρ E ( t ) 1 = 1 g s G ρ F ( t s ) ψ ρ E ( t s ) 1 = φ {\displaystyle \forall t\in G\quad \rho _{F}(t)\circ \varphi \circ \rho _{E}(t)^{-1}={\frac {1}{g}}\sum _{s\in G}\rho _{F}(t)\circ \rho _{F}(s)\circ \psi \circ \rho _{E}(s)^{-1}\circ \rho _{E}(t)^{-1}={\frac {1}{g}}\sum _{s\in G}\rho _{F}(ts)\circ \psi \circ \rho _{E}(ts)^{-1}=\varphi }
  1. Comme les représentations ne sont pas isomorphes, φ ne peut être à la fois injective et surjective. Le lemme de Schur montre que, comme φ n'est pas un automorphisme, φ est l'application nulle.
  2. Si (E, ρE) = (F, ρF), les hypothèses du corollaire 1 sont vérifiées, ce qui montre que φ est une homothétie. Dans ce cas, l'expression définissant φ est la moyenne de g applications toutes semblables à ψ et donc ayant la même trace que ψ. Les traces de φ et ψ sont donc égales. En notant λ le rapport de l'homothétie φ on a donc : nλ = Tr(φ) = Tr(ψ). En appliquant tout ceci à un ψ arbitraire de trace 1, on trouve de plus que n est inversible dans K.
Remarque.

Si la caractéristique p de K est non nulle, la preuve de ce corollaire met en évidence que le nombre premier p ne divise pas n. Comme on a supposé que p ne divise pas g, ceci n'est pas surprenant quand on sait que le degré n d'une représentation irréductible divise toujours l'ordre g du groupe.[réf. souhaitée]

Corollaire 4

C'est un quatrième corollaire qui est utilisé dans la théorie des caractères. Il correspond à la traduction en termes de matrices du corollaire précédent. Utilisons les notations suivantes : soient A et B deux représentations matricielles d'un groupe fini G d'ordre g sur un même corps K dont la caractéristique ne divise pas g et sur lequel le polynôme Xg – 1 soit scindé. Les dimensions respectives de E et F sont notées n et m. L'image d'un élément s de G par A (resp. B) est noté aij(s) (resp. bij(s)).

On a alors, sous les hypothèses du corollaire précédent :

  1. Si les représentations A et B ne sont pas isomorphes, alors :
    i , j [ 1 , n ] k , l [ 1 , m ] s G a i j ( s ) b k l ( s 1 ) = 0. {\displaystyle \forall i,j\in [1,n]\;\forall k,l\in [1,m]\quad \sum _{s\in G}a_{ij}(s)b_{kl}(s^{-1})=0.}
  2. En notant δij le symbole de Kronecker, on a :
    i , j , k , l [ 1 , n ] 1 g s G a i j ( s ) a k l ( s 1 ) = 1 n δ i l δ j k . {\displaystyle \forall i,j,k,l\in [1,n]\quad {\frac {1}{g}}\sum _{s\in G}a_{ij}(s)a_{kl}(s^{-1})={\frac {1}{n}}\delta _{il}\delta _{jk}.}
Démonstration
  1. Si C une matrice de dimension mxn de coefficients (cjk), la traduction du point 1 du corollaire précédent montre que :
    s G A ( s ) C B ( s ) 1 = 0 {\displaystyle \sum _{s\in G}A(s)CB(s)^{-1}=0}
    donc
    i [ 1 , n ] l [ 1 , m ] j k s G a i j ( s ) c j k b k l ( s 1 ) = j k ( s G a i j ( s ) b k l ( s 1 ) ) c j k = 0. {\displaystyle \forall i\in [1,n]\;\forall l\in [1,m]\quad \sum _{jk}\sum _{s\in G}a_{ij}(s)c_{jk}b_{kl}(s^{-1})=\sum _{jk}\left(\sum _{s\in G}a_{ij}(s)b_{kl}(s^{-1})\right)c_{jk}=0.}
    Cette égalité est vraie pour toute matrice C, donc pour toute valeur de cjk, ce qui démontre le point 1.
  2. Avec les mêmes notations (maintenant B = A et m = n), on obtient d'après le point 2 du corollaire précédent :
    1 g s G A ( s ) C A ( s ) 1 = 1 n T r ( C ) I d {\displaystyle {\frac {1}{g}}\sum _{s\in G}A(s)CA(s)^{-1}={\frac {1}{n}}{\rm {Tr}}(C){\rm {Id}}}
    donc
    i , j [ 1 , n ] 1 g j k s G a i j ( s ) c j k a k l ( s 1 ) = 1 n k c k k δ i l . {\displaystyle \forall i,j\in [1,n]\quad {\frac {1}{g}}\sum _{jk}\sum _{s\in G}a_{ij}(s)c_{jk}a_{kl}(s^{-1})={\frac {1}{n}}\sum _{k}c_{kk}\delta _{il}.}
    On en déduit :
    i , j , k , l [ 1 , n ] 1 g s G a i j ( s ) a k l ( s 1 ) = 1 n δ i l δ j k , {\displaystyle \forall i,j,k,l\in [1,n]\quad {\frac {1}{g}}\sum _{s\in G}a_{ij}(s)a_{kl}(s^{-1})={\frac {1}{n}}\delta _{il}\delta _{jk},}
    et le point 2 est démontré.

Applications

Caractère

C'est la première application historique du lemme. On suppose ici que K est le corps ℂ des nombres complexes et on munit ℂG (l'espace vectoriel – de dimension g – des applications de G dans ℂ) du produit hermitien 〈 , 〉 suivant :

f , h C G f , h = 1 g s G f ( s ) h ( s ) ¯ . {\displaystyle \forall f,h\in \mathbb {C} ^{G}\quad \langle f,h\rangle ={\frac {1}{g}}\sum _{s\in G}f(s){\overline {h(s)}}.}

(Si z désigne un nombre complexe, z désigne ici son conjugué.)

Les caractères irréductibles d'un groupe fini G forment une famille orthonormale deG.

Démonstration

C'est une conséquence directe du corollaire 4. L'article associé démontre que la trace de ρ(s−1) est égale au conjugué de la trace de ρ(s), pour tout élément s de G. En utilisant les notations du paragraphe précédent, on obtient :

χ 1 , χ 2 = 1 g s G ( i = 1 n a i i ( s ) ) ( j = 1 m b j j ( s ) ) ¯ = 1 g s G ( i = 1 n a i i ( s ) ) ( j = 1 m b j j ( s 1 ) ) = 1 g i j ( s G a i i ( s ) b j j ( s 1 ) ) . {\displaystyle \langle \chi _{1},\chi _{2}\rangle ={\frac {1}{g}}\sum _{s\in G}\left(\sum _{i=1}^{n}a_{ii}(s)\right){\overline {\left(\sum _{j=1}^{m}b_{jj}(s)\right)}}={\frac {1}{g}}\sum _{s\in G}\left(\sum _{i=1}^{n}a_{ii}(s)\right)\left(\sum _{j=1}^{m}b_{jj}(s^{-1})\right)={\frac {1}{g}}\sum _{ij}\left(\sum _{s\in G}a_{ii}(s)b_{jj}(s^{-1})\right).}

Si les deux représentations ne sont pas isomorphes, alors le point 1 du corollaire permet de conclure à l'orthogonalité.

D'après le point 2 on obtient :

χ 1 , χ 1 = 1 n i j δ i j δ i j = 1 , {\displaystyle \langle \chi _{1},\chi _{1}\rangle ={\frac {1}{n}}\sum _{ij}\delta _{ij}\delta _{ij}=1,}

ce qui démontre la proposition.

Ce résultat est un des fondements de la théorie des caractères.

Groupe abélien fini

Article détaillé : Théorème de Kronecker.

D'autres applications existent. Le lemme de Schur permet de démontrer directement que tout groupe abélien fini est un produit de cycles. La démonstration se fonde essentiellement sur l'algèbre linéaire.

Ce résultat se démontre aussi directement (cf. article détaillé), ou par l'analyse des caractères.

Notes et références

  1. (de) I. Schur, « Untersuchungen über die Darstellung der endlichen Gruppen durch gebrochenen linearen Substitutionen », J. Reine. Angew. Math., vol. 132,‎ , p. 85-137 (lire en ligne)
  2. (de) Von G. Frobenius, « Über Gruppencharaktere », Sitzungsber. K. Pr. Akad. Wiss. Berlin,‎ (lire en ligne)
  3. (de) H. Maschke, « Beweis des Satzes, dass diejenigen endlichen linearen Substitutionesgruppen, in welchen einige durchgehends verschwindende Coefficienten auftenen intransitiv sind », Math. Ann., vol. 52,‎ , p. 363-368
  4. C'est le cas des corps de caractéristique nulle et algébriquement clos, tel le corps des nombres complexes.

Voir aussi

Article connexe

Relations d'orthogonalité de Schur (en)

Liens externes

  • icône décorative Portail de l’algèbre