Moyenne quasi-arithmétique

En mathématiques et en statistiques, les moyennes quasi-arithmétiques, ou moyennes de Kolmogorov ou encore moyennes selon une fonction f [1] constituent une généralisation de la moyenne (de Hölder) d'ordre p (qui est elle-même une généralisation des moyennes usuelles : arithmétique, géométriqueetc.). Elles sont paramétrées par une fonction f.

Définition

Soit f {\displaystyle f} une fonction d'un intervalle I R {\displaystyle I\subset \mathbb {R} } dans les nombres réels, continue et injective.

La moyenne selon la fonction f des n {\displaystyle n} nombres x 1 , , x n I {\displaystyle x_{1},\dots ,x_{n}\in I} est définie par M f ( x 1 , , x n ) = f 1 ( f ( x 1 ) + + f ( x n ) n ) {\displaystyle M_{f}(x_{1},\dots ,x_{n})=f^{-1}\left({\frac {f(x_{1})+\cdots +f(x_{n})}{n}}\right)} , que l'on peut aussi écrire

M f ( x ) = f 1 ( 1 n k = 1 n f ( x k ) ) {\displaystyle M_{f}({\vec {x}})=f^{-1}\left({\frac {1}{n}}\sum _{k=1}^{n}f(x_{k})\right)}

Il est nécessaire que f {\displaystyle f} soit injective pour que son inverse f 1 {\displaystyle f^{-1}} soit définie. Comme f {\displaystyle f} est définie sur un intervalle, f ( x 1 ) + + f ( x n ) n {\displaystyle {\frac {f(x_{1})+\cdots +f(x_{n})}{n}}} appartient au domaine de définition de f 1 {\displaystyle f^{-1}} .

Comme f {\displaystyle f} est injective et continue, elle est strictement monotone, d'où il découle que la moyenne selon f est toujours comprise entre le minimum et le maximum des nombres en argument :

min ( x 1 , , x n ) M f ( x 1 , , x n ) max ( x 1 , , x n ) {\displaystyle \min(x_{1},\ldots ,x_{n})\leqslant M_{f}(x_{1},\ldots ,x_{n})\leqslant \max(x_{1},\ldots ,x_{n})}

Exemples

(Dans les exemples suivants, I = R {\displaystyle I=\mathbb {R} } ou R + {\displaystyle \mathbb {R} ^{+}} )

  • Pour f ( x ) = a x + b {\displaystyle f(x)=a\cdot x+b} , alors la moyenne selon f correspond à la moyenne arithmétique quels que soient a 0 {\displaystyle a\neq 0} et b {\displaystyle b} (voir la propriété d'invariance d'échelle infra).
  • Pour f ( x ) = log a x {\displaystyle f(x)=\log _{a}x} , alors la moyenne selon f correspond à la moyenne géométrique quelle que soit la base du logarithme dès lors que celle-ci est positive et différente de 1.
  • Pour f ( x ) = 1 x {\displaystyle f(x)={\frac {1}{x}}} , alors la moyenne selon f correspond à la moyenne harmonique.
  • Pour f ( x ) = x p {\displaystyle f(x)=x^{p}} , alors la moyenne selon f correspond à la moyenne d'ordre p {\displaystyle p} .
  • Pour f ( x ) = e x {\displaystyle f(x)=e^{x}} , alors la f {\displaystyle f} -moyenne est la moyenne dans le demi-anneau logarithmique (en), qui est une version décalée d'une constante de la fonction softmax: M f ( x 1 , , x n ) = s o f t m a x ( x 1 , , x n ) ln ( n ) {\displaystyle M_{f}(x_{1},\dots ,x_{n})=\mathrm {softmax} (x_{1},\dots ,x_{n})-\ln(n)} . Le ln ( n ) {\displaystyle -\ln(n)} correspond à une division par n {\displaystyle n} .
  • Par contre, la moyenne logarithmique n'est pas une moyenne quasi-arithmétique [2].

Propriétés

Les propriétés suivantes sont vraies pour toute fonction f {\displaystyle f} satisfaisant à la définition ci-dessus:

Symétrie : La valeur de M f {\displaystyle M_{f}} est invariante par permutation de ses arguments.

Point fixe : x I , M f ( x , , x ) = x {\displaystyle \forall x\in I,M_{f}(x,\dots ,x)=x} .

Croissance : M f {\displaystyle M_{f}} est croissante en chacun de ses arguments (puisque f {\displaystyle f} et f 1 {\displaystyle f^{-1}} sont monotones de même sens).

Continuité : M f {\displaystyle M_{f}} est continue en chacun de ses arguments (puisque f {\displaystyle f} est continue).

Substitution : n'importe quel sous-ensemble de k {\displaystyle k} arguments peut être remplacé par sa f {\displaystyle f} -moyenne répétée k {\displaystyle k} fois, sans changer le résultat de la f {\displaystyle f} -moyenne globale. Si l'on note m = M f ( x 1 , , x k ) {\displaystyle m=M_{f}(x_{1},\dots ,x_{k})} on a ainsi:

M f ( x 1 , , x k , x k + 1 , , x n ) = M f ( m , , m k  fois , x k + 1 , , x n ) {\displaystyle M_{f}(x_{1},\dots ,x_{k},x_{k+1},\dots ,x_{n})=M_{f}(\underbrace {m,\dots ,m} _{k{\text{ fois}}},x_{k+1},\dots ,x_{n})}

Partitionnement (ou associativité) : Le calcul de la moyenne selon f peut être séparée en plusieurs calculs de sous-ensembles de même taille :

M f ( x 1 , , x n k ) = M f ( M f ( x 1 , , x k ) , M f ( x k + 1 , , x 2 k ) , , M f ( x ( n 1 ) k + 1 , , x n k ) ) {\displaystyle M_{f}(x_{1},\dots ,x_{n\cdot k})=M_{f}(M_{f}(x_{1},\dots ,x_{k}),M_{f}(x_{k+1},\dots ,x_{2\cdot k}),\dots ,M_{f}(x_{(n-1)\cdot k+1},\dots ,x_{n\cdot k}))}

Auto-distributivité : Pour toute moyenne de Kolmogorov M {\displaystyle M} de deux arguments, on a :

M ( x , M ( y , z ) ) = M ( M ( x , y ) , M ( x , z ) ) {\displaystyle M(x,M(y,z))=M(M(x,y),M(x,z))} .

Médialité : Pour toute moyenne de Kolmogorov M {\displaystyle M} de deux arguments, on a :

M ( M ( x , y ) , M ( z , w ) ) = M ( M ( x , z ) , M ( y , w ) ) {\displaystyle M(M(x,y),M(z,w))=M(M(x,z),M(y,w))} .

Équilibrage : Pour toute moyenne de Kolmogorov M {\displaystyle M} de deux arguments, on a :

M ( M ( x , M ( x , y ) ) , M ( y , M ( x , y ) ) ) = M ( x , y ) {\displaystyle M\left(M(x,M(x,y)),M(y,M(x,y))\right)=M(x,y)} .

Théorème central limite : Sous conditions de régularité et pour un échantillon suffisamment grand, n { M f ( X 1 , , X n ) f 1 ( M f ( X 1 , , X n ) ) } {\displaystyle {\sqrt {n}}\{M_{f}(X_{1},\dots ,X_{n})-f^{-1}(M_{f}(X_{1},\dots ,X_{n}))\}} suit approximativement une loi normale[3].

Invariance d'échelle : La moyenne de Kolmogorov est invariante par translation et homothétie de la fonction f {\displaystyle f} :

a ,   b 0 , ( ( t ,   g ( t ) = a + b f ( t ) ) x ;   M f ( x ) = M g ( x ) {\displaystyle \forall a,\ \forall b\neq 0,((\forall t,\ g(t)=a+b\cdot f(t))\Rightarrow \forall x;\ M_{f}(x)=M_{g}(x)} .

Caractérisation

Il existe plusieurs ensembles de propriétés qui caractérisent la moyenne de Kolmogorov (c'est-à-dire que pour toute fonction M {\displaystyle {\mathcal {M}}} satisfaisant ces propriétés, il existe une fonction f {\displaystyle f} telle que M = M f {\displaystyle {\mathcal {M}}=M_{f}} ).

  • La médialité est essentiellement suffisante pour caractériser une moyenne de Kolmogorov[4]:chapitre 17.
  • L'auto-distributivité est essentiellement suffisante pour caractériser une moyenne de Kolmogorov[4]:chapitre 17.
  • Kolmogorov a démontré que les cinq propriétés de symétrie, point fixe, monotonicité, continuité et substitution caractérisent entièrement une moyenne de Kolmogorov [5].
  • Équilibrage: Une question intéressante consiste à savoir si cette propriété peut remplacer celle de substitution dans l'ensemble de Kolmogorov, c'est-à-dire si les cinq propriétés de symétrie, point fixe, monotonicité, continuité et équilibrage suffisent à caractériser une moyenne de Kolmogorov. Georg Aumann (en) a démontré dans les années 1930 que la réponse, en général, est non [6], mais qu'il suffit d'ajouter l'hypothèse que M {\displaystyle {\mathcal {M}}} soit analytique pour que ce soit le cas[7].

Homogénéité

Les moyennes sont habituellement homogènes, mais pour presque toutes les fonctions f {\displaystyle f} , la moyenne selon f ne l'est pas. En fait, les seules moyennes de Kolmogorov homogènes sont les moyennes d'ordre p. Voir Hardy–Littlewood–Pólya, page 68.

La propriété d'homogénéité peut cependant être obtenue en normalisant les arguments par une moyenne (homogène) C {\displaystyle C} .

M f , C x = C x f 1 ( f ( x 1 C x ) + + f ( x n C x ) n ) {\displaystyle M_{f,C}x=Cx\cdot f^{-1}\left({\frac {f\left({\frac {x_{1}}{Cx}}\right)+\cdots +f\left({\frac {x_{n}}{Cx}}\right)}{n}}\right)}

Cependant, cette modification peut violer les propriétés de monotonicité et de partitionnement.

Références

  • (en) Cet article est partiellement ou en totalité issu de l’article de Wikipédia en anglais intitulé « Quasi-arithmetic mean » (voir la liste des auteurs).
  1. Xavier Gourdon, Les maths en tête, Analyse, Ellipses, , p. 111
  2. J.B. Hiriart-Urruty, « Il y a encore du TAF », Losanges,‎ , p. 41 (lire en ligne Accès limité)
  3. Miguel de Carvalho, « Mean, what do you Mean? », The American Statistician, vol. 70, no 3,‎ , p. 764‒776 (DOI 10.1080/00031305.2016.1148632, lire en ligne)
  4. a et b Aczél, J.; Dhombres, J. G., Functional equations in several variables. With applications to mathematics, information theory and to the natural and social sciences. Encyclopedia of Mathematics and its Applications, 31., Cambridge, Cambridge Univ. Press,
  5. Anton Grudkin, « Characterization of the quasi-arithmetic mean », sur Math stackexchange,
  6. Georg Aumann, « Vollkommene Funktionalmittel und gewisse Kegelschnitteigenschaften », Journal für die reine und angewandte Mathematik, vol. 1937, no 176,‎ , p. 49–55 (DOI 10.1515/crll.1937.176.49)
  7. Georg Aumann, « Grundlegung der Theorie der analytischen Analytische Mittelwerte », Sitzungsberichte der Bayerischen Akademie der Wissenschaften,‎ , p. 45–81

Voir aussi

Bibliographie

  • (en) Andrey Kolmogorov, Selected Works I : Mathematics and Mechanics, Springer, (ISBN 978-94-010-5347-1), « On the Notion of Mean »
  • Andrey Kolmogorov, « Sur la notion de la moyenne », Atti Reale Accademia Nazionale dei Lincei, vol. 12,‎ , p. 388–391
  • (en) John Bibby, « Axiomatisations of the average and a further generalisation of monotonic sequences », Glasgow Mathematical Journal, vol. 15,‎ , p. 63–65
  • (en) G.H. Hardy, J.E. Littlewood et G. Pólya, Inequalities, Cambridge, Cambridge Univ. Press, .

Articles connexes

  • icône décorative Portail des mathématiques