3 Points selles (Niveau L2-L3)

Les points critiques a qui ne sont pas des extrema peuvent être de différents types. L’absence d’extrema peut être visible sur une droite passant par a s’il y a un point d’inflexion (comme pour xx3 dans ) et il peut y avoir des points critiques qui sont des maxima dans certaines directions et des minima dans d’autres. Ces points ont un certain intérêt et seront nommés points selles.

Définition B.3.

Soit Un et f:U et aU.

  1. 8.

    Soient deux sous-espaces vectoriels F et G supplémentaires n=FG (c’est à dire FG={0} et n=F+G) On dit que a est un point selle (resp. point selle local) de f selon la décomposition n=FG si a est un minimum (resp. minimum local) pour la restriction f|a+F de f au sous espace affine a+F, et si a est un maximum (resp. maximum local) pour la restriction f|a+G de f au sous espace affine a+G. On parle de point selle si il existe une telle décomposition.

  2. 9.

    Si f de classe 𝒞1. Soit a un point critique de f, un sous espace vectoriel Hn est un plan d’inflexion si pour toute droite Δ passant par a inclus dans a+H, f|Δ n’a pas d’extrema local en a.

Remarque B.1.

La décomposition FG d’un point selle n’est pas forcément unique et on ne demande rien en dehors (a+G)(F+a), en particulier, il peut y avoir des plans d’inflexion en un point selle (ex f(x,y)=x2y2+(xy)3, (0,0) est un point selle local dans la décomposition (,0)(0,) car x2+x3 a un minimum local en 0 et y2y3 un maximum local, de même (0,0) est un point selle dans la décomposition (1,1/2)(1/2,1) mais (1,1) est une droite d’inflexion)

Proposition B.5.

Soit f:U de classe 𝒞1

  1. 10.

    Si a est un point selle de f, c’est un point critique de f.

  2. 11.

    Si f est 𝒞2 et a est un point critique de f. Si D2f(a) est non-dégénérée, ni positive ni négative, alors a est un point selle local de f.

  3. 12.

    Si a est un point critique de f H est un plan d’inflexion en a de dimension dim(H)>n/2 alors a n’est pas un point selle local. De plus si f est 𝒞2 pour tout hH, D2f(a)(H,H)=0.

Démonstration : 

Pour (1) on remarque qu’il suffit de montrer df(a)=0 ce qui ne dépend pas de la base de n on peut donc supposer a point selle pour la décomposition F=k×{0}, G={0}×nk. Comme f restreint à a+F à un minimum local, les k premières dérivées partielles s’annulent, les n-k dernières s’annulent à cause du maximum sur a+G, d’où df(a)=0.

La preuve de (2) nécessite quelques bases d’algèbre linéaire. Pour (2), comme D2f(a) est non dégénérée, les valeurs propres de H(f)(a) (les racines du polynôme Xdet(H(f)(a)Xid)) sont non nulles. Comme la matrice D2f(a) n’est ni positive ni négative, il y a à la fois des valeurs propres λ positives et négatives. Soit F l’espace vectoriel engendré par les vecteurs propres u (les un tels que H(f)(a)u=λu qui existent car si det(H(f)(a)λid)=0, H(f)(a)λid n’est pas injective donc a un noyau) des valeurs propres λ strictement positives, et de même G avec les négatives. D2f(a) restreint à F est positive donc f|a+F admet un minimum local et de même pour G.

Pour (3), si dim(H)>n/2 et supposons par l’absurde a point selle, on a dim(F)+dim(G)=n, on a soit dim(F)n/2, soit dim(G)n/2, disons qu’on se trouve dans le premier cas, alors ndim(H+F)=dim(F)+dim(H)dim(FH) implique dim(FH)dim(F)+dim(H)n>n/2+n/2n=0 donc FH{0} une contradiction car la restriction de f à toute droite dans a+FH devrait avoir un minimum local en a et un point d’inflexion à la fois. Si D2f(a)(H,H)0, on a vu que cela suffit à ce que f ait un extremum local sur la droite a+H, vu si ϕ(λ)=f(a+λH), ϕ′′(0)=D2f(a)(H,H).   □

Théorème B.6.

Soient Ank,Bk des compacts convexes et K:C=A×B continue. Si pour tout (a,b)C,ank,bk, xK(x,b) est convexe et yK(a,y) est concave, alors il existe un point de C qui soit un point selle (x0,y0) selon la décomposition nk×{0}{0}×k autrement dit :

xA,yBK(x0,y)K(x0,y0)K(x,y0). (B.1)

De plus, (B.1) est équivalente à l’égalité :

MinxAMaxyBK(x,y)=MaxyBMinxAK(x,y). (B.2)
Remarque B.2.

On a des Min et Max au lieu d’inf et sup car des fonctions continues sur des compacts atteignent leurs bornes (cf. la preuve pour la continuité de xMaxyBK(x,y) et de façon similaire de yMaxxAK(x,y).

Dans le cas où f est bilinéaire, ce résultat s’appelle le théorème du min-max de von Neumann. Il a une signification en théorie des jeux. Si f donne la valeur que gagne un joueur A en position xU si f(x)0 et f(x) la valeur que gagne le joueur B (et perd le joueur A) si f(x)0. Si A ne peut influencer que la direction {0}×k et B seulement la direction nk×{0}. Alors un point selle est un ”équilibre de Nash” c’est-à-dire un point où ni A ni B n’ont intérêt à changer leur stratégie, car si A change sa stratégie celle de B étant constante, étant donné que le point selle est un maximum, A va perdre en gain, et de même si B change sa position avec celle de A constante, le caractère de minimum dans la direction du changement de B montre que B ne peut que perdre plus.

Démonstration : 
  1. MaxyBMinxAK(x,y)MinxAMaxyBK(x,y) est toujours vrai. Comme pour tout xA,yB, MinxAK(x,y)K(x,y)MaxyAK(x,y), on déduit en prenant le max : MaxyBMinxAK(x,y)MaxyBK(x,y) soit en prenant un Min en x:

    MaxyBMinxAK(x,y)MinxAMaxyBK(x,y).
  2. (B.1)(B.2)

    De plus, en considérant (x0,y0) de (B.1), on a :

    K(x0,y0)MinxAK(x,y0)MaxyBMinxAK(x,y),
    K(x0,y0)MaxyBK(x0,y)MinxAMaxyBK(x,y),

    d’où l’égalité complète en rassemblant les 3 dernières inégalités.

  3. g:xMaxyBK(x,y) est continue.

    Soit x,xnA, xnx, soit yn (resp t) atteignant le max pour xn (resp x) c’est à dire : MaxyBK(xn,y)=K(xn,yn). Supposons que g(xn)=K(xn,yn) ne converge pas vers g(x). Par compacité, on peut extraire une suite telle que yϕ(n)Y. Par continuité de K :

    g(xϕ(n))=K(xϕ(n),yϕ(n))K(x,Y)<K(x,t)=MaxyBK(x,y)=g(x).

    Or K(xϕ(n),t)K(xϕ(n),yϕ(n)) donc en passant à la limite par continuité de K, K(x,t)K(x,Y)<K(x,t), une contradiction.

  4. (B.1)(B.2) On prend x0A réalisant le minimum c’est à dire tel que :

    α=MinxAMaxyBK(x,y)=MaxyBK(x0,y)

    Il existe par la continuité du point précédent et par compacité. De même, il existe y0B réalisant le maximum :

    MinxAK(x,y0)=MaxyBMinxAK(x,y)=α.

    Donc pour tout xA,yB, en utilisant (B.2) pour l’égalité du milieu, on obtient :

    K(x0,y)MaxYBK(x0,Y)=α=MinXAK(X,y0)K(x,y0).

    En prenant x=x0, y=y0, on voit α=K(x0,y0), ce qui dit donc que (x0,y0) est un point selle.

  5. Montrons (B.2). Considérons, pour ϵ>0,

    Kϵ(x,y)=K(x,y)+ϵx22.

    Comme xϵx22 est strictement convexe, il en est de même de Kϵ(.,y) pour tout yB (convexe plus strictement convexe donne strictement convexe).

    Montrons que pour tout y, la fonction Kϵ(.,y) a un unique minimum. En effet, si x1x2 sont deux minima, par stricte convexité : Kϵ((x+y)/2,y)<Kϵ(x1,y)/2+Kϵ(x2,y)/2=K(xi,y) en contradiction avec le caractère de minimum. Donc on a un unique E(y) atteignant le minimum de Kϵ(.,y) Par le deuxième point (appliqué à Kϵ(y,x)) fϵ(y)=Kϵ(E(y),y) est continue, donc atteint son maximum en y. En conséquence, par la définition de fϵ et le choix de y

    fϵ(y)=MaxyBMinxAKϵ(x,y)=Kϵ(E(y),y)=MinxAKϵ(x,y).

    Soit xA,yB,t]0,1[, on a par concavité :

    Kϵ(x,(1t)y+ty)(1t)Kϵ(x,y)+tKϵ(x,y)(1t)fϵ(y)+tKϵ(x,y).

    En prenant x=E((1t)y+ty), on obtient fϵ((1t)y+ty)(1t)fϵ(y)+tKϵ(E((1t)y+ty),y).

    Vu que y maximise fϵ, en soustrayant et divisant par t, on a :

    fϵ(y)Kϵ(E((1t)y+ty),y)().

    On veut prendre t0, voyons que yE(y) est continue. Supposons yny, et supposons E(yn)↛E(y) par compacité, on a une suite extraite yϕ(n) telle que E(yϕ(n))ZE(y). Par continuité Kϵ(E(yϕ(n))),yϕ(n))Kϵ(Z,y)>Kϵ(E(y),y),

    l’inégalité stricte venant de l’unicité du minimum d’une fonction strictement convexe.

    Or par définition Kϵ(E(y)),yϕ(n))Kϵ(E(yϕ(n))),yϕ(n)) donc en passant à la limite Kϵ(E(y),y)Kϵ(Z,y)>Kϵ(E(y),y), une contradiction.

    On a donc montré la continuité de yE(y).

    Donc en passant à la limite dans l’inégalité (), on obtient : fϵ(y)Kϵ(E(y),y) et ce pour tout yB Par ailleurs par définition de fϵ, fϵ(y)Kϵ(x,y). Autrement dit (E(y),y) est un point selle de Kϵ. Par l’implication (B.1)(B.2), on déduit, vu K(x,y)Kϵ(x,y)K(x,y)+ϵD (avec D=MaxxAx22< par compacité) :

    MinxAMaxyBK(x,y) MinxAMaxyBKϵ(x,y)
    =MaxyBMinxAKϵ(x,y)ϵC+MaxyBMinxAK(x,y).

    En prenant ϵ0, on obtient l’inégalité qui manque pour avoir (B.2) pour K.