2 Fonctions convexes

Il est pratique de considérer des fonctions f:E],+]={+}. Dans ce cas on parle de domaine de f :

D(f)={xE:f(x)<}.

Les propriétés que l’on considère dans cette section vont être déterminées par l’ensemble des valeurs au dessus du graphe de f, que l’on appelle épigraphe de f:

Epi(f)={(x,λ)E×:f(x)λ}.

On utilise les conventions += et λ.= si λ>0, 0.=0.

Définition 3.3.

Soit C un ensemble convexe.

  1. 1.

    Une fonction f:C],+] est dite convexe si pour tout λ]0,1[,x,y,C,

    f(λx+(1λ)y)λf(x)+(1λ)f(y).
  2. 2.

    Une fonction f:C],+] est dite strictement convexe si pour tout λ]0,1[,x,y,C, avec xy

    f(λx+(1λ)y)<λf(x)+(1λ)f(y).
  3. 3.

    Une fonction f:C[,+[ est dite concave si f est convexe.

Exemple 3.2.

Une fonction affine f(x1,,xn)=i=1naixi+b est convexe et concave mais pas strictement convexe ! Une norme sur E est convexe.

Remarque 3.1.

Si f est convexe, alors CD(f) est convexe car si f(x)<+,f(y)< alors

f(λx+(1λ)y)λf(x)+(1λ)f(y)<.

On peut donc toujours remplacer soit C par E soit C par CD(f) selon votre goût (pour les fonctions infinies ou les ensembles convexes).

Proposition 3.3.

Soit E un e.v. et f:C],].

  1. 4.

    f est convexe si et seulement si Epi(f) est convexe

  2. 1’.

    Si f est convexe alors pour tout t, f1(],t]) est convexe. La réciproque est fausse.

  3. 5.

    Si μ>0, f,g convexes alors μf+g est convexe. De plus, elle est aussi strictement convexe si f ou g l’est.

  4. 6.

    Si fi,iI sont convexes alors l’enveloppe supérieure f(x)=supiIfi(x) est convexe.

  5. 7.

    (facultatif) f est convexe ssi g:E],+], définie par g(x)=f(x) si xC et g(x)=+ sinon, est convexe.

  6. 8.

    Si f est strictement convexe, alors f a au plus un minimum sur C.

Le dernier point donne la première relation simple des fonctions convexes à l’optimisation.

Démonstration : 

Pour (1), l’énoncé est vide si f(x) ou f(y)=. Soit donc (x,t1),(y,t2)Epi(f) (comme on veut ti< cela utilise la réduction précédente). On remarque que (λx+(1λ)y,λt1+(1λ)t2)Epi(f) ssi f(λx+(1λ)y)λt1+(1λ)t2.

Si les épigraphes sont convexes, cette propriété est vérifiée et donc en prenant l’infimum sur t1,t2 (qui donne f(x),f(y)) on a le résultat. Si f vérifie l’inégalité, on utilise f(x)t1,f(y)t2 pour conclure:

f(λx+(1λ)y)λf(x)+(1λ)f(y)λt1+(1λ)t2.

(1)’ On montre la convexité de D={x:f(x)t} comme ci-dessus. Soit x,yD alors pour λ[0,1]: f(λx+(1λ)y)λf(x)+(1λ)f(y)λt+(1λ)t=t. Donc λx+(1λ)yD. Par contre si g=1[0,[ alors si t<0 , g1(],t])=∅︀, si 0t<1 , g1(],t])=],0[ et sinon pour t1, g1(],t])= et ce sont 3 intervalles donc 3 ensembles convexes. Mais g n’est pas convexe g(0)=1>1/2g(1)+1/2g(1)=1/2.

(2) est évident en utilisant l’inégalité:

μf(λx+(1λ)y)+g(λx+(1λ)y)μ(λf(x)+(1λ)f(y))+(λg(x)+(1λ)g(y))=(λ(μf+g)(x)+(1λ)(μf+g)(y)).

(3) vient de la stabilité des convexes par intersection et de Epi(f)=iIEpi(fi).

(4) est évident car Epi(f)=Epi(g).

(5) si xy sont deux points atteignant le minima, f((x+y)/2)<(f(x)+f(y))/2 contredisant la minimalité.   □

Une propriété importante des fonctions convexes est le fait qu’on peut les caractériser en terme d’accroissements:

Proposition 3.4.

Soit f:E],+] une fonction. f est convexe si et seulement si pour tout x,hE la fonction Δx,hf(t):=f(x+th)f(x)t est croissante sur +.

Démonstration : 

Il suffit de noter que g(t)=Δx,hf(t)=f(x+th)f(x)t est croissante si et seulement si g(t)g(s) pour 0<t<s si et seulement si on a l’inégalité de convexité :

f(x+th)=f(ts(x+sh)+x(1ts))f(x+sh)ts+f(x)(1ts).

Donc la convexité de f implique la croissance énoncée et réciproquement en prenant s=1 on écrit toute paire x,y sous la forme y=x+h et l’inégalité ci-dessus se réécrit en l’inégalité définissant la convexité de f:

f((1t)x+ty)=f(x+th)f(x+h)t+f(x)(1t)=f(y)t+f(x)(1t).

Cela implique une régularité minimale des fonctions convexes:

Corollaire 3.5.

Si f:E],] est convexe, pour tout xD(f) et tout hE, la dérivée directionnelle Dhf(x) existe dans [,] au sens où la limite suivante existe et vaut:

Dhf(x):=limt0+f(x+th)f(x)t=inft>0f(x+th)f(x)t.
Démonstration : 

Par la proposition précédente g(t)=f(x+th)f(x)t est croissante donc admet une limite pour t0+ qui coïncide avec l’infimum.   □

2.1 Calcul des cônes normaux courants

Soient g1,,gn des fonctions convexes C1 définies U avec U ouvert convexe tel qu’il existe x0U avec gi(x0)<0 pour tout i.

Soit la contrainte :

C={xU:i{1,,n},gi(x)0}.

On sait que chaque gi1(],0]) est convexe comme image réciproque d’un intervalle borné supérieurement par une application convexe. Par intersection, on sait donc que C=i=1ngi1(],0])U est aussi convexe.

Théorème 3.6 (admis, cf Section B.1).

Soit xC tel que:

  1. 9.

    les l premières contraintes sont actives, c’est à dire: g1(x)==gl(x)=0

  2. 10.

    les autres contraintes ne sont pas actives, c’est à dire gl+1(x)<0,gn(x)<0

Si l=0, on a NC(x)={0} et sinon, le cône normal à C en x est donné par

NC(x)={i=1lλigi(x),λi0}.
Exemple 3.3.

Soit A={(x,y)2:xy0,}. Si on pose g1(x,y)=yx,g2(x,y)=y qui sont linéaires donc convexes et C1, on a:

A={(x,y)2:g1(x,y)0,g2(x,y)0}

Calculons NA(0) le cône normal en 0=(0,0).

On a g1(0,0)=0=g2(0,0) donc toutes les contraintes sont actives.

On calcule donc g1(0,0)=(1,1),g2(0,0)=(0,1). D’après le théorème, on a :

NA(0)=+(1,1)++(0,1).
Exercice 3.4.
  1. 11.

    Pour A de l’exemple précédent, si a=(x,x) pour x>0. Montrer que NA(a)=+(1,1).

  2. 12.

    Pour b=(x,0), x>0. Montrer que NA(b)=+(0,1).

  3. 13.

    Y-a-t-il d’autres valeurs de NA(c) et si oui, pour quels points cA ?

2.2 Fonctions convexes sur

Soit I un intervalle de . Pour une fonction f:I et aI, on considère la fonction (taux d’accroissement de f en a) Δaf définie par Δaf(x)=f(x)f(a)xa pour tout xI{a}. La proposition 3.4 se reformule sous la forme:

Proposition 3.7.

Une fonction f:I est convexe si et seulement si pour tout aI, la fonction Δaf est croissante sur I{a}.

On en déduit les inégalités suivantes (inégalité des pentes, cf dessin en cours) sur une fonction f:

Proposition 3.8.

Une fonction convexe f:I vérifie l’inégalité des pentes :

a,b,cI,a<b<cf(b)f(a)baf(c)f(a)caf(c)f(b)cb.
Théorème 3.9.

Soit I un intervalle ouvert de , et f:I une fonction convexe. Alors pour tout aI, f admet des dérivées à droite et à gauche en a. On a pour tout xI : f(x)fd(a)(xa)+f(a) et f(x)fg(a)(xa)+f(a). En particulier, il existe une fonction affine g telle que g(a)=f(a) et g(x)f(x) pour tout xI. De plus, si a<b sont dans I, on a fg(a)fd(a)fg(b).

Démonstration : 

Soit aI. Dans le cas d’une fonction à une variable, le corollaire 3.5 implique l’existence de dérivées à droites et à gauches (pour l’instant peut-être infinies). Dans l’inégalité des pentes en faisant cb+ ou ab, on obtient:

<f(b)f(a)bafd(b),
fg(b)f(c)f(b)cb<+.

Pour a<b, 0<ϵi<(ba)/2, l’inégalité des pentes appliquée aux points aa+ϵ1<bϵ2<b donne:

f(a+ϵ1)f(a)ϵ1f(bϵ2)f(a+ϵ1)(baϵ1ϵ2)f(bϵ2)f(b)ϵ2

et en passant à la limite ϵ10+ ou ϵ20+ puis les deux, on obtient:

fd(a)f(bϵ2)f(b)ϵ2,
f(a+ϵ1)f(a)ϵ1fg(b),
fd(a)fg(b).

Donc fd(a)<+, fg(a)>, ce qui termine la preuve des dérivabilités à droite et à gauche, et on a l’inégalité attendue.

De plus, la formulation comme infimum, dans le corollaire 3.5, montre que pour tout x>a que f(x)f(a)xafd(a) et donc f(x)fd(a)(xa)+f(a). De même, pour tout x<a on a f(x)f(a)xafg(a); en multipliant par xa (qui est négatif!) on a donc que pour tout x<a f(x)f(a)+fg(a)(xa).

De plus, fg(b)fd(b) (en passant aux limites ab,cb+ dans l’inégalité des pentes); par conséquent, pour x<a fg(a)(xa)fd(a)(xa), et on voit finalement que l’inégalité f(x)fd(a)(xa)+f(a) est valide pour tout x. Le même raisonnement s’applique pour montrer que l’autre inégalité est vraie pour tout x.   □

Corollaire 3.10.

Soit I un intervalle ouvert de , alors une fonction convexe f:I est continue.

Exercice 3.5.

Trouver une fonction convexe f:[0,1[ qui n’est pas continue en {0}.

Proposition 3.11.

Si E= et f est dérivable sur un ouvert convexe UE (donc un intervalle ouvert) alors f est convexe si et seulement si f est croissante.

Démonstration : 

) Supposons f convexe, l’inégalité qu’on a montrée au (2) du théorème précédent s’écrit (f(u)f(v))(uv)0 donc (f(u)f(v)),(uv) ont même signe et f est croissante. On peut alternativement utilisé pour a<b, f(a)=fd(a)fg(b)=f(b) grâce à l’inégalité vue au théorème 3.9.

) Réciproquement si f croissante, montrons que f convexe, on veut voir f(λa+(1λ)b)λf(a)+(1λ)f(b) pour a<b,λ]0,1[. Par l’égalité des accroissements finis, la pente f(λa+(1λ)b)f(a)(1λ)(ba) est atteinte par f en un point de ]a,λa+(1λ)b[, et de même f(b)f(λa+(1λ)b)(λ(ba) est atteinte par f en un point de ]λa+(1λ)b,b[ donc par croissance de la dérivée :

f(λa+(1λ)b)f(a)(1λ)(ba)f(b)f(λa+(1λ)b)λ(ba)
f(λa+(1λ)b)(1(1λ)(ba)+1λ(ba))f(a)(1λ)(ba)+f(b)λ(ba)
f(λa+(1λ)b)(1λ(1λ))f(a)(1λ)+f(b)λ.

Ceci conclut.  □