Coursmismi
Coursmismi
Coursmismi
Alain Yger
30 mai 2012
Table des matières
i
ii TABLE DES MATIÈRES
est une assertion fausse (n est ici nombre entier positif). Par contre
i ≤ 2i + 1
(i étant le nombre complexe correspondant à (0, 1)) n’est pas une relation car il n’y a pas d’ordre dans
C ; ce n’est ni vrai, ni faux, mais simplement vide de sens.
1
2 CHAPITRE 1. BASES DE LOGIQUE ET THÉORIE DES ENSEMBLES
p. Nord
M’
*
2
R
m m’
* |z|=1 *
M*
p. Sud
Les droites du plan correspondent aux cercles tracés sur le globe et passant par le pôle Nord : il n’y a
plus de droites parallèles !
Établir à partir d’un jeu d’axiomes qu’une assertion est VRAIE, c’est prouver un théorème. Si ceci est
fait de manière intermédiaire dans le but de prouver ultérieurement qu’une autre assertion est VRAIE,
on parle plutôt de lemme. Lorsque l’on déduit d’un théorème qu’une assertion est VRAIE, on prouve
un corollaire de ce théorème.
1.1. OPÉRATIONS LOGIQUES 3
R S Rv S
0 0 0
0 RvS
1 1
1 0 1
1 1
1
S
La disjonction correspond au montage en parallèle dans les circuits électriques (R et S étant pensés
comme des interrupteurs).
1. La conjonction [et] logique R ∧ S.
R S R S
0 0 0
0 1 0
1 0 0 R S
1 1 1
La conjonction correspond au montage en série dans les circuits électriques (R et S étant pensés comme
des interrupteurs).
3. L’implication R implique S (notée R =⇒ S) :
R S R S
0 0 1
0 1 1
1 0 0
1 1 1
Ce qui est un peu inattendu dans la définition de l’implication est que R =⇒ S est toujours vraie dans
tous les cas où R est fausse ; on considère (ce qui n’est pas absurde) qu’une assertion fausse implique
4 CHAPITRE 1. BASES DE LOGIQUE ET THÉORIE DES ENSEMBLES
1 = 2 =⇒ 2 = 3 1 = 2 =⇒ 2 = 2
R S R S
0 0 1
0 1 0
1 0 0
1 1 1
R nonR
0 1
1 0
attention ! la position des parenthèses est très importante pour la lecture des expressions (on doit
toujours veiller à ne faire une opération logique qu’entre deux assertions).
La table de vérité d’une telle assertion composite R(R, S, T, ...) s’écrit en étudiant cas par cas les
diverses possibilités (R vraie ou fausse, S vraie ou fausse, T vraie ou fausse, etc.) et en utilisant les
tables de vérité des diverses opérations. Si par hasard la table de vérité de R(R, S, T, ...) s’écrit comme
une colonne de 1, on dit que l’assertion R(R, S, T, ...) est inconditionnellement vraie (ou encore que c’est
une évidence), c’est-à-dire qu’elle est vraie quelque soient les valeurs (0 ou 1) prises par les assertions
R, S, T ,..., et on appelle alors R(R, S, T, ...) règle logique. Ces règles logiques seront utilisées dans les
raisonnements conduisant à des lemmes, théorèmes, corollaires.
1.2. ENSEMBLES ET PARTIES D’UN ENSEMBLE ; QUANTIFICATEURS 5
Exemples. On vérifiera en exercice que les assertions composites suivantes sont inconditionnellement
vraies et deviennent donc des règles logiques :
(R ∨ R) =⇒ R
R =⇒ R
R ∨ (non R)
R ⇐⇒ (non (non R))
R =⇒ (R ∨ S)
(S ∨ S) =⇒ (S ∨ R)
(R ∨ S) =⇒ (S ∨ R)
(R ∧ S) =⇒ (S ∧ R)
(R ∨ S) ⇐⇒ (S ∨ R)
(R ∧ S) ⇐⇒ (S ∧ R)
( )
(R =⇒ S) =⇒ (R ∨ T ) =⇒ (S ∨ T )
Certaines de ces assertions inconditionnellement vraies jouent un rôle très important dans les raison-
nements logiques ; en voici deux exemples :
1. La règle de contraposition que l’on retrouvera plus loin comme moteur de certains raisonnements :
( )
(R =⇒ S) ⇐⇒ (non S) =⇒ (non R)
Supposons maintenant que R soit une assertion dans laquelle figure un symbole matérialisé par une
lettre x (par exemple x ≥ 3 ou x ∈ R, ou encore (x ∈ [1, +∞[) =⇒ (x ≥ 0)). On note (pour tenir
compte de la présence de ce caractère x) l’assertion R en l’écrivant plutôt R{x}.
6 CHAPITRE 1. BASES DE LOGIQUE ET THÉORIE DES ENSEMBLES
Si E est un ensemble et R{x} une telle assertion, on définit deux nouvelles assertions que l’on note
ainsi :
∀x ∈ E R{x}
∃x ∈ E R{x}
La première se lit :
<< pour tout élément x de E, R{x} >> ;
elle est vraie si pour tout élément x de E, l’assertion R{x} est vraie ; elle est fausse sinon.
La seconde se lit :
<< il existe un élément x de E , R{x} >> ;
elle est vraie s’il existe au moins un élément x de E tel que l’assertion R{x} soit vraie ; elle est fausse
sinon.
On a donc la règle (que l’on vérifie en introduisant par exemple le sous-ensemble A de E constitué des
éléments x pour lesquels R(x) est vraie et son complémentaire)
( )
( ) ( )
non ∀ x ∈ E , R{x} ⇐⇒ ∃ x ∈ E , non (R{x}) .
On peut également introduire des assertions dans lesquelles figurent plusieurs symboles mathématiques,
par exemple deux symboles x et y ; on notera une telle assertion R{x, y} (par exemple “x + y ≥ 1” ou
“x divise y”). Si E et F sont deux ensembles, on peut alors introduire les six assertions :
∀x ∈ E , ∀y ∈ F , R{x, y}
∀x ∈ E , ∃y ∈ F , R{x, y}
∃x ∈ E , ∀y ∈ F , R{x, y}
∃x ∈ E , ∃y ∈ F , R{x, y}
∀y ∈ F , ∃x ∈ E , R{x, y}
∃y ∈ F , ∀x ∈ E , R{x, y}
Les symboles ∀ et ∃ (dont on remarque qu’ils doivent être échangés lorsque l’on prend la négation d’une
assertion) sont appelés quantificateurs. L’ordre dans lequel on les écrit est important : par exemple “∀x ∈
E, , ∃ y ∈ F , ...” signifie littéralement : “pour tout x de E, il existe y dans F , dépendant a priori de x,...”
alors que “ ∃y ∈ F , ∀x ∈ E , ...” signifie “il existe y dans F tel que, pour tout x dans E, ....”.
Définition 1.2. Si E est un ensemble, on appelle sous-ensemble de E toute sous-famille composée
d’éléments de E (donc extraite de E) ; on dit aussi qu’un sous-ensemble de E est une partie de E.
1.2. ENSEMBLES ET PARTIES D’UN ENSEMBLE ; QUANTIFICATEURS 7
On convient que la partie n’ayant aucun élément, que l’on appelle l’ensemble vide et que l’on note ∅,
est un sous-ensemble particulier de E. C’est donc un sous-ensemble de tous les ensembles.
Définition 1.3. Si E est un ensemble et A et B deux parties de E, on note A ⊂ B (A inclus dans B)
l’assertion “∀x ∈ A , x ∈ B”.
Pour toute partie A de E, les assertions A ⊂ E et ∅ ⊂ A sont donc vraies.
Deux parties A et B sont dites égales (on note A = B) si A ⊂ B et B ⊂ A, c’est-à-dire si A et B ont
exactement les mêmes éléments.
On définit maintenant deux opérations importantes entre les sous-ensembles d’un même ensemble E.
Définition 1.4. Si A et B sont deux parties de E, on appelle union de A et B et on note A ∪ B la
partie de E dont les éléments appartiennent à A ou à B. On appelle intersection de A et B (et on note
A ∩ B) la partie de E dont les éléments appartiennent à A et à B.
Deux parties A et B sont dites disjointes si A ∩ B = ∅, c’est-à-dire si A et B n’ont aucun élément en
commun. Si une partie A s’écrit A = A1 ∪ A2 avec A1 ∩ A2 = ∅, on dit que A1 et A2 réalisent une
partition de A.
On a A ∪ B = B ∪ A et A ∩ B = B ∩ A. Les opérations ∪ et ∩ sont dites commutatives. De plus
A ∪ ∅ = ∅ ∪ A pour toute partie A de E, ce qui fait dire que ∅ est élément neutre pour l’opération ∪.
Enfin A ∩ ∅ = ∅ pour toute partie A de E, ce qui fait dire que ∅ est cette fois élément absorbant pour
l’opération ∩.
Définition 1.5. Si A est une partie de E, on appelle complémentaire de A dans E et on note CE A ou
encore E \ A (ou aussi Ac lorsqu’il est implicite que l’on travaille dans un ensemble E) le sous-ensemble
constitué des éléments de E n’appartenant pas à A.
Par exemple, le complémentaire de {1, 2, 3, 4, 5} dans N est {n ∈ N t.q. n ≥ 6}.
On vérifie les deux égalités :
(A ∩ B)c = Ac ∪ B c
(A ∪ B)c = Ac ∩ B c .
Définition 1.6. Si A et B sont deux parties de E, on note A \ B l’ensemble des éléments de A qui
n’appartiennent pas à B et A ∆ B (différence symétrique de A et B) l’ensemble
A ∆ B := (A \ B) ∪ (B \ A) .
On vérifiera que
A ∪ B = (A ∩ B) ∪ (A ∆ B)
et que les deux parties A ∩ B et A ∆ B réalisent une partition de A ∪ B.
La preuve de ces diverses assertions sera illustrée par des diagrammes où les parties seront représentées
par des patatoïdes ; faites les dessins !
Dernières règles importantes à retenir :
(A ∪ B) ∪ C = A ∪ (B ∪ C) (A ∩ B) ∩ C = A ∩ (B ∩ C)
(A ∪ B) ∩ C = (A ∩ C) ∪ (B ∩ C)
8 CHAPITRE 1. BASES DE LOGIQUE ET THÉORIE DES ENSEMBLES
(on dit que l’opération ∩ est distributive par rapport à l’opération ∪). Les deux opérations ∪ et ∩
semblent se comporter respectivement comme l’addition et la multiplication des nombres réels ; d’ailleurs
∅ joue exactement le même rôle que 0 (neutre pour la première opération, absorbant pour la seconde).
Cette analogie sera intéressante plus tard.
E = {x0 , x1 , x2 , ...} ,
les xj étant des éléments distincts ; l’ensemble des nombres entiers positifs N est le prototype d’ensemble
dénombrable ; de même, l’ensemble Z est dénombrable (voici un moyen de numéroter les éléments de
Z : x0 = 0, x1 = 1, x2 = −1, x3 = 2, x4 = −2, x5 = 3, x6 = −3, etc.). Il est un peu plus difficile de
montrer que Q est dénombrable (on le montrera plus tard dans ce cours) mais l’on verra plus loin que
R, lui, ne l’est pas (ni C, bien sûr).
Si l’on a un ensemble fini E, il est évident que l’on dispose d’une stratégie pour choisir un élément de
E ; c’est aussi vrai si E est dénombrable (il suffit de prendre x0 ).
En revanche, pareille opération de choix pose problème en théorie des ensembles. Au quatre axiomes,
s’en ajoute un (qui ne s’en déduit pas) qui est aussi fondamental, l’axiome du choix, axiome que l’on
peut énoncer ainsi :
«Étant donnée une collection d’ensembles non vides de l’univers n’ayant deux à deux aucun élément
commun, on peut construire un nouvel ensemble en prenant un élément dans chacun des ensembles de
la collection»
Admettre l’axiome du choix conduit à des paradoxes comme celui de Banach-Tarski (apparu en 1923) :
on peut faire un puzzle avec une boule et reconstituer avec les morceaux du puzzle deux boules de
même volume que la boule initiale !
On convient cependant communément aujourd’hui de raisonner en admettant l’axiome du choix.
1.4. PRODUIT DE DEUX ENSEMBLES 9
Il s’avère aussi que les quatre axiomes de la théorie des ensembles proposés ci-dessus (avant l’axiome du
choix) n’excluent nullement que des ensembles puissent s’auto-appartenir, situation qui ne correspond
pas à l’idée intuitive d’appartenance à un ensemble. On évite ce phénomène en ajoutant aux quatre
axiomes proposés plus haut (en fait cinq avec l’axiome du choix) un sixième axiome, dit axiome de
fondation :
«Tout ensemble non vide contient un élément avec lequel il n’a aucun élément en commun»
On verra un peu plus loin pourquoi cet axiome exclut qu’il existe un ensemble E qui s’auto-appartienne,
donc tel que E soit élément de E (attention ! “élément de” et non “partie de” !). C’est donc cet axiome
qui exclut que l’ensemble de tous les ensembles puisse être un ensemble.
(R =⇒ S) ⇐⇒ (non S =⇒ non R)
non S =⇒ non R
est vraie. Prouver que R =⇒ S est VRAIE revient donc à prouver que (non S) =⇒ (non R) est VRAIE.
Exemple : Soit x = p/q un nombre réel rationnel non nul (pq ̸= 0) ; alors
(y ∈
/ Q) =⇒ (xy ∈
/ Q)
est VRAIE ; en effet, si xy = a/b ∈ Q (avec b ̸= 0), on a y = q/p × a/b ∈ Q, ce qui prouve que
(xy ∈ Q) =⇒ (y ∈ Q).
1.8. COMPTER, CALCULER, ORDONNER, RAISONNER PAR RÉCURRENCE 11
∑
n
n(n + 1)(2n + 1)
R{n} : 0 + 1 + · · · + n2 = k2 =
6
k=1
pour tout n ∈ N, il suffit de montrer que R{0} est vraie (ce qui est immédiat ici car 0 = 0) puis de
montrer que, si R{n} est vraie, R{n + 1} l’est aussi ; or, ici
∑
n+1 (∑
n ) n(n + 1)(2n + 1)
k2 = k 2 + (n + 1)2 = + (n + 1)2
6
k=0 k=0
( n(2n + 1) ) (n + 1)(n + 2)(2(n + 1) + 1)
= (n + 1) + (n + 1) =
6 6
et l’on voit donc que (R{n} vraie) =⇒ (R{n + 1} vraie), ce qui prouve bien que R{n} est vraie pour
ou entier n ∈ N. Le principe sur lequel est fondé le raisonnement par récurrence nous oblige à nous
ressourcer aux axiomatiques qui régissent la construction de l’ensemble des nombres entiers positifs
N, ensemble essentiel aux mathématiques discrètes (celles dont se nourrit l’informatique). C’est ce qui
justifie ici dans ce cours la digression qui suit sur l’ensemble N des nombres entiers positifs, cadre de
l’arithmétique.
1.8.1 L’axiomatique de N
Le logicien et mathématicien italien Guiseppe Peano (1858-1932) proposa 5 axiomes régissant la
construction des entiers naturels positifs (l’ensemble N) ; de fait, le mathématicien allemand Dedekind
fut le premier à les formuler en 1888.
1. N contient au moins un élément noté 0 ;
2. Tout élément de N admet un successeur S(n) ;
3. Si deux éléments de N ont des successeurs égaux, ils sont égaux ;
4. 0 n’est successeur d’aucun élément ;
5. Si A est un sous-ensemble de N tel que 0 ∈ A et que (∀x ∈ A , S(x) ∈ A) soit vraie, alors A = N
(principe de récurrence).
C’est sur l’axiome 5 que se fonde le principe du raisonnement par récurrence sur lequel nous allons
revenir.
somme=a;
repeter b fois
somme=S(somme);
fin
produit=0;
repeter a fois
produit=produit + b;
fin
On vérifiera que l’addition et la multiplication sont deux opérations sur N partageant certaines proprié-
tés qu’ont (isolément ou entre elles) l’union et l’intersection sur l’ensemble des parties d’un ensemble
E, à savoir :
– les deux opérations sont commutatives ;
– les deux opérations sont associatives (on réécrira ce que cela veut dire) ;
– 0 est élément neutre pour l’addition (comme ∅ pour l’union) ;
– 0 est élément absorbant pour la multiplication (comme ∅ pour l’intersection) ;
– la multiplication est distributive par rapport à l’addition (comme l’opération d’intersection l’est
par rapport à l’union) ;
On dit que l’ensemble N équipé de l’addition est un monoïde.
Si a ≤ b, on a a+c ≤ b+c et ac ≤ bc pour tout c dans N et l’on dit que l’ordre ainsi défini est compatible
avec l’addition et la multiplication. On lit a ≤ b aussi «a est plus petit que b».
On a les trois propriétés très importantes suivantes :
A1. Toute partie non vide A de N possède un plus petit élément : en effet, l’ensemble A des nombres
plus petits que tous les éléments de A contient 0 et, d’après le principe de récurrence, contient un
nombre k dont le successeur cesse d’être plus petit que tous les éléments de A. Ce nombre k est bien
le plus petit de tous les éléments de A (montrer pourquoi, c’est un bon exercice de petit raisonnement
logique pour vous entraîner). C’est aussi le plus grand de tous les nombres qui sont plus petits que
tous les éléments de A (on dit que c’est le plus grand minorant où encore la borne inférieure de A, il se
trouve que c’est en fait un élément de A).
A2. Toute partie non vide A de N majorée par un nombre M (i.e ∀x ∈ A , x ≤ M ) admet un plus gr-
-and élément : il suffit de prendre le plus petit élément de l’ensemble des nombres qui majorent A. Ce
nombre est le plus petit majorant de A (on dit aussi la borne supérieure de A,il se trouve que c’est, ici
encore, un élément de A).
A3. N n’admet pas de majorant
Les trois propriétés A1,A2,A3 équivalent aux axiomes de Peano et l’on peut donc dire que N est le
seul ensemble qui puisse être équipé d’un ordre de manière à ce que les trois clauses A1,A2,A3 soient
remplies.
1.8. COMPTER, CALCULER, ORDONNER, RAISONNER PAR RÉCURRENCE 13
La clause A1 nous dit que l’ordre est total : si a et b sont deux éléments de N, on a toujours a ≤ b ou
b ≤ a.
Plus généralement, on appelle ordre sur un ensemble une relation ≤ ayant les trois propriétés suivantes :
– a ≤ a (réflexivité)
– ((a ≤ b) ∧ (b ≤ a)) =⇒ (a = b) (antisymétrie)
– ((a ≤ b) ∧ (b ≤ c)) =⇒ (a ≤ c) (transitivité).
L’ordre est dit total si étant donné deux éléments a et b de l’ensemble, on a toujours a ≤ b ou b ≤ a.
Sinon, l’ordre est dit partiel. Par exemple, la relation «a divise b» dans N est une autre relation d’ordre
sur N, non totale. L’inclusion A ⊂ B est une relation d’ordre (encore non total) sur l’ensemble P(E)
des parties d’un ensemble E.
implique donc (R{n + 1} vraie et l’assertion (∀n ≥ 2, R{n} VRAIE) résulte du principe 2.
14 CHAPITRE 1. BASES DE LOGIQUE ET THÉORIE DES ENSEMBLES
P := p1 · · · pN + 1
admet d’après ce qui précède un diviseur premier p, donc dans la liste p1 , ..., pN . Mais p divise p1 · · · pN
et p1 · · · pN + 1, donc divise 1, ce qui est impossible (car p ≥ 2). L’hypothèse faite (“il existe un nombre
fini de nombres premiers”) conduit à une contradiction. L’assertion contraire (“il y a une infinité de
nombres premiers”) est donc vraie.
Un autre exemple de preuve par récurrence : le théorème d’Euclide. Soient a et b deux entiers
positifs avec b ̸= 0 ; il existe un unique couple (q, r) d’éléments de N avec a = bq + r et r ∈ {0, ..., b − 1}.
Le nombre r est dit reste dans la division euclidienne de a par b.
Preuve. On prouve l’assertion
R{a} : “il existe (q, r) ∈ N × {0, ..., b − 1} , a = bq + r”
par récurrence sur a en utilisant le principe 1. L’assertion R{0} est vraie car 0 = b × 0 + 0. Supposons
R{a} vraie ; on a
a + 1 = (bq + r) + 1 = bq + (r + 1)
a + 1 = bq + (b − 1) + 1 = b(q + 1) = b(q + 1) + 0
et l’assertion R{a + 1} est vraie avec r = 0. L’assertion R{a} implique donc toujours R{a + 1} et le
principe 1 s’applique.
L’unicité de (q, r) vient du fait que si a = q1 b + r1 = q2 b + r2 , on a, si r1 ≤ r2
ce qui implique q1 − q2 = 0 car sinon (q1 − q2 )b ≥ b ; on a donc aussi r1 = r2 et l’unicité du couple (q, r)
est prouvée.
[q,r] = div(a,b)
1.8. COMPTER, CALCULER, ORDONNER, RAISONNER PAR RÉCURRENCE 15
l’instruction qui calcule, étant donnés deux nombres entiers tels que b ̸= 0, l’unique couple (q, r) avec
r ∈ {0, ..., b − 1} tel que a = bq + r donné par la division euclidienne de a par b. On pourrait tout aussi
bien utiliser les commandes de MAPLE10. Considérons la suite d’instructions (on les a traduites ici en
français pour les expliciter) qui conduit au calcul du PGCD de deux entiers a et b ; le nombre à calculer
est noté PGCD dans la suite d’instructions ci-dessous.
fonction PGCD=PGCD(a,b);
x=a;
y=b;
tant que y est non nul, faire
[q,r] = div(x,y);
si r=0
PGCD = y;
y=0;
sinon
[q1,r1]= div(y,r);
x=r;
PGCD = x;
y=r1;
fin
ce qui se lit comme la suite de calculs
a = bq0 + r0
b = r 0 q1 + r 1
r0 = r 1 q2 + r 2
.. .
. = ..
rN −2 = qN rN −1 + rN
rN −1 = rN qN +1 + 0
(comme les restes successifs r0 , r1 , ... décroissent strictement et qu’il y a un nombre fini d’entiers entre
0 et b, il vient forcément un moment où rN divise rN −1 , rN étant le dernier reste obtenu non nul). Le
PGCD de a et b est aussi celui de b et r0 , de r0 et r1 , et ainsi, en cascade, de rN et 0 ; il vaut donc rN .
CONCLUSION : Le PGCD de a et b est donc égal au dernier reste non nul rN dans ce très célèbre
algorithme de division dit algorithme d’Euclide.
Par exemple, pour a = 13 et b = 4,
13 = 4 × 3 + 1
4 = 4×1+0
le dernier reste non nul étant ici r0 = 1. On a donc PGCD (a, b) = 1.
Plus loin dans ce cours, on apprendra à “remonter” ces calculs une fois que l’on saura manier les nombres
entiers négatifs.
fonction X=newbase(a,b);
X=[];
x=a;
tant que x est non nul, faire
(q,r) = div(x,b);
x= q ;
X=[r,X];
fin
Cet algorithme s’arrête forcément (on va voir tout de suite pourquoi) et fournit une liste
X = [dN −1 , dN −2 , ..., d0 ]
a = d0 + d1 b + d2 b2 + · · · + dN −1 bN −1 ; (∗∗)
cette liste est d’ailleurs l’unique liste de nombres entre 0 et b − 1 telle qu’il soit possible d’écrire a sous
la forme (**) pour un certain entier N . Cette suite X est appelée écriture en base b de l’entier a. Le cas
b = 2 est intéressant car l’écriture en base 2 se fait avec 2 chiffres. Par exemple, en base 2, on vérifiera,
comme
7 = 1 + 1 × 2 + 1 × 22 ,
que l’écriture de 7 est 111.
La raison pour laquelle l’algorithme s’arrête (on obtient un quotient nul au bout d’un certain dans les
divisions) est que, comme b ≥ 2, bn finit par dépasser a si n est assez grand.
La décomposition en base 10 est la plus connue (les chiffres dk étant les chiffres {0, 1, 2, 3, 4, 5, 6, 7, 8, 9}.
Cette idée présidera au chapitre suivant à la construction des nombres décimaux.
Une telle écriture (unique) est dite développement en fraction continue de la fraction a/b. Voici (vous
pouvez vous entraîner à le vérifier, puis éventuellement à le tester sur des exemples comme nous l’avons
fait en cours) la syntaxe de l’algorithme qui, étant donnés deux nombres entiers positifs a et b (avec
b ̸= 0) retourne la suite p0 , p1 , ..., pN des nombres impliqués dans le développement en fraction continue
(†) de la fraction a/b.
1.9. NOTION DE FONCTION ; ÉLÉMENTS DE COMBINATOIRE 17
fonction DVLP=fraccont(a,b);
DVLP=[];
x=a;
y=b;
tant que y > 0
[q,r] = div(x,y);
DVLP=[DVLP,q];
x = y;
y = r;
fin
que l’on calculera en résolvant l’équation du second degré x2 − x − 1 = 0 (faites ce petit calcul pour
vous rafraîchir les idées sur la résolution des équations du second degré). On verra ainsi que
√
5+1
x= ,
2
√
ce qui laisse pressentir que 5 ne saurait être un nombre rationnel (on y reviendra au chapitre 2, lorsque
nous passerons de l’étude des nombres rationnels à celle des nombres réels). Cette idée (du dévelop-
pement en fraction continue "illimité") sera précisément une de celles nous permettant d’introduire la
notion de nombre réel via les approximations rationnelles.
L’ensemble des fonctions de E dans F est donc une partie de l’ensemble produit X × Y (dès que E
contient plus d’un élément, ce n’est pas tout l’ensemble E × F ). On note en général F E l’ensemble des
applications de E dans F . Ceci peut sembler artificiel mais on en verra une justification un peu plus
loin (dans la section 1.9.6, lorsque l’on se restreindra au cadre des ensembles finis).
18 CHAPITRE 1. BASES DE LOGIQUE ET THÉORIE DES ENSEMBLES
est vraie (on utilise aussi l’assertion contraposée qui est équivalente et que l’on écrira).
Exemple : L’application x 7→ x3 de R dans R est injective, tandis que x 7→ x2 (toujours de R dans R)
ne l’est pas.
Définition 1.13. Soient E et F deux ensembles non vides ; une fonction f de E dans F est dite
surjective (on dit que c’est une surjection) si et seulement l’assertion
∀y ∈ F , ∃x ∈ E , y = f (x)
est vraie.
Exemple. L’application x 7→ x3 de R dans R est surjective, tandis que x 7→ x2 (toujours de R dans R)
ne l’est pas.
On appelle bijection entre deux ensembles E et F une fonction de E dans F qui est à la fois injective
et surjective. Cela se lit encore
∀y ∈ F , ∃ ! x ∈ E , y = f (x)
si le symbole ∃ ! x se lit “il existe un x unique ...”.
Exemple important. Si E est un ensemble, on peut associer une fonction importante χA à toute
partie A de E ; la fonction χA (dite fonction caractéristique de A) est la fonction de E dans l’ensemble
{0, 1} définie par {
1 si x ∈ A
χA (x) :=
0 sinon
On vérifiera en exercice que si A et B sont deux parties de E, alors, pour tout x ∈ E,
Ceci étant posé, on constate que l’application de P(E) dans l’ensemble des fonctions de E dans {0, 1}
qui à A associe χA est une bijection. Elle met donc en bijection l’ensemble P(E) des parties de E avec
l’ensemble des applications de E dans {0, 1} que l’on note {0, 1}E .
Exemple. Si f est l’application de R dans R définie par f (x) = x2 (elle n’est ni injective, ni surjective),
on vérifiera pour s’entraîner que f ([1, 2]) = [1, 4] et que f −1 ([1, 4]) = [−2, −1] ∪ [1, 2] ; remarquons sur
cet exemple que f −1 (f (A)) peut être beaucoup plus gros que A !
On vérifie tout de suite que ces deux opérations de prise d’image directe et de prise d’image inverse
sont liées en fait par les relations
∀A ∈ P(E) , A ⊂ f −1 (f (A))
∀B ∈ P(F ) , f (f −1 (B)) ⊂ B .
Proposition 1.1. Si f est injective, pour toute partie A de E, on a f −1 (f (A)) = A ; si f est surjective,
pour toute partie B de F , f (f −1 (B)) = B.
Preuve. Prouvons le premier point ; on connaît déjà une inclusion et il suffit donc de montrer que
f −1 (f (A)) ⊂ A. Prenons x dans f −1 (f (A)), ce qui signifie qu’il existe x′ dans A tel que f (x) = f (x′ ) ;
comme f est injective, on a x = x′ et donc x ∈ A, c’est gagné. L’autre point (pour f surjective) se
montre encore plus facilement : si y ∈ B, y s’écrivant f (x), on a nécessairement x ∈ f −1 (B) (par
définition) et donc y ∈ f (f −1 (B)), d’où l’inclusion B ⊂ f (f −1 (B)).
ces applications du type f ◦ f , f ◦ f ◦ f , ..., dites itérées d’une application donnée f , jouent un rôle important dans un
domaine aujourd’hui en plein essor des mathématiques (aux confins de la physique), la dynamique ; les structures fractales
dérivent par exemple de cette idée d’itération d’application.
On dit qu’une application f de E dans F est inversible à gauche si et seulement si il existe une
application g de F dans E telle que
∀x ∈ E , (g ◦ f )(x) = x .
On a alors la proposition :
Proposition 1.2. Soient E et F deux ensembles non vides ; une application f de E dans F est injective
si et seulement si elle est inversible à gauche.
Preuve. Si f est inversible à gauche et que f (x1 ) = f (x2 ) on a g(f (x1 )) = x1 = g(f (x2 ) = x2 , donc
x1 = x2 , ce qui prouve que f est injective. Si maintenant f est injective, on construit un inverse à
gauche en posant g(y) = x si y = f (x) (il n’y a qu’un seul x ∈ E qui convienne) et g(y) = x0 où x0 est
n’importe quel élément de E si y ∈ / f (E).
On dit qu’une application f de E dans F est inversible à droite si et seulement si il existe une application
g de F dans E telle que
∀y ∈ F , (f ◦ g)(y) = y .
On a alors la proposition :
20 CHAPITRE 1. BASES DE LOGIQUE ET THÉORIE DES ENSEMBLES
Proposition 1.3. Soient E et F deux ensembles non vides ; une application f de E dans F est surjective
si et seulement si elle est inversible à droite.
Preuve. Si f est surjective, on définit une application g de F dans E en posant, pour tout y ∈ F ,
g(y) = x(y), où x(y) est un élément de f −1 ({y}) (qui est non vide par hypothèses) ; c’est l’axiome du
choix (voir la section 1.3) auquel on recours ici pour justifier que l’on puisse réaliser ce processus de
sélection qui permet de “piquer” un élément g(y) dans chaque sous-ensemble (non vide par hypothèses)
f −1 ({y}.
S’il existe un inverse à droite g, le fait que tout y de F s’écrive y = f (g(y)) implique bien que f est
surjective.
Proposition 1.4. Soient E et F deux ensembles non vides ; une application f de E dans F est bijective
si et seulement si elle est inversible à droite et à gauche ; les inverses g1 (à gauche) et g2 (à droite)
sont alors égaux, on note g1 = g2 = f −1 et on dit alors que f est inversible.
Preuve. On combine les deux propositions 1.2 et 1.3. Si f admet un inverse à gauche g1 et un inverse
à droite g2 , f est donc bijective, la réciproque étant vraie aussi. Les deux inverses à gauche g1 et à
droite g2 sont alors égaux : en effet, on a g1 ◦ f = IdE , ce qui implique, en composant par g2 à droite
et en utilisant l’associativité, g1 ◦ (f ◦ g2 ) = g1 ◦ IdF = g1 = IdE ◦ g2 = g2 , donc finalement g1 = g2
comme voulu. On voit, si f −1 = g1 = g2 , que f −1 ◦ f est l’application identité sur E et que f ◦ f −1 est
l’application identité sur F . .
le nombre de parties à p éléments dans un ensemble à n éléments, on voit que l’on a la relation
( ) ( ) ( )
n n−1 n−1
= + (∗)
p p−1 p
pour tout n strictement plus grand que 1 et tout p entre 1 et n ; il suffit pour voir cela de trier d’un
côté les parties à p éléments assujetties à contenir un élément marqué de l’ensemble (il en a autant que
de parties à p − 1 éléments dans un ensemble à n − 1 éléments), de l’autre les parties à p éléments qui
ne contiennent pas cet élément marqué (il y en a autant que de parties à p éléments dans un ensemble
à n − 1 éléments).
En convenant que ( )
n
=1
0
pour tout n ≥ 0 (la seule partie à zéro élément d’un ensemble à n éléments donné est la partie vide) et
que ( )
0
=0
1
(ce qui est logique, il n’y a pas d’élément dans l’ensemble vide !), la relation (∗) reste valable pour
tout entier n ≥ 1 et tout entier p entre 0 et n et cette liste de relations s’écrit sous forme d’un tableau
triangulaire descendant, le triangle de Pascal (de fait, ce triangle était connu des mathématiciens arabes
bien avant Pascal) :
1
1 1
1 2 1
1 3 3 1
1 4 6 4 1
.. .. ..
. . .
( )
n
(on a indiqué sur la ligne n (n = 0, 1, ...) la liste dans l’ordre des nombres pour p = 0, ..., n).
p
( )
n
Le nombre , pour n ≥ 1 et p entre 0 et n est appelé nombre de combinaisons de p éléments pris
p
parmi n ; on le note aussi Cnp (par analogie avec la notation( A
p
)n utilisée pour le nombre d’arrangements) ;
n
cependant on préfèrera dans ce cours utiliser la notation , plus classique dans la terminologie anglo-
p
saxonne.
Il existe une relation entre le nombre d’arrangements de p éléments parmi n et le nombre de combinaisons
de p éléments parmi n lorsque p est entre 1 et n.
22 CHAPITRE 1. BASES DE LOGIQUE ET THÉORIE DES ENSEMBLES
Proposition
( ) 1.7. Si n est un entier non nul et p un entier entre 1 et n, les nombres entiers Apn et
n
sont liés par la relation
p ( )
n
× p! = Apn ,
p
où p! := 1 × 2 × · · · × (p − 1) × p, d’où la formule
( )
n n!
=
p p! (n − p)!
(ce nombre est une “fausse” fraction, c’est un nombre entier !).
Remarque. Si la formule proposée dans cet énoncé pour exprimer le nombre de combinaisons de p éléments parmi n
est intéressante du point de vue théorique (c’est d’ailleurs un fait surprenant que cette écriture fractionnaire se simplifie
pour donner un entier !), il s’agit en revanche d’une formule inexploitable du point de vue théorique (n! est très vite un
entier énorme ingérable informatiquement, pensez par exemple à un nombre comme 1000! = 1000 × 999 × 998 × · · · !).
Preuve. À une partie constituée de p éléments correspond autant d’arrangements de p éléments parmi
n qu’il y a de possibilités de permuter entre eux ces p éléments. Or il y a App = p! applications bijectives
(ou injectives, c’est pareil) d’un ensemble à p éléments dans lui-même. On a la relation voulue.
En comptant toutes les parties d’un ensemble à n éléments et en les classant suivant leur cardinal, on
a la relation
∑n ( )
n n
2 = .
p
p=0
qui devrait vous rappeler le cas particulier (1 + 1)n = 2n de la formule du binôme dans le calcul
algébrique commutatif :
∑n ( )
n n p n−p
(x + y) = x y .
p
p=0
( )
n
On justifiera pourquoi cette relation entre la formule du binôme et les nombres de combinaisons
p
(que l’on appelle aussi pour cette raison coefficients binomiaux) en comptant combien de fois xp y n−p
apparaît lorsque l’on développe
(x + y) × (x + y) × · · · × (x + y)
(x + y multiplié n fois par lui-même) ; il faut choisir x dans p de ces facteurs, y dans les n − p facteurs
restants et le nombre de possibilités de faire cela est précisément le nombre de parties à p éléments dans
un ensemble à n éléments. Pareille formule n’est valable que sous la clause de commutativité, à savoir
que xy = yx ; vous verrez en effet ultérieurement que dans le cadre du calcul matriciel, la formule du
binôme est de fait beaucoup plus compliquée car on ne peut plus cette fois “regrouper” (comme nous
venons de le faire) les mots contenant p fois le symbole x et n − p fois le symbole y.
FIN DU CHAPITRE 1
Chapitre 2
{x ∈ Q ; x2 ≤ 2}
qui est un√sous-ensemble majoré de Q n’admet pas de plus petit majorant dans Q (s’il y en avait un,
ce serait 2 qui ne peut être dans Q !)
C’est pour retrouver pour E = Q cette propriété indispensable à la notion de mesure, à savoir que
tout sous-ensemble majoré (resp. minoré) d’un certain ensemble ordonné (E, ≤) admette un plus petit
majorant (resp. un plus grand minorant) dans E qu’il a fallu “inventer” (ou découvrir, car le monde de
l’analyse nous entourant est réel) les nombres réels. à travers eux, la perception de l’infiniment petit se
fera jour.
23
24 CHAPITRE 2. NOMBRES ENTIERS, RATIONNELS, RÉELS ET COMPLEXES
tous les minorants de A, dit aussi borne inférieure de A) et que toute partie non vide et majorée B de
N admet un plus grand élément (le plus petit de tous les majorants de B, dit aussi borne supérieure de
B).
En revanche, si a, b ∈ N et si a > b, on ne peut résoudre dans N l’équation x + a = b. C’est le cas si
a > 0 et b = 0. Cela prive le monoïde (N, +) d’avoir la propriété suivante : tout élément a admet un
inverse pour l’addition, i.e un élément a′ de N tel que a + a′ = a′ + a = 0.
L’ensemble Z des entiers relatifs a lui cette propriété ; le monoïde (Z, +) est même le plus petit monoïde
que l’on puisse construire qui contienne N, l’addition prolongeant l’addition sur N, avec de plus la
propriété que tout élément ait cette fois un opposé pour l’addition. L’ensemble Z est réalisé comme
l’ensemble des classes de couples d’entiers positifs [(a, b)], où l’on décide de mettre dans la même classe
(ou encore d’identifier) deux couples quelconques (a1 , b1 ) et (a2 , b2 ) tels que b1 + a2 = a1 + b2 ; notons
que c’est naturel de mettre dans la même “classe” deux tels couples puisque, formellement (si on avait
droit aux soustractions), l’égalité a1 + a2 = b1 + b2 se lirait aussi b1 − a1 = b2 − a2 ; il est donc licite
de faire l’identification si l’on pense un entier relatif comme la “différence” de deux éléments de N. On
peut interpréter a comme une “perte”, b comme un “gain”, le couple (a, b) étant lui pensé comme un
bilan ; dire que a1 + b2 = a2 + b1 revient à dire que (a1 , b1 ) et (a2 , b2 ) correspondent au même bilan
comptable.
On peut aussi (pour plus de simplicité et si l’on est moins féru de constructions abstraites) voir Z comme
l’union de N et des opposés −1, −2, ... des entiers positifs non nuls. En effet, la classe [(a, b)] correspond
à l’entier naturel strictement positif b − a (et on la note ainsi) si b > a ; cette même classe [(a, b)] est
notée (c’est une convention) −(a−b) lorsque a > b (a−b est alors un entier naturel strictement positif) ;
elle est notée enfin 0 si a = b.
On a un ordre total sur Z prolongeant l’ordre sur N en décidant que
∀a, b ∈ N , −a ≤ b
∀a, b ∈ N , (−a ≤ −b) ⇐⇒ (b ≤ a)
L’addition des deux classes [(a1 , b1 )] et [(a2 , b2 )] est par définition la classe [(a1 + a2 , b1 + b2 )]. Pour la
multiplication, c’est un peu plus compliqué, il faut remarquer formellement que
(b1 − a1 )(b2 − a2 ) = a1 a2 + b1 b2 − a1 b2 − a2 b1
est définir donc le produit des classes [(a1 , b1 )] et [(a2 , b2 )] par
[(a1 , b1 )] × [(a2 , b2 )] = [(a1 b2 + a2 b1 , a1 a2 + b1 b2 )] .
Si l’on veut être plus concret, on peut simplement dire que la multiplication sur Z prolonge la multi-
plication sur N comme suit :
∀a, b ∈ N , (−a) × b := −(ab)
∀a, b ∈ N , (a) × (−b) = ab .
L’ordre sur Z est compatible avec ces deux opérations au sens suivant
((a ≤ b) ∧ (c ≤ d)) =⇒ a + c ≤ b + d
((a ≤ b) ∧ (c ≥ 0)) =⇒ ac ≤ bc
((a ≤ b) ∧ (c ≤ 0)) =⇒ bc ≤ ac
L’addition sur Z est commutative (x+y = y+x), associative ((x+y)+z = x+(y+z)), admet un élément
neutre (ici 0 car 0+x = x+0 = x pour tout x) et tout élément x admet un opposé x′ pour l’addition (ici
2.1. L’ANNEAU Z DES ENTIERS RELATIFS 25
x′ = −x car x + (−x) = (−x) + x = 0). On dit que (Z, +) est un groupe abélien, qualificatif emprunté
au mathématicien norvégien Niels Henryk Abel (1802-1829), contemporain du mathématicien français
Evariste Galois (1811-1832) qui, comme lui, inventa la théorie des groupes au service du problème
de la résolubilité (ou non) à la règle et au compas des équations algébriques. La théorie des groupes,
invention des mathématiciens pour des questions au départ de nature exclusivement mathématique,
est devenue à l’orée du XX-ème siècle un formidable outil au service d’autres disciplines scientifiques,
telles en particulier la chimie (liaisons atomiques, classification périodique). On retire l’épithète abélien
lorsque l’opération d’addition cesse d’être commutative.
La multiplication sur Z est commutative (xy = yx) , associative ((x.y).z = x.(y.z)), 1 est élément neutre
(on dit plutôt élément unité pour éviter de faire la confusion avec 0 qui lui est élément neutre pour
l’addition), ce qui signifie 1.x = x.1 = x, mais aucun entier relatif différent de ±1 n’admet d’inverse
pour la multiplication ; donc (Z, ×) n’est pas un groupe, pas plus que (Z \ {0}, ×).
En revanche, la multiplication dans Z est distributive par rapport à l’addition et l’on dit que (Z, +, ×)
a ainsi une structure d’anneau commutatif unitaire : c’est un groupe abélien pour l’addition, la multi-
plication est commutative, associative, distributive par rapport à l’addition et admet un élément neutre
(dit élément unité). Les épithètes commutatif et unitaire sont respectivement retirées lorsque la mul-
tiplication cesse d’être commutative (xy ̸= yx pour certains x, y) ou qu’il n’y a plus d’élément unité
pour cette même opération de multiplication (comme ici 1 qui vérifie 1.x = x.1 = x pour tout x).
Toute partie A non vide et minorée de Z admet un plus petit élément (le plus grand de tous les
minorants de A, dit encore borne inférieure de A). Toute partie B non vide et majorée de Z admet un
plus grand élément (le plus petit de tous les majorants de B, dit encore borne supérieure de B). On
notera que bornes inférieure et supérieure d’un sous-ensemble A de Z, pourvu qu’elles existent, sont
tous les deux des éléments de A. Ceci ne sera plus le cas avec les sous-ensembles de R, on le verra plus
loin !
au0 + bv0 = d
(une telle relation est appelée identité de Bézout lorsque d = 1). De plus, si ab ̸= 0 et si a = da′ et
b = db′ , a′ et b′ sont premiers entre eux et toutes les solutions de l’équation au + bv = d (cas particulier
d’une équation à coefficients entiers et dont on cherche les solutions entières, prototype de ce que l’on
appelle, en hommage à Diophante d’Alexandrie, une équation diophantienne) sont tous les couples (u, v)
de la forme que
u = u0 + b′ k , v = v0 − a′ k , k ∈ Z.
ligne les calculs faits dans l’algorithme de division euclidienne de |a| par |b| (on suppose ici b ̸= 0).
|a| = |b|q0 + r0
|b| = r0 q1 + r1
r0 = r1 q2 + r2
.. ..
. = .
rN −3 = qN −1 rN −2 + rN −1
rN −2 = qN rN −1 + d
rN −1 = dqN +1 + 0
On écrit
d = rN −2 − qN rN −1
= rN −2 − qN (rN −3 − qN −1 rN −2 )
= −qN rN −3 + (1 + qN qN −1 )rN −2
.. .
. = ..
= u 0 a + v0 b
Pour prouver l’autre volet de l’assertion lorsque ab ̸= 0, on remarque que toute solution (u, v) de
l’équation diophantienne au + bv = d s’écrit
u = u0 + u′ , v = v0 + v ′ ,
où (u′ , v ′ ) est solution de l’équation diophantienne sans second membre (on dit encore homogène, on
retrouvera cette terminologie avec les systèmes linéaires ou les équations différentielles) au′ + bv ′ = 0. Si
l’on pose a = da′ et b = db′ , a′ et b′ sont premiers entre eux (car on a “évacué” en mettant d en facteur
tous les diviseurs communs). Le couple (u′ , v ′ ) est solution de a′ u′ = −b′ v ′ ; mais comme le PGCD
de a′ et b′ est égal à 1, il existe (x, y) dans Z2 avec xa′ + yb′ = 1, soit donc (1 − yb′ )u′ = −b′ v ′ , soit
u′ = b′ (yu′ − v ′ ) ce qui prouve que b′ divise u′ , soit u′ = b′ k pour k ∈ Z ; de même a′ divise v ′ et l’on a
v ′ = k ′ a′ ; comme a′ b′ est non nul, on a a′ u′ + v ′ b′ = 0 implique k ′ = −k et l’on a donc u = u0 + kb′ ,
v = v0 − ka′ comme voulu.
Plus que l’énoncé du théorème 2.1 lui même, ce qui est très important (parce que très utile) est qu’il
s’agisse d’une assertion dont la démonstration est constructive, c’est-à-dire s’articule sur un algorithme.
Voici, en quelques lignes de code, la fonction qui calcule, étant donnés deux entiers relatifs a et b avec
b ̸= 0 à la fois le PGCD d de a et b, mais aussi une paire d’entiers relatifs (u, v) telle que d = au + bv
(il s’agit, on le remarquera, d’un algorithme inductif qui s’auto-appelle) :
fonction [PGCD,u,v]=bezout(a,b);
x=a ;
y= abs(b) ;
[q,r]=div(x,y);
si r==0
PGCD = y;
u=0 ;
v=1;
sinon
2.2. NOMBRES RATIONNELS ET NOMBRES RÉELS 27
[d,u1,v1]=bezout(y,r);
PGCD=d;
u=v1;
v=sign(b)*(u1- q*v1);
fin
On pourra s’entraîner à programmer cet algorithme et à le tester sur une calculatrice programmable,
comme nous le ferons dans le cours sous un environnement scientifique (MATLAB 7).
Corollaire 2.1.1. (lemme de Gauss, Carl-Friedrich Gauss, 1777-1855) Soient a et b deux éléments non
nuls de Z avec PGCD (a, b) = 1. Si c est un nombre entier relatif tel que b divise ac, alors b divise c.
Preuve. On prend u et v tels que au + bv = 1 et on multiplie cette égalité par c, ce qui donne
c = acu + bcv ; comme b divise acu (puisque b divise ac) et bien sûr bcv, b divise c. Nous avons d’ailleurs
utilisé ce raisonnement dans la preuve du théorème 2.1.
Une
√ application du lemme de Gauss : il n’existe pas de couple d’entiers strictement positifs (p, q) tel que
2 = p/q. Prouvons ceci par l’absurde : si x = p/q existe, on aurait
p2 = 2q 2 ;
si l’on suppose p et q premiers entre eux (la fraction étant écrite sous forme irréductible, ce qu’il est licite de supposer
après simplification), on déduirait du lemme de Gauss (appliqué d’abord avec a = q et b = p, premiers entre eux et
c = 2q) que p divise 2q, puis (toujours avec Gauss et cette fois a = q, b = p, c = 2) que p divise 2, donc que p = 1 ou
p = 2 ; le cas p = 1 donnerait 1 = 2q 2 , ce qui est impossible car 2 ne peut diviser 1 dans Z ! le cas p = 2 donnerait, après
simplification, 2 = q 2 , ce qui est impossible aussi (2 ne saurait être le carré d’un entier).
Avant de clôre ce paragraphe, remarquons que l’on peut naturellement prolonger l’algorithme de division
euclidienne (par un entier strictement positif b) à Z tout entier en remarquant que our tout a ∈ Z, il
existe un unique couple (q, r), avec q ∈ Z et r ∈ {0, ..., b − 1} tel que a = bq + r. Ceci est connu lorsque
a > 0 et peut se démontrer par récurrence sur a = −1, −2, −3, ... exactement comme on l’a fait dans
la section 1.7.4 pour prouver le théorème d’Euclide. L’unicité du couple (q, r) s’obtient de la même
manière. On peut donc énoncer cette nouvelle version du théorème d’Euclide :
Théorème d’Euclide dans Z. Soit a un entier relatif et b un nombre entier strictement positif ; il
existe un unique couple d’entiers (q, r) avec q ∈ Z et r ∈ {0, ..., b − 1} tel que a = bq + r ; le nombre
q est dit quotient de a par b dans la division euclidienne, le nombre r est lui dit reste après division
euclidienne de a par b.
L’ensemble des fractions ainsi obtenu est le plus petit ensemble (on le note Q) contenant Z auquel on
puisse prolonger l’addition et la multiplication de Z selon les règles
ce qui est juste la réduction au même dénominateur si l’on pense cette formule comme
a1 a2 a1 b2 + a2 b1
+ = ,
b1 b2 b1 b2
et
de manière à ce que (Q, +, ×) soit un anneau commutatif unitaire et que de plus tout élément non
nul (a, b) de Q admette un inverse (en l’occurrence (b, a) puisque (ab, ba) correspond au couple (1, 1),
lui-même identifié au nombre 1).
Un anneau commutatif unitaire où tout élément x distinct de l’élément neutre 0 pour l’addition admet
un inverse pour la multiplication (comme (Q, +, ×)) est appelé corps commutatif.
Ce qui manque à l’ensemble Q ainsi construit n’est pas une propriété algébrique ((Q, +, ×) est bien un
corps commutatif, on l’a vu), mais une propriété relevant plus de l’analyse : Q ne vérifie pas la propriété
de la borne supérieure !
En effet, comme nous l’avons déjà dit, le sous-ensemble
{x ∈ Q ; x2 ≤ 2}
est un sous-ensemble majoré de Q (il est majoré par 3 car 9 ≥ 2), mais qui ne √ possède pas de borne
supérieure dans Q. En effet, la borne supérieure “potentielle” serait le nombre 2 dont on a vu (avec le
lemme de Gauss, section 2.1.2) qu’il ne pouvait être rationnel ; on aurait pu aussi envisager le recours
aux développements en fraction continue : si x vérifie x2 = 2, on a x2 − 1 = 1, soit aussi
1
x=1+ ; (†)
1+x
L’unicité de l’écriture d’une fraction en fraction continue finie exclut qu’un nombre rationnel x puisse
vérifier la formule (†) ci-dessus (le fait d’identifier par exemple le développement en fraction continue de
x et celui obtenu en substituant ce développement au second membre de (†) conduit à une absurdité).
2. Le point de vue concret hérité de l’école primaire
Lorsque l’on doit calculer une fraction (comme 22/7) de nombres entiers positifs, on pose la division et
22
l’on écrit les décimales après la virgule. On trouve par exemple ici = 3+0, 142857 142857 142857 · · · ,
7
22
ce que l’on note encore = 3 + 0, 142857 pour indiquer que le “mot” 142857 est répété indéfiniment.
7
Si l’on songe que le nombre de restes possibles dans la division euclidienne par b est fini (il y a b reste
possibles), on voit que forcément le développement décimal d’une fraction a/b avec a ∈ N et b ∈ N \ {0}
est de la forme
a
= m + 0, d1 · · · dN dN +1 · · · dN ,
b
avec m ∈ Z (quotient de a par b dans la division euclidienne), d1 , ..., dM étant des chiffres entre 0 et
9, la barre surmontant le “mot” dN +1 · · · dM signifiant que ce mot se reproduit de manière périodique
indéfiniment dans l’écriture décimale.
2.2. NOMBRES RATIONNELS ET NOMBRES RÉELS 29
On peut supposer aussi a ∈ Z et associer à la fraction a/b la donnée de l’entier m (quotient de a par
b dans la division euclidienne (élargie à Z comme on l’a vu en fin de section 2.1.2), ce peut être un
entier positif ou négatif, que l’on appelle partie entière de a/b) et de la suite d1 , d2 , .... où, à partir d’un
certain cran, un certain mot dN +1 · · · dM finit par se répéter indéfiniment. Les nombres dj , j = 1, 2, ...,
sont dites décimales de a/b.
On note
a
= m + 0, d1 d2 · · · dN dN +1 · · · dM . (††)
b
Définition 2.1. Le développement (††) est dit développement décimal de la fraction a/b.
On peut vérifier qu’un développement décimal ayant ainsi un motif répété correspond au développement
d’une fraction.
En revanche, le développement décimal d’un éventuel nombre x tel que x2 = 2 (que l’on peut chercher
par approximations successives en tâtonnant) ne peut présenter de “mot” se répétant par périodicité.
On traitera un exemple pour se convaincre, comme
x = 12, 431572 .
On a
1000x − 12431 = 0, 572 ,
soit
1000(1000x − 12431) = 572, 572 = 572 + 0, 572 ,
soit encore
1000(1000x − 12431) − 572 = 1000x − 12431 ,
d’où l’on déduit bien que x est une fraction.
Parmi les fractions, figure une catégorie de fractions intéressantes, celles des fractions décimales, de la
forme
d1 d2 dN
x = m + 0, d1 · · · dN = m + + + ··· + N ,
10 100 10
1 = 0 + 0, 9 ;
en effet, si on ajoute à 9/10 = 0, 9 le décimal 9/100 = 0, 09, puis 9/1000 = 0, 009, et que l’on répète N
fois cette opération, on trouve
9 (1 − 1 ) 1
9(1/10 + 1/100 + 1/1000 + · · · + 1/10N ) = × 10N
=1− N ,
10 1 − 10
1 10
quantité qui devient arbitrairement petite plus N est grand ; on se rapproche de 1 sans jamais l’atteindre,
comme l’archer avançant chaque fois en jetant sa flèche aux 1/10 de la distance au but qu’il espère
atteindre ; il atteindra certes ce but (à 1/9 de sa position initiale), mais au bout d’une “infinité" de
jets ! La notion de série convergente, que vous retrouverez l’année prochaine en mathématiques, est déjà
cachée derrière ce paradoxe. Ainsi le nombre décimal
m + 0, d1 · · · dN
30 CHAPITRE 2. NOMBRES ENTIERS, RATIONNELS, RÉELS ET COMPLEXES
avec dN ∈ {1, ..., 9} a t-il comme autre développement décimal (infini cette fois) le développement
m + 0, d1 · · · (dN − 1) 9
On fait ici surgir une notion d’infini dans l’écriture même des nombres aussi simples que les fractions.
Si l’on exclut les développements décimaux qui se terminent par une répétition infinie de 9, on peut
considérer que l’ensemble des fractions est en correspondance bijective avec l’ensemble des développe-
ments décimaux du type (††), les développements se terminant par une infinité de 9 étant interdits.
L’addition et la multiplication des nombres décimaux se fait en posant les additions et multiplications
comme habituellement (attention aux retenues, y compris pour la partie entière !). En revanche, addition
et multiplication des nombres rationnels introduits de cette manière sont des opérations plus délicates,
à cause du problème des retenues (essayez d’écrire l’algorithme permettant de calculer la somme de
deux développements décimaux, vous verrez la difficulté, liée au fait que pour poser une addition on
commence par la droite et que les développements décimaux sont en général illimités à droite !). Nous
y reviendrons.
Remarquons pour en finir avec le corps des nombres rationnels que l’écriture d’une fraction a/b en
fraction continue ne fait pas intervenir, elle, de développement infini, mais seulement un développement
fini (on développera par exemple 22/7 en fraction continue et l’on comparera avec le développement
décimal).
Terminons ici cette section sur l’ensemble Q des nombres rationnels en expliquant pourquoi Q (de par
sa construction abstraite proposée dans le point 1 ci-dessus) est un ensemble dénombrable, c’est-à-dire
en bijection avec N. Comme Z est dénombrable et N \ {0} aussi, on peut numéroter les éléments de
Z × (N \ {0}) ; en effet, on peut numéroter (par exemple comme suit) les éléments de N × (N \ {0}) :
x0 = (0, 1)
x1 = (1, 1) , x2 = (0, 2) ,
x3 = (2, 1) , x4 = (1, 2) , x5 = (0, 3) ;
etc.
on peut aussi numéroter (sur le même principe) les éléments de {−n ; n ∈ N∗ } × N∗ et par conséquent,
en intercalant par exemple les deux numérotations, numéroter les éléments de
( )
Z × N∗ = (N × N∗ ) ∪ {−n ; n ∈ N∗ } × N∗ .
Ceci nous autorise à numéroter les éléments de Q (on “saute” bien sûr les répétitions !). L’ensemble des
nombres rationnels Q est donc dénombrable.
x = m + 0, d1 d2 d3 · · · ,
où m est un élément de Z et les dj , j = 1, 2, ..., des chiffres pris dans la liste {0, ..., 9}.
L’ensemble des nombres réels contient Q si l’on identifie un nombre rationnel à son unique développe-
ment ne se terminant pas par une succession infinie de 9.
2.2. NOMBRES RATIONNELS ET NOMBRES RÉELS 31
Un nombre réel correspond donc à la donnée d’un entier m et d’une suite de chiffres entre 0 et 9,
c’est-à-dire d’une application d : N → {0, ..., 9}.
On a un ordre total sur l’ensemble des nombres réels, prolongeant l’ordre sur Q. On note cet ordre ≤.
écrire x < y signifie x ≤ y et x ̸= y. Voici comment est défini cet ordre :
Définition 2.3. Soient x = m + 0, d1 d2 · · · et y = m′ + 0, d′1 d′2 · · · deux nombres réels ; on dit que x ≤ y
si et seulement si m ≤ m′ et si la suite de chiffres d1 , d2 , ..., dN , ... précède la suite d′1 , d′2 , ...., d′N , ... pour
l’ordre lexicographique sur {0, ..., 9}.
La partie entière du nombre réel x = m+0, d1 d2 · · · est par définition le plus grand entier E(x) inférieur
ou égal à x ; cet entier vaut donc m si l’un des dj au moins est différent de 9 ; sinon x = m + 1 et
E(x) = x = m + 1.
xn = m + 0, d1 · · · dn−1 dn 0 .
La définition de la convergence exclut qu’une même suite de nombres réels puisse avoir deux limites
distinctes.
Remarque. Si (xn )n≥n0 est une suite convergente, il existe a et b dans R tels que
∀n ≥ n0 , a ≤ xn ≤ b .
En effet, si m est la valeur où stationne la suite (mn )n , il vient un moment où tous les xn sont tels que
m ≤ xn ≤ m + 1.
L’ordre sur R est compatible avec le passage à la limite : si (xn )n converge vers x, (yn )n vers y et que
xn ≤ yn pour tout n ∈ N, alors x ≤ y.
L’ensemble des nombres réels possède la propriété essentielle suivante :
Proposition 2.1. Toute suite croissante de nombres réels majorée par un nombre réel M est convergente
vers un nombre réel x tel que x ≤ M . Toute suite décroissante de nombres réels minorée par un nombre
réel m est convergente vers un nombre réel x tel que m ≤ x.
Preuve. On fait la preuve pour les suites croissantes majorées. Soit (xn )n une telle suite. Posons
Les parties entières des xn forment une suite croissante et majorée (mn )n de nombres entiers ; cette
suite stationne donc à la borne supérieure m de l’ensemble A0 := {mn ; n ∈ N} des valeurs de la suite.
La suite (dn,1 )n est une suite croissante de nombres entre 0 et 9 qui stationne donc, quand n est grand,
à la borne supérieure d1 du sous-ensemble majoré de N défini par A1 := {dn,1 ; n ∈ N}. Á partir du cran
N1 où cette suite (dn,1 )n stationne, la suite (dn,2 )n devient une suite croissante qui elle aussi finit par
stationner sur un chiffre d2 entre 0 et 9 ; et ainsi de suite, on finit par montrer que, pour chaque indice
p ∈ N∗ , la suite (dn,p )n finit par être croissante au delà d’un certain cran Np et donc par stationner sur
un chiffre dp entre 0 et 9. Le nombre réel
x = m + 0, d1 d2 · · · dp · · ·
((a ≤ b) ∧ (c ≤ d)) =⇒ a + c ≤ b + d
((a ≤ b) ∧ (c ≥ 0)) =⇒ ac ≤ bc
((a ≤ b) ∧ (c ≤ 0)) =⇒ bc ≤ ac
L’ensemble des nombres réels obéit au critère des suites adjacentes ou encore lemme des “gendarmes” :
Proposition 2.3. Soient (xn )n et (yn )n deux suites adjacentes de nombres réels. Les deux suites
convergent vers une limite commune dans R.
Preuve. La suite (xn )n est croissante et majorée par y0 , donc convergente vers une limite x. La suite
(yn )n est décroissante et minorée par x0 , donc converge vers une limite y. Comme xn ≤ yn , on a x ≤ y.
La suite (yn − xn )n est une suite de nombres réels positifs tendant vers 0. Si
la suite (mn − m′n )n stationne pour n grand à la valeur 0, ainsi que chaque suite (dn,p − d′n,p )n pour
p = 1, 2, .... Les nombres réels x et y limites de ces deux suites sont donc égaux.
Exemple 1. Les suites (xn )n et (yn )n de l’exemple précédent convergent vers une limite commune. Il
en est de même pour les suites (un )n et (vn )n . Il se trouve que la limite commune des suites (un )n et
(vn )n est un nombre irrationnel jouant un rôle que l’on verra capital dans la section suivante (consacrée
à l’introduction de C), le nombre π, correspondant à la moité du périmètre du cercle de rayon 1.
Exemple 2. Des tests numériques (sous Mathematica) montrent aisément que la convergence des suites
(un )n et (vn )n de l’exemple 1 vers π est une convergence très lente ; ce sont des valeurs très grandes
de n qui permettent de voir surgir les premières décimales de π (voir le test effectué en cours sous
Mathematica en prenant n = 100, puis n = 1000, enfin n = 10000). Notons d’ailleurs que l’erreur entre
la limite pressentie (en l’occurrence π) et le nombre rationnel un est majorée par vn − un = 4/(4n + 1)
(on cherchera en exercice à le justifier). Il existe des procédés autrement plus rapides pour calculer les
décimales de π, tel celui que proposa le mathématicien anglais John Machin (1680-1752) qui remarqua
(en exploitant des formules de trigonométrie que l’on évoquera au chapitre suivant) que les deux suites
(encore adjacentes, on le justifiera en exercice) de termes généraux respectifs
∑
2n−1
4(1/5)2k+1 − (1/239)2k+1
ũn = 4 (−1)k
2k + 1
k=0
∑
2n
4(1/5)2k+1 − (1/239)2k+1
ṽn = 4 (−1)k
2k + 1
k=0
convergent elles aussi toutes les deux vers π ; ceci lui permit d’être le premier à calculer les cent premières
décimales du nombre π. On remarquera cette fois que l’erreur entre π et son approximation “inférieure”
ũn est majorée par
4(1/5)4n+1 − (1/239)4n+1
4 ,
4n + 1
ce qui est une quantité négligeable comparée à la quantité 4/(4n + 1) contrôlant supérieurement l’erreur
entre π et son approximation inférieure un dans l’exemple 1 précédent. On fera le test de la convergence
des deux suites adjacentes (ũn )n et (ṽn )n en cours (sous Mathematica). Le calcul (fait sous machine)
de ũ100 et de ṽ100 fait apparaître deux fractions ayant même développement décimal au moins jusqu’à
l’ordre 100 ; les 100 décimales ainsi obtenues sont donc nécessairement (de par cet effet de “pincement”
lié au critère de convergence des suites adjacentes) les cent premières décimales du nombre irrationnel
π.
A = {x ∈ Q ; x2 ≤ 2} .
En revanche, R (avec son ordre prolongeant l’ordre sur Q) est le plus petit ensemble contenant Q et
ayant la propriété de la borne supérieure (ou de la borne inférieure).
Proposition 2.4. Soit A un sous-ensemble majoré non vide de R. Alors l’ensemble des majorants de
A dans R admet un plus petit élément dans R, dit borne supérieure de A. Soit B un sous-ensemble
minoré non vide de R. Alors l’ensemble des minorants de B admet un plus grand élément, dit borne
inférieure de B.
2.2. NOMBRES RATIONNELS ET NOMBRES RÉELS 35
Remarque importante. On peut caractériser la borne supérieure b d’un sous-ensemble non vide
majoré A de R par les deux clauses :
– b est un majorant de A (∀x ∈ A , x ≤ b) ;
– si y < b, il existe x ∈ A avec y < x ≤ b (tout réel y strictement inférieur à b cesse d’être un
majorant de A).
De même, on peut caractériser la borne inférieure a d’un sous-ensemble non vide majoré B de R par
les deux clauses :
– a est un minorant de B (∀x ∈ B , a ≤ x) ;
– si a < y, il existe x ∈ B avec a ≤ x < y (tout réel y strictement supérieur à a cesse d’être un
minorant de B).
Preuve de la proposition 2.4. On va montrer que tout sous-ensemble non vide et majoré A de R
admet un plus petit majorant en utilisant le critère des suites adjacentes (proposition 2.3).
k
On fixe n ∈ N et on considère le sous-ensemble An de Z constitué des entiers relatifs k tels que
10n
majore A (comme A est majoré, le sous-ensemble An est non vide du fait que R est archimédien). Le
sous-ensemble An est minoré : en effet, A est non vide et contient un élément x0 ; si k ∈ An , on a
x0 × 10n ≤ k ; An est donc minoré (dans Z) par la partie entière de x0 × 10n . L’ensemble An admet
donc un plus petit élément an et l’on pose
an − 1
xn : =
10n
an
yn : = .
10n
Il est facile de voir que les suites (xn )n et (yn )n ainsi construites sont adjacentes, donc convergent vers
une limite commune b. Comme yn majore A, b majore A (puisque le passage à la limite est compatible
avec l’ordre). Si b′ était un majorant de A plus petit que b et distinct de b, on pourrait trouver un des
nombres xn (pour n assez grand) avec b′ < xn ≤ b. Mais il y a toujours un élément de A entre xn et
yn , donc au delà de xn . Donc b′ ne majore pas A et l’on a une contradiction. Nous avons ainsi prouvé
par l’absurde que b était bien le plus petit majorant de A.
La preuve est identique pour montrer que tout sous-ensemble de R minoré admet un plus grand minorant
(une borne inférieure).
On introduit un instrument fondamental de mesure, la valeur absolue.
Définition 2.7. La valeur absolue |x| d’un nombre réel x est par définition le plus grand des deux
nombres x et −x, ou encore la borne supérieure de l’ensemble {x, −x}.
La valeur absolue obéit aux deux règles suivantes :
La seconde de ces règles, dite inégalité triangulaire, a pour conséquence la troisième règle suivante :
∀x, y ∈ R , |x| − |y| ≤ |x − y| .
Cette notion de valeur absolue nous permet de formuler de manière différente l’assertion :
«La suite de nombres réels (xn )n converge vers le nombre réel x»
On a en effet la proposition suivante :
36 CHAPITRE 2. NOMBRES ENTIERS, RATIONNELS, RÉELS ET COMPLEXES
Proposition 2.5. Soit (xn )n une suite de nombres réels. La suite (xn )n converge vers le nombre réel
x si et seulement si :
∀ϵ > 0 , ∃N (ϵ) ∈ N , (n ≥ N (ϵ)) =⇒ (|xn − x| ≤ ϵ) . (∗)
Preuve. Pour chaque ϵ > 0, il existe (puisque R est archimédien) un entier N ∈ N tel que 10−N ≤ ϵ.
Si la suite (xn )n converge vers x, alors pour n assez grand (dépendant de N , donc de ϵ), xn et x ont les
mêmes décimales jusqu’à l’ordre N . La valeur absolue |xn − x| est donc majorée par 10−N , donc par ϵ.
On vient donc de vérifier que si la suite (xn ) converge vers x, la clause (∗) est remplie.
Réciproquement, si |xn − x| ≤ 10−N −1 , xn et x ont les mêmes décimales au moins jusqu’à l’ordre N ;
si la clause (∗) est remplie, la suite (xn )n converge donc vers x.
Cette nouvelle caractérisation de la convergence permet de prouver (ce dont on pouvait se douter) que
la prise de limite, déjà compatible avec l’ordre, est aussi compatible avec les opérations de prise de
valeur absolue, d’addition, de multiplication, et de prise d’inverse sur R.
Proposition 2.6. Soient (xn )n et (yn )n deux suites de nombres réels respectivement convergentes vers
les nombres réels x et y ; alors la suite (|xn |)n converge vers |x|, la suite (xn + yn )n converge vers x + y
et la suite (xn yn )n converge vers xy. De plus, si x ̸= 0, alors xn ̸= 0 pour n ≥ n0 et la suite (1/xn )n≥n0
converge vers 1/x.
Preuve. Pour le premier point, on utilise l’inégalité
||xn | − |x|| ≤ |xn − x|
et la proposition 2.5.
Pour ce qui est de la somme, on remarque que
|x + y − xn − yn | ≤ |xn − x| + |yn − y|
(inégalité triangulaire). Si ϵ > 0, il existe N (ϵ) tel que
( )
n ≥ N (ϵ) =⇒ (|xn − x| ≤ ϵ/2) ∧ (|yn − y| ≤ ϵ/2) .
En reportant dans (†), on trouve bien que pour n ≥ N (ϵ), |xn yn − xy| ≤ ϵ, ce que l’on voulait pour
assurer la convergence de (xn yn )n vers xy d’après la proposition 2.5.
Pour ce qui est de l’inverse enfin, on remarque que pour n assez grand |xn | ≥ |x|/2 car (|xn |)n converge
vers |x|. Ensuite, on remarque que
1 1 |xn − x|
2
− = ≤ |xn − x| ,
xn x |xn | |x| |x|2
quantité que l’on peut rendre inférieure ou égale à ϵ dès que |xn − x| ≤ ϵ|x|2 /2.
2.2. NOMBRES RATIONNELS ET NOMBRES RÉELS 37
[a, b] := {x ∈ R ; a ≤ x ≤ b} ;
]a, b] := {x ∈ R ; a < x ≤ b}
et
[a, b[:= {x ∈ R ; a ≤ x < b} .
On peut étendre ces définitions au cas a = b. Dans ce cas, on convient que le segment [a, a] est le
singleton {a} tandis que les trois autres intervalles sont vides. Ces intervalles sont dits bornés car ils
admettent tous (lorsqu’ils sont non vides) une borne supérieure (b) et une borne inférieure (a). On
définit par extension les intervalles non bornés
] − ∞, b[ := {x ∈ R ; x < b}
] − ∞, b] := {x ∈ R ; x ≤ b}
]a, +∞[ := {x ∈ R ; x > a}
[a, +∞[ := {x ∈ R ; x ≥ a} .
Le premier et le troisième sont dits ouverts, les deux autres sont dits fermés.
Tous ces sous-ensembles de R sont convexes, au sens suivant : un sous-ensemble E de R est convexe et
et seulement si, pour tout couple (x, y) d’éléments de E, le segment [x, y] est inclus dans E.
Si I est un intervalle de R (de l’un des types suivants, borné ou non-borné), on appelle intérieur de I (et
on note I ◦ ) le nouvel intervalle obtenu en retirant à I les bornes (supérieure ou inférieure) qu’il contient
éventuellement. On appelle adhérence de I (et on note I) le nouvel intervalle obtenu en ajoutant à I
les bornes (supérieure ou inférieure) qu’il ne contenait éventuellement pas. On a donc I ◦ ⊂ I ⊂ I pour
tout intervalle de R. L’intérieur d’un intervalle non vide (par exemple [a, a]) peut fort bien être vide !
Preuve. La suite (an )n est une suite de nombres réels croissante majorée (par b0 ), donc convergente
d’après la proposition 2.1 vers un nombre réel x. La suite (bn ) est une suite de nombres réels décroissante
minorée (par a0 ), donc convergente d’après la proposition 2.1 vers un nombre réel y. Comme an ≤ bn
38 CHAPITRE 2. NOMBRES ENTIERS, RATIONNELS, RÉELS ET COMPLEXES
pour tout n ∈ N, le fait que la prise de limite soit compatible avec l’ordre implique x ≤ y. Le segment
[x, y] est inclus dans tous les segments [an , bn ].
Remarque. L’intersection des segments emboîtés [an , bn ] (pour n ∈ N) se réduit à un seul point si
et seulement si les suites (an )n et (bn )n sont adjacentes, ce qui signifie que la suite (bn − an )n des
“longueurs” (on dit aussi diamètres) des segments emboîtés converge vers 0.
Une application : R n’est pas dénombrable. Prouvons ici par l’absurde, en utilisant le fait que R
vérifie la propriété des segments emboîtés, que R (au contraire de Q) n’est pas dénombrable, c’est-à-dire
qu’il n’est pas possible de “lister” les nombres réels en une liste (sans répétitions)
x0 , x1 , x2 , ..., xn , .... .
Supposons que ceci soit possible. Soit [a0 , b0 ] un segment de R, avec b0 − a0 > 0, ne contenant pas x0
(il suffit de prendre b0 < x0 ou a0 > x0 ). On peut construire un segment [a1 , b1 ] tel que b1 − a1 > 0,
inclus dans [a0 , b0 ], et ne contenant pas le point x1 (discuter suivant que r1 est intérieur à [a0 , b0 ], est
une borne de ce segment, ou est un point de R \ [a0 , b0 ]) ; en continuant ainsi de suite, on trouve une
suite de segments emboîtés [an , bn ] telle que l’intersection de tous ces segments ne contienne aucun des
nombres xk , k ∈ N, donc aucun nombre réel, ce qui est en contradiction avec le fait que R vérifie la
propriété des segments emboîtés (et donc que l’intersection des [an , bn ] pour n ∈ N soit non vide) !
Définition 2.8. On dit qu’un sous-ensemble E de R est un voisinage d’un point x si et seulement s’il
existe un intervalle ouvert non vide ]x − ϵ1 , x + ϵ2 [ tel que
x ∈]x − ϵ1 , x + ϵ2 [⊂ E ;
un sous-ensemble de R vide ou voisinage de chacun de ses points est dit ouvert. Un sous-ensemble de
R est dit fermé si et seulement si son complémentaire est ouvert.
Un sous-ensemble de R n’a aucune raison d’être ouvert ou fermé ! Par exemple, Q n’est ni ouvert ni
fermé car tout intervalle ouvert non vide de R contient toujours au moins un nombre irrationnel et un
nombre rationnel, même en fait un nombre décimal.
Cependant, à tout sous ensemble E de R, on peut associer un sous-ensemble ouvert E ◦ inclus dans E
(E ◦ est d’ailleurs le plus grand ouvert – au sens de l’inclusion –inclus dans E) et un sous-ensemble fermé
E contenant E (qui est le plus petit fermé – au sens de l’inclusion – contenant E). L’ensemble E ◦ est
dit intérieur de E, l’ensemble E est dit adhérence de E. Ces deux ensembles sont définis respectivement
ainsi :
– un nombre x est dans E ◦ si et seulement si E est un voisinage de x ;
– un nombre x est dans E si et seulement si x est limite d’une suite (xn )n de points de E.
Il est très possible que E ◦ soit vide (même si E ne l’est pas) ; en revanche, on a toujours E ⊂ E.
L’ensemble E \ E ◦ est appelé frontière de E ; la frontière de E est l’ensemble des points qui sont à
la fois limite d’une suite (xn )n de points de E et d’une suite (yn )n de points de R \ E : par exemple,
la frontière de R \ Z est exactement l’ensemble Z, mais la frontière de R \ Q est R tout entier car
tout nombre réel s’approche à la fois par une suite de nombres décimaux et par une suite de nombres
irrationnels (on expliquera pourquoi). De même, Z a pour intérieur l’ensemble vide, pour adhérence
Z et donc pour frontière Z, tandis que Q a toujours pour intérieur l’ensemble vide, pour adhérence
R (tout nombre réel s’approche par une suite de décimaux), et donc pour frontière R tout entier ! Il
faut donc se méfier parfois des intuitions en ce qui concerne la frontière qui peut (comme dans le cas
E = R \ Q ou E = Q dont la frontière est R tout entier) être beaucoup plus grande que l’ensemble et
même le contenir !
2.2. NOMBRES RATIONNELS ET NOMBRES RÉELS 39
qui est le cercle unité privé du pôle nord (1, 0) dans le plan réel. L’application
x
f : (x, y) 7−→
1−y
réalise une bijection entre cet ensemble et R (on pourra s’exercer à faire un dessin comme celui fait en cours). On peut
donc compléter R en ajoutant un point “à l’infini”, en l’occurrence celui qui correspond au pôle nord (0, 1) du cercle unité,
seul point à ne pas avoir d’image par l’application f . Cependant, dans ce que nous ferons ici, nous ajouterons à R deux
points à l’infini pour rendre compte de ce qui se passe pour les valeurs du passé infini et du futur infini, l’ensemble des
nombres réels étant pensé, comme c’est souvent le cas en physique, comme l’axe des temps.
Définition 2.9. Une suite (xn )n de nombres réels converge vers +∞ si et seulement si
(converger vers 0+ signifie converger vers 0 en restant positif pour n assez grand, converger vers 0−
signifie converger vers 0 en restant négatif pour n assez grand ; la notation ∀n >> 0 se lit “pour tout n
assez grand”).
40 CHAPITRE 2. NOMBRES ENTIERS, RATIONNELS, RÉELS ET COMPLEXES
En revanche si (xn )n est une suite tendant vers +∞ et (yn )n une suite tendant vers −∞, on ne peut a
priori rien dire de la suite (xn + yn )n (on dit que l’on est en face d’une indétermination). On dit aussi
que la forme +∞ − ∞ est une forme indéterminée. Il faut travailler plus pour en dire quelque chose et
lever cette indétermination : par exemple, c’est seulement en écrivant
1
n2 − n = n2 (1 − )
n
que l’on peut conclure que (n2 − n)n tend vers +∞ lorsque n tend vers +∞. Suivant ce même principe,
une suite de terme général
a0 np + a1 np−1 + · · · + ap ,
où p ∈ N \ {0} et a0 , ..., ap sont des nombres réels avec a0 ̸= 0, tend vers +∞ si a0 > 0 et vers −∞ si
a0 < 0 (lorsque n tend vers l’infini). Ceci se voir en remarquant
( a1 1 ap 1 )
a0 np + a1 np−1 + · · · + ap = a0 np 1 + + ··· = a0 np (1 + vn ) ,
a0 n a 0 np
où la suite (vn )n tend vers 0.
On retrouve le même problème d’indétermination à lever lorsque la suite (xn )n converge vers +∞ ou
−∞, que la suite (yn )n converge vers 0, et que l’on veuille étudier la suite xn yn (on dit que les formes
(+∞) × 0 ou (−∞) × 0 sont des formes indéterminées). Par exemple, on ne peut pas sans travailler
davantage conclure immédiatement au comportement lorsque n tend vers l’infini de la suite de terme
général
1
xn = × log n
n
dont on montrera plus tard qu’elle converge vers 0.
La “multiplication” “naïve”
(x1 , y1 ) × (x2 , y2 ) := (x1 × x2 , y1 × y2 )
n’est pas une opération intéressante (pas de distributivité par rapport à l’addition par exemple) et on
l’oubliera.
On dispose par contre aussi d’une action externe de R sur R2 de la manière suivante : à a ∈ R et (x, y)
dans R2 , on associe
a · (x, y) := (a × x, a × y) = (ax, ay) .
Addition et multiplication externe vérifient les règles de compatibilité
On dit que R2 équipé de l’addition et de cette action externe du corps R dessus est un R-espace vectoriel
(on note cette structure (R2 , +, ·)).
On note que (R, +, ×) est un aussi R-espace vectoriel sur lui-même avec l’action externe a · x = a × x.
Définition 2.10. Une fonction l de R dans R est dite R-linéaire si et seulement si L vérifie
Pour se donner une fonction R-linéaire l de R dans lui-même, il suffit de se donner l(1) car alors
Pour se donner une fonction R-linéaire L de R2 dans lui-même, il suffit de se donner L(1, 0) = (a, c) et
L(0, 1) = (b, d) ; en effet, on a alors, pour tout (x, y) dans R2 ,
( )
L(x, y) = x · L(1, 0) + y · L(0, 1) = ax + by, cx + dy .
On peut donc représenter l’application L par un tableau à deux lignes et deux colonnes, le tableau
suivant ( )
a b
,
c d
que l’on appelle matrice de L relativement au système (l’ordre des éléments est important) B =
[(1, 0), (0, 1)].
Proposition 2.6. La composée l = l2 ◦ l1 de deux applications R-linéaires l1 et l2 de R dans R est une
application linéaire l de R dans R avec l(1) = l1 (1) × l2 (1).
La composée de deux applications R-linéaires L1 et L2 de R2 dans R2 est une application linéaire
L = L2 ◦ L1 de R2 dans R2 . La matrice de l’application L dans le système B s’écrit
( ) ( ) ( )
a2 b2 a b1 a2 a1 + b2 c1 a2 b1 + b2 d1
• 1 = .
c 2 d2 c1 d1 c2 a1 + d2 c1 c2 b1 + d2 d1
On peut aussi définir une addition (commutative et associative) sur M2,2 (R) en posant
( ) ( ) ( )
a1 b1 a b2 a1 + a2 b1 + b2
+ 2 = .
c1 d1 c2 d2 c1 + c2 d1 + d2
Additionner les matrices de L1 et L2 relativement au système B revient à écrire la matrice relativement
au système B de l’application
(x, y) 7−→ L1 (x, y) + L2 (x, y) .
Proposition 2.7. L’ensemble M2,2 (R) équipé de l’addition et de la multiplication externe hérite d’une
structure de R-espace vectoriel.
Preuve. On laisse la vérification en exercice.
Exercice. Pour s’entraîner au calcul du produit de deux matrices, on vérifiera qu’une matrice
( )
a b
A=
c d
vérifie toujours la formule
( ) ( )
1 0 0 0
A • A − (a + d) · A + (ad − bc) · =
0 1 0 0
On en déduira, si ad − bc ̸= 0, qu’il existe une matrice B, à savoir la matrice
( )
1 d −b
B :=
ad − bc −c a
telle que ( )
1 0
A•B =B•A= .
0 1
Les applications linéaires de R2 dans R2 jouant un rôle important en physique (suivant le principe de
moindre action) sont celles qui préservent les angles (orientés) des figures (et par voie de conséquence
préservent les formes des objets), si l’on convient d’y ajouter l’application nulle qui envoie tout point
(x, y) sur le point (0, 0). Ces applications sont les applications linéaires de R2 dans R2 obtenues en
composant une homothétie de rapport r ≥ 0 et de centre l’origine avec une rotation autour de (0, 0)
d’angle θ. La matrice d’une telle application dans le système B est
( ) ( ) ( ) ( )
cos θ − sin θ a −b 1 0 0 −1
r· = =a· +b·
sin θ cos θ b a 0 1 1 0
avec a = r cos θ et b = r sin θ.
On remarque que deux applications linéaires du type précédent, de matrices respectivement
( ) ( )
cos θ1 − sin θ1 a1 −b1
r1 · =
sin θ1 cos θ1 b1 a1
et ( ) ( )
cos θ2 − sin θ2 a2 −b2
r2 · =
sin θ2 cos θ2 b2 a2
commutent pour la composition et que la matrice de leur composée est
( ) ( ) ( ) ( )
a1 −b1 a2 −b2 a1 a2 − b1 b2 −(a1 b2 + b1 a2 ) a −b
• = =
b1 a1 b2 a2 a1 b2 + b1 a2 a1 a2 − b1 b2 b a
avec a = a1 a2 − b1 b2 et b = a1 b2 + b1 a2 .
2.3. LE PLAN R2 ET LES NOMBRES COMPLEXES 43
Si l’on se limite à trouver L de manière à ce que sa matrice relativement au système B soit de la forme
( )
a −b
b a
on trouve deux applications linéaires L possibles (les rotations d’angle un demi-droit dans le sens
des aiguilles d’une montre ou le sens inverse, dit aussi sens trigonométrique), celles dont les matrices
relativement à B sont ( )
0 −1
± .
1 0
Ces deux matrices A vérifient A • A = −IdR2 , équation qui formellement correspond à X 2 + 1 = 0.
Définition 2.11. On appelle nombre complexe toute matrice 2 × 2 de nombres réels de la forme
( )
1 0
a· + b · i,
0 1
√
où i = −1 désigne la matrice ( )
0 −1
i= .
1 0
On notera pour simplifier cette matrice a + ib et l’on dira que a est la partie réelle du nombre complexe
a + ib, b sa partie imaginaire ; de plus le nombre complexe a + ib est dit affixe du couple (a, b) de R2 .
Proposition 2.8. l’ensemble des nombres complexes C peut être équipé d’une addition (l’addition des
matrices) et d’une multiplication (le produit des matrices) selon les règles
Muni de ces deux opérations (C, +, ×) hérite d’une structure de corps commutatif et l’identification
entre a et a + i0 permet de considérer R avec ses deux opérations comme un sous-corps de (C, +, ×).
Preuve. On se contentera de montrer que tout nombre complexe a + ib avec a et b non tous les deux
nuls admet un inverse pour la multiplication. Pour cela, on remarque que
(a + ib) × (a − ib) = a2 + b2 ,
Par exemple
1 2 − 3i 2 3
= = − i.
2 + 3i 13 13 13
Le reste des vérifications relève de la routine.
a = r cos θ , b = r sin θ ,
|z| = |z|
arg z = −arg z , ∀z ∈ C \ {0}
|z1 z2 | = |z1 | × |z2 |
z1 + z2 = z1 + z2
z1 z2 = z1 × z2
|z|2 = z×z
1 z
= , ∀z ∈ C \ {0}
z |z|2
||z1 | − |z2 || ≤ |z1 − z2 |
|z1 + z2 | ≤ |z1 | + |z2 | ,
l’égalité dans l’une des deux inégalités ci-dessus n’ayant lieu que si l’un des zi est nul ou si z1 et z2 sont
non nuls et ont même argument.
2.3. LE PLAN R2 ET LES NOMBRES COMPLEXES 45
Quant à la formule
arg (z1 z2 ) = arg z1 + arg z2 , ∀z1 , z2 ∈ C \ {0} ,
il faut la manier avec soin : elle signifie que si θi , i = 1, 2, est une détermination de l’argument de zi ,
θ1 + θ2 est une détermination de l’argument de z1 z2 . C’est la même signification qu’il faut accorder à
la formule
arg z = −arg z , ∀z ∈ C \ {0} .
On note aussi, pour tout x réel, exp x = ex ; le nombre e = exp 1 est un nombre réel (dont on verra
plus tard qu’il est irrationnel) appelé à jouer un rôle important.
Outre cette propriété d’échanger les deux opérations, l’application exponentielle est une application
fondamentale autant en mathématiques qu’en physique car correspondant à des phénomènes d’évolution
régis par une équation différentielle très simple dont nous parlerons au prochain chapitre.
De fait, la fonction exponentielle se prolonge en une fonction de C dans C \ {0} (notée aussi exp) et
suivant la même règle d’échange des opérations d’addition et de multiplication, c’est-à-dire
Définition 2.12. Si z = x + iy est un nombre complexe écrit sous forme cartésienne, on pose
Le nombre complexe exp(x + iy) correspond donc à l’application linéaire de R2 dans R2 obtenue en
composant l’homothétie de centre (0, 0) et de rapport exp x avec la rotation autour de (0, 0) d’angle
orienté y. Ceci explique bien pourquoi l’on a la formule
et donc en particulier
∀z ∈ C , exp z × exp(−z) = 1 ,
d’où exp z ̸= 0.
Outre encore la propriété qu’elle a d’échanger les deux opérations, l’application exponentielle considérée
comme une application de C dans C \ {0} est encore une application fondamentale autant en mathéma-
tiques qu’en physique car attachée aux phénomènes d’évolution dans le plan gouvernés par un système
différentiel (vous verrez cela plus tard) ainsi qu’aux phénomènes temporels de nature ondulatoire (vous
l’avez rencontrée en physique).
On note aussi exp z = ez .
L’image par l’application exponentielle de la droite du plan paramétrée par
(c’est-à-dire passant par le point (x0 , y0 ) et dirigée par le vecteur (u0 , v0 )) est soit un cercle de centre
(0, 0) et de rayon ex0 (si u0 = 0), soit (lorsque u0 ̸= 0) une spirale tourbillonnant depuis l’origine
(sur laquelle elle s’écrase) jusqu’à l’infini (on expliquera pourquoi en exercice) ; ceci justifie pourquoi la
fonction exponentielle s’avère un outil majeur pour modéliser les phénomènes tourbillonnaires (cyclones,
tourbillons dans un écoulement turbulent ...) ; le cas u0 = 0 correspond à une situation stable (on a
affaire à un cercle et non une spirale), tandis que le cas u0 ̸= 0 correspond à la situation instable. On
a représenté sur la figure ci-dessous les deux modèles de situation.
−2
−4
−6
−8
−10
−15 −10 −5 0 5 10 15
Figure 2.1 – L’image des droites par l’application exponentielle complexe : modèle stable [x0 = 1, y0 =
0, u0 = 0](en trait plein) et modèle instable [x0 = 1, y0 = 0, u0 = 1/2](en pointillés)
Sur la figure suivante, on a représenté l’image d’un cercle (en l’occurrence de rayon r = 7) par l’ap-
plication exponentielle complexe ; on constatera que l’image du cercle de rayon 1 est une courbe sans
point double, puis que la situation se complique au fur et à mesure que r augmente (des points doubles
apparaîssent, on expliquera pourquoi, dès que le diamètre du cercle est au moins égal à 2π).
2.3. LE PLAN R2 ET LES NOMBRES COMPLEXES 47
800
600
400
200
−200
−400
−600
−800
Les fonctions cos et sin déduites de la fonction exponentielle via les formules
exp(iz) + exp(−iz)
cos z :=
2
exp(iz) − exp(−iz)
sin z :=
2i
sont aussi des fonctions très importantes (du point de vue de la physique par exemple) dans le champ
complexe. Sur la figure ci-dessous, on a représenté en trait plein (resp. en pointillés) l’image du cercle
de centre z = 0 et de rayon 7 par l’application cos (resp. sin). Plus le rayon du cercle augmente, plus
les points doubles se multiplient pour l’image par sin !
48 CHAPITRE 2. NOMBRES ENTIERS, RATIONNELS, RÉELS ET COMPLEXES
500
400
300
200
100
−100
−200
−300
−400
−500
Figure 2.3 – L’image du cercle de centre z = 0 et de rayon r = 7 par les applications cos et sin
Utilisant l’application exponentielle, on remarque que l’écriture d’un nombre complexe sous forme
trigonométrique est
z = r exp(iθ) = reiθ ,
où θ est une détermination arbitraire de arg z. De plus, les trois nombres e, i, π sont liés par la relation
capitale
e2iπ = 1
dont on reparlera (cette relation n’est pas un jeu d’écriture, elle implique vraiment quatre êtres ma-
thématiques : une fonction, la fonction exponentielle, et trois nombres, à√savoir la base des logarithmes
néperiens e, le demi-périmètre du cercle unité π et la racine carrée i = −1.
Comme application de la très importante relation (†), nous énoncerons deux listes de formules, celles
attribuées au mathématicien français Abraham de Moivre (1667-1754), à l’origine des tous premiers
développements de l’analyse complexe (1707) et celles (en quelque sorte “inverses”) attribuées au ma-
thématicien suisse Leonhard Euler (1707-1783).
2.3. LE PLAN R2 ET LES NOMBRES COMPLEXES 49
On remarque ensuite que i2p = (−1)p et que i2p+1 = (−1)p i (car i2 = −1). En identifiant les parties
réelles et imaginaires, on obtient les formules voulues.
Remarque. On remarque qu’il existe un polynôme Tn de degré exactement n tel que
cos(nθ) = Tn (cos θ) ;
on a T0 (X) = 1, T1 (X) = X, T2 (X) = 2X 2 − 1, à vous de trouver T3 (X), T4 (X), etc. On pourra vérifier ceci soit
directement avec les formules de Moivre, soit en utilisant un raisonnement par récurrence. Le polynôme Tn , dit n-ème
polynôme de Tchebychev, joue un rôle très important dans les questions relatives à l’approximation des fonctions par des
fonctions polynomiales.
(−1) ∑(
p 2p+1
2p + 1
)
= (−1)k sin((2(p − k) + 1)θ) si n = 2p + 1 .
22p+1 k
k=0
fait que dans le membre de droite, on peut se contenter de prendre la partie réelle (la partie imaginaire
étant automatiquement nulle du fait de l’égalité).
Remarque. Les formules d’Euler permettent d’exprimer sous forme d’une combinaison linéaire finie
∑
ak eikθ
k∈Z
la somme étant finie et les coefficients ak1 ,k2 étant des nombres complexes. Ce procédé est dit linéarisation des expres-
sions trigonométriques et jouera un rôle majeur dans la simplification des calculs de primitives ou d’intégrales de telles
expressions, on le verra au chapitre suivant.
A = Reiθ
rn = R
∃k ∈ Z , nφ = θ + 2kπ .
Ceci équivaut à
r = R1/n
θ 2kπ
∃k ∈ Z , φ = + .
n n
Ceci équivaut encore, si l’on utilise la division euclidienne de k par n, k = nq + m :
r = R1/n
θ 2mπ
∃m ∈ {0, ..., n − 1} , ∃q ∈ Z, φ = + + 2πq ,
n n
ou encore
|z| = R1/n
( )
( θ + 2πm )
∃m ∈ {0, ..., n − 1} , arg z = arg exp i .
n
Preuve. On vient de voir avec ce qui précède que ces nombres sont tous solutions de z n = A. Il reste
à montrer que ces nombres sont bien distincts. Si l’on avait
( θ + 2πm ) ( θ + 2πm )
2 1
R1/n exp i = R1/n exp i
n n
avec 0 ≤ m1 < m2 ≤ n − 1, on aurait
( 2π(m − m ) )
2 1
exp i = 1,
n
m2 − m1
ce qui est impossible car 0 < 2π < 2π, ce qui prouve que l’argument du nombre
n
( 2π(m − m ) )
2 1
exp i
n
est différent de celui de 1 (dont les déterminations sont les 2kπ, k ∈ Z).
Exemple. Si A = 1, l’équation z n = 1 admet n racines distinctes, les n nombres
2miπ
zm = exp( ) , m = 0, ..., n − 1 .
n
Les affixes de ces points sont les n sommets (dont le point (1, 0)) du polygone régulier à n côtés inscrit
dans le cercle de centre (0, 0) et de rayon 1. Ce polygone est unique dès qu’il a pour sommet le point
(1, 0) et on obtient ses autres sommets en découpant à partir du point (1, 0) le cercle de rayon 1 en n
2π
arcs de longueur égales ( ) ; voir la figure ci-dessous.
n
2 π /n
2miπ
Les nombres complexes exp( ) avec PGCD (m, n) = 1 sont dits racines primitives n-èmes de
n
l’unité.
Plus généralement, si a, b, c sont trois nombres complexes avec a ̸= 0, on peut écrire, pour tout
z ∈ C,
b
az 2 + bz + c = a(z 2 + z) + c
a
( b b2 − 4ac )
= a (z + )2 − .
2a 4a2
b 2 b2 − 4ac
(z + ) = .
2a 4a2
X 2 = b2 − 4ac ; (†)
b 2
(z + ) =0
2a
b
et admet comme seule solution z = − ;
2a
– si b2 − 4ac ̸= 0, l’équation az 2 + bz + c = 0 admet deux racines distinctes
−b ± u
z= ,
2a
2
δ/4a
z1
u/2a
R
θ −b/2a
θ/2
−u/2a
z2
– b2 − 4ac = 0, auquel cas l’équation az 2 + bz + c = 0 a une racine unique dans C qui d’ailleurs se
b
trouve être réelle (z = − ) ;
2a
– b2 − 4ac > 0, auquel cas l’équation az 2 + bz + c = 0 a ses deux racines (distinctes) dans R ;
– b2 − 4ac < 0, auquel cas l’équation az 2 + bz + c = 0 a ses deux racines (distinctes et conjuguées)
dans C \ R.
Dans le premier cas −b/2a est réel, les deux nombres u/2a et −u/2a aussi et tous les points de la figure
précédente sont sur l’axe réel, en particulier les deux racines z1 et z2 . Dans le second cas, on a θ = π
points représentant u/2a et −u/2a sont sur l’axe y ′ Oy, symétriques par rapport à l’origine ; on a
et les√
u = i −δ ∈ iR et les deux racines z1 et z2 correspondent à des points symétriques par rapport à l’axe
x′ Ox (voir la figure ci-dessous).
54 CHAPITRE 2. NOMBRES ENTIERS, RATIONNELS, RÉELS ET COMPLEXES
z
u/2a 1
R
2
δ /4a R
x’ −b/2a x
−u/2a z2
y’
Remarque. Le calcul de la racine carrée z = x + iy d’un nombre A = u + iv ̸= 0 donné sous forme cartésienne est
grandement facilité par les deux relations :
u = Re A = x2 − y 2
√
|u + iv| = u2 + v2 = |z| 2
= x2 + y 2 ,
relations d’où l’on déduit
√√
u2 + v 2 + u
x = ±
2
√√
u2 + v 2 − u
y = ± .
2
Cependant, on obtient ainsi quatre nombres complexes au lieu des deux prévus (l’équation du second degré z 2 = A ayant
deux racines), à savoir les quatre nombres
√√ √√
u2 + v 2 + u u2 + v 2 − u
± ±i ;
2 2
il faut utiliser la relation supplémentaire
2xy = v = Im A ,
relation dont on retient juste
signe (xy) = signe v
pour conclure et isoler les deux couples (x0 , y0 ) et (−x0 , −y0 ) solutions parmi les quatre trouvés. Par exemple, les deux
racines de z 2 = −3 + 7i sont à prendre parmi les quatre nombres
√√ √√
58 − 3 58 + 3
± ±i ;
2 2
comme xy = 7 > 0, il ne reste que deux choix possibles et l’on trouve ainsi que les deux racines de l’équation z 2 = −3 + 7i
sont (√ √ √√ )
58 − 3 58 + 3
z=± +i .
2 2
2.3. LE PLAN R2 ET LES NOMBRES COMPLEXES 55
Cette étude de la résolution des équations du second degré augure d’un résultat plus général attribué
à l’encyclopédiste Jean Le Rond d’Alembert (1717-1783) : toute équation algébrique
a0 z n + a1 z n−1 + · · · + an ,
les aj étant des nombres complexes avec a0 ̸= 0, admet au moins une racine dans C. Plusieurs démons-
trations vous en seront présentées plus tard dans votre parcours mathématique.
FIN DU CHAPITRE 2
56 CHAPITRE 2. NOMBRES ENTIERS, RATIONNELS, RÉELS ET COMPLEXES
Chapitre 3
L’objectif dans ce chapitre est l’étude des fonctions numériques d’une variable réelle, c’est-à-dire
des fonctions d’un sous-ensemble D de R (dit domaine de définition de la fonction) et à valeurs dans R.
L’ensemble R pouvant être pensé comme l’axe des temps, ces fonctions modélisent souvent des grandeurs
physiques (mesurées dans un système d’unités adéquat) évoluant pendant un certain laps de temps. On
mettra en équation l’étude de cette évolution de manière à la fois à la prédire et à la contrôler, mais
il nous faudra auparavant introduire les concepts de continuité et de dérivabilité. Cela nous donnera
l’opportunité d’associer à un phénomène d’évolution un modèle mathématique, puis ensuite d’étudier
ce modèle.
lim f (xn ) = l .
n→+∞
Dans le cas particulier où a est un point appartenant au domaine de définition de f , alors, dire que f
admet une limite l en a implique automatiquement que cette limite l soit égale à f (a). On dit dans ce
cas (c’est une définition sur laquelle nous reviendrons en détails dans la section 3.2 plus loin) que f est
continue au point a. Lorsque a est un point du domaine de définition d’une fonction f , dire que cette
fonction est continue en ce point a, c’est exactement dire que la limite de f en a existe (cette limite
valant d’ailleurs automatiquemenr f (a)), ce qui signifie que pour toute suite (xn )n∈N de points de D
convergeant vers a, on a
lim f (xn ) = f (a) .
n→+∞
Dire que f n’est pas continue en a revient donc à exhiber une suite (xn )n∈N de points de D qui tende
vers a sans que la suite (f (xn ))n∈N tende vers f (a).
Lorsque a est un point de D \ D, on peut aussi parler pour f de convergence de f vers ±∞ au point a :
– On dit que la fonction f converge vers +∞ au point a ∈ D \ D (ou encore admet +∞ pour limite
au point a, ou bien encore tend vers +∞ en a) si et seulement si pour toute suite (xn )n≥0 de
57
58 CHAPITRE 3. FONCTIONS NUMÉRIQUES ET MODÉLISATION
lim f (xn ) = +∞ ;
n→+∞
– on dit enfin que la fonction f converge vers −∞ au point a ∈ D \ D (ou encore admet −∞ pour
limite au point a, ou bien encore tend vers −∞ en a) si et seulement si pour toute suite (xn )n≥0
de points de D convergeant vers a,
lim f (xn ) = −∞ .
n→+∞
Remarque. Si a est un point de D et si f (définie sur D) admet une limite en a, alors nécessairement cette limite est
égale à f (a).
Si D est tel qu’il existe une suite de points de D tendant vers +∞ (c’est-à-dire si D n’est pas majoré),
on peut aussi parler de limite de la fonction f au point +∞ :
– on dit que f admet une limite finie l ∈ R lorsque x tend vers +∞ dans D si et seulement si pour
toute suite (xn )n≥0 de points de D convergeant vers +∞ dans D (il en existe par hypothèses sur
D !), on a
lim f (xn ) = l ;
n→+∞
– on dit que f converge vers +∞ lorsque x tend vers +∞ dans D si et seulement si pour toute suite
(xn )n≥0 de points de D convergeant vers +∞ dans D, on a
lim f (xn ) = +∞ ;
n→+∞
– on dit que f tend vers −∞ lorsque x tend vers +∞ dans D si et seulement si pour toute suite
(xn )n≥0 de points de D convergent vers +∞ dans D, on a
lim f (xn ) = −∞ .
n→+∞
S’il existe une suite de points de D tendant vers −∞ (ce qui signifie que D n’est pas minoré), on peut
parler pour une fonction f de D dans R de convergence vers une limite finie l ou vers ±∞ lorsque x
tend vers −∞ dans D.
On a la proposition suivante, permettant de formuler mathématiquement le fait qu’une fonction tende
vers une limite finie l ∈ R au point a ∈ D ou vers ±∞ en un point a ∈ D \ D :
Proposition 3.1. Soit D un sous-ensemble de R, f une fonction de D dans R et l un nombre réel.
Alors f admet l pour limite au point a ∈ D si et seulement si :
Preuve. On se contentera de prouver la première assertion (la preuve des autres est identique).
Supposons tout d’abord (†) vraie et fixons ϵ > 0 arbitraire ; il lui correspond donc d’après (†) un certain
nombre η > 0. Si (xn )n est une suite de points de D convergeant vers a, alors pour n assez grand, on
a |xn − a| < η ; mais alors, puisque (†) est vraie, on a |f (xn ) − l| ≤ ϵ pour n assez grand ; comme ϵ
est arbitraire, ceci prouve que la suite (f (xn ))n converge vers l (si l’on se souvient de ce que signifie la
convergence d’une suite (un )n de nombres réels vers une limite réelle, voir la proposition 2.5).
On prouve que l’assertion lim f (x) = l implique l’assertion (†) en utilisant un raisonnement par contra-
x→a
position. La négation de (†) s’écrit :
En particulier, pour chaque n ∈ N \ {0}, il existe xn ∈ D avec |xn − a| < 1/n et |f (xn ) − l| ≥ ϵ ; la
suite (xn )n≥1 converge vers a tandis que la suite (f (xn ))n≥1 ne converge pas vers l, ce qui prouve que
l’assertion lim f (x) = l est fausse. On a donc bien prouvé ainsi par contraposition que
x→a
On a des équivalences analogues si D est non minoré pour les trois types de convergence vers −∞.
On remarque que la limite d’une fonction f en un point a de D (a pouvant être éventuellement −∞ ou
+∞), limite qui peut être un nombre réel l ou bien valoir ±∞ si a ∈ D \D, peut fort bien ne pas exister
(par exemple la fonction f : x ∈ R 7−→ sin x ne tend ni vers une limite l, ni vers +∞, ni vers −∞
lorsque x tend vers +∞). En revanche, si cette limite existe, elle est unique ; une fonction numérique
ne saurait avoir deux limites distinctes (appartenant à la droite numérique achevée) en un point a
adhérent à son domaine de définition D (ou en +∞ si D n’est pas majoré, ou bien en −∞ si D n’est
pas minoré).
Toutes les règles de calcul concernant la compatibilité entre la prise de limite et les opérations sur R
(addition, multiplication, prise d’inverse si cela est possible, prise de valeur absolue) énoncées pour les
suites dans la proposition 2.6 ou dans la section 2.2.8 rejaillissent sur les limites de fonctions (puisque
tester si une fonction a une limite en un point de la droite achevée revient à le tester sur les suites). On
énoncera pas toutes ces règles mais il est utile en exercice que vous vous exerciez à les “retranscrire”
toutes du contexte des suites vers celui des fonctions.
Nous donnerons quelques règles de compatibilité entre prise de limite et composition des applications :
Proposition 3.2. Soit D et E deux sous-ensembles de R, f une fonction de D dans R, g une fonction
de E dans R avec f (D) ⊂ E. On suppose que
– a ∈ D et lim f (x) = l ∈ R (notons que ceci implique que l est automatiquement dans E) ;
x→a,x∈D
– lim g(y) = L ∈ R .
y→l,y∈E
60 CHAPITRE 3. FONCTIONS NUMÉRIQUES ET MODÉLISATION
Alors
lim (g ◦ f )(x) = L .
x→a ,x∈D
En combinant (1) et (2), on voit que si x ∈ D et |x − a| < η, on a |f (x) − l| < η1 et donc par ricochet
y = f (x) ∈ E et par voie de conséquence |g(y) − L| = |g(f (x)) − L| < ϵ, ce qui était ce que l’on voulait
montrer.
On a aussi des propositions tout à fait identiques du type par exemple de la suivante :
Proposition 3.4. Soit D et E deux sous-ensembles de R, f une fonction de D dans R, g une fonction
de E dans R avec f (D) ⊂ E. On suppose que
– a ∈ D et lim f (x) = +∞ ∈ R (notons que ceci implique que E est automatiquement non
x→a,x∈D
majoré) ;
– lim g(y) = L ∈ R ∪ {−∞, +∞}.
y→+∞,y∈E
Alors
lim (g ◦ f )(x) = L .
x→a ,x∈D
Ou bien encore :
Proposition 3.5. Soit D et E deux sous-ensembles de R, f une fonction de D dans R, g une fonction
de E dans R avec f (D) ⊂ E. On suppose que
– D non majoré et lim f (x) = l ∈ R (notons que ceci implique que l ∈ E) ;
x→+∞,x∈D
– lim g(y) = L ∈ R ∪ {−∞, +∞}.
y→l,y∈E
Alors
lim (g ◦ f )(x) = L .
x→+∞ ,x∈D
Les preuves des propositions 3.4 et 3.5 sont identiques à celle de la proposition 3.3.
Si a est un point de D, on dira aussi que f a une limite à droite l ∈ R ∪ {−∞, +∞} si et seulement
a est adhérent à D∩]a, +∞[ et si la restriction de f à D∩]a, +∞[ (c’est-à-dire l’application qui à
x ∈ D∩]a, +∞[ associe f (x)) a pour limite l lorsque x dans vers a dans D∩]a, +∞[. Idem pour la
notion de limite à gauche en a. Lorsque a est adhérent à la fois à D∩]a, +∞[ et D∩] − ∞, a[, on peut
donc dire que f a une limite en a si f a des limites à droite et à gauche en a et si ces deux limites sont
égales (comme éléments de la droite numérique achevée). Si a ∈ A, ces deux limites sont nécesairement
alors de plus égales à f (a).
Exemples.
3.2. CONTINUITÉ D’UNE FONCTION EN UN POINT ET SUR UN ENSEMBLE 61
– Soit f la fonction de R dans [0, 1] qui à un nombre réel x associe le nombre x − E(x), où E(x)
désigne la partie entière de x (c’est-à-dire le plus grand nombre m ∈ Z inférieur ou égal à x). En
tout point x de R \ Z, la fonction f admet une limite égale à f (x) (on vérifiera ce fait en utilisant
les développements décimaux). En revanche, en tout point de Z, la fonction f a pour limite à
gauche l = 0 et pour limite à droite l = 1.
– Soit f la fonction définie sur D =] − π, π[\{0} par
cos x
f (x) := .
sin x
En tout point x de D, f a pour limite f (x) ; en revanche, au point x = 0, f a pour limite à droite
+∞ (car x 7→ cos x a pour limite 1 en 0 tandis que x 7→ sin x a pour limite en zéro à droite 0 par
valeurs supérieures) et à gauche −∞ (car x 7→ cos x a pour limite 1 en 0 tandis que x 7→ sin x
a pour limite en zéro à gauche 0 par valeurs inférieures). Au point π, on vérifiera que f a pour
limite −∞ tandis qu’en −π, f a pour limite +∞.
Terminons par une proposition intéressante :
Proposition 3.6. Soit f est une fonction monotone (c’est-à-dire croissante ou décroissante) sur un
intervalle ouvert ]a, b[ (borné ou non borné). Alors f a une limite à gauche et à droite en tout point de
]a, b[.
Preuve. Ceci résulte du fait que R vérifie la propriété de la borne supérieure. Supposons par exemple
f croissante et notons, pour x0 ∈]a, b[, M (x0 ) la borne supérieure de f (]a, x0 [) (sous-ensemble de R
majoré par f (x0 )). Par définition de M (x0 ), il existe, pour tout ϵ > 0, un nombre x < x0 tel que
on a donc
lim f (x) = M (x0 ) = sup{f (x) ; x < x0 }
x→x0 ,x<x0
Si A est un sous-ensemble de D, la fonction f est dite continue sur A si et seulement si f est continue
en tout point de A. Si f est continue sur D, on dit que f est continue partout (sous-entendu bien sûr
seulement là où elle est définie !).
Remarque. On pourrait simplement se contenter de dire que f est continue en x0 si et seulement si f admet une limite
finie en x0 ; en effet, on a vu que, si cette limite existe, c’est nécessairement f (x0 ).
62 CHAPITRE 3. FONCTIONS NUMÉRIQUES ET MODÉLISATION
Si x0 est un point de D adhérent à D∩]x0 , +∞[, on dit que f est continue à droite en x0 si
Idem pour la notion de continuité à gauche en un point x0 adhérent à D∩] − ∞, x0 [. Si x0 est un point
de D adhérent à la fois à D∩]x0 , +∞[ et à D∩] − ∞, x0 [, dire que f est continue en x0 équivaut donc
à dire que f est continue à gauche et à droite en x0 .
Proposition 3.7. Une fonction continue sur un intervalle fermé [a, b] est bornée sur cet intervalle et
atteint ses bornes.
Nota Lire soigneusement la preuve de cette proposition plus délicate que les autres (c’est normal, le matériel dont nous
disposons s’accumule de jour en jour plus nous avançons dans le cours) est un exercice qui ne saurait être que profitable.
Il ne s’agit pas de savoir la refaire “par cœur” (cela n’a pas d’intérêt et en plus, il y a plein d’autres preuves) mais d’en
comprendre les idées clef. J’y reviendrai dans le prochain cours, mais relisez la avant !
Preuve. Soit f une telle fonction. Montrons par l’absurde que f est majorée ; si ce n’était pas le cas,
tous les ensembles
An := {x ∈ [a, b] ; f (x) ≥ n} , n = 0, 1, 2, ...,
seraient non vides (et bien sûr tous majorés par b). Posons
xn := sup{x ; x ∈ An }
(ce nombre existe et est un élément de [a, b] car R vérifie la propriété de la borne supérieure ou inférieure).
La suite (xn )n est par construction même (on le vérifiera) une suite décroissante de nombres réels tous
entre a et b (en effet An+1 ⊂ An , l’ensemble des majorants de An est donc inclus dans celui des
majorants de An+1 ). Cette suite converge donc vers un point x ∈ [a, b]. Comme f est continue sur
[a, b], donc en particulier en x, la suite (f (xn ))n devrait converger vers f (x), ce qui est impossible car
f (xn ) ≥ n pour tout n, ce qui implique lim f (xn ) = +∞, d’où la contradiction. La fonction f est
n→∞
donc majorée sur [a, b] et l’on peut poser M = sup(f ([a, b]).
D’après le fait que M est borne supérieure de f ([a, b]), il existe, pour chaque n ∈ N \ {0} un élément x
de [a, b] tel que M − 1/n < f (x) ≤ M ; on pose
La suite (un )n≥1 est une suite croissante majorée, donc convergente vers un nombre ξ ∈ [a, b] ; comme
f est continue en ξ, on a
1
f (ξ) = lim f (un ) ≥ lim (M − )≥M;
n→+∞ n→+∞ n
mais comme on a aussi f (ξ) ≤ sup(f ([a, b]) = M , on a f (ξ) = M .
On raisonne de manière identique pour montrer que f ([a, b]) est minoré et qu’il existe un point η de
[a, b] tel que f (η) = inf(f ([a, b]).
Une vision intuitive de la continuité d’une fonction f sur un intervalle I (ouvert, semi-ouvert ou fermé,
borné ou non ) est la suivante : f est continue sur I si et seulement si le graphe de f , c’est-à-dire le
sous-ensemble de R2 défini comme
peut se tracer au crayon sans que l’on ait jamais à lever celui-ci. G. Peano a construit par exemple une
courbe continue du plan (c’est-à-dire une paire de fonctions continues de [0, 1] dans R) telle que l’image
3.2. CONTINUITÉ D’UNE FONCTION EN UN POINT ET SUR UN ENSEMBLE 63
par l’application (γ1 , γ2 ) de [0, 1] soit [0, 1]2 . Ainsi le carré [0, 1]2 peut-il être balayé d’un trait de crayon
“continu” (on ne lève jamais le crayon pour faire ce traçé) ! Ceci repose sur le théorème suivant :
Théorème des valeurs intermédiaires. Soit f une fonction continue sur un intervalle fermé [a, b] ;
l’image de f est l’intervalle fermé [inf(f ([a, b])), sup(f ([a, b]))], ce qui signifie que f prend toute va-
leur intermédiaire entre les deux nombres inf(f ([a, b])) et sup(f ([a, b])), ces nombres étant eux-mêmes
atteints d’après la proposition 3.7.
Remarque. Ceci est faux si l’on remplace [a, b] par une union I1 ∪ I2 de deux intervalles fermés disjoints (même s’il
est toujours vrai que toute fonction continue sur une telle union y est bornée et atteint ses bornes. La fonction qui à
x ∈ [0, 1] ∪ [2, 3] associe x évite les valeurs y ∈]1, 2[ ; pourtant inf(f ([0, 1] ∪ [2, 3])) = 0 et sup(f ([0, 1] ∪ [2, 3])) = 3 et donc
]1, 2[⊂ [0, 3] !
Nota Je n’ai pas traité cette preuve en cours, mais je vous invite à la lire soigneusement et à tenter de comprendre
comment le raisonnement (subtil, car par l’absurde) s’enchevêtre. Ceci montre qu’autant le résultat est intuitivement
évident, autant en fait il s’agit d’un résultat profond et non tout à fait évident. La conséquence que nous en donnerons
avec la preuve du théorème de d’Alembert pour les équations algébriques à coefficients réels et de degré impair montre
que ce théorème des valeurs intermédiaires a des applications non triviales du tout !
Preuve. C’est une nouvelle fois une conséquence du fait que R vérifie la propriété de la borne supérieure.
On fait une preuve par l’absurde en supposant qu’il existe un nombre y tel que
( ) ( )
inf(f ([a, b])) < y < sup(f ([a, b])) ∧ ∀x ∈ [a, b] , f (x) ̸= y
(c’est la négation de l’assertion du théorème puisque l’on sait déjà que les deux valeurs m = inf(f ([a, b])
et M = sup(f ([a, b])) sont, elles, atteintes sur [a, b] d’après la proposition 3.7). Le nombre f (a) est donc
soit strictement inférieur à y, soit strictement supérieur à y.
On suppose tout d’abord que f (a) < y et l’on considère le sous-ensemble de [a, b] défini par
Ce sous-ensemble de R est non vide majoré et admet donc une borne supérieure β ∈ [a, b].
Montrons que nécessairement β = b. Si ce n’était pas le cas, on aurait β < b et f (β) ̸= y. Deux cas sont
alors à envisager :
– soit f (β) − y > 0 (ce qui impose β > a), mais alors, du fait de la continuité de f en β, il existerait
η > 0 tel que
|x − β| < η =⇒ f (x) − y > 0 ;
ceci est en contradiction avec le fait que dans l’intervalle ]β − η, β] ∩ [a, b], il doive exister un
nombre x tel que f ([a, x]) ⊂] − ∞, y[, donc en particulier tel que f (x) − y < 0 (définition de la
borne supérieure) ;
– soit f (β) − y < 0, mais alors, du fait de la continuité de f en β, il existerait η > 0 tel que
mais alors il existerait x ∈]β, β + η[∩[a, b] tel que f ([a, x]) ⊂] − ∞, y[, ce qui contredit la définition
de y comme borne supérieure de E.
On a donc nécessairement β = b et f ([a, b]) ⊂] − ∞, α[, ce qui est impossible puisque la valeur M > y
doit être prise par f sur [a, b].
Si f (a) > y, on considère le sous-ensemble de [a, b] défini par
Ce sous-ensemble de R est non vide minoré et admet donc une borne inférieure α. Comme précédemment
on montre que α = a, donc que f ([a, b]) ⊂]y, +∞[, ce qui est contradictoire avec le fait que la valeur
m < y est atteinte par f sur [a, b].
Application. Toute fonction polynomiale de la forme x → a0 xp + a1 xp−1 + · · · + ap avec a0 ̸= 0, les aj réels et p impair,
s’annule en au moins un point de R (puisque la limite en −∞ est l’infini avec le signe de −a0 et que la limite en +∞ est
l’infini avec cette fois le signe de a0 ). On vient donc de montrer ici le théorème de d’Alembert dans le cas particulier des
équations algébriques à coefficients réels et de degré impair. Il n’existe d’ailleurs pas de preuve “purement algébrique” du
théorème fondamental de l’algèbre ; toute preuve implique un voyage du côté de l’analyse comme celui ci !
une fonction strictement croissante ou strictement décroissante sur I est dite strictement monotone sur
l’intervalle I.
Le résultat suivant est très important car il nous permet d’introduire la notion de fonction inverse :
Proposition 3.8. Soit I un intervalle de R (de n’importe quel type, ouvert, semi-ouvert ou fermé,
borné ou non borné) et f une fonction strictement monotone et continue de I dans R ; alors f est
une bijection entre I et son image f (I) (qui d’ailleurs est aussi un intervalle J du même type que
I) et l’application inverse f −1 est aussi une application strictement monotone continue de J dans I
(strictement croissante si f est strictement croissante, strictement décroissante si f est strictement
décroissante).
Preuve. On suppose f strictement croissante pour fixer les idées. Clairement, f est injective sur I
puisque x1 ̸= x2 implique soit x1 < x2 , auquel cas f (x1 ) < f (x2 ), soit x2 < x1 , auquel cas f (x2 ) <
f (x1 ). L’application f est donc une application bijective entre I et son image f (I) et l’application
inverse f −1 existe bien (de f (I) dans I). Si y1 = f (x1 ) < y2 = f (x2 ), on a nécessairement x1 < x2
(puisque sinon y2 ≥ y1 ). L’application f −1 est donc bien strictement croissante aussi. Remarquons que
nous n’avons pas encore utilisé la continuité de f à ce point de notre raisonnement. On va l’exploiter
maintenant.
3.4. FONCTIONS STRICTEMENT MONOTONES SUR UN INTERVALLE 65
Si y1 = f (a) et y2 = f (b) sont deux points de f (I) avec y1 < y2 , alors le théorème des valeurs
intermédiaires implique que f prenne sur [a, b] toute valeur entre y1 (incluse) et y2 (incluse), donc que
f (I) contienne l’intervalle [y1 , y2 ]. Ainsi f (I) ne peut présenter de “trou” et est donc un intervalle J. Cet
intervalle J est du même type que I et admet comme borne inférieure m = inf{f (x); x ∈ I} ∈ R∪{−∞}
et comme borne supérieure M = sup{f (x); x ∈ I} ∈ R ∪ {+∞} (ces bornes étant incluses si les bornes
correspondantes de I le sont, par exemple f ([a, b]) = [m, M ], f (]a, b]) =]m, M ], f ([a, b[) = [m, M [,
f (]a, b[) =]m, M [, f (] − ∞, b]) =]m, M ],etc. si a, b ∈ R).
La fonction f −1 est strictement monotone sur l’intervalle J = f (I) et admet donc, d’après la proposition
3.6, une limite à gauche f −1 (y− ) et à droite f −1 (y+ ) en tout point y de J (avec f −1 (y− ) ≤ f −1 (y) ≤
f −1 (y+ )). Mais, comme f −1 (J) = I et ne peut donc avoir de “trou”, les limites à gauche et à droite de
f −1 en y sont égales et valent donc d’après le lemme des gendarmes f −1 (y). La fonction f −1 est donc
continue sur J = f (I).
Remarque. Le résultat est faux si l’on omet l’hypothèse “f continue” et que l’on garde toutes les autres ; par exemple la
fonction [0, 2] → [0, 3] définie par f (x) = x si x ∈ [0, 1[ et f (x) = x + 1 pour x ∈ [1, 2] a pour image [0, 1[∪[2, 3] qui n’est
pas un intervalle !
Exemples.
• La fonction x 7−→ sin x est strictement croissante sur [−π/2, π/2], à valeurs dans [−1, 1] ; elle admet
donc une fonction réciproque Arcsin : [−1, 1] −→ [−π/2, π/2], continue sur [−1, 1] et strictement
croissante sur cet intervalle (bijective de [−1, 1] dans [−π/2, π/2]) ; on a
( ) ( )
(x ∈ [−π/2, π/2]) ∧ (y = sin x) ⇐⇒ (y ∈ [−1, 1]) ∧ (x = Arcsin y) ;
1.5
0.5
−0.5
−1
−1.5
−2
−2 −1.5 −1 −0.5 0 0.5 1 1.5 2
• La fonction x 7−→ cos x est strictement décroissante sur [0, π], à valeurs dans [−1, 1] ; elle admet
donc une fonction réciproque Arcos : [−1, 1] −→ [0, π], continue sur [−1, 1] et strictement décroissante
(bijective de [−1, 1] dans [0, π]) ; on a
( ) ( )
(x ∈ [0, π]) ∧ (y = cos x) ⇐⇒ (y ∈ [−1, 1]) ∧ (x = Arcos y) ;
66 CHAPITRE 3. FONCTIONS NUMÉRIQUES ET MODÉLISATION
2.5
1.5
0.5
−0.5
−1
−1 −0.5 0 0.5 1 1.5 2 2.5 3
• La fonction x 7−→ exp x est strictement croissante de R dans ]0, +∞[ ; elle admet donc une fonction
réciproque log :]0, +∞[−→ R, continue, strictement croissante (bijective de ]0, +∞[ dans R) ; on a
( ) ( )
(x ∈ R) ∧ (y = exp(x)) ⇐⇒ (y ∈ ]0, +∞[) ∧ (x = log y) .
Le graphe de la fonction exponentielle est “tourné’ vers le haut, celui de la fonction logarithme regarde
vers le bas. La fonction exponentielle est une fonction convexe, la fonction logarithme est une fonction
concave. On verra plus tard pourquoi l’exponentielle impose toujours à l’infini sa limite aux fonctions
puissances (comme x → x2 ) tandis que ce sont les fonctions puissances qui imposent leur limite au
logarithme.
30
25
20
15
10
0 5 10 15 20 25 30
Figure 3.3 – Graphes de exp (en pointillés), de log (en plein) et de x → x2 (en tirets)
Soit f une application strictement monotone entre deux intervalles I et J de R, comme sur la figure
ci-dessous. Soit G(f ) le graphe de f et G(f −1 ) le graphe de f −1 . On a l’assertion suivante :
( ) ( )
∀x ∈ R , ∀y ∈ R , (x ∈ I) ∧ (y = f (x)) ⇐⇒ (y ∈ J) ∧ (x = f −1 (y)) .
Comme
G(f ) = {(x, y) ∈ I × J ; y = f (x)}
−1
G(f ) = {(y, x) ∈ J × I ; x = f −1 (y)}
= {(y, x) ∈ J × I ; y = f (x)} ,
on voit que le graphe de f −1 s’obtient à partir du graphe de f en prenant l’image de l’ensemble G(f )
par l’application linéaire de R2 dans R2 qui à (x, y) associe (y, x) ; cette application correspond à la
3.5. DÉRIVABILITÉ EN UN POINT ET SUR UN INTERVALLE 67
symétrie par rapport à la première bissectrice. Ceci reste vrai si l’on remplace I et J par deux ensembles
D et E tels que f : D → E réalise une bijection entre D et E, d’inverse f −1 : E → D.
−1
G(f )
G(f)
I J
Ceci reste vrai dès que f est une bijection (non nécessairement monotone) entre deux sous-ensembles
D et E de R : le graphe de l’application inverse f −1 s’obtient toujours en prenant l’image du graphe de
f par la symétrie par rapport à la première diagonale (la première diagonale est l’ensemble des points
de R2 défini comme {(x, x) ; x ∈ R}). On verra des exemples dans la section 3.6.
lim ϵ(h) = 0 .
h→0
que par un “terme d’erreur” de la forme (x−x0 )ϵ(x−x0 ) avec lim ϵ(h) = 0, c’est-à-dire un terme d’erreur
h→0
négligeable par rapport à |x − x0 | lorsque x se rapproche de x0 . On écrit un tel terme o(|x − x0 |) pour
signifier qu’il est négligeable devant |x − x0 | ; ce sont les notations aujourd’hui communément utilisées
(en mathématiques autant qu’en physique) introduites par le mathématicien allemand Landau (1877-
1938), spécialiste de théorie analytique des nombres : une fonction φ définie au voisinage de 0 (sauf
éventuellement en 0) et qui est un o(1) est une fonction tendant vers 0 en 0 ; si n ∈ N, c’est un o(|h|n )
si h → φ(h)/|h|n tend vers 0 lorsque h tend vers 0.
Si f est définie au voisinage de x0 et que l’on examine le graphe de f au voisinage de x0 , dire que f est
dérivable en x0 signifie que la droite Dx0 ,h joignant les points (x0 , f (x0 )) et (x0 + h, f (x0 + h)) pour
h non nul et proche de 0 tend vers une “droite limite”, précisément la droite passant par (x0 , y0 ) et de
pente a(x0 ) ; en effet, le nombre
f (x0 + h) − f (x0 )
h
qui représente la pente de la droite Dx0 ,h (voir figure ci-dessous) tend vers a(x0 ). Cette droite limite
Tx0 d’équation y = f (x0 ) + a(x0 )(x − x0 ) est dite tangente géométrique en (x0 , f (x0 )) au graphe de f
tandis que l’application affine
est dite application affine tangente à f au point x0 . Pour calculer numériquement f près de x0 , on
assimilera f à sa fonction affine tangente et l’on se ramènera à calculer les valeurs d’une fonction affine,
ce qui se fait très rapidement dès que l’on connaît la valeur en deux points√ distincts (voir la formule
(∗) ci-dessus). Attention ! Un graphe (comme celui de la fonction x 7−→ |x| près de l’origine) peut
présenter une tangente géométrique sans que la fonction soit dérivable : ceci se produit si la tangente
géométrique s’avère être une droite verticale, comme sur l’exemple mentionné. Dire que la fonction f
est dérivable en un point x0 intérieur à son domaine de définition revient donc à dire que le graphe
de F admet au point (x0 , y0 ) une tangente géométrique non verticale ; la fonction x 7−→ |x| n’est par
exemple pas dérivable en 0 car le graphe présente un point “anguleux”, le point (0, 0) : il y a en effet
une demi-tangente géométrique à droite (y = x), une demi-tangente géométrique à gauche (y = −x),
mais pas de tangente car ces deux droites sont distinctes !
3.5. DÉRIVABILITÉ EN UN POINT ET SUR UN INTERVALLE 69
Tx
0
D
x0 ,h
G(f)
(x0+ h, f(x0+h))
(x 0 , f(x0 ))
Lorsque f est définie au moins dans un intervalle semi-ouvert [x0 , x0 + η[, on dit de même que f admet
une dérivée à droite en x0 avec pour dérivée à droite en x0 le nombre réel a+ (x0 ) si et seulement si
pour h ∈]0, η[
f (x0 + h) = f (x0 ) + a+ (x0 )h + hϵ+ (h) ,
où la fonction ϵ+ définie dans ]0, η[ par
f (x0 + h) − f (x0 ) − a+ (x0 )h
ϵ+ (h) :=
h
est telle que
lim ϵ+ (h) = 0 .
h→0+
Lorsque f est définie au moins dans un intervalle semi-ouvert ]x0 − η, x0 ], on dit aussi que f admet une
dérivée à gauche en x0 avec pour dérivée à gauche en x0 le nombre réel a− (x0 ) si et seulement si pour
h ∈]0, η[
f (x0 − h) = f (x0 ) − a− (x0 )h − hϵ− (h) ,
où la fonction ϵ− définie dans ]0, η[ par
f (x0 ) − f (x0 − h) − a− (x0 )h
ϵ− (h) :=
h
est telle que
lim ϵ− (h) = 0 .
h→0+
Si f est définie au moins dans [x0 , x0 + ϵ[ et admet une dérivée à droite en x0 , la droite limite des
droites Dx0 ,h avec h > 0 est dite demi-tangente à droite en (x0 , f (x0 )) au graphe de f ; c’est la droite
d’équation y = a+ (x0 )(x − x0 ) + f (x0 ). On a une définition analogue pour la demi-tangente à gauche
si f est définie au moins dans ]x0 − ϵ, x0 ] et a une dérivée à gauche en x0 .
Proposition 3.9. Une fonction définie au voisinage de x0 et dérivable en x0 est continue en x0 . Ceci
vaut aussi si la fonction est au moins définie d’un côté de x0 et admet une dérivée (du côté où elle est
définie) en x0 .
70 CHAPITRE 3. FONCTIONS NUMÉRIQUES ET MODÉLISATION
Preuve. On fait la preuve dans le premier cas (f définie dans un voisinage V de x0 et dérivable en
x0 ). On peut écrire alors, pour x dans ]x0 − η, x0 + η[\{x0 },
avec lim ϵ(h) = 0. Pour |x − x0 | ≤ η1 , on peut affirmer que |ϵ(x − x0 )| < 1, donc que
h→0
si l’on choisit |x − x0 | < inf(η1 , α/(|a(x0 )| + 1)) avec α > 0 arbitraire, on voit que |f (x) − f (x0 )| < α,
ce qui prouve
La réciproque de cette proposition est fausse (par exemple x → |x| n’est pas dérivable en x = 0).
Il existe même des fonctions continues sur un intervalle et dérivables en aucun point de cet inter-
valle ; ce sont par exemple les structures fractales (pensez au bord d’un flocon de neige !). On doit
au mathématicien tchèque Bernard Bolzano (1781-1848), au mathématicien allemand Karl Weierstrass
(1815-1897), au suédois Von Koch (1870-1924), au français H. Lebesgue (1875-1941), nombre de tels
exemples. L’exemple de Bolzano est présenté dans le chapitre 2 du support de cours. Voici par exemple
le début du cheminement conduisant à la construction du flocon de Von Koch : pour chaque segment,
on retire le segment médian et on le remplace par la ligne brisée composée des deux côtés du triangle
équilatéral s’appuyant sur le segment médian.
0 1
∑
n
sin(πk 2 t)
t ∈ [0, 1] 7−→ lim ,
n→+∞ k2
k=1
B. Riemann avait aussi proposé au milieu du XIX-ème siècle un autre exemple intéressant de fonction
continue partout et dérivable nulle part. Le graphe de cette fonction, hérissé partout de “piquants” est
reproduit ci-dessous :
3.5. DÉRIVABILITÉ EN UN POINT ET SUR UN INTERVALLE 71
1.4
1.2
0.8
0.6
0.4
0.2
−0.2
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1
Notons aussi que l’on peut parler de continuité en un point quelconque du domaine de définition d’une
fonction alors que l’on ne parle de dérivabilité qu’en un point intérieur à ce domaine de définition ; ceci
est plus restrictif !
Définition 3.10. Si I est un intervalle ouvert de R (ou plus généralement un sous-ensemble ouvert de
R), une fonction f définie sur I est dérivable sur I si et seulement si elle est dérivable en tout point de
I. En tout point x0 de I où la dérivée existe, on la note f ′ (x0 ) et l’on définit ainsi une nouvelle fonction
sur l’ensemble des points de I où f est dérivable ; cette nouvelle fonction est dite fonction dérivée de f
sur I.
et l’on voit que le nombre dérivé est (f g)′ (x0 ) = f (x0 )g ′ (x0 ) + g(x0 )f ′ (x0 ).
– la fonction x → xn , avec n ∈ Z est dérivable sur R \ {0} (sur R si n ∈ N) et sa fonction dérivée
est :
x −→ nxn−1 ;
72 CHAPITRE 3. FONCTIONS NUMÉRIQUES ET MODÉLISATION
d’où le fait que x → xn est dérivable (si n < 0) en tout point de R \ {0} avec comme dérivée la
fonction x → nxn−1 .
Concernant la composition des fonctions, on a la règle essentielle, dite de Leibniz (Gottfried Wilhelm
von Leibniz, philosophe et mathématicien allemand, 1646-1716) que les anglo-saxons appellent aussi
chain rule :
Théorème (règle de Leibniz) Soit f une fonction définie au voisinage de x0 , dérivable en x0 ; soit
g une fonction définie au voisinage de f (x0 ), dérivable en f (x0 ) ; alors g ◦ f est dérivable en x0 , de
dérivée g ′ (f (x0 )) × f ′ (x0 ).
Preuve. On a, pour H voisin de 0,
g(f (x0 ) + H) = g(f (x0 )) + g ′ (f (x0 ))H + o(|H|)
(car g est dérivable en f (x0 )). Mais on a aussi, pour h voisin de 0,
f (x0 + h) = f (x0 ) + hf ′ (x0 ) + o(|h|)
puisque f est dérivable en x0 . On a donc, en combinant les deux choses que, pour h voisin de 0,
(g ◦ f )(x0 + h) = g(f (x0 ) + hf ′ (x0 ) + o(|h|)) = g(f (x0 ) + [hf ′ (x0 ) + o(|h|)])
= g(f (x0 )) + g ′ (f (x0 )) × (hf ′ (x0 ) + o(|h|)) + o(|hf ′ (x0 ) + o(|h|)|)
= g(f (x0 )) + hg ′ (f (x0 ))f ′ (x0 ) + o(|h|) ,
d’où le résultat voulu.
Applications :
– Si f est dérivable en x0 de dérivée f ′ (x0 ) et que f ne s’annule pas en x0 , la fonction 1/f est
dérivable en x0 , de dérivée
f ′ (x0 )
(1/f )′ (x0 ) = − 2
f (x0 )
(on compose f avec y → 1/y) .
– Si f et g sont dérivables en x0 et que g ne s’annule pas en x0 , f /g est aussi dérivable en x0 et
f ′ (x0 )g(x0 ) − f (x0 )g ′ (x0 )
(f /g)′ (x0 ) =
g 2 (x0 )
(on combine le résultat pour 1/g et le résultat pour le produit de f et 1/g).
3.5. DÉRIVABILITÉ EN UN POINT ET SUR UN INTERVALLE 73
– Si f est bijective d’un intervalle ouvert I contenant x0 dans un intervalle J contenant f (x0 ) et
que f et f −1 sont dérivables, l’une en x0 , l’autre en f (x0 ), alors on a la relation
(f −1 )′ (f (x0 )) × f ′ (x0 ) = 1 ,
On a le résultat suivant :
Proposition 3.11. Soit f une fonction strictement monotone sur un intervalle ouvert I, dérivable en
tout point de I et telle que f ′ (x0 ) ̸= 0 pour tout x0 ∈ I (en fait f ′ (x0 ) > 0 pour tout x0 de I si f
est strictement croissante, f ′ (x0 ) < 0 pour tout x0 de I si f est strictement décroissante) ; la fonction
continue f −1 : f (I) → I est alors dérivable en tout point y0 de f (I) avec
1
(f −1 )′ (y0 ) = .
f ′ (f −1 (y0 ))
x − f (x0 ) x − f (x0 )
y = x0 + = f −1 (y0 ) +
f ′ (x0 ) f ′ (x0 )
−1
x − f (f (y0 ))
= f −1 (y0 ) +
f ′ (x0 )
x − y0
= f −1 (y0 ) + ′ −1 .
f (f (y0 ))
Ceci montre que f −1 est dérivable au point y0 , de dérivée 1/f ′ (f −1 (y0 )).
Ce résultat nous permettra d’étudier le comportement des inverses de certaines fonctions classiques. À
l’opposé de ce résultat, on a la proposition suivante, aussi très importante et que l’on admettra pour
l’instant (cela résultera du théorème fondamental de l’analyse dont on parlera dans la section 3.7) :
Proposition 3.12. Soit f une fonction dérivable sur un intervalle ouvert I, de dérivée identiquement
nulle sur cet intervalle ; la fonction f est alors constante sur I.
Remarque. Il faut cependant prendre garde à l’intuition ! Il existe en effet des fonctions continues, croissantes et surjec-
tives de [0, 1] dans [0, 1], dérivables et de dérivée nulle en tous les points de [0, 1] hormis un ensemble au plus dénombrable
de points (où la fonction n’est pas dérivable) ! Ce sont les célèbres escaliers du diable (voir par exemple la figure ci-dessous
où nous avons introduit les trois premières fonctions d’une suite approchant un tel escalier.
74 CHAPITRE 3. FONCTIONS NUMÉRIQUES ET MODÉLISATION
∑
n
f (x) := lim xk ;
n→+∞
k=0
et que cette quantité tend vers +∞ lorsque n tend vers +∞ (lorsque x > 1). Tout n’est cependant pas
désespéré car l’on pourrait, pour corriger le tir, introduire, si x un nombre réel positif ou nul, la suite
(un (x))n≥0 de terme général
xn
un (x) := .
n!
On a
x
un+1 (x) = un (x) ,
n+1
3.6. QUELQUES FONCTIONS CLASSIQUES ET LEURS INVERSES 75
ce qui implique, dès que n est supérieur où égal à la partie entière E[2x] de 2x, que
un (x)
un+1 (x) ≤ .
2
La suite de terme général
∑
n ∑
n
xk
Un (x) := uk (x) =
k!
k=0 k=0
est une suite croissante de nombres réels majorée car, pour n > E[2x], on a
∑ xk
E[2x]
∑
n
xk
Un (x) = +
k! k!
k=0 k=E[2x]+1
∑ xk
E[2x]
xE[2x]+1 ∑
n−E[2x]−1
1
≤ +
k! (E[2x] + 1)! 2k
k=0 k=0
∑
E[2x]+1
x k
x E[2x]+1
≤ +2 .
k! (E[2x] + 1)!
k=0
La suite (Un (x))n≥0 est donc une suite de nombres réels croissante majorée, donc convergente vers une
limite que l’on convient d’appeler exp x ou ex .
Si maintenant x < 0 et si (Un (x))n≥0 désigne toujours la suite de terme général
∑
n ∑
n
xn
Un (x) := uk (x) = ,
n!
k=0 k=0
on vérifie que la suite (U2p (x))p≥0 est une suite croissante, que la suite (U2p+1 (x))p≥0 est une suite
décroissante et que la suite de terme général U2p+1 (x) − U2p (x) tend vers 0 lorsque p tend vers l’infini.
Les deux suites (U2p (x))p≥0 et (U2p+1 (x))p≥0 sont donc des suites adjacentes ayant une limite commune
et la suite (Un (x))n≥0 converge donc vers une limite (la limite commune des deux suites ci-dessus), limite
que l’on appelle encore exp x.
Définition 3.11. La fonction exponentielle x 7−→ exp x est la fonction définie sur R par
∑
n
xk
exp x = ex := lim .
n→+∞ k!
k=0
( ∑
2n
|x1 |k1 ) ( ∑
2n
|x2 |k2 )
|Vn (x1 , x2 )| ≤ × e|x2 | + × e|x1 |
k1 ! k2 !
k1 =E[n/2]+1 k2 =E[n/2]+1
|x1 | |x2 | |y|
≤ (e − UE[n/2] (|x1 |))e + (e − UE[n/2] (|x2 |))e|x1 | ,
Cette formule implique que la fonction exponentielle ne s’annule jamais et reste strictement positive
puisque ex ≥ 1 si x ≥ 0 et que ex = 1/e−x ∈]0, 1[ si x < 0. De plus, pour x ≥ 0, la fonction exponentielle
est telle que
xn+1
≤ ex
(n + 1)!
pour tout n ∈ N, ce qui implique que pour tout entier n ∈ N,
ex
lim = +∞
x→+∞ xn
lim ex xn = 0,
x→−∞
ce que l’on résume en général en disant que l’exponentielle impose sa limite aux fonctions puissances.
On peut écrire, pour tout h ∈ R,
( ∑
n
hk−2 )
exp(h) = 1 + h + h2 × lim
n→+∞ k!
k=2
( ∑
n−2
hk )
= 1 + h + h2 × lim ;
n→+∞ (k + 2)!
k=0
comme
n−2 hk ∑ |hk |
∑
n−2
≤ ≤ e|h| ≤ e
(k + 2)! k!
k=0 k=0
ex+h − ex ( eh − 1 )
= ex ×
h h
pour tout h ∈ R \ {0}, la fonction exponentielle est dérivable (donc continue) en tout point x de R avec
d x
[e ] = ex .
dx
La fonction exponentielle s’auto-dérive en elle même (on verra que la seule fonction dérivable sur un
intervalle de R et se dérivant en elle-même est la fonction exponentielle), d’où son importance majeure
dans les problèmes d’évolution en physique ou en biologie (par exemple les problèmes liés aux processus
de désintégration atomique ou aux processus d’évolution de population du type “proie-prédateur”). On
y reviendra.
3.6. QUELQUES FONCTIONS CLASSIQUES ET LEURS INVERSES 77
Une autre approche de la fonction exponentielle consiste à remarquer (on le justifiera plus loin) qu’on
l’obtient comme la limite suivante :
( x )n
∀x ∈ R , exp x = lim 1 + . (∗)
n→+∞ n
On justifiera cette formule (∗) plus loin. On peut cependant expliquer comment on peut la deviner en
raisonnant comme suit. On aurait pu deviner la formule (∗) pour x > 0 en essayant de modéliser de
manière numérique la recherche d’une fonction dérivable au voisinage de [0, x] et s’auto-dérivant en
elle-même. Si la fonction (inconnue, mais supposée valant 1 en x = 0) est échantillonnée aux points
0, x/N, ..., (N − 1)x/N, x, ... avec N entier très grand et que l’on pose uk = f (kx/N ), k = 0, ..., N , on
voit que la suite (uk )k doit se plier à la règle récurrente :
x x
uk+1 − uk = f ((k + 1)x/N ) − f (kx/N ) ≃ f (kx/N ) = uk ;
N N
partant de u0 = 1, on aboutit à
( x )k
uk = 1 + ;
N
( x )N
en particulier uN = 1 + . Si l’on choisit le pas x/N de plus en plus petit pour “pister” au
N
mieux la fonction f , on voit que le calcul nous conduit naturellement vers la construction de la fonction
exponentielle. On attribue au mathématicien suisse Leonhard Euler (1707-1783) cette méthode devenue
le prototype de la méthode numérique dite des éléments finis permettant la résolution des équations
différentielles dont y ′ = y est le prototype.
La fonction exponentielle est une fonction strictement croissante sur R car si x2 > x1 ,
et, comme fonction bijective de R dans ]0, +∞[, admet donc une fonction réciproque (dite logarithme
népérien) :
Définition 3.12. La fonction logarithme népérien est la fonction bijective de ]0, +∞[ dans R définie
comme la fonction réciproque de la fonction exponentielle, c’est-à-dire :
( ) ( )
(x ∈ R) ∧ (y = exp x) ⇐⇒ (y ∈]0, +∞[) ∧ (x = log y) .
La fonction logarithme y 7−→ log y est une fonction strictement croissante sur ]0, +∞[, dérivable d’après
la proposition 3.11, et de dérivée la fonction
1
y→ .
y
Plus généralement, à cause de la règle de Leibniz, si a est un nombre réel, la fonction composée
y → log |y − a|
est une fonction dérivable sur R \ {a}, de dérivée en tout point de cet ensemble ouvert la fonction
1
y→
y−a
78 CHAPITRE 3. FONCTIONS NUMÉRIQUES ET MODÉLISATION
(on fera la vérification pour x > a et x < a). Il est très important de remarquer que si a est une nombre
réel et n un entier relatif, les fonctions f dérivables sur R \ {a} et telles que
∀y1 ∈]0, +∞[ , ∀y2 ∈]0, +∞[ , log(y1 y2 ) = log y1 + log y2 . (††)
x ∈ R 7−→ ax := ex log a ,
(en prenant le deux suites (A2p )p≥0 et (A2p+1 )p≥0 , on a affaire à deux suites adjacentes ayant même
limite). La fonction cos est ainsi dérivable en x = 0 et de dérivée 0.
La fonction x → sin x sera, elle, la fonction impaire définie pour x ≥ 0 par
(∑
n
x2k+1 )
sin x := lim (−1)k = lim Bn (x)
n→+∞ (2k + 1)! n→+∞
k=0
(en prenant les deux suites (B2p )p≥0 et (B2p+1 )p≥0 , on a affaire à deux suites adjacentes ayant même
limite). La fonction sin est ainsi dérivable en x = 0 et de dérivée 1.
La formule du binôme (c’est un peu plus compliqué que pour l’exponentielle et on l’admettra) implique
les deux relations clef
cos′ = − sin
sin′ = cos .
On constate (du fait que cos x est atteint comme limite de suites adjacentes) que
cos 0 = 1>0
22 24 16
cos 2 ≤ 1− + =1−2+ = −1/3 < 0 ;
2! 4! 24
d’après le théorème des valeurs intermédiaires
{x ∈ [0, 2] ; cos x = 0} ̸= ∅
80 CHAPITRE 3. FONCTIONS NUMÉRIQUES ET MODÉLISATION
cos2 + sin2 ≡ 1
nous assure donc, puisque cos(π/2) = 0, que sin(π/2) = ±1 ; mais comme la fonction cos est croissante
sur [0, π/2] (car de dérivée sin positive sur [0, π/2]), on a nécessairement sin(π/2) = 1.
Armés des deux relations (3.1), nous constatons que les fonctions cos et sin sont périodiques de période
2π, ce qui signifie
On constate aussi (si l’on regarde le sens de variations des deux fonctions cos et sin) que l’application
permet de paramétrer de manière bijective le cercle unité de R2 , les deux fonctions coordonnées ainsi
définies correspondant aux prises de lignes trigonométriques cos et sin d’un angle (exprimé en radians)
au sens de la trigonométrie usuelle.
Les fonctions cos x et sin x représentent donc bien les lignes trigonométriques du nombre réel x.
Le nombre π/2 (premier zéro strictement positif de la fonction continue x → cos x) correspond à
la mesure de l’angle droit orienté dans le sens trigonométrique, et donc, on le verra plus loin, à la
longueur du quart de périmètre de cercle unité, la longueur étant calculée par approximations du quart
de circonférence par des lignes polygonales. Les fonctions cos et sin que l’on vient d’introduire, ainsi
d’ailleurs que le nombre π sont bien celles que l’on connaissait déjà !
On a vu que la fonction sin est strictement croissante de [−π/2, π/2] dans [−1, 1] et admet une fonction
inverse strictement croissante Arcsin : [−1, 1] 7−→ [−π/2, π/2]. D’après la proposition 3.11, la fonction
y 7−→ Arcsin y
1 1
y→ =√ .
cos(Arcsin y) 1 − y2
La fonction cos est strictement décroissante de [0, π] dans [−1, 1] et admet une fonction inverse stricte-
ment décroissante Arcos : [−1, 1] 7−→ [0, π]. D’après la proposition 3.11, la fonction
y 7−→ Arcos y
3.6. QUELQUES FONCTIONS CLASSIQUES ET LEURS INVERSES 81
1 1
y→− = −√ .
sin(Arcos y) 1 − y2
Le fait que les dérivées de Arcsin et Arcos soient opposées résulte de la formule
π
Arcsin y + Arcos y ≡ ∀y ∈ [−1, 1] .
2
Une troisième fonction trigonométrique est importante : c’est la fonction tangente, définie par
sin x
tan x := , x ∈]π/2, π/2[ ,
cos x
lim tan x = +∞
x→π/2−
lim tan x = −∞ ).
x→−π/2+
La fonction tangente se prolonge par π-périodicité en une fonction continue (surjective, bien sûr non
injective) de E = R \ {(2k + 1)π/2 ; kZ} dans R. La fonction x 7−→ tan x ainsi prolongée est dérivable
sur E, de dérivée
x → tan′ (x) = 1 + tan2 x .
Elle admet sur ] − π/2, π/2[ une fonction réciproque, strictement croissante de R dans ] − π/2, π/2[, la
fonction
y 7−→ Arctan y
On a
π
lim Arctan x = −
x→−∞ 2
π
lim Arctan x =
x→+∞ 2
1 1
Arctan ′ (y) = = .
1 + tan2 (Arctan y) 1 + y2
−1
−2
−3
−4
−8 −6 −4 −2 0 2 4 6 8
Figure 3.9 – les graphes de la fonction tan (en pointillé) et Arctan (en plein)
La fonction Arctan peut être utilisée aux fins de trouver un paramétrage cette fois rationnel du cercle
unité du plan R2 . En effet, si t ∈ R, on a les formules de trigonométrie
cos t = cos2 (t/2) − sin2 (t/2) = 2 cos2 (t/2) − 1
sin t = 2 sin(t/2) cos(t/2) ;
pour t ∈] − π, π[, on peut transformer ces formules en introduisant u = tan(t/2), c’est-à-dire en posant
t = 2Arctan u. Comme
cos2 (t/2) + sin2 (t/2) 1
1 + tan2 (t/2) = = ,
cos2 (t/2) cos2 (t/2)
les relations deviennent :
2 1 − u2
cos t = 2
−1=
1+u 1 + u2
2u
sin t =
1 + u2
et l’application
( 1 − u2
2u )
Φ : u ∈ R 7−→ ,
1+ u2
1 + u2
est une application bijective entre R et le cercle unité privé du point (−1, 0) ; on remarque d’ailleurs
que
( 1 − u2 2u )
lim , = (−1, 0) ,
u→±∞ 1 + u2 1 + u2
3.6. QUELQUES FONCTIONS CLASSIQUES ET LEURS INVERSES 83
ce qui montre que l’application Φ peut être prolongée en une application de R ∪ {−∞, +∞} dans
le cercle unité, cette fois surjective, injective sur R et surtout, ce qui est important, rationnelle (les
applications coordonnées sont des applications rationnelles). Les deux paramètres t et u sont liés par
la relation
t = 2Arctan (u) ;
le paramètre t est une fonction dérivable (et strictement monotone) du paramètre u et l’on a
dt 2
= .
du 1 + u2
On utilisera ce paramétrage du cercle unité pour les calculs à venir d’intégrales de fonctions rationnelles
des lignes trigonométriques cos et sin.
De même que les fonctions trigonométriques cos et sin permettent de paramétrer le cercle unité,
d’équation cartésienne x2 + y 2 = 1, deux fonctions importantes en relation étroite elles aussi avec la
fonction exponentielle permettent de paramétrer une branche de l’hyperbole d’équation x2 − y 2 = 1,
autre conique importante (on appelle conique toute section plane d’un cône, les coniques se classant en
trois catégories, ellipses, paraboles et hyperboles) ; la branche ainsi paramétrée de l’hyperbole {x2 −y 2 =
1} est celle située dans le demi-plan droit {x > 0}.
La fonction cosh (cosinus hyperbolique) est la fonction paire définie sur R par
ex + e−x ∑ x2k n
cosh x := = lim .
2 n→+∞ (2k)!
k=0
C’est une fonction paire, positive (cosh x ≥ 1 pour tout x ∈ R), dérivable sur R et de dérivée la fonction
sinh (sinus hyperbolique) définie par
ex − e−x
sinh x := .
2
La fonction sinh est une fonction impaire, strictement monotone et dérivable sur R.
Les graphes de ces deux fonctions sont représentés sur la figure ci-dessous.
84 CHAPITRE 3. FONCTIONS NUMÉRIQUES ET MODÉLISATION
10
−2
−4
−6
−8
−10
−3 −2 −1 0 1 2 3
Figure 3.10 – les graphes de la fonction cosh (en pointillé) et sinh (en plein)
La fonction cosh tend vers +∞ en ±∞ plus vite que toutes les fonctions x → |x|α avec α strictement
positif ; la fonction sinh tend vers −∞ en −∞ et +∞ en +∞ (toujours en valeur absolue plus rapidement
que toutes les fonctions puissances). Les deux graphes sont asymptotiques lorsque x tend vers +∞.
Les deux fonctions sont liées par la relation
∀x ∈ R , cosh2 x − sinh2 x = 1 ,
ce qui correspond au fait que
t 7−→ (cosh t, sinh t)
correspond à une application bijective entre R et la branche de l’hyperbole du plan d’équation carté-
sienne x2 − y 2 = 1 qui est incluse dans le demi-plan {x > 0} (il existe une branche symétrique par
rapport à l’axe y ′ Oy dans le demi-plan {x < 0} qui elle est paramétrée par t 7−→ (− cosh t, sinh t)).
La fonction sinh : R −→ R strictement monotone et de dérivée cosh ne s’annulant pas sur R admet
une fonction inverse argsinh (“Argument sinus hyperbolique”) : R −→ R définie par
( ) ( )
(x ∈ R) ∧ (y = sinh x) ⇐⇒ (y ∈ R) ∧ (x = argsinh y) .
On a donc la formule
√
argsinh y = log(y + 1 + y2 )
La fonction cosh : [0, +∞[−→ [1, +∞[ est strictement monotone et a pour dérivée sur ]0, +∞[ la
fonction sinh ne s’annulant pas sur ]0, +∞[ ; elle admet donc une fonction inverse argcosh (“Argument
cosinus hyperbolique” : [1, +∞[7−→ [0, +∞[ définie par
( ) ( )
(x ∈ [0, +∞[) ∧ (y = cosh x) ⇐⇒ (y ∈ [1, +∞[) ∧ (x = argcosh y) .
Cette fonction est (d’après la proposition 3.11) dérivable sur ]1, +∞[, de dérivée :
1 1
argcosh ′ (y) = =√ .
sinh(argcosh (y)) y −1
2
En fait, la fonction argcosh se calcule en remarquant que si y est un nombre réel supérieur où égal à 1,
l’équation
ex + e−x
=y
2
équivaut au système
x ≥0
X = ex
X − 2yX + 1
2
= 0,
On a donc la formule
√
argcosh y = log(y + y 2 − 1)
Les graphes de ces deux fonctions argsinh et argcosh sont représentés sur la figure ci-dessous :
86 CHAPITRE 3. FONCTIONS NUMÉRIQUES ET MODÉLISATION
2.5
1.5
0.5
−0.5
−1
−1.5
−2
−2.5
−5 −4 −3 −2 −1 0 1 2 3 4 5
Figure 3.11 – les graphes de la fonction argcosh (en pointillé) et argsinh (en plein)
sinh x
tanh : x ∈ R 7−→ ;
cosh x
cette fonction (dite fonction tangente hyperbolique) est une fonction dérivable sur R, de dérivée
cosh2 x − sinh2 x 1
(tanh)′ (x) = = = 1 − tanh2 (x) ;
cosh2 x cosh2 x
c’est donc (d’après la proposition 3.11) une fonction strictement croissante de R dans ]−1, 1[, admettant
une fonction réciproque elle aussi strictement croissante de ] − 1, 1[ dans R. La fonction réciproque est
appelée fonction argument tangente hyperbolique et est notée et définie par la règle
( ) ( )
(x ∈ R) ∧ (y = tanh x) ⇐⇒ (y ∈] − 1, 1[) ∧ (x = argtanh y) .
en remarquant que la différence des fonctions figurant aux deux membres est dérivable et de dérivée
nulle, donc que cette différence est constante (proposition 3.12) et égale à sa valeur en 0 (soit ici 0).
3.7. FONCTIONS DE DEUX OU TROIS VARIABLES : UNE INITIATION 87
– enfin, on a [ ]
λ · µ · (x, y) = λµ · (x, y)
Les deux vecteurs ⃗i := (1, 0) et ⃗j := (0, 1) constituent la base canonique de R2 et les deux nombres réels
x et y constituent les coordonnées cartésiennes 2 . Les coordonnées cartésiennes permettent le repérage
des points du plan et la mise en équations des problèmes géométriques posés dans le plan ; c’est sur ce
principe que repose la géométrie cartésienne.
Comme le couple (x, y) peut aussi être repéré par son affixe, à savoir le nombre complexe x + iy,
le plan R2 s’identifie à C et, sous cet angle, on parle encore de plan complexe à propos de R2 . Les
⃗ ̸= (0, 0) du plan vectoriel R2 peuvent être ainsi repérés non seulement par leurs coordonnées
vecteurs V
cartésiennes, mais aussi par leurs coordonnées polaires :
x y
cos θ := √ et sin θ := √ .
x + y2
2 x + y2
2
Le nombre positif r est le module du vecteur V ⃗ et l’on dit que les nombres θ + 2kπ (k ∈ Z) sont les
déterminations de l’argument de ce même vecteur (x, y). De même, un point M ̸= (0, 0) de R2 peut
−−→ −−→
être repéré par sa distance r = ∥OM ∥ à l’origine (0, 0) du plan et par l’angle de vecteurs θ := (⃗i, OM )
(défini modulo 2π), ce qui donne
ou encore
−−→
OM = r(cos θ ⃗i + sin θ ⃗j) .
s’interprète, lui, comme la « colatitude » du point M sur la sphère de centre (0, 0, 0) et de rayon r, cette
colatitude étant mesurée depuis le « pôle nord » (0, 0, r(M )). Les deux angles θ ∈ [0, 2π[ et φ ∈ [0, π]
permettant, avec en plus la connaissance de r = (M ), le repérage du point M , sont dits angles d’Euler
et on a
−−→
OM = x⃗i + y ⃗j + z ⃗k = r sin φ(cos θ ⃗i + sin θ ⃗j) + r cos φ ⃗k . (3.2)
Un point M = (x, y, z) ̸= (0, 0, 0) de l’espace affine R3 peut être repéré en coordonnées cylindriques. La
première de ces coordonnées est la quantité
√
ρ = ρ(M ) = x2 + y 2 ;
si ρ > 0, la seconde coordonnée cylindrique de M est encore l’unique nombre réel θ ∈ [0, 2π[ défini par
les deux conditions
x y
cos θ := √ et sin θ := √ ;
2
x +y 2 x + y2
2
⟨(x1 , y1 ) , (x2 , y2 )⟩ := x1 x2 + y1 y2 .
Les deux vecteurs (x1 , y1 ) et (x2 , y2 ) sont dits orthogonaux si ce produit scalaire est nul.
La distance euclidienne 4 entre deux points M1 := (x1 , y1 ) et M2 := (x2 , y2 ) du plan est par définition
√ √
−−−−→ −−−−→
d(M1 , M2 ) := (x2 − x1 ) + (y2 − y1 ) = ⟨M1 M2 , M1 M2 ⟩ .
2 2
−−−−→ −−−−→
si en particulier les deux vecteurs M1 M2 et M2 M3 sont orthogonaux, on a
ce qui signifie que le carré de l’hypoténuse d’un triangle rectangle est égal à la somme des carrés des
côtés adjacents à l’angle droit.
Si (x1 , y1 ) et (x2 , y2 ) sont deux vecteurs non nuls, on remarque que l’on a la formule algébrique
ou encore
(⟨ ⟩ )2 ( )2
(x1 , y1 ) , (x2 , y2 ) x1 y2 − x2 y1
√ √ + √ 2 √ = 1.
x21 + y12 x22 + y22 x1 + y12 x22 + y22
4. C’est à Euclide (environ 330-260 A.C) et à ses Eléments que cette terminologie fait ici référence.
5. Pythagore a-t’il réellement existé comme individu ? Était-ce une secte ou un groupe de personnes ? Le mystère
demeure sur le mathématicien grec installé à Crotone (Calabre, autrefois Magna Grecia) autour de 500 A.C.
3.7. FONCTIONS DE DEUX OU TROIS VARIABLES : UNE INITIATION 91
Il existe donc, grâce au fait que tout point du cercle unité s’écrive de manière unique (cos θ, sin θ) avec
θ ∈ [0, 2π[, un unique réel θ ∈ [0, 2π[ tel que
⟨ ⟩
(x1 , y1 ) , (x2 , y2 )
cos θ = √ 2 √
x1 + y12 x22 + y22
x1 y2 − x2 y1
sin θ = √ 2 √ .
x1 + y12 x22 + y22
Ce nombre θ ∈ [0, 2π[ est, par définition, la mesure (en radians) de l’angle orienté formé par les vecteurs
(x1 , y1 ) et (x2 , y2 ).
⃗2 := (x2 , y2 ) sont deux vecteurs indépendants du plan, la quantité x1 y2 − x2 y1 est
⃗1 := (x1 , y1 ) et V
Si V
égale à la surface du parallélogramme construit à partir de (x1 , y1 ) et (x2 , y2 ) si le repère {(0, 0), V ⃗2 }
⃗1 , V
est direct, ou à l’opposé de cette surface si le repère {(0, 0), V ⃗2 } est un repère indirect dans le plan
⃗1 , V
lorsque celui ci est orienté de manière à ce que la base canonique {(1, 0), (0, 1)} soit une base directe.
On peut d’ailleurs plonger R2 dans R3 en identifiant les points (x, y) et (x, y, 0) et définir le vecteur
⃗1 ∧ V
V ⃗2 (dit produit extérieur de V
⃗1 , V
⃗2 ) par
V ⃗2 := (0, 0, x1 y2 − x2 y1 ) = (x1 y2 − x2 y1 ) ⃗k .
⃗1 ∧ V (3.4)
⃗1 et V
On a représenté ce vecteur (dont la longueur vaut l’aire du parallélogramme construit sur V ⃗2 ) sur
la figure suivante :
v1 ^ v2
v2
P
2 0
R v1
Un sous-ensemble U du plan est dit ouvert si, étant donné un point quelconque (x0 , y0 ) de U , il existe
un disque
D(x0 ,y0 ) (ϵ) := {(x, y) ; d((x, y), (x0 , y0 )) < ϵ}
tel que
(x0 , y0 ) ∈ D(x0 ,y0 ) (ϵ) ⊂ U .
On dit aussi que U est « voisinage » de chacun de ses points.
−−−→ −−→
Dire qu’une suite de points (Mn )n≥0 (avec OMn = (xn , yn )) converge vers le point M (tel que OM =
(x, y)) signifie
lim d((xn , yn ), (x, y)) = 0 ;
n→+∞
92 CHAPITRE 3. FONCTIONS NUMÉRIQUES ET MODÉLISATION
lim xn = x et lim yn = y .
n→+∞ n→+∞
On peut ainsi définir l’adhérence A d’un sous-ensemble A du plan comme l’ensemble des points limites
de suites de points de A et la notion de limite d’une fonction f : A → R en un point (a, b) ∈ A : dire
que
lim f (x, y) = l
(x,y)→(a,b)
(x,y)∈A
(où l ∈ R) équivaut à dire que pour toute suite ((xn , yn ))n≥0 de points de A convergeant vers (a, b), on
a
lim f (xn , yn ) = l ,
n→+∞
ou encore
( )
∀ ϵ > 0 , ∃ η > 0 , tel que d((x, y), (a, b)) < η et (x, y) ∈ A =⇒ |f (x, y) − l| < ϵ .
⟨(x1 , y1 , z1 ) , (x2 , y2 , z2 )⟩ := x1 x2 + y1 y2 + z1 z2 .
Les deux vecteurs (x1 , y1 , z1 ) et (x2 , y2 , z2 ) sont dits orthogonaux si ce produit scalaire est nul.
La distance euclidienne entre deux points M1 := (x1 , y1 , z1 ) et M2 := (x2 , y2 , z2 ) de l’espace est par
définition
√ √
−−−−→ −−−−→
d(M1 , M2 ) := (x2 − x1 )2 + (y2 − y1 )2 + (z2 − z1 )2 = ⟨M1 M2 , M1 M2 ⟩ .
Cette distance obéit (comme dans le cas du plan R2 ) aux quatre impératifs exigés d’une distance. Elle
est encore intimement liée au produit scalaire, par la formule
√⟨ ⟩
d(M1 , M2 ) = (x2 − x1 , y2 − y1 , , z2 − z1 ) , (x2 − x1 , y2 − y1 , , z2 − z1 ) ,
−−−−→ −−−−→
si en particulier les deux vecteurs M1 M2 et M2 M3 sont orthogonaux, on a
ce qui signifie encore que le carré de l’hypoténuse d’un triangle rectangle (de l’espace cette fois) est égal
à la somme des carrés des côtés adjacents à l’angle droit.
3.7. FONCTIONS DE DEUX OU TROIS VARIABLES : UNE INITIATION 93
⟨V ⃗ ⟩
⃗1 , V
√ √2
⟨V ⃗1 ⟩ ⟨V
⃗1 , V ⃗2 ⟩
⃗2 , V
est un nombre appartenant à [−1, 1], que l’on peut donc écrire de manière unique cos θ avec θ ∈ [0, π] ;
on note donc
⟨V ⃗ ⟩
⃗1 , V
cos(V ⃗2 ) := √
⃗1 , V √2 ;
⟨V ⃗1 ⟩ ⟨V
⃗1 , V ⃗2 ⟩
⃗2 , V
si ce nombre est < 0 (c’est-à-dire si θ ∈]π/2, π]), on dit que l’angle des vecteurs V
⃗1 et V
⃗2 est obtus ; si
ce nombre est > 0 (c’est-à-dire si θ ∈ [0, π/2[), on dit que l’angle des vecteurs V
⃗1 et V
⃗2 est aigu ; si ce
⃗ ⃗
nombre est nul, les vecteurs V1 et V2 sont orthogonaux.
Le produit extérieur V⃗1 ∧ V
⃗2 de deux vecteurs V
⃗1 = (x1 , y1 , z1 ) et V
⃗2 = (x2 , y2 , z2 ) est défini par les
règles « tournantes »
⃗i ∧ ⃗j = ⃗k = −⃗j ∧ ⃗i
⃗j ∧ ⃗k = ⃗i = −⃗k ∧ ⃗j
⃗k ∧ ⃗i = ⃗j = −⃗i ∧ ⃗k
⃗1 , W
pour tout choix de vecteurs V ⃗ 1, V
⃗2 , W
⃗ 2 et de scalaires λ, µ. Cela donne donc
⃗1 , V
mesure exactement le volume du parallélépipède construit à partir des trois vecteurs V ⃗2 , V
⃗3 (ce
volume étant nul dès que ce parallélépipède se trouve « aplati ») ; le nombre
⟨ ⟩
⃗1 ∧ V
V ⃗2 , V
⃗3
6. Se référer à la classique règle des trois doigts ou du bonhomme d’Ampère que vous connaissez et appliquez en
physique.
94 CHAPITRE 3. FONCTIONS NUMÉRIQUES ET MODÉLISATION
⃗1 , V
et, lui, appelé produit mixte des trois vecteurs V ⃗2 , V
⃗3 et on a
⟨ ⟩ ⟨ ⟩ ⟨ ⟩
⃗1 ∧ V
V ⃗2 , V
⃗3 = V ⃗2 ∧ V⃗3 , V ⃗1 = V ⃗3 ∧ V
⃗1 , V
⃗2
v^ v
1 2
111111111111111111111111111
000000000000000000000000000
000000000000000000000000000
111111111111111111111111111
000000000000000000000000000
111111111111111111111111111
000000000000000000000000000
111111111111111111111111111
Q
000000000000000000000000000
111111111111111111111111111
000000000000000000000000000
111111111111111111111111111
v2
000000000000000000000000000
111111111111111111111111111
000000000000000000000000000
111111111111111111111111111
000000000000000000000000000
111111111111111111111111111
000000000000000000000000000
111111111111111111111111111
000000000000000000000000000
111111111111111111111111111
000000000000000000000000000
111111111111111111111111111
P
000000000000000000000000000
111111111111111111111111111
00000
11111
000000000000000000000000000
111111111111111111111111111
00000
11111
000000000000000000000000000
111111111111111111111111111
00000
11111
v 000000000000000000000000000
111111111111111111111111111
00000
11111
000000000000000000000000000
111111111111111111111111111
3 00000
11111
000000000000000000000000000
111111111111111111111111111
00000
11111
000000000000000000000000000
111111111111111111111111111
00000
11111
000000000000000000000000000
111111111111111111111111111
000000000000000000000000000
111111111111111111111111111
000000000000000000000000000
111111111111111111111111111
v
000000000000000000000000000
111111111111111111111111111
1
000000000000000000000000000
111111111111111111111111111
000000000000000000000000000
111111111111111111111111111
000
111
000
111
000
111
000
111
000
111
000
111
000
111
000
111
000
111
000
111
000
111
000
111
000
111
000
111
Figure 3.13 – Le produit extérieur, l’aire d’un parallélogramme, le volume d’un parallélépipède
Le fait d’avoir muni R3 d’une distance permet de définir la notion d’ouvert U de R3 ainsi que la notion
de limite d’une fonction réelle en un point adhérent à son domaine de définition. Un sous-ensemble U
de l’espace est dit ouvert si, étant donné un point quelconque (x0 , y0 , z0 ) de U , il existe une sphère
pleine ouverte
S(x0 ,y0 ,z0 ) (ϵ) := {(x, y, z) ; d((x, y, z), (x0 , y0 , z0 )) < ϵ}
telle que
(x0 , y0 , z0 ) ∈ S(x0 ,y0 ,z0 ) (ϵ) ⊂ U .
On dit aussi que U est « voisinage » de chacun de ses points.
−−−→
Dire qu’une suite de points (Mn )n≥0 (avec OMn = (xn , yn , zn )) converge vers le point M (tel que
−−→
OM = (x, y, z)) signifie
lim d((xn , yn , zn ), (x, y, z)) = 0 ;
n→+∞
On peut ainsi définir l’adhérence A d’un sous-ensemble A de l’espace comme l’ensemble des points
limites de suites de points de A et la notion de limite d’une fonction f : A → R en un point (a, b, c) ∈ A :
dire que
lim f (x, y, z) = l
(x,y,z)→(a,b,c)
(x,y,z)∈A
3.7. FONCTIONS DE DEUX OU TROIS VARIABLES : UNE INITIATION 95
(où l ∈ R) équivaut à dire que pour toute suite ((xn , yn , zn ))n≥0 de points de A convergeant vers
(a, b, c), on a
lim f (xn , yn , zn ) = l
n→+∞
ou encore
( )
∀ ϵ > 0 , ∃ η > 0 , tel que d((x, y, z), (a, b, c)) < η et (x, y, z) ∈ A =⇒ |f (x, y, z) − l| < ϵ .
Si maintenant f est définie dans un voisinage ouvert U d’un point (x0 , y0 ) du plan (et est à valeurs
réelles), on dit que f est différentiable en (x0 , y0 ) s’il existe une application R-linéaire
df(x0 ,y0 ) : R2 −→ R
telle que
f (x0 + h, y0 + k) − f (x0 , y0 ) − df(x0 ,y0 ) (h, k)
lim √ = 0,
(h,k)→(0,0) h2 + k 2
(h,k)̸=(0,0)
∂f f (x0 + h, y0 ) − f (x0 , y0 )
a(x0 ,y0 ) = (x0 , y0 ) := lim
∂x h→0
∗
h
h∈R
∂f f (x0 , y0 + k) − f (x0 , y0 )
b(x0 ,y0 ) = (x0 , y0 ) := lim .
∂y k→0
∗
k
k∈R
Ces deux nombres sont appelés respectivement dérivées partielles de f par rapport à x et y au point
(x0 , y0 ) et il n’y a rien de plus facile pour les calculer que, dans l’expression de f (x, y), de « colorier »
en rouge une des deux variables x ou y, de considérer ensuite
d ∂f
[f (x, y)] = (x, y)
dx ∂x
d ∂f
[f (x, y)] = (x, y) ,
dy ∂y
96 CHAPITRE 3. FONCTIONS NUMÉRIQUES ET MODÉLISATION
les dérivations se faisant par rapport aux variables « non coloriées » (« colorier » une variable revient
donc en quelque sorte à la « geler »).
Exemple. On a
∂ [ 1 ] −2x
2 4
=
∂x 1 + x + y (1 + x2 + y4 )2
∂ [ 1 ] −4y 3
= .
∂y 1 + x2 + y4 (1 + x2 + y 4 )2
Remarque. Une application différentiable en un point (x0 , y0 ) d’un ouvert U de R2 est continue en ce point, mais
l’assertion réciproque est fausse (puisqu’elle est fausse, on la vu, dans le cas des fonctions d’une variable).
Important ! On admettra ici que si f est définie dans un ouvert U de R2 , si les dérivées partielles
∂f ∂f
(x, y) et (x, y)
∂x ∂y
existent (au sens sont calculables comme ci-dessus en tout point (x, y) de U ) et que les fonctions
∂f
(x, y) ∈ U −→ (x, y)
∂x
∂f
(x, y) ∈ U −→ (x, y)
∂y
sont continues sur U , alors f est différentiable en tout point de U et l’on a alors, bien sûr, pour tout
(x, y) ∈ U ,
∂f ∂f
∀ (h, k) ∈ R2 , df(x,y) (h, k) = (x, y) h + (x, y) k .
∂x ∂x
Le graphe d’une fonction f : A ⊂ R2 −→ R est par définition le sous-ensemble Γ(f ) de R3 donné par
Γ(f ) := {(x, y, z) ∈ R3 ; (x, y) ∈ A et z = f (x, y)} .
Par exemple, sur la figure 3.14 ci-dessous, on a figuré le graphe (représenté en trois dimensions) de
l’application
(x, y) ∈ [−10, 10] × [−10, 10] 7−→ 3x2 − 2y 2 .
300
200
100
−100
−200
10
5 10
5
0
0
−5
−5
−10 −10
Si f est une fonction définie et différentiable en tout point d’un ouvert U de R2 , le gradient de f est
par définition l’application
−→ ( ∂f ∂f )
∇f : (x, y) ∈ U 7−→ (x, y) , (x, y) ∈ R2 .
∂x ∂y
Le gradient de f est donc une application de U dans R2 qui à tout point de U associe donc un vecteur de
−→
R2 ; une telle application est dite champ de vecteurs sur U . En un point (x, y) de U où ∇f (x, y) ̸= (0, 0),
la « ligne de plus grande pente » sur le graphe de f au départ du point (x0 , y0 , f (x0 , y0 )) est la courbe
ainsi paramétrée par le paramètre t (voisin de 0) :
−→
(x, y) = (x0 , y0 ) + t ∇f (x0 , y0 )
( −→ )
z = f (x0 , y0 ) + t ∇f (x0 , y0 ) ;
(on remarque d’ailleurs que t 7−→ z(t) est une fonction croissante de t au voisinage de t = 0) ; cela
résulte de ce que, pour (h, k) voisin de (0, 0),
⟨−→ ⟩
f (x0 + h, y0 + k) ≃ f (x0 , y0 ) + ∇f (x0 , y0 ) , (h, k) ,
Si maintenant f est définie dans un voisinage ouvert U d’un point (x0 , y0 , z0 ) du plan (et est à valeurs
réelles), on dit que f est différentiable en (x0 , y0 , z0 ) s’il existe une application R-linéaire
telle que
f (x0 + h, y0 + k, z0 + l) − f (x0 , y0 , z0 ) − df(x0 ,y0 ,z0 ) (h, k, l)
lim √ = 0,
(h,k,l)→(0,0) h2 + k 2 + l2
(h,k,l)̸=(0,0)
∂f f (x0 + h, y0 , z0 ) − f (x0 , y0 , z0 )
a(x0 ,y0 ,z0 ) = (x0 , y0 , z0 ) := lim
∂x h→0
∗
h
h∈R
∂f f (x0 , y0 + k, z0 ) − f (x0 , y0 , z0 )
b(x0 ,y0 ,z0 ) = (x0 , y0 , z0 ) := lim
∂y k→0
∗
k
k∈R
∂f f (x0 , y0 , z0 + l) − f (x0 , y0 , z0 )
c(x0 ,y0 ,z0 ) = (x0 , y0 , z0 ) := lim .
∂z l→0
∗
l
l∈R
Ces trois nombres sont appelés respectivement dérivées partielles de f par rapport à x, y, z au point
(x0 , y0 , z0 ) et il n’y a rien de plus facile pour les calculer que, dans l’expression de f (x, y, z), de « colorier »
en rouge deux des trois variables {y, z}, {x, z}, {x, y}, de considérer ensuite
d ∂f
[f (x, y, z)] = (x, y, z)
dx ∂x
d ∂f
[f (x, y, z)] = (x, y, z)
dy ∂y
d ∂f
[f (x, y, z)] = (x, y, z) ,
dz ∂z
les dérivations se faisant par rapport aux variables « non coloriées » (« colorier » une variable revient
donc en quelque sorte à la « geler »).
Exemple. On a
∂ [ 1 ] −2x
=
∂x 1 + x2 + y4 + z6 (1 + x2 + y4 + z6 )2
∂ [ 1 ] −4y 3
=
∂y 1 + x2 + y4 + z6 (1 + x2
+ y 4 + z6 ) 2
∂ [ 1 ] −6z 5
2 4 6
=
∂z 1 + x + y + z (1 + x2 + y4 + z 6 )2
Remarque. Une application différentiable en un point (x0 , y0 , z0 ) d’un ouvert U de R3 est continue en ce point, mais
l’assertion réciproque est fausse (puisqu’elle est fausse, on la vu, dans le cas des fonctions d’une ou de deux variables).
Important ! On admettra ici que si f est définie dans un ouvert U de R3 , si les dérivées partielles
∂f ∂f ∂f
(x, y, z) , (x, y, z) et (x, y, z)
∂x ∂y ∂z
existent (au sens sont calculables comme ci-dessus en tout point (x, y, z) de U ) et que les fonctions
∂f
(x, y, z) ∈ U −→ (x, y, z)
∂x
∂f
(x, y, z) ∈ U −→ (x, y, z)
∂y
∂f
(x, y, z) ∈ U −→ (x, y, z)
∂z
3.7. FONCTIONS DE DEUX OU TROIS VARIABLES : UNE INITIATION 99
sont continues sur U , alors f est différentiable en tout point de U et l’on a alors, bien sûr, pour tout
(x, y, z) ∈ U ,
∂f ∂f ∂f
∀ (h, k, l) ∈ R3 , df(x,y,z) (h, k, l) = (x, y, z) h + (x, y, z) k + (x, y, z) l .
∂x ∂x ∂x
Le graphe d’une fonction f : A ⊂ R3 −→ R est par définition le sous-ensemble Γ(f ) de R4 donné par
La représentation graphique de Γ(f ) n’est cette fois plus possible comme elle l’était pour une fonction
de deux variables (on ne peut visualiser les objets en quatre dimensions).
Si f est une fonction définie et différentiable en tout point d’un ouvert U de R3 , le gradient de f est
par définition l’application
−→ ( ∂f ∂f ∂f )
∇f : (x, y, z) ∈ U 7−→ (x, y, z) , (x, y, z) , (x, y, z) ∈ R3 .
∂x ∂y ∂z
Le gradient de f est donc une application de U dans R3 qui à tout point de U associe donc un vecteur
de R3 ; une telle application est dite encore champ de vecteurs sur U . En un point (x, y, z) de U
−→
où ∇f (x, y, z) ̸= (0, 0, 0), la « ligne de plus grande pente » sur le graphe de f au départ du point
(x0 , y0 , z0 , f (x0 , y0 , z0 )) est la courbe ainsi paramétrée par le paramètre t (voisin de 0) :
−→
(x, y, z) = (x0 , y0 , z0 ) + t ∇f (x0 , y0 , z0 )
( −→ )
w = f (x0 , y0 , z0 ) + t ∇f (x0 , y0 , z0 ) ;
(on remarque d’ailleurs que t 7−→ w(t) est une fonction croissante de t au voisinage de t = 0) ; cela
résulte de ce que, pour (h, k, l) voisin de (0, 0, 0),
⟨−→ ⟩
f (x0 + h, y0 + k, z0 + l) ≃ f (x0 , y0 , z0 ) + ∇f (x0 , y0 , z0 ) , (h, k, l) ,
Ainsi, c’est en se déplaçant sur le graphe de f suivant (en (x, y, z)) la direction que nous indique à
chaque instant le gradient de f (resp. son opposé) que l’on peut espérer se rapprocher au plus vite des
points où f présente un maximum (resp. un minimum) local. On retrouve ici encore, pour les fonctions
de trois variables cette fois, la méthode du gradient.
Exemple 1
Supposons que
γ : I ⊂ R 7−→ γ(t) = (x(t), y(t))
soit une application différentiable d’un intervalle I de R, à valeurs dans R2 , ce qui signifie que les
fonctions t 7−→ x(t) et t 7−→ y(t) sont dérivables en tout point de I (une telle application est appelée
un arc paramétré plan différentiable). Supposons que F soit une application définie et différentiable sur
un ouvert U de R2 , avec γ(I) ⊂ U .
La fonction F ◦ γ est alors dérivable en tout point de I, de dérivée
∂F ∂F ⟨−−→ ⟩
(F ◦ γ)′ (t) = (x(t), y(t)) x′ (t) + (x(t), y(t)) y ′ (t) = ∇F (x(t), y(t)) , (x′ (t), y ′ (t)) .
∂x ∂y
Exemple 2
Supposons que
γ : I ⊂ R 7−→ γ(t) = (x(t), y(t), z(t))
soit une application différentiable d’un intervalle I de R, à valeurs dans R3 , ce qui signifie que les
fonctions t 7−→ x(t), t 7−→ y(t) et t 7−→ z(t) sont dérivables en tout point de I (une telle application
est appelée un arc paramétré gauche différentiable). Supposons que F soit une application définie et
différentiable sur un ouvert U de R3 , avec γ(I) ⊂ U .
La fonction F ◦ γ est alors dérivable en tout point de I, de dérivée
∂F ∂F ∂F
(F ◦ γ)′ (t) = (x(t), y(t), z(t)) x′ (t) + (x(t), y(t), z(t)) y ′ (t) + (x(t), y(t), z(t)) z ′ (t)
∂x ∂y ∂z
⟨−−→ ⟩
= ∇F (x(t), y(t), z(t)) , (x′ (t), y ′ (t), z ′ (t)) .
Exemple 3
Soit F : (u, v) 7−→ (x(u, v), y(u, v)) une application d’un ouvert U de R2 , à valeurs dans R2 , telle
que les applications coordonnées x et y soient toutes les deux différentiables en tout point de U . Soit
V un ouvert de R2 contenant F (U ) et G une application différentiable de V dans R.
L’application G ◦ F : U −→ R est différentiable en tout point (u, v) de U et on a
∂[G ◦ F ] ∂G ∂x ∂G ∂y
(u, v) = (F (u, v)) + (F (u, v))
∂u ∂x ∂u ∂y ∂u
∂[G ◦ F ] ∂G ∂x ∂G ∂y
(u, v) = (F (u, v)) + (F (u, v)) .
∂v ∂x ∂v ∂y ∂v
3.7. FONCTIONS DE DEUX OU TROIS VARIABLES : UNE INITIATION 101
Pour voir ce résultat, il suffit d’écrire explicitement ce que signifie la différentiabilité de G en F (u, v),
soit
et de remarquer que
√
x(u + h, v + k) = x(u, v) + dx(u,v) (h, k) + o( h2 + k 2 ) = x(u, v) + H
√
y(u + h, v + k) = y(u, v) + dy(u,v) (h, k) + o( h2 + k 2 ) = y(u, v) + K
et si G est une application différentiable dans le secteur ouvert F (]r1 , r2 [×]θ1 , θ2 [) du plan et à valeurs dans R, la fonction
Exemple 4
Soit F : (u, v, w) 7−→ (x(u, v), y(u, v)) une application d’un ouvert U de R3 , à valeurs dans R3 , telle
que les applications coordonnées x, y, z soient toutes les trois différentiables en tout point de U . Soit
V un ouvert de R3 contenant F (U ) et G une application différentiable de V dans R.
L’application G ◦ F : U −→ R est différentiable en tout point (u, v, w) de U et on a
∂[G ◦ F ] ∂G ∂x ∂G ∂y ∂G ∂z
(u, v, w) = (F (u, v, w)) + (F (u, v, w)) + (F (u, v, w))
∂u ∂x ∂u ∂y ∂u ∂z ∂u
∂[G ◦ F ] ∂G ∂x ∂G ∂y ∂G ∂z
(u, v, w) = (F (u, v, w)) + (F (u, v, w)) + (F (u, v, w))
∂v ∂x ∂v ∂y ∂v ∂z ∂v
∂[G ◦ F ] ∂G ∂x ∂G ∂y ∂G ∂z
(u, v, w) = (F (u, v, w)) + (F (u, v, w)) + (F (u, v, w)) .
∂w ∂x ∂w ∂y ∂w ∂z ∂w
Pour voir ce résultat, il suffit d’écrire explicitement ce que signifie la différentiabilité de G en F (u, v, w),
soit
et de remarquer que
√
x(u + h, v + k, w + l) = x(u, v, w) + dx(u,v,w) (h, k, l) + o( h2 + k 2 + l2 ) = x(u, v, w) + H
√
y(u + h, v + k, w + l) = y(u, v, w) + dy(u,v,w) (h, k, l) + o( h2 + k 2 + l2 ) = y(u, v, w) + K
√
z(u + h, v + k, w + l) = z(u, v, w) + dz(u,v,w) (h, k, l) + o( h2 + k 2 + l2 ) = z(u, v, w) + L
∂2f d [ ∂f ]
(x0 , y0 ) = (x, y) (x0 , y0 )
∂x2 dx ∂x
∂2f d [ ∂f ]
(x0 , y0 ) = (x, y) (x0 , y0 )
∂y∂x dy ∂x
∂2f d [ ∂f ]
(x0 , y0 ) = (x, y) (x0 , y0 )
∂x∂y dx ∂y
∂2f d [ ∂f ]
(x0 , y0 ) = (x, y) (x0 , y0 )
∂y 2 dy ∂y
(mêmes règles de « coloriage » des variables que précédemment pour effectuer ces calculs de dérivées
partielles à l’ordre 2 du point de vue pratique). En fait, un lemme important de calcul différentiel, le
lemme de Schwarz 7 , assure, lorsque f est deux fois différentiable au point (x0 , y0 ) l’égalité automatique
des dérivées croisées
∂2f ∂2f
(x0 , y0 ) = (x0 , y0 ) .
∂y∂x ∂x∂y
7. On admettra ici ce lemme attribué au mathématicien allemand Hermann Schwarz (1843-1921), constamment utilisé
en analyse.
3.7. FONCTIONS DE DEUX OU TROIS VARIABLES : UNE INITIATION 103
ce qui permet d’approcher les variations de f au voisinage de (x0 , y0 ) à l’ordre deux en fonction de la
petite perturbation (h, k).
Pour une fonction de trois variables, les dérivées partielles à l’ordre 2 sont :
∂2f d [ ∂f ]
(x0 , y0 , z0 ) = (x, y, z) (x0 , y0 , z0 )
∂x2 dx ∂x
∂2f d [ ∂f ] ∂2f d [ ∂f ]
(x0 , y0 , z0 ) = (x, y, z) (x0 , y0 , z0 ) = (x0 , y0 , z0 ) = (x, y, z) (x0 , y0 , z0 )
∂y∂x dy ∂x ∂x∂y dx ∂y
∂2f d [ ∂f ] ∂2f d [ ∂f ]
(x0 , y0 , z0 ) = (x, y, z) (x0 , y0 , z0 ) = (x0 , y0 , z0 ) = (x, y, z) (x0 , y0 , z0 )
∂z∂x dz ∂x ∂x∂z dx ∂z
∂2f d [ ∂f ]
(x0 , y0 , z0 ) = (x, y, z) (x0 , y0 , z0 )
∂y 2 dy ∂y
∂2f d [ ∂f ] ∂2f d [ ∂f ]
(x0 , y0 , z0 ) = (x, y, z) (x0 , y0 , z0 ) = (x0 , y0 , z0 ) = (x, y, z) (x0 , y0 , z0 )
∂z∂y dz ∂y ∂y∂z dy ∂z
∂2f d [ ∂f ]
(x0 , y0 , z0 ) = (x, y, z) (x0 , y0 , z0 )
∂z 2 dz ∂z
(mêmes règles de « coloriage » des variables que précédemment pour effectuer ces calculs de dérivées
partielles à l’ordre 2 du point de vue pratique). Les égalités entre dérivées « croisées » viennent encore
du lemme de Schwarz. Formellement, on peut même écrire, si f est deux fois différentiable en (x0 , y0 , z0 ),
( ∂ ∂ ∂ )
f (x0 + h, y0 + k, z0 + l) = f (x0 , y0 ) + h +k +l [f ](x0 , y0 )
∂x ∂y ∂z
1( ∂ ∂ ∂ )2
+ h +k +l [f ](x0 , y0 , z0 ) + o(h2 + k 2 + l2 ) ,
2 ∂x ∂y ∂z
ce qui permet d’approcher les variations de f au voisinage de (x0 , y0 , z0 ) à l’ordre deux en fonction de
la petite perturbation (h, k, l).
Une fonction f de deux ou trois variables, à valeurs réelles, qui admet des dérivées partielles jusqu’à
l’ordre 2 continues sur un ouvert U est deux fois dfférentiable en tout point de cet ouvert ; pour rendre
compte de la continuité des dérivées partielles à l’ordre 2 sur U , on dit que f est de classe C 2 dans
l’ouvert U .
Pour une fonction de classe C 2 dans un ouvert U de R2 , on définit le laplacien 8 de f comme la fonction
∂2f ∂2f
∆[f ] := 2
+ 2;
∂x ∂y
c’est donc une fonction continue de U dans R. Même chose pour une fonction de classe C 2 dans un
ouvert U de R3 , dont le laplacien est défini comme la fonction
Le laplacien est un opérateur différentiel du second ordre très important du point de vue pratique :
pour les fonctions de plusieurs variables, c’est lui qui permet de mettre en évidence les variations
d’une fonction (par exemple les « lignes de rupture » et les « contours » des objets dans une image
2-dimensionnelle), ce que fait la dérivée pour les fonctions d’une variable.
De même, un champ de vecteurs dans un ouvert U de l’espace est la donnée d’une application de U
dans R3 .
Si (x, y, z) 7−→ F⃗ (x, y, z) est un champ de vecteurs dans un ouvert U de R3 et si les applications
coordonnées P, Q, R de F⃗ = P ⃗i + Q ⃗j + R ⃗k sont différentiables dans U , on associe au champ de
vecteurs F⃗ un nouveau champ de vecteurs dans l’ouvert U , le rotationnel de F⃗ , défini formellement par
−→ ⃗ ( ∂ )
rot F : = ⃗i + ∂ ⃗j + ∂ ⃗k ∧ (P ⃗i + Q ⃗j + R ⃗k)
∂x ∂y ∂z
( ∂R ∂Q ) ( ) ( )
= − ⃗i + ∂P − ∂R ⃗j + ∂Q − ∂P ⃗k
∂y ∂z ∂z ∂x ∂x ∂y
(le produit extérieur de deux vecteurs de l’espace ayant été défini en (3.5), remarquer encore l’aspect
« tournant » des formules pour les retenir).
−→
Lorsque F⃗ s’écrit ∇f , où f est une fonction de classe C 2 dans U (on dit aussi dans ce cas que le champ
de vecteurs F⃗ dérive du potentiel scalaire f ), alors on a
−→ ⃗ −→ −→
rot F = rot (∇f ) ≡ ⃗0 ,
autrement dit le rotationnel d’un champ dérivant d’un potentiel est nul (il suffit de faire le calcul et
d’appliquer le lemme de Schwarz assurant l’égalité des dérivées secondes croisées).
Lorsque U est un ouvert de R2 et F⃗ = (P, Q) un champ de vecteurs différentiable dans U , on peut
considérer le champ de vecteurs
dans l’ouvert U × R de R3 ; on a
−→ ⃗ ( ∂Q ∂P )
rot F = − ⃗k .
∂x ∂y
3.7. FONCTIONS DE DEUX OU TROIS VARIABLES : UNE INITIATION 105
−→
Ce rotationnel est nul si F⃗ s’écrit ∇f , où f est une fonction de classe C 2 de U dans R. Le rotationnel
⃗ ainsi associé au champ de vecteurs F⃗ = (P, Q) dans l’ouvert U de R2 est un champ de vecteurs
de F
mettant en évidence les aspects « tourbillonaires » du champ F⃗ , d’où la terminologie de rotationnel ;
voici par exemple (sur la figure 3.15 ci-dessous) l’image de
∂Q ∂P
−→ ⃗
(x, y) 7−→ − = ∥rot F∥
∂x ∂y
lorsque F⃗ = (P, Q) est le champ de vitesse des particules dans un écoulement turbulent (on note la
mise en évidence des tourbillons).
Exemples. Si F⃗ =− →
∇f , où f est une fonction de classe C 2 d’un ouvert U de R3 dans R, on a
−→ ∂ [ ∂f ] ∂ [ ∂f ] ∂ [ ∂f ]
div (∇f ) = + + = ∆f .
∂x ∂x ∂y ∂y ∂z ∂z
⃗ =−
Si F
→⃗
rot G, ⃗ = (P, Q, R) est un champ de vecteurs de classe C 2 dans un ouvert U de R3 , on a
où G
−→⃗ ∂ ( ∂R ∂Q ) ∂ ( ∂P ∂R ) ∂ ( ∂Q ∂P )
div (rot G) = − + − + − ≡0
∂x ∂y ∂z ∂y ∂z ∂x ∂z ∂x ∂y
106 CHAPITRE 3. FONCTIONS NUMÉRIQUES ET MODÉLISATION
Voici un petit formulaire récapitulatif des opérations sur les champs de vecteurs ou les fonctions scalaires.
−→ −−→
rot [∇ F ] = ⃗0
−→ ⃗ −→ −→
rot [f F ] = ∇f ∧ F⃗ + f rot f⃗
−→
div [∇f ] = ∆f
−→ ⃗
div [rot G] =0
−→
div [f F⃗ ] = ⟨∇f , F⃗ ⟩ + f div F⃗
−→ −→
div [F⃗1 ∧ F⃗2 ] = ⟨rot F⃗1 , F⃗2 ⟩ − ⟨rot F⃗2 , F⃗1 ⟩
[ √ ]
∆ log x2 + y 2 = 0 ∀ (x, y) ∈ R2 \ {(0, 0)}
[ 1 ]
∆ −√ =0 ∀ (x, y, z) ∈ R3 \ {(0, 0, 0)}
x2 + y 2 + z 2
P := [a1 , b1 ] × [a2 , b2 ]
(avec −∞ < aj < bj < +∞, j = 1, 2) ; cette aire vaut par définition
On sait donc aussi calculer l’aire d’une union finie R de pavés en découpant cette union comme une
mosaïque de pavés P ′ dont les intérieurs ]a1 , b1 [×]a2 , b2 [ sont disjoints ; l’aire de l’union est dans ce cas
la somme des aires des pavés P ′ (voir figure 3.16 ci-dessous).
3.8. AIRES, INTÉGRATION, PRIMITIVES 107
P
P P’
P’ P’
P’
La physique fait apparaître bien souvent des structures (qualifiées de fractales) s’auto-reproduisant à
toutes les échelles, comme par exemple le flocon de neige (on a déjà rencontré le flocon de von Koch) ;
si l’on imagine un tel flocon planaire ou une figure fractale telle l’ensemble de Mandelbrojt représenté
en clair sur la figure 3.17 suivante, il est difficile d’emblée de décider quelle est l’aire de ce domaine !
Dans l’espace, la situation est encore plus compliquée : quelle est par exemple l’aire (ramenée à une
aire plane) d’un piton rocheux tel l’aiguille du Midi à Chamonix ?
20
40
60
80
100
120
140
Le paradoxe de Banach-Tarski évoqué au chapitre 1 (on peut découper une sphère pleine comme un
puzzle et réaliser avec les morceaux une sphère pleine de volume double) nous laisse pressentir qu’il
existe des sous-ensembles de l’espace R3 que l’on sera toujours incapable de mesurer ; il en est de même
dans le plan.
La méthode la plus naïve de tenter de calculer une aire est inspirée des probabilités et est d’origine très
ancienne : supposons par exemple que le “cadre” de la figure 3.17 soit d’aire normalisée égale à 1. On
jette des points sur ce cadre, tous les points de chute étant équiprobables. On fait cela un nombre N
(très très grand de fois), puis on divise par N le nombre de jets (Nfav ) où le point est tombé sur la cible
(le domaine A dont on veut calculer l’aire). Dans les bons cas (c’est-à-dire lorsque parler de cette aire a
un sens), la loi des grands nombres (outil clef du principe sur lequel se fonde le raisonnement statistique,
comme dans les sondages d’opinion par exemple) permet d’assurer que lorsque N (le nombre de jets,
108 CHAPITRE 3. FONCTIONS NUMÉRIQUES ET MODÉLISATION
ceux ci étant supposés indépendants) tend vers +∞, alors le quotient Nfav /N tend vers l’aire de A.
Cette méthode très intuitive est connue comme la méthode de Monte Carlo et permet, lentement, c’est
vrai, de calculer l’aire d’un domaine si cela est possible.
Nous nous proposons maintenant de décrire succintement, après les méthodes d’inspiration “probabi-
liste”, les méthodes numériques de calcul d’aire ; ce sont bien sûr elles qui, dans 99% des cas, sont les
seules utilisables pour calculer une aire (et donc une intégrale). Ce sont ces méthodes qui ont guidé
la genèse de la théorie de l’intégration, depuis Riemann au XIX-ème siècle jusqu’à Henri Lebesgue au
début du XX-ème siècle. C’est le point de vue de Lebesgue qui soutend ici en filigramme notre esquisse
de présentation. Les méthodes passant par la recherche de formules exactes ne sont utilisables que dans
des cas très particulier que nous décrirons ultérieurement (sections 3.7.2 et 3.7.3 à venir).
Ce qu’il est a priori facile de faire est de tenter de mesurer un ensemble borné A du plan “de l’extérieur”
en définissant son aire supérieure comme la borne inférieure (c’est-à-dire le plus grand minorant) de
l’ensemble
{aire (R) ; R union de pavés contenant A} ;
R
B
Si maintenant A est un sous-ensemble borné du plan, on dit que l’on peut le mesurer si, pour tout
ϵ > 0, on peut trouver une union finie de pavés Rϵ telle que l’aire supérieure de l’ensemble
soit au plus ϵ ; sur la figure 3.19, on a représenté un tel ensemble ∆(A, Rϵ ). On peut mesurer l’ensemble
A si l’on peut trouver des unions finies de rectangles qui “collent” au mieux à A, excepté sur un ensemble
d’aire supérieure arbitrairement petite (c’est-à-dire intuitivement occupant un espace arbitrairement
petit dans le plan).
R\A
A\R
Si A est un sous-ensemble borné du plan que l’on est capable de mesurer, on appelle aire de A son
aire supérieure ; si P0 est un grand pavé contenant A, on voit que cette aire supérieure est aussi égale
au nombre aire (P0 ) − aire∗ (P0 \ A), ce qui signifie essentiellement que l’on obtient le même nombre
en approchant A “de l’extérieur” ou “de l’intérieur” ; c’est là précisément ce qui caractérise les sous-
ensembles du plan que l’on est capable de mesurer et qui permet d’en définir sans aucune ambigüité
l’aire.
Si f est une fonction définie sur D et à valeurs dans [0, +∞[, on appelle sous-graphe de f l’ensemble
SG (f ) := {(x, y) ∈ D × R ; 0 ≤ y ≤ f (x)} .
110 CHAPITRE 3. FONCTIONS NUMÉRIQUES ET MODÉLISATION
y=f(x)
x’ a Ij b x
y’
Le sous-graphe A d’une fonction continue positive sur un segment [a, b] est un exemple très important
d’ensemble que l’on sait mesurer. Pour voir cela, on découpe l’intervalle [a, b] en N segments égaux
sup
Ik (de longueur (b − a)/N ), k = 1, ..., N puis on introduit les deux ensembles RN inf
et RN définis
respectivement par
sup
∪
N
RN := (Ik × [0, sup f ])
Ik
k=1
∪
N
inf
RN := (Ik × [0, inf f ]) .
Ik
k=1
sup sup
(voir la figure 3.20 ci-dessous). L’ensemble A ∆ RN est inclus dans RN \ RN
inf
, donc dans l’union ∆N
des pavés Ik × [inf f, sup f ] et son aire supérieure est donc majorée par
Ik Ik
b−a ∑
N
(sup f − inf f ) ;
N Ik Ik
k=1
comme f est continue, on admettra que pour N assez grand, on peut faire en sorte que pour tout
intervalle Ik de la subdivision, on ait
sup f − inf f < ϵ .
Ik Ik
sup
L’aire supérieure de la différence symétrique A ∆ RN peut donc être rendue arbitrairement petite pour
sup
un choix convenable d’union de pavés RN et le graphe de f est un ensemble que l’on peut mesurer.
3.8. AIRES, INTÉGRATION, PRIMITIVES 111
Toute fonction réelle continue f sur un intervalle [a, b] s’écrit comme la différence de deux fonctions
positives continues, à savoir f + := sup(f, 0) et f − := sup(−f, 0). Ceci nous permet de définir la notion
d’intégrale de f sur [a, b] (en remarquant que f s’écrit f = f + − f − sur [a, b]).
Définition 3.11. Si f est une fonction continue de [a, b] dans R, on appelle intégrale de f sur [a, b] le
nombre réel ∫ ∫ b
f (t), dt = f (t)dt = Aire (SG (f + )) − Aire (SG (f − )) .
[a,b] a
On a les formules évidentes suivantes, si f et g sont deux fonctions continues sur [a, b], avec a < b :
∫ b ∫ b ∫ b
f (t) dt + g(t) dt = (f (t) + g(t)) dt
a a a
∫ b ∫ c ∫ b
f (t) dt = f (t) dt + f (t) dt , ∀c ∈]a, b[
a a c
∫ b
(f ≥ 0 sur [a, b]) =⇒ f (t) dt ≥ 0
a
∫ b ∫ b
(f ≤ g sur [a, b]) =⇒ f (t) dt ≤ g(t) dt
a a
∫ b ∫ b
f (t) dt ≤ |f (t)| dt .
a a
La seconde relation est dite relation de Chasles ; la quatrième relation traduit la monotonie de la prise
d’intégrale ; la dernière inégalité joue un rôle majeur et s’interprète comme la “version continue” de
l’inégalité triangulaire.
On convient, si a < b, de noter
∫ a ∫ b
f (t) dt := − f (t) dt
b a
et, si a = b, ∫ a
f (t) dt = 0 ;
a
avec ces conventions, la relation de Chasles reste valable si a, b, c sont trois points quelconques et dans
un ordre quelconque d’un intervalle I de R sur lequel la fonction f est continue. Ceci sera important
pour la suite. Si a et b sont deux nombres réels et f une fonction continue sur [a, b], on conviendra de
noter ∫ ∫ b
f (t) = ϵ f (t)dt
[a,b] a
avec ϵ = 1 si a ≤ b et ϵ = −1 si a est strictement supérieur à b.
est dérivable sur I, de dérivée F ′ ≡ f . On dit que F est une primitive de f ; c’est d’ailleurs la primitive
de f qui s’annule en a (une telle primitive est unique).
Preuve. Avec la relation de Chasles et les propriétés de l’intégrale, on a, si x0 ∈ I et h est assez petit
(pour que l’intervalle de bornes x0 et x0 + h soit dans I)
∫ x0 +h
F (x0 + h) = F (x0 ) + f (x0 )h + (f (t) − f (x0 )) dt .
x0
donc
F (x0 + h) = F (x0 ) + hf (x0 ) + o(h) ,
ce qui démontre la première partie de notre résultat.
Supposons maintenant que G soit une autre primitive de f s’annulant en a. La fonction G − F est
une fonction dérivable sur I et de dérivée identiquement nulle ; d’après la proposition 3.12 (admise),
la fonction G − F est constante ; comme elle est nulle en x = a, elle est identiquement nulle et l’on a
G ≡ F , ce qui prouve la seconde partie de notre théorème (la clause d’unicité de la primitive s’annulant
en a).
Le théorème fondamental de l’analyse est souvent confondu avec son corollaire immédiat :
Corollaire. Si f est une fonction à valeurs réelles définie et dérivable sur un intervalle ouvert I et si
[a, b] ⊂ I, on a
∫ b
f ′ (t) dt = f (b) − f (a) .
a
Une application majeure de ce résultat est la très célèbre car très utile formule suivante :
Formule d’intégration par parties. Soient f et g deux fonctions à valeurs réelles dérivables sur un
intervalle ouvert I de R, à dérivées continues sur I ; on a, si [a, b] ⊂ I,
∫ b ∫ b ∫ b [ ]b
f ′ (t)g(t) dt = − f (t)g ′ (t) dt + f (b)g(b) − f (a)g(a) = − f ′ (t)g(t) dt + f g .
a a a a
On a donc ∫ ∫
f (t)dt = f (u(x))u′ (x)dx
[c,d] [a,b]
si u est strictement monotone décroissante, ce que l’on peut résumer en la seconde formule
∫ ∫
f (t)dt = f (u(x))|u′ (x)| dx (††)
[c,d] [a,b]
Preuve. On prouve la première formule (†) (la seconde en résulte immédiatement). Soit F une primitive
de f sur J ; la fonction F ◦ u est alors une primitive de f ◦ u sur I d’après la règle de Leibniz. On a
donc ∫ ∫
b d
f (u(x))u′ (x)dx = F (u(b)) − F (u(a)) = F (d) − F (c) = f (t) dt ,
a c
on calcule l’intégrale d’une fonction de signe quelconque en écrivant la fonction sous la forme f =
f + − f − = sup(f, 0) − sup(−f, 0) sur [a, b]. C’est évidemment là le moyen universel de calculer une
intégrale.
Souvent on a besoin en physique de calculer l’intégrale d’une fonction continue sur [a, b], mais à valeurs
complexes (ce qui signifie que les fonctions Re f et Im f (parties réelle et imaginaire de f ) sont continues.
On définit alors l’intégrale de f sur le segment [a, b] par
∫ b ∫ b ∫ b
f (t) dt := Re f (t) dt + i Im f (t) dt
a a a
ce qui ramène le calcul à celui de l’intégrale d’une fraction rationnelle dont nous reparlerons plus loin.
On utilise pour voir cela le changement de variables u = tan(θ/2), soit θ = 2Arctan u, vu précédemment.
On se ramène ainsi au cadre des fractions rationnelles : si G est une primitive de la fraction rationnelle
( 2
)
P 1−u
1+u2 , 2u
1+u 2 2
u 7−→ ( ) ,
Q 1−u2
2,
2u
2
1 + u2
1+u 1+u
alors
θ 7−→ F (θ) := G(tan (θ/2))
est une primitive de
P (cos θ, sin θ)
θ 7−→ .
Q(cos θ, sin θ)
Remarquons toutefois que les choses sont plus simples lorsque la fonction à intégrer est simplement
dans ce cas, on peut profiter du fait que tout polynôme trigonométrique P (cos θ, sin θ) à coefficients
réels s’exprime grâce aux formules d’Euler comme une somme d’expressions du type
∑
N
P (cos θ, sin sin θ) = a0 + (aj cos(kj θ) + bj sin(kj θ))
j=1
où les aj sont des nombres réels et les kj des entiers non nuls. Une primitive de la fonction donnée par
θ 7−→ P (cos θ, sin θ) est alors
∑
N
aj sin(kj θ) − bj cos(kj θ)
F : θ 7−→ a0 θ +
j=1
kj
3.8. AIRES, INTÉGRATION, PRIMITIVES 115
en résulte.
Les calculs s’avèrent plus simples si la fonction à intégrer s’exprime sous l’une des formes
où H est une fraction rationnelle ; dans le premier cas, le changement de variable à effectuer est u = sin θ ;
dans le second cas, c’est u = cos θ qui est le changement de variable adéquat.
2. Les expressions rationnelles en les lignes trigonométriques hyperboliques
Si I est un intervalle ouvert de R et si
P (cosh x, sinh x)
x 7−→
Q(cosh x, sinh x)
P (cosh x, sinh x) ̸= 0
sur I, on peut utiliser le changement de variables ex = u pour remarquer (en utilisant la formule de
changement de variables) que, si a, b ∈ I,
∫ ∫ eb −1 −1
b
P (cosh x, sinh x) P ( u+u
2 , u−u
2 ) du
dx = −1 u−u−1
a Q(cosh x, sinh x) ea Q( u+u
2 , 2 ) u
3. Les fonctions dont une dérivée à un certain ordre est une fraction rationnelle.
Dans ce cas, c’est l’intégration par parties que l’on exploite en cherchant à faire apparaître la dérivée
de la fonction à intégrer : par exemple, pour x > 0,
∫ x ∫ x
dt
log t dt = [t log t]1 −
x
t = x log x − x
1 1 t
et, pour x ∈ R,
∫ x ∫ x
t dt log(1 + x2 )
Arctan t dt = [tArctan t]x0 − 2
= xArctan x − .
0 0 1+t 2
116 CHAPITRE 3. FONCTIONS NUMÉRIQUES ET MODÉLISATION
ce qui permet encore de faire “chuter” l’exposant n jusqu’à n = 0. En fait, on pourrait calculer aussi de
cette manière les intégrales des fonctions à valeurs complexes du type
Isolant les parties réelles et imaginaires des deux membres dans ce type de formule, on peut ainsi
calculer en faisant chuter l’exposant n jusqu’à n = 0 les primitives des fonctions
Ces calculs (qui englobent les exemples 4 et 5) s’avèrent très importants en mathématiques de l’ingé-
nieur.
On envisagera à titre d’exercice le dernier cas suivant :
√
6. Intégrales de fonctions du type F (x, ax2 + bx + c) (F fraction rationnelle en deux variables).
Introduites par N. Abel et liées au paramétrage des coniques, les intégrales de telles expressions se rencontrent couramment.
On transforme le trinôme
b 2 b2 ∆
ax2 + bx + c = a(x + ) +c− = a(X 2 − 2 ) ,
2a 4a 4a
b
où X := x + et ∆ := b2 − 4ac. On envisage ensuite tous les cas (le cas ∆ = 0 se ramène au cas des fractions rationnelles
2a
en x ; on peut en effet éliminer la prise de racine carrée car nous avons affaire sous le radical à un carré parfait) :
– a > 0 et ∆ = −δ 2 < 0 : on pose comme changement de variable
b δ
x=− + × sinh u ,
2a 2a
ce qui nous ramène au calcul de l’intégrale d’une expression du type étudiée dans l’exemple 2 ;
– a > 0 et ∆ = δ 2 > 0 : on pose comme changement de variable
b δ
x=− + × (± cosh u) ,
2a 2a
ce qui nous ramène encore au calcul de l’intégrale d’une expression étudiée dans l’exemple 2 ;
3.8. AIRES, INTÉGRATION, PRIMITIVES 117
∑
N
x 7−→ ak xk
k=0
est
∑
N
xk+1
x 7−→ ak ,
k+1
k=0
on est ramené à chercher une primitive de R/Q (dans R privé des zéros éventuels de Q).
Si deg Q = 1, alors deg R ≤ 0 et il s’agit de trouver une primitive de
1
x 7−→
ax + b
(a ̸= 0) sur R \ {−b/a} ; une telle primitive est, on l’a vu, la fonction
1
x 7−→ log |ax + b|
a
et nous fait sortir du monde des fonctions rationnelles.
Si deg Q = 2, on est ramené à chercher une primitive pour une fraction rationnelle
αx + β
x 7−→ .
ax2 + bx + c
Trois cas sont à envisager :
118 CHAPITRE 3. FONCTIONS NUMÉRIQUES ET MODÉLISATION
aX 2 + bX + c = a(X − x1 )(X − x2 )
αx + β u1 u2
= + ,
a(x − x1 )(x − x2 ) x − x1 x − x2
où u1 et u2 sont deux nombres réels (pour calculer u1 multiplier R/Q par x − u1 et faire u1 = 0,
même principe pour calculer u2 ) ; une primitive de x → R(x)/Q(x) dans R\{x1 , x2 } est la fonction
αx + β α αx0 + β
= +
a(x − x0 )2 a(x − x0 ) a(x − x0 )2
α αx0 + β 1
x 7−→ log |x − x0 | − .
a a x − x0
( δ2 )
– Si ∆ = −δ 2 < 0, le trinôme aX 2 + bX + c s’écrit a (X + (b/2a))2 + 2 et la fraction rationnelle
4a
s’écrit sous la forme
αx + β x + (b/2a) 1
=u +v ,
ax2 + bx + c (x + b/2a)2 + δ 2 /4a2 (x + b/2a)2 + δ 2 /4a2
où u et v sont deux coefficients réels que l’on calculera. Une primitive sur R est alors la fonction
[ ( )]
u 2av x + (b/2a)
x 7−→ log((x + b/2a)2 + δ 2 /4a2 ) + Arctan 2a .
2 δ δ
On voit surgir ici la fonction Arctan qui d’ailleurs est encore un avatar de la fonction logarithme.
(cette fois, le temps, y et ses deux premières dérivées sont impliqués) est dite équation différentielle,
dans le premier cas d’ordre 1, dans le second cas d’ordre 2.
3.9. ÉQUATIONS DIFFÉRENTIELLES 119
On s’intéressera ici aux équations différentielles dites linéaires, d’ordre 1 et de plus résolubles en y ′ ,
c’est-à-dire du type
y ′ (t) = a(t)y(t) + b(t) ,
ou d’ordre 2 et résolubles en y ′′ (dérivée de y ′ ), c’est-à-dire du type
Souvent y ′ est interprété comme la vitesse, y ′′ comme l’accélération. Souvent aussi en physique ou en
mécanique, y est une fonction à deux composantes et il peut être utile de penser que y est une fonction
définie sur un intervalle I de R et à valeurs dans C.
passant par le point (t0 , y0 ), c’est à dire des graphes des solutions y de l’équation y ′ (t) = a(t)y(t) + b(t)
définies au voisinage de t0 et telles que y(t0 ) = y0 (ce qui signifie que le graphe de la solution passe par
le point (t0 , y0 ) du plan).
Avant d’attaquer ce problème, essayons d’examiner numériquement les choses et de “simuler” l’évolution
d’un phénomène physique y (à partir de l’instant t = t0 ) lorsque ce phénomène est régi par une équation
différentielle
y ′ = a(t)y + b(t) ,
où a et b sont des fonctions continues ; pour cela, on décide d’un pas d’échantillonnage τ du temps et
l’on s’intéresse à la suite de terme général
On peut calculer les termes de cette suite récurrente et, en affichant sur un graphique les points
(t0 + nτ, uτ,n ), n ∈ N, on obtient une approximation de l’évolution du phénomène physique (d’au-
tant meilleure que τ est petit). Cette méthode est la méthode d’Euler ; on l’a déjà rencontré à propos
de l’exponentielle (solution de l’équation différentielle très simple y ′ = y) et c’est le prototype de toutes
les méthodes numériques utilisées dans la modélisation des phénomènes physiques régis par des équa-
tions différentielles. Il semble se dégager en tout cas le fait qu’il n’y ait, pour des phénomènes régis par
une équation différentielle du type (*) qu’une seule courbe intégrale passant par (t0 , y0 ).
Revenons donc au problème de la recherche des courbes intégrales de l’équation (*) (passant par (t0 , y0 ))
du point de vue théorique. La réponse à cette question est fournie par le théorème de Cauchy (Augustin
120 CHAPITRE 3. FONCTIONS NUMÉRIQUES ET MODÉLISATION
Preuve. Avant de montrer qu’il existe une solution, on va prouver qu’elle est unique. Supposons qu’il
y ait deux fonctions y1 , y2 dérivables sur I et telles que
( ) ( )
∀t ∈ I , y1′ (t) = a(t)y1 (t) + b(t) ∧ y2′ (t) = a(t)y2 (t) + b(t)
avec de plus y1 (t0 ) = y2 (t0 ). Considérons la fonction z = y1 − y2 ; cette fonction est dérivable sur I,
nulle en t0 , et telle que
z ′ (t) = a(t)z(t) .
Soit A la primitive de a sur I s’annulant en t0 , soit
∫ t
A : t ∈ I 7−→ a(u) du .
t0
D’après la proposition 3.12, la fonction Z est constante ; comme Z(t0 ) = z(t0 ) = 0, on a Z(t) = 0 pour
tout t dans I, donc z ≡ 0. L’unicité de notre solution est ainsi prouvée.
Pour achever la preuve du théorème de Cauchy, on pourrait se contenter de vérifier que la fonction y
définie par (∗∗) satisfait l’équation différentielle y ′ (t) = a(t)y(t) + b(t) sur I en même temps que la
“condition initiale” y(t0 ) = y0 . C’est un peu pénible, mais cela se fait (faites le en exercice).
Plutôt que de faire cette vérification, on va tenter de résoudre (∗) avec la condition initiale y(t0 ) = y0
en trois temps :
1. D’abord en cherchant toutes les solutions de l’équation différentielle dite homogène ou sans second
membre
y ′ (t) = a(t)y(t) , ∀t ∈ I . (†)
Si l’on pose Y (t) = y(t) exp(−A(t)), chercher y solution de (†) sur I revient à chercher Y solution de
soit
Y ′ (t) = 0 , ∀t ∈ I ;
3.9. ÉQUATIONS DIFFÉRENTIELLES 121
d’après la proposition 3.12, dire que y est solution de (†) équivaut à dire que Y est une fonction
constante ; la solution générale de l’équation (†) sur I est donc
y(t) = C exp(A(t)) ,
où C est une constante complexe arbitraire. Les solutions de l’équation (†) sur I dépendent donc d’un
degré de liberté (C). Ce sont les multiples de la fonction
t ∈ I 7−→ exp(A(t)) .
L’ensemble E des solutions y de l’équation (†) sur I, muni de l’addition et de la multiplication externe
(λ, f ) ∈ R × E 7−→ λ · y = λy ,
est un R-espace vectoriel, engendré par un élément de base, à savoir la fonction t 7−→ exp(A(t)).
2. Ensuite, en cherchant une solution particulière de l’équation (∗) sous la forme
où C est une fonction dérivable de t ; cette méthode est dite méthode de variation de la constante et
on la retrouve classiquement lorsqu’il s’agit de trouver, une fois résolue l’équation sans second membre,
une solution particulière de l’équation avec second membre. écrire que y est solution de (∗) donne ici
soit
C ′ (t) = b(t) exp(−A(t)) ,
dont une solution est la fonction
∫ t
ypart : t ∈ I 7−→ exp(A(t)) b(u) exp(−A(u)) du .
t0
puis en ajustant le degré de liberté que constitue la constante C pour que la solution y = yC de (∗)
ainsi construite vaille y0 en t0 . Ici l’ajustement correspond à prendre C = y0 car A(t0 ) = 0.
On trouve bien la solution (∗∗) proposée.
y(t0 ) = y0 > 0 .
Ce type d’équation, classique en physique ou en mécanique, est dite équation de Bernoulli, ce en relation
avec le mathématicien et physicien suisse Jacob Bernoulli (1654-1705) ; cette équation (lorsque α = n ∈
N \ {0, 1}) apparaît dans la recherche des courbes de “descente en temps constant”, c’est-à-dire des
courbes dites “isochrones” (par exemple celles, dites de Leibniz, le long desquelles un objet descendant
sous les lois de la gravité descendra avec une composante de vitesse verticale constante, se reporter
à ma page web pour d’autres exemples, tels les courbes “brachistochrones” ou les courbes isochrones
de Huygens) ; de telles courbes jouent un rôle important par exemple en horlogerie de précision (d’où
l’influence de l’école suisse au travers de la dynastie des Bernoulli !).
Si y existe, y reste strictement positive dans un intervalle ouvert J assez petit contenant t0 et inclus
dans I et l’on a, dans cet intervalle ouvert J,
y ′ (t)
= a(t)(y(t))1−α + b(t) , ∀t ∈ J . (∗ ∗ ∗)
(y(t))α
En posant, pour tout t ∈ J,
z(t) := (y(t))1−α ,
on voit que (∗ ∗ ∗) équivaut à
Le problème de la résolution de l’équation y ′ (t) = a(t)y(t) + b(t)y α (t) avec condition initiale y(t0 ) = y0
se ramène donc à la résolution au voisinage de t0 de l’équation linéaire
avec condition initiale z(t0 ) = y01−α = z0 . Une fois z trouvée, on en déduit y par
1
y(t) = (z(t)) 1−α
et l’intervalle de vie de y est le plus grand intervalle ouvert sur lequel la solution z(t) définie par la
formule
( ∫ t )
( ∫ u ) (∫ t )
z(t) = z0 + (1 − α)b(u) exp − (1 − α)a(v) dv du exp (1 − α)a(u)du
t0 t0 t0
Soit I un intervalle ouvert de R, t0 un point de I, et a, b, c trois fonctions continues sur I ; chercher une
fonction y définie et deux fois dérivable dans un intervalle ouvert J ⊂ I contenant t0 et telle que
s’appelle résoudre l’équation différentielle linéaire du second ordre (††) près de t0 . Chercher les solutions
y de cette équation obéissant aux deux conditions initiales
y(t0 ) = y0 , y ′ (t0 ) = v0
les conditions
y(t0 ) = y0 , y ′ (t0 ) = v0
étant appelées conditions initiales.
On peut montrer que le problème de Cauchy posé pour une équation différentielle linéaire
avec a, b, c continues sur un intervalle I, et conditions initiales y(t0 ) = y0 , y ′ (t0 ) = v0 , admet une unique
solution y définie et deux fois dérivable sur I tout entier.
C’est encore la méthode d’Euler qui permet de résoudre numériquement ce problème : si τ est un pas
d’échantillonnage du temps fixé a priori et si un,τ est une approximation de y(t0 + nτ ), la dérivée au
point t0 + nτ peut être approchée par
uτ,0 = y0
uτ,1 = y0 + τ v0 .
Le calcul des uτ,n , n ≥ 0, à partir des conditions initiales est possible de proche en proche et, en
affichant sur un graphique les points (t0 + nτ, uτ,n ), n ∈ N, on obtient une approximation de l’évolution
124 CHAPITRE 3. FONCTIONS NUMÉRIQUES ET MODÉLISATION
du phénomène physique régi par l’équation différentielle linéaire du second ordre (††) (d’autant meilleure
que τ est petit). Cette méthode d’Euler nous permet aussi de deviner que par un point (t0 , y0 ) (avec
t0 ∈ I) passe une seule courbe intégrale ayant pour tangente au point (t0 , y0 ) la droite de pente imposée
v0 .
Nous allons montrer ce résultat de manière constructive (c’est évidemment cela qui est important !)
lorsque t → a(t), t → b(t) sont des fonctions constantes sur I. Du fait des motivations physiques, nous
nous placerons à la fois dans le cadre (général) complexe et dans le cadre (particulier) réel. On rencontre
de telles équations différentielles par exemple en électronique ou en mécanique. Par exemple, si l’on a
affaire à une cellule électrique comme celle de la figure ci-dessous
A R L E C
000000000
B F D
on voit (le condensateur de capacité c étant supposé non chargé à l’instant t = 0), que, si i désigne
l’intensité (comptée algébriquement) du courant circulant de A vers C , la loi d’Ohm implique (si R
désigne la valeur numérique de la résistance, L l’inductance de la bobine)
∫
1 t
uAB (t) = R i(t) + L i′ (t) + i(ξ)dξ = R i(t) + L i′ (t) + UCD (t) , t ≥ 0 ,
c 0
et ∫
1 t
uCD (t) = i(ξ)dξ , t ≥ 0
c 0
si UAB (t) désigne (à l’instant t) la différence de potentiel entre A et B et UCD (t) celle entre C et D,
′
soit i(t) = c UCD (t) ; en regroupant ces relations, on trouve immédiatement, en posant UCD = y et
UAB = f :
Lc y ′′ (t) + Rc y ′ (t) + y(t) = f (t) ,
soit
R ′ 1 f (t)
y ′′ (t) = −y (t) − y(t) + ,
L Lc Lc
ce qui montre que y est solution d’une équation différentielle du second ordre à coefficients constants.
Théorème de Cauchy pour les équations linéaires du second ordre à coefficients constants.
Soit I un intervalle ouvert de R, t0 ∈ I, a, b deux nombres complexes, c une fonction continue de I
dans C (la partie réelle et la partie imaginaire de c sont des fonctions continues dans I) ; soit y0 et v0
deux nombres complexes. le problème de Cauchy linéaire du second ordre
y ′′ (t) = ay ′ (t) + by(t) + c(t)
y(t0 ) = y0
y ′ (t0 ) = v0
3.9. ÉQUATIONS DIFFÉRENTIELLES 125
admet une et une seule solution y : I 7−→ C à valeurs complexes définie sur I tout entier et deux fois
dérivable sur I (ses parties réelle et imaginaire sont deux fois dérivables). Dans le cas particulier où
a, b, y0 , v0 sont des nombres réels et où c est une fonction de I 7−→ R, le problème de Cauchy linéaire
du second ordre ci-dessus admet une unique solution réelle y : I 7−→ R.
Preuve.
I. Preuve de l’unicité de la solution.
On se place dans le cadre (le plus général) où toutes les données sont a priori complexes. Montrons tout
d’abord, comme dans le cas du premier ordre, que si une solution y : I 7−→ C existe sur I tout entier,
elle est unique. Pour cela, prenons deux solutions y1 et y2 de notre problème de Cauchy. La différence
z = y1 − y2 est solution du problème de Cauchy
X 2 − aX − b = (X − w1 )(X − w2 ) .
D2 − aD − b = (D − w1 Id) ◦ (D − w2 Id) .
Si l’on pose
Z = (D − w2 Id)[z] = z ′ − w2 z ,
on voit que
(D − w1 Id)[Z] = Z ′ − w1 Z = 0 .
La fonction Z est donc solution du problème de Cauchy linéaire du premier ordre
Z ′ (t) − w1 Z(t) = 0, ∀t ∈ I
Z(t0 ) = 0.
En utilisant ce que nous avons fait dans le cas du problème de Cauchy pour des équations linéaires du
premier ordre, on voit que
Z(t) = 0 , ∀ t ∈ I
(la fonction nulle est aussi solution de ce problème !). La fonction z est donc solution du problème de
Cauchy linéaire du premier ordre
z ′ (t) − w2 z(t) = 0, ∀t ∈ I
z(t0 ) = 0;
on en déduit (toujours en utilisant ce que nous avons fait dans le cas du problème de Cauchy pour
des équations linéaires du premier ordre) que z = 0 sur I, ce qui prouve l’unicité de notre solution au
problème de Cauchy linéaire du second ordre posé.
II. Résolution de y ′′ = ay ′ + by
Avant de construire une solution de l’équation y ′′ (t) = ay ′ (t) + by(t) + c(t), nous remarquons (comme
dans le cas du problème de Cauchy du premier ordre) que ceci est plus facile si c est la fonction
126 CHAPITRE 3. FONCTIONS NUMÉRIQUES ET MODÉLISATION
nulle. Traitons d’abord ce cas particulier important (on dit que l’on s’intéresse à l’équation sans second
membre) tout d’abord dans le cas général où a et b sont des constantes complexes quelconques, puis
dans le cas particulier très important où a et b sont des nombres réels.
IIA. Résolution de l’équation homogène y ′′ = ay ′ +b dans le cas où a et b sont des constantes complexes
arbitraires
Notons w1 et w2 les deux racines (complexes) de l’équation caractéristique X 2 − aX − b = 0. Nous
devons distinguer les deux sous-cas w1 ̸= w2 et w1 = w2 .
– Dans le premier sous-cas, les deux fonctions à valeurs complexes
sont solutions de l’équation différentielle du second ordre linéaire sans second membre
On a là une famille de solutions dépendant de deux degrés de liberté (ces degrés de liberté ici
complexes étant matérialisés par les deux constantes complexes C1 et C2 ). Si nous imposons les
conditions initiales
y(t0 ) = y0
y ′ (t0 ) = v0 ,
C1 ew1 t0 + C2 ew2 t0 = y0
C2 w1 ew1 t0 + C2 w2 ew2 t0 = v0 ;
ce système admet une solution unique (C1 , C2 ) car (w2 − w1 ) exp(w1 t0 + w2 t0 ) (qui est le déter-
minant du système) est non nul.
– Dans le second sous-cas, on constate que
t 7−→ ew1 t
et
t 7−→ tew1 t
sont solutions de de y ′′ (t) − ay ′ (t) − by(t) = 0. Toutes les fonctions de la forme
sont solutions de l’équation différentielle du second ordre linéaire sans second membre
On a là encore une famille de solutions dépendant de deux degrés de liberté (ces degrés de liberté
ici complexes étant matérialisés par les deux constantes complexes C1 et C2 ). Si nous imposons
les conditions initiales
y(t0 ) = y0
y ′ (t0 ) = v0 ,
(C1 + t0 C2 )ew1 t0 = y0
(C1 w1 + C2 (t0 w1 + 1))ew1 t0 = v0 ;
(1 + t0 w1 − t0 w1 ) exp(w1 t0 + w2 t0 ) = exp(w1 t0 + w2 t0 )
cherchant les solutions complexes comme dans le cas général puis en en prenant la partie réelle)
que les solutions réelles de l’équation y ′′ = ay ′ + by sont les fonctions
−1
−2
−3
0 5 10 15 20 25 30 35 40 45 50
0.2
0.15
0.1
0.05
−0.05
−0.1
−0.15
0 5 10 15 20 25 30 35 40 45 50
ne s’annule pas sur I. Cette fonction s’appelle le wronskien de la paire de solutions (y1 , y2 ) de l’équation
linéaire sans second membre y ′′ − ay ′ − by = 0.
Nous cherchons ensuite une solution particulière de l’équation y ′′ (t) − ay ′ (t) − by(t) = c(t) de la forme
les fonctions C1 et C2 étant supposées être deux fois dérivables sur I et satisfaire au système
(c’est encore une méthode de variation des constantes comme pour la recherche d’une solution particu-
lière de l’équation du premier ordre y ′ (t) = a(t)y(t) + b(t)). En reportant et en utilisant le fait que y1
et y2 sont solutions de y ′′ − ay ′ − by = 0, on voit qu’une telle fonction y est solution de l’équation de
y ′′ (t) − ay ′ (t) − by(t) = c(t) sur l’intervalle I. On trouve ainsi comme solution particulière de l’équation
avec second membre y ′′ (t) = ay ′ (t) + by(t) + c(t) la fonction
∫ t
y1 (u)y2 (t) − y2 (u)y1 (t)
t 7−→ ypart (t) := c(u) du .
t0 W (u)
La solution générale de l’équation avec second membre y ′′ (t) = ay ′ (t) + by(t) + c(t) s’écrit donc
∫ t
y1 (u)y2 (t) − y2 (u)y1 (t)
y(t) = C1 y1 (t) + C2 y2 (t) + c(u) du (†††)
t0 W (u)
où C1 et C2 sont des constantes ; la solution de notre problème de Cauchy (conditions initiales y(t0 ) = y0
et y ′ (t0 ) = v0 ) s’obtient en ajustant les constantes pour que
C1 y1 (t0 ) + C2 y2 (t0 ) = y0
C1 y1′ (t0 ) + C2 y2′ (t0 ) = v0 ,
ce qui, on l’a vu, est possible en résolvant un système linéaire de deux équations à deux inconnues à
coefficients complexes sont le déterminant est non nul. Le théorème de Cauchy est complètement prouvé
dans ce cas général (et la solution exhibée).
IIIB. Résolution du problème de Cauchy lorsque a, b, y0 , v0 ∈ R et c : I 7−→ R
Dans ce cas, on peut affirmer que notre problème de Cauchy
y ′′ − ay ′ − by − c = 0 , y(t0 ) = y0 , y ′ (t0 ) = v0 ,
où y1 et y2 sont les fonctions introduites au II (dans le cas complexe ou dans le cas réel). Le problème
de Cauchy se résout finalement en ajustant les constantes C1 et C2 pour que
Par linéarité, on constate que la remarque s’applique également lorsque le second membre est de la
forme c : t 7−→ P (t) cos(ωt) ou c : t 7−→ P (t) sin(ωt), P étant une fonction polynômiale de t et ω un
nombre réel : il suffit en effet, pour construire dans ce cas une solution particulière de l’équation y ′′ (t) =
ay ′ (t) + by(t) + c(t), de combiner des solutions particulières pour l’équation y ′′ (t) = ay ′ (t) + by(t) + c̃(t),
où c̃(t) = (P (t)/2)e±iωt ou bien c̃(t) = (P (t)/2i)e±iωt .