Einführung in Die Theoretische Physik

Einführung in die Theoretische Physik
Teil I: Mathematische Methoden
Prof. W. Bernreuther1 , RWTH Aachen
WS 2009/2010 und SS 2011
Version 7. Juli 2011
Latex-Satz: Jan Busch
1
Kommentare, Druckfehlerhinweise, etc. bitte an die Email-Adresse
[email protected]
Inhaltsverzeichnis
1 Einleitung 5
1.1 Bemerkungen zur Vorlesung . . . . . . . . . . . . . . . . . . . . . . . 5
1.2 Literaturhinweise . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
2 Funktionen einer reellen Variablen 10

2.1 Reelle Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
2.2 Differentialrechnung . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
2.2.1 Rechenregeln . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
2.2.2 Höhere Ableitungen . . . . . . . . . . . . . . . . . . . . . . . . 25
2.2.3 Lokale Extremwerte, stationäre Punkte . . . . . . . . . . . . . 26
2.3 Potenzreihen und Taylorentwicklung . . . . . . . . . . . . . . . . . . 27
2.3.1 Folgen und Reihen . . . . . . . . . . . . . . . . . . . . . . . . 27
2.3.2 Potenzreihen . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
2.3.3 Taylorentwicklung um x0 = 0 . . . . . . . . . . . . . . . . . . 32
2.3.4 Taylorentwicklung um einen beliebigen Punkt x0 . . . . . . . . 35
2.3.5 Elementare transzendente Funktionen als Potenzreihen . . . . 36
2.3.6 Anwendungen . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
2.4 Integralrechnung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
2.4.1 Stammfunktion = unbestimmtes Integral . . . . . . . . . . . . 41
2.4.2 Bestimmtes Integral . . . . . . . . . . . . . . . . . . . . . . . 48
3 Komplexe Zahlen 57
3.1 Kartesische Darstellung . . . . . . . . . . . . . . . . . . . . . . . . . . 58
3.2 Darstellung in Polarkoordinaten . . . . . . . . . . . . . . . . . . . . . 59
3.3 Funktionen einer komplexen Variablen . . . . . . . . . . . . . . . . . 62
3.4 Anwendungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
4 Gewöhnliche Differentialgleichungen 69
4.1 Beispiele für Differentialgleichungen 1. Ordnung . . . . . . . . . . . . 73
4.1.1 y 0 (x) = f (x) . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
4.1.2 y 0 (x) = H(x, y) . . . . . . . . . . . . . . . . . . . . . . . . . . 73
4.1.3 y 0 + a(x)y = 0 . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
4.1.4 y 0 + a(x)y = f (x) . . . . . . . . . . . . . . . . . . . . . . . . . 77
4.1.5 y 0 + ay = f (x) . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
INHALTSVERZEICHNIS 3
4.2 Beispiele für lineare DGL 2. und höherer Ordnung . . . . . . . . . . . 81

4.2.1 Drei allgemeine Aussagen . . . . . . . . . . . . . . . . . . . . 81
4.2.2 Lösung von y 00 + ay 0 + by = 0 . . . . . . . . . . . . . . . . . . 84
4.3 Beispiele aus der Physik . . . . . . . . . . . . . . . . . . . . . . . . . 87
4.3.1 1-dim. Federpendel im schwerelosen Raum . . . . . . . . . . . 87
4.3.2 1-dim. Federpendel im schwerelosen Raum mit Reibung . . . . 89
4.4 Allgemeine Hinweise . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
4.4.1 Anfangs- und Randbedingungen . . . . . . . . . . . . . . . . . 89
4.4.2 Zusammenfassung: lineare Differentialgleichungen . . . . . . . 91
5 Vektorrechnung 94
5.1 Skalare und Vektoren . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
5.2 Elementare Operationen, Vektorräume . . . . . . . . . . . . . . . . . 97
5.3 Bezugssysteme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100
5.4 Skalarprodukt, Vektorprodukt, Mehrfachprodukte von Vektoren . . . 103
5.4.1 Skalarprodukt zweier Vektoren . . . . . . . . . . . . . . . . . . 103
5.4.2 Vektorprodukt zweier Vektoren . . . . . . . . . . . . . . . . . 105
5.4.3 Mehrfachprodukte von Vektoren . . . . . . . . . . . . . . . . . 108
5.4.4 Definition und Eigenschaften des -Tensors . . . . . . . . . . . 109
5.5 Vektorwertige Funktionen, Raumkurven . . . . . . . . . . . . . . . . 110
5.5.1 Parametrisierung von Bahnkurven . . . . . . . . . . . . . . . . 111
5.5.2 Differentiation und Integration vektorwertiger Funktionen . . 113
5.5.3 Charakteristische Größen einer Kurve . . . . . . . . . . . . . . 115
6 Matrizen, Determinanten, Eigenwertproblem 121

6.1 Drehungen eines Koordinatensystems . . . . . . . . . . . . . . . . . . 121
6.1.1 Eigenschaften einer Drehmatrix . . . . . . . . . . . . . . . . . 124
6.2 Passive und aktive Transformationen . . . . . . . . . . . . . . . . . . 128
6.3 Skalare und Vektoren im euklidischen Raum . . . . . . . . . . . . . . 129
6.4 Rechenregeln für Matrizen . . . . . . . . . . . . . . . . . . . . . . . . 131
6.4.1 Spezielle Matrizen . . . . . . . . . . . . . . . . . . . . . . . . 132
6.4.2 Rechenregeln . . . . . . . . . . . . . . . . . . . . . . . . . . . 133
6.5 Determinanten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134
6.5.1 Einige Rechenregeln für Determinanten . . . . . . . . . . . . . 136
6.5.2 Entwicklungssatz . . . . . . . . . . . . . . . . . . . . . . . . . 136
6.5.3 Anwendungen . . . . . . . . . . . . . . . . . . . . . . . . . . . 137
6.6 Eigenwerte, Eigenvektoren, Diagonalisierung reell-symm. Matrizen . . 141
6.6.1 Berechnung der Eigenwerte . . . . . . . . . . . . . . . . . . . 142
6.6.2 Berechnung der Eigenvektoren . . . . . . . . . . . . . . . . . . 144
6.6.3 Diagonalisierung (Hauptachenstransformation) . . . . . . . . . 146
4 Einführung in die Theoretische Physik
7 Funktionen mehrerer reeller Variablen 149

7.1 Felder in der Physik . . . . . . . . . . . . . . . . . . . . . . . . . . . 149
7.1.1 Skalares Feld . . . . . . . . . . . . . . . . . . . . . . . . . . . 150
7.1.2 Vektorfeld . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151
7.2 Stetigkeit, partielle Ableitungen, totales Differential . . . . . . . . . . 152
7.2.1 Stetigkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 154
7.2.2 Partielle Ableitungen . . . . . . . . . . . . . . . . . . . . . . . 156
7.2.3 Totales Differential, Differenzierbarkeit . . . . . . . . . . . . . 157
7.2.4 Regeln für die partiellen Ableitungen . . . . . . . . . . . . . . 159
7.3 Taylorentwicklung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 163
7.3.1 Taylor-Formeln . . . . . . . . . . . . . . . . . . . . . . . . . . 163
7.3.2 Lokale Extremwerte, stationäre Punkte . . . . . . . . . . . . . 166
7.4 Gradient, Divergenz, Rotation . . . . . . . . . . . . . . . . . . . . . . 170
7.4.1 Gradient . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 170
7.4.2 Divergenz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 178
7.4.3 Rotation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 180
7.5 Polarkoordinaten und Zylinderkoordinaten . . . . . . . . . . . . . . . 184
7.5.1 Ebene Polarkoordinaten . . . . . . . . . . . . . . . . . . . . . 184
7.5.2 Zylinderkoordinaten . . . . . . . . . . . . . . . . . . . . . . . 187
7.5.3 Räumliche Polarkoordinaten (Kugelkoordinaten) . . . . . . . . 191
7.6 Integration im Rn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 192
7.7 Kurvenintegrale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 192
7.7.1 Methoden zur Berechnung von Kurvenintegralen . . . . . . . . 193
7.7.2 Eigenschaften von Kurvenintegralen . . . . . . . . . . . . . . . 196
7.7.3 Hinreichendes Kriterium für ein Gradientenfeld . . . . . . . . 200
7.8 Zweidimensionale Integrale . . . . . . . . . . . . . . . . . . . . . . . . 204
7.8.1 Variablentransformation, Jacobi-Determinante . . . . . . . . . 208
7.8.2 Flächen im Raum, Flächenintegrale über Vektorfelder . . . . . 215
7.9 Dreidimensionale Integrale . . . . . . . . . . . . . . . . . . . . . . . . 218
7.9.1 Variablentransformation, Jacobi-Determinante . . . . . . . . . 219
Kapitel 1
Einleitung
1.1 Bemerkungen zur Vorlesung

Der Zweck des ersten Teils der Vorlesung Einführung in die Theoretische Physik, der
den Inhalt dieses Skriptums umfasst, ist die Behandlung von mathematischen Me-
thoden, die für die Gebiete der Theoretischen und der Experimentalphysik benötigt
werden, die Sie in den beiden ersten Semestern des Bachelor-Studiums kennenlernen
werden. Das sind vor allem die Mechanik und in der Experimentalphysik auch Teile
der Wärmelehre und der Elektrodynamik.
Wir besprechen zunächst die Differential- und Integralrechnung für reelle Funktio-
nen, die von einer reellen Variablen abhängen, und insbesondere die in der Physik
ständig benutzte Methode der Taylor-Entwicklung einer Funktion.
Danach behandeln wir komplexe Zahlen und elementare algebraische Operationen
mit diesen Zahlen. Messgrößen in der Physik sind reell, d.h. nehmen reelle Zahlen-
werte an. Es ist aber oft nützlich, diese Größen zunächst durch komplexe Zahlen
bzw. komplexwertige Funktionen darzustellen.
Viele Grundgesetze der Physik sind nicht als algebraische Gleichungen, sondern als
Differentialgleichungen formulierbar – man denke z.B. an die Newtonsche Bewe-
gungsgleichung (siehe unten). Die Mechanik von Punktteilchen und starren Körpern
wird durch gewöhnliche Differentialgleichungen beherrscht, das sind Gleichungen, in
denen eine von einer reellen Variablen abhängige Funktion und ihre Ableitungen vor-
kommen. Einfache, wichtige Beispiele solcher Differentialgleichungen und Lösungs-
methoden besprechen wir in Kapitel 4.
Viele Observablen (Messgrößen) der Physik sind gerichtete Größen, sog. Vektoren.
Man denke an den Ort, die Geschwindigkeit und die Beschleunigung eines Teil-
chens/Körpers und an eine Kraft, die auf ein Teilchen bzw. einen ausgedehnten
Körper wirkt. Vektoren, elementare algebraische Operationen mit diesen Objekten,
und Vektoren, die von einer reellen Variablen abhängen, behandeln wir in Kapitel 5.
In Kapitel 6 lernen wir die mathematischen Objekte Matrix und Determinante ei-
ner Matrix kennen und besprechen, wie man mit diesen Objekten rechnet. Matrizen
und Determinanten benötigt man z.B. zur Lösung linearer Gleichungssysteme. Wir
behandeln dann das sog. Eigenwertproblem für reelle symmetrische Matrizen. Diese
Problemstellung hat viele Anwendungen in der Physik (und der Mathematik). Sie
wird Ihnen z.B. in der Vorlesung Theoretische Physik I: Mechanik bei der Behand-
lung der Trägheitseigenschaften von starren Körpern wiederbegegnen.
Kapitel 7 befasst sich mit der Differential- und Integralrechnung von Funktionen
mehrerer Variablen. Viele Messgrößen der Physik hängen von mehreren Variablen
ab. Man denke etwa an die Gravitationskraft zwischen zwei punktförmigen Teilchen
(Massenpunkten), deren Stärke (und Richtung) von den Ortsvektoren der beiden
Teilchen abhängt – also von den 6 Ortskoordinaten, die die Positionen der beiden
Teilchen im Raum zu einem bestimmten Zeitpunkt angeben (siehe den Mechanik-
Teil der Vorlesung). Manche Kräfte sind nicht nur Funktionen der Ortskoordinaten
des Teilchens, auf das sie wirken, sondern hängen auch explizit vom Zeitpunkt ab,
zu dem sie wirken.
Wir werden in dieser Vorlesung die oben genannten mathematischen Objekte einfüh-
ren und vor allem Rechenoperationen üben. Auf strenge Beweise wird weitgehend
verzichtet. Diese Beweise werden in den Vorlesungen über Höhere Mathematik gelie-
fert. (In diesen Vorlesungen lernen Sie natürlich auch noch Begriffe und mathema-
tische Methoden kennen, die hier nicht besprochen werden.) Sie sollten die HöMa-
und diese Vorlesung nicht als redundante Veranstaltungen ansehen. In den HöMa-
Vorlesungen wird die genannte Mathematik in der Regel allgemeiner, abstrakter
und strenger behandelt. Der Stoff wird, salopp gesprochen, aus einem etwas ande-
ren Blickwinkel behandelt – das führt in der Regel zu einem tieferen Verständnis.
Die Physik befasst sich mit der Erforschung der Gesetzmäßigkeiten der unbe-
lebten Natur (die Biophysik auch mit der Untersuchung von Teilen der belebten
Natur). Gegenstand der Untersuchungen sind physikalische Systeme, das sind
Teile der Natur, die real vorhanden oder durch Experimente realisierbar sind. Die
Theoretische Physik befasst sich mit der Untersuchung bzw. Beschreibung solcher
physikalischer Systeme mit mathematischen Methoden. Dazu wird ein System oder
Prozess modelliert. In den einfachsten Fällen sind solche Modelle Idealbilder der Rea-
litiät. Grundlage dieser Untersuchungen bzw. dieser Modellbildung sind einheitliche
Gesetze, sog. Naturgesetze. Natürlich ist es das oberste Ziel jeder Naturwissenschaft,
bisher unbekannte Naturgesetze zu entdecken. Die Grundgesetze der Mechanik sind
allerdings seit langem bekannt.
In der Mechanik wird die Wirkung von Kräften (in der modernen Physik spricht
man allgemeiner von Wechselwirkungen) auf Körper, insbesondere auf deren Bewe-
gung untersucht. Gegenstand der theoretischen Mechanik ist die Berechnung, d.h.
die Vorhersage dieser Kraftwirkung, insbesondere die Berechnung der Bahnen von
Körpern mit Hilfe von Bewegungsgleichungen.
Wir behandeln im Rahmen dieses Mathematik-Teils der Vorlesung nur einfache An-
wendungen aus der Mechanik und verwenden nur Konzepte, die Sie bereits aus der
Schulphysik kennen sollten. Eine umfassende Begriffsbildung liefert der Mechanik-
Teil dieser Vorlesung. Wir idealisieren Körper durch Massenpunkte, soll heissen, man
1.1 Bemerkungen zur Vorlesung 7
denkt sich die gesamte Masse eines (kleinen) Körpers auf einen Punkt im Raum
konzentriert. Wir bezeichnen dies auch pauschal als ein Teilchen. Aus dem Physik-
Unterricht in der Schule sollten Sie wissen, dass die Bewegung eines Teilchens im
Raum festgelegt ist, wenn wir seine Bahn, d.h. seinen Ort als Funktion der Zeit
kennen. Daraus erhält man durch Differentiation nach der Zeit die Geschwindigkeit
und die Beschleunigung des Teilchens:
dr dv d2 r
Ort r = r(t) ⇒ Geschwindigkeit v = ⇒ Beschleunigung a = = 2 .
dt dt dt
Ort, Geschwindigkeit und Beschleunigung sind Vektoren (siehe Kapitel 5). Diese
werden oft durch einen Pfeil über dem jeweiligen Symbol gekennzeichnet, z. B. −
→
r.
In diesem Skript kennzeichnen wir Vektoren in der Regel durch Fettbuchstaben.
Aus dem Schulunterricht sollten Sie auch noch wissen, dass das grundlegende Bewe-
gungsgesetz der Mechanik die Newtonsche Bewegungsgleichung ist: Die Masse eines
Teilchens mal seiner Beschleunigung ist gleich der auf das Teilchen einwirkenden
Kraft. Benutzt man, dass die Beschleunigung die 2. Ableitung des Ortsvektors nach
der Zeit ist, ist dieses Gesetz gegeben durch
d2 r
m =F, (1.1.1)
dt2
wobei m die Masse des Teilchens und F die auf das Teilchen einwirkende Kraft
ist. Die die Bewegung verursachenden Kräfte können wir für unsere Zwecke als be-
kannt voraussetzen; sie werden bzw. wurden in der Regel experimentell bestimmt.
Die Gl. 1.1.1 ist eine Differentialgleichung (2. Ordnung)– tatsächlich handelt es sich
um 3 Differentialgleichungen für die 3 Koordinaten des Ortsvektors. Die Lösung
dieser Differentialgleichung werden wir für einfache Kraftgesetze in Kapitel 4 lösen.
Beispiele für Kräfte, die wir im Rahmen dieses Mathematik-Teils der Vorlesung be-
nutzen, sind:
• Die Gravatitationskraft der Erde F Erde auf ein Objekt der Masse m, das nicht
zu weit von der Erdoberfläche entfernt ist. In diesem Fall ist diese Kraft in sehr
guter Näherung ortsunabhängig und gegeben durch
m
F Erde = mg = −mgez , g = 9, 81 , (1.1.2)
s2
wobei g die sog. Erdbeschleunigung und ez ein von der Erdoberfläche senkrecht nach
oben zeigender Einheitsvektor ist.
• Die Hookesche Federkraft
F H = −k(r − r 0 ) , (1.1.3)
wobei die Federkonstante k die Stärke der jeweiligen Rückstellkraft charakterisiert
und r 0 die Ruhelage des am Ende der Feder befindlichen Massenpunktes ist.
• Reibungskräfte, die proportional zur Geschwindigkeit bzw. zum Quadrat der Ge-
schwindigkeit eines Körpers sind, siehe Kapitel 4.
• Die Kraft, die ein elektrisches Feld E auf ein Teilchen der Ladung q ausübt, ist
F E = qE . (1.1.4)
In Kapitel 4, das Methoden zur Lösung einfacher Differentialgleichungen gewid-

met ist, werden zunächst der Einfachkeit halber Bewegungen in einer Raumdimen-
sion, z B. in x-Richtung betrachtet. Dann sind der Ort, die Geschwindigkeit und die
Beschleunigung eines Teilchens gegeben durch
dx dv d2 x
x = x(t) , v= , a= = 2 ,
dt dt dt
und die Newtonsche Bewegungsgleichung lautet
d2 x
m =F. (1.1.5)
dt2
Hinweise:
1. Bei Physik-Anwendungen sollten Sie immer folgende elementare Regel beher-

zigen: Überprüfen Sie die physikalische Dimension der in einer (Differenti-
al)gleichung vorkommenden Größen und die Dimension der Lösung der Glei-
chung. So können Sie oft grobe Fehler feststellen bzw. vermeiden. Wir kenn-
zeichnen die Dimension einer physikalischen Größe A mit [A]. In der Mechanik
verwendet man als Einheitensystem das MKS-System (Meter, Kilogramm, Se-
kunde). So sind die Dimensionen bzw. Einheiten der obigen Größen:
m m
[x] = Länge, Einheit = m , [v] = , [a] = 2 ,
s s
kg m
[m] = Masse, Einheit = kg , [F ] = 2 = N (Newton) .
s
Im Mathematik-Teil dieser Vorlesung, d.h. in diesem Skript werden wir aller-
dings die auftretenden Größen in der Regel als dimensionslos ansehen.
2. Es gibt ja seit einiger Zeit leistungsfähige Computeralgebra-Programme, z.B.

Mathematica, Maple oder Matlab, die per Knopfdruck Funktionen differenzie-
ren und integrieren, Funktionsgraphen zeichnen, die Determinante einer Ma-
trix berechnen, etc. Wenn Sie wirklich von dieser Vorlesung profitieren wollen,
sollten Sie aber die Hausaufgaben nicht mit Hilfe eines solchen Programms
lösen, sondern alles per Hand rechnen und zeichnen.
1.2 Literaturhinweise 9
1.2 Literaturhinweise
Mathematische Methoden:
Lehrbücher, die große Teile der mathematischen Methoden dieser Vorlesung und
etliches mehr behandeln, sind:
S. Großmann: Mathematischer Einführungskurs für die Physik, Teubner Verlag (2009).
C.B. Lang und N. Pucker: Mathematische Methoden in der Physik, Spektrum Aka-
demischer Verlag (2005).
Als Nachschlagewerk zu empfehlen: I. N. Bronstein u. a.: Taschenbuch der Mathe-
matik, Verlag Harri Deutsch (2008).
Newtonsche Mechanik:
Zum Vorlesungsteil Newtonsche Mechanik wird es ein Skriptum geben, das im L2P
als pdf file zur Verfügung gestellt werden wird.
Für Anfänger geeignete Lehrbücher sind:
W. Nolting: Grundkurs Theoretische Physik 1: Klassische Mechanik, Springer Ver-
lag (2006).
W. Greiner u.a.: Klassische Mechanik I, Verlag Harri Deutsch (2008).
S. Brandt, H. D. Dahmen: Mechanik. Eine Einführung in Experiment und Theorie,
Springer-Verlag (2004).
T. Fließbach, Mechanik, Spektrum Akademischer Verlag (2009). Dieses Buch setzt
die o.g. mathematischen Methoden im Wesentlichen voraus und behandelt die New-
tonsche Mechanik nur sehr knapp. Es ist für die Vorlesung Theoretische Physik I,
Mechanik geeignet.
Kapitel 2
Funktionen einer reellen Variablen
Wir besprechen in diesem Kapitel zunächst einige grundlegende Eigenschaften reel-

ler Funktionen einer reellen Variablen und dann die Differentiation und Integration
solcher Funktionen. Vieles davon dürfte Ihnen aus der Schule bekannt sein. Neu
für Sie ist vermutlich die Taylor-Entwicklung von Funktionen, eine enorm wichtige
Näherungsmethode.
Viele Messgrößen der Physik hängen von einer anderen Meßgröße ab. So Sind Ort,
Geschwindigkeit und Beschleunigung eines Teilchens Funktionen der Zeit, der At-
mosphärendruck ist bei konstanter Temperatur eine Funktion des Abstandes von
der Erdoberfläche, etc. Wie bereits in der Einleitung betont wurde, sind Mess-
größen dimensionsbehaftet. Wir ignorieren das aber in diesem Kapitel, d.h. alle
(un)abhängigen Variablen und weitere auftretende Parameter werden, wenn nicht
anders erwähnt, als dimensionslos betrachtet.
2.1 Reelle Funktionen

Eine reelle Funktion f einer reellen Variablen x ist eine Vorschrift, die einer reellen
Zahl x auf eindeutige Weise eine reelle Zahl y = f (x) zuordnet:
x 7→ y = f (x).
Es ist x ∈ Df ⊆ R der Definitionsbereich Df und y ∈ Wf ⊆ R der Wertebereich W
der Funktion, wobei R die Menge der reellen Zahlen bezeichnet.
Man unterscheidet drei Darstellungsarten einer Funktion:

1. Explizite Darstellung: y = f (x). Beispiel: y = x4 − sin2 x.
2. Implizite Darstellung: F (x, y) = 0. Beispiel: x2 + xy 5 − 7 = 0.
3. Parameterdarstellung: x = g(t), y = h(t). Beispiel:
x = a cos t,
y = a sin t, −π ≤ t ≤ π.
2.1 Reelle Funktionen 11
Weitere Begriffe bzw. Eigenschaften:

Eine Funktion ist gerade, wenn f (−x) = f (x).
Beispiele: f (x) = a cos x,
f (x) = bx2 .
Eine Funktion ist ungerade, wenn f (−x) = −f (x).

Beispiele: f (x) = a sin x,
f (x) = bx3 .
Eine Funktion ist monoton steigend bzw. fallend, wenn
x1 > x 2 ⇒ f (x1 ) ≥ f (x2 ) bzw. f (x1 ) ≤ f (x2 ) . (2.1.1)
Eine Funktion ist streng monoton steigend bzw. fallend, wenn
x1 > x 2 ⇒ f (x1 ) > f (x2 ) bzw. f (x1 ) < f (x2 ) . (2.1.2)
Eine Funktion f ist periodisch mit der Periode p ∈ R, wenn
f (x + p) = f (x) ∀x, x + p ∈ Df , (2.1.3)
Beispiele: f (x) = sin x und cos x haben die Periode p = 2π. Es ist
sin(x + 2π) = sin x , cos(x + 2π) = cos x ∀x ∈ R .
Umkehrfunktion:
Wenn eine Funktion f (x) einem bestimmten Gebiet x ∈ D streng monoton steigend
oder fallend ist, d.h. wenn eine der Bedingungen (2.1.2) erfüllt ist, dann ist sie in
diesem Gebiet umkehrbar. Die Umkehrfunktion von f bezeichnet man in der Regel
mit f −1 , d.h. x = f −1 (y). Diese Funktion ist durch Vorschrift
f −1 (f (x)) = x (2.1.4)
definiert. Graphisch erhält man die Umkehrfunktion f −1 durch Spiegelung des Gra-
phen von f an der Geraden y = x.
Vorsicht: Die Notation kann zu Missverständnissen führen; f −1 (y) ist nicht
[f (y)]−1 = f (y)
1
.
√
Beispiel: Die Umkehrfunktion von y = x2 (x ≥ 0) ist y = x und nicht y = x12 .
Sei f (x) : D 7→ WD streng monoton. Der Definitionsbereich der Umkehrfunktion
f −1 (x) ist WD , ihr Wertebereich ist D.
Wenn eine Funktion nicht in ihrem gesamten Definitionsbereich streng monoton ist,
sondern nur in verschiedenen Teilgebieten, kann man sie separat umkehren. Das lie-
fert aber in diesen Teilgebieten verschiedene Umkehrfunktionen.
Beispiel: Die Funktion y = x2 ist in ganz R definiert, aber nur in den Teilgebie-
ten x ≥ 0 und x ≤ 0 streng monoton. Im Gebiet x ≥ 0 nennen wir die Funktion
f1 = f , im Gebiet x ≤ 0 ist durch f die Funktion f2 = √ f definiert. Die Umkehr-
2 −1
funktion von f1 (x) = x im Gebiet x ≥ 0 ist f1 (x) √ = x. Die Umkehrfunktion
von f2 (x) = x2√im Gebiet x ≤ 0 ist f2−1 (x) = − x (wobei hier x ≥ 0); denn
f2−1 (f2 (x)) = − x2 = −|x|.
Exponentialfunktionen und Logarithmen:

Die Exponentialfunktion zur Basis e sollten Sie aus der Schule kennen. Ihre Defini-
tion ist x n
exp(x) = lim 1 + . (2.1.5)
n→∞ n
Man kann zeigen (siehe HöMaI-Vorlesung), dass sie identisch ist mit ex , wobei
n
1
e = lim 1 + = 2, 71828...
n→∞ n
Es gelten die üblichen Rechenregeln für Potenzen:
1
e0 = 1 , ex ey = ex+y , e−x =
.
ex
Die Exponentialfunktion ist auf ganz R definiert; ihr Wertebreich ist 0 < y < ∞.
Die Logarithmusfunktion ln x (Logarithmus naturalis)
y = ln x , x>0
ist die Umkehrfunktion von ex im Gebiet x > 0. Es gilt
eln x = x ∀x > 0 und ln(ex ) = x ∀x ∈ R . (2.1.6)
Beachten Sie, dass ln x positiv, null, negativ für x > 1, x = 1, 0 < x < 1 ist. Der
Logarithmus aus einer negativen Zahl macht im Rahmen der Mathematik der reellen
Zahlen und Funktionen keinen Sinn (siehe das Kapitel über komplexe Zahlen). Oft
begegnet man aber folgender Funktion, die in der reellen Analysis auch für negative
Zahlen definiert ist:
f (x) = ln |x| , x 6= 0 .
Für x → 0 geht f (x) → −∞. Das folgt aus 2.1.6.
Allgemeine Potenzfunktion: Für eine beliebige positive reelle Zahl a ist diese
Funktion definiert durch
y = ax ≡ ex ln a , a > 0, x ∈ R. (2.1.7)
Sie ist wie ex auf ganz R definiert; ihr Wertebereich ist 0 < y < ∞. Es ist nicht
schwer zu zeigen, dass folgende Rechenregeln gelten:
(ax )y = axy , ax ay = ax+y .
Für x > 0 ist die Umkehrfunktion von (2.1.7) die Logarithmusfunktion zu einer
beliebigen Basis a ∈ R, a > 0:
ln x
y = loga x = , x > 0.
ln a
Analog zu oben ist die Funktion loga |x| für alle x 6= 0 definiert. Man überzeuge sich
davon, dass folgende Rechenregeln gelten – hier bezeichnet log den Logarithmus zu
einer beliebigen Basis a > 0, insbesondere ln = loge :

r x
log(x ) = r log x , log(xy) = log x + log y, log = log x − log y .
y
Trigonometrische Funktionen:
Die trigonometischen Funktionen
sin x cos x
sin x , cos x , tan x = , cot x =
cos x sin x
sind die wichtigsten Beispiele für periodische Funktionen. Die Funktionen sin x und
cos x sind auf der ganzen reellen Achse definiert; die Funktionen tan x und cot x wer-
den bei den Nullstellen von cos x bzw. sin x unendlich, d.h. ihr Definitionsbereich
ist R abzüglich dieser Nullstellen. Da es sich bei den trigonometrischen Funktionen
um periodische Funktionen handelt, sind sie nicht in ihren ganzen Definitionsbe-
reichen umkehrbar – ihre Umkehrfunktionen, die sog. inversen trigonometrischen
Funktionen oder Arkusfunktionen sind mehrdeutig. Will man eine eindeutige Um-
kehrfunktion erhalten, muss man den Definitionsbereich der jeweiligen trigonome-
trischen Funktion auf ein Gebiet beschränken, in dem sie streng monoton steigend
oder fallend ist. Man nennt das ein Monotonieintervall. Dies ist am Beispiel von
sin x in Abbildung 2.1(a) dargestellt.
1. y = sin x. Diese Funktion ist in ganz R definiert und ist periodisch mit Periode
2π, also nicht im ihrem ganzen Definitionsbereich umkehrbar. Will man eine
eindeutige Umkehrfunktion erhalten, muss man den Definitionsbereich der je-
weiligen trigonometrischen Funktion auf ein Gebiet beschränken, in dem sin x
streng monoton steigend oder fallend ist. Man wählt das Monotonieintervall
n π πo
Dsin = x − ≤ x ≤ ,

2 2
in dem sin x streng monoton steigend ist. Die zu diesem Intervall des sin x
gehörende Umkehrfunktion wird mit
arcsin x ≡ sin−1 x
bezeichnet, siehe Abbildung 2.1(a). Für x ∈ Dsin ist −1 ≤ sin x ≤ 1. Deshalb

ist der Definitionsbereich von y = arcsin x:
Darcsin = {x |−1 ≤ x ≤ 1}
und ihr Wertebereich ist

π π
− ≤ arcsin x ≤ .
2 2
Merke: arcsin x ist die dimensionslose Länge eines Bogens am Einheitskreis,
d.h. der Winkel, dessen Sinus den Wert x hat, siehe Abbildung 2.1(b)
2. y = cos x ist in ganz R definiert und ist periodisch mit Periode 2π. Zur Um-
kehrung beschränkt man sich auf das Monotonieintervall
Dcos = {x |0 ≤ x ≤ π } ,
in dem cos x streng monoton fallend ist. Die Umkehrfunktion ist
arccos x ≡ cos−1 (x) .
Ihr Definitionsbereich ist

−1 ≤ x ≤ 1,
und ihr Wertebereich
0 ≤ arccos x ≤ π.
3. y = tan x. Der Definitionsbereich dieser Funktion zerfällt in unendlich viele

offene Intervalle1 π π
− + nπ , + nπ , n ∈ Z .
2 2
Die Funktion tan x ist periodisch mit der Periode π. In jedem dieser Intervalle
ist tan x streng monoton steigend. Zur Umkehrung wählt man das Monoto-
nieintervall n π πo
Dtan = x − < x < ,

2 2
Die Umkehrfunktion ist
arctan x ≡ tan−1 (x).
−∞ < x < ∞,
π π
− < arctan x < .
2 2
4. y = cot x. Der Definitionsbereich dieser Funktion zerfällt in unendlich viele
offene Intervalle
(nπ , (n + 1)π) , n ∈ Z .
Die Funktion cot x ist periodisch mit der Periode π. In jedem dieser Intervalle
ist cot x streng monoton fallend. Zur Umkehrung wählt man das Monotonie-
intervall
Dtan = {x |0 < x < π } ,
Die Umkehrfunktion ist
y = arccot x.
−∞ < x < ∞,
0 < arccot x < π.
1
Die Menge der ganzen Zahlen bezeichnet man mit Z = {0, ±1, ±2, ±3, . . .}, die Menge der
natürlichen Zahlen mit N = {1, 2, 3, . . .}. Außerdem benutzt man das Symbol N0 = {0, 1, 2, 3, . . .}.
Hinweise:
1) Machen Sie sich mit diesen Funktionen vertraut, z.B. anhand des Buches von
Bronstein et al. Zeichnen Sie diese Funktionen!
2) Die Umkehrfunktionen der trigonometrischen Funktionen nennt man wie gesagt
auch Arkusfunktionen. Die zu den oben gewählten Monotonieintervallen gehörenden
Arkusfunktionen sind die sog. Hauptwerte dieser Funktionen. Wenn man zur Um-
kehrung einer trignonometrischen Funktion ein anderes Monotonieintervall wählt,
verschiebt sich der Wert der zugehörigen Arkusfunktion um eine Konstante; siehe
z.B. das Buch von Bronstein et al.
Stetigkeit:
Die Funktion f (x) sei in einem offenen Intervall (a, b) definiert und es sei x0 ∈
(a, b). Die Funktion heißt stetig an der Stelle x0 , wenn zu jedem beliebig kleinen
> 0 stets eine passende Zahl δ() > 0 angegeben werden kann, so dass |f (x) −
f (x0 )| < für alle x, die |x − x0 | < δ() erfüllen. Diese Definition ist mit folgender
Definition äquivalent: Wenn für jede Zahlenfolge {xn }∞ n=0 , die gegen x0 konvergiert,
die jeweiligen Funktionswerte f (xn ) gegen f (x0 ) konvergieren, dann heißt f in x0
stetig. (Beweis der Äquivalenz in der HöMaI-Vorlesung.) Man schreibt
lim f (x) = f (x0 ) .
x→x0
Man spricht von linksseitiger bzw. rechtsseitiger Stetigkeit, wenn der Grenzwert der
Funktion für von links bzw. von rechts gegen x0 konvergierende Zahlenfolgen exis-
tiert. Demnach ist eine bei x0 stetige Funktion beidseitig stetig.
Salopp gesprochen ist eine Funktion f bei x0 stetig, wenn ihr Graph bei x0 keinen
Sprung hat oder wenn f (x0 ) 6= ±∞. Die Funktionen in Abbildung 2.2a,b sind bei x0
stetig, während die Funktion in Abbildung 2.2c bei x0 unstetig ist – diese Funktion
ist bei x0 nicht definiert. Man kann diese Funktion bei x0 zwar links- oder rechtsei-
tig stetig ergänzen, indem man ihr den linksseitigen oder rechtsseitigen Grenzwert
zuweist,
lim f (x) = y0 , lim f (x) = y00 .
x%x0 x&x0
Da y0 6= y00 kann man ihr nicht beide Werte zuweisen, sonst wäre f nicht eindeutig.
Zwei Grenzwerte:
In Abschnitt 2.2 benötigen wir die beiden folgenden Grenzwerte:
sin x
lim = 1, (2.1.8)
x→0 x
ex − 1
lim = 1. (2.1.9)
x→0 x
Zum Beweis von (2.1.8) benutzt man die Ungleichung
π
| sin x| ≤ |x| ≤ | tan x| für |x| < .
2
π
2
-π
2
-π π
2 2
(a)
x
1
π
φ= 2
x
0 φ=
arcsin x
φ = − π2
−1
(b) φ = arcsin x ist ein Bogen
am Einheitskreis.
Abbildung 2.1: (a) Die Funktion sin x ist im Intervall − π2 ≤ x ≤ π2 streng monoton
steigend (durchgezogene rote Kurve). Die Umkehrfunktion in diesem Bereich ist
arcsin x, das ist nur die durchgezogene blaue Kurve! Der Definitionsbereich dieser
Funktion ist −1 ≤ x ≤ 1 und ihr Wertebereich ist − π2 ≤ arcsin x ≤ π2 .
x0 x0 x0
(a) Stetig bei x0 . (b) Stetig bei x0 . (Aber dort (c) Unstetig bei x0 .
nicht differenzierbar.)
Abbildung 2.2: Beispiele für bei x0 stetige und nichtstetige Funktionen.
Diese Ungleichung erhält man durch elementare geometrische Überlegungen. Somit

ist
x sin x π
cos x = ≤1 für 0 < |x| < .
tan x x 2
Da cos x → 1 für x → 0, folgt aus dieser Ungleichung der Grenzwert (2.1.8).
Zum Beweis von (2.1.9) benutzt man die Ungleichung
1 ex − 1 1
≤ ≤ für 0 < |x| < 1 . (2.1.10)
1 + |x| x 1 − |x|
Den linken Teil dieser Ungleichung beweist man folgendermaßen: Für x > 0 und
n > 1 ist x 1 x n
1+x= 1+ < 1+ < ex , (2.1.11)
1 n
wobei die binomische Formel (2.2.3) und die Definition (2.1.5) der Exponentialfunk-
tion verwendet wurde. Dieselbe Ungleichung gilt für 0 > x > −1 (nachprüfen).
Somit ist
ex − 1 1
≥1≥ für x > 0 .
x 1+x
Für 0 > x > −1 erhält man mit der Ungleichung (2.1.11):
1 ex − 1 1 1
ex < ⇒ ≥ = .
1−x x 1−x 1 + |x|
Damit ist die linke Seite von (2.1.10) bewiesen. Die rechte Seite dieser Ungleichung
beweist man analog (Hausaufgabe). Den Grenzwert (2.1.9) erhält man im Limes
x → 0 auf der linken und rechten Seite von (2.1.10).
Beispiele für Funktionen mit Unstetigkeiten bzw. singulären Punkten:

Ein Beispiel für eine unstetige Stelle einer Funktion ist die bereits oben diskutierte
Funktion aus Abbildung 2.2c. Diese Funktion hat bei x0 einen Sprung, ist aber in
der Umgebung von x0 beschränkt. Der am häufigsten auftretende Typ einer Unste-
tigkeitsstelle einer Funktion sind Punkte x0 , an denen die Funktion unendlich wird,
d.h. divergiert. Viele uns interessierende Funktionen besitzen solche sog. singulären
Punkte2 x0 . Man unterscheidet verschiedene Typen von Singularitäten. Wir führen
hier keine Klassifizierung durch, sondern geben nur einige Beispiele.
a) Pole: Wir betrachten als Beispiele
1 1 1 1
f (x) = , g(x) = 2
= , h(x) = .
1−x 1−x (1 + x)(1 − x) (1 − x)2
Die Funktion f divergiert bei x = 1. Wenn x → 1 von links, dann f → ∞; wenn
x → 1 von rechts, dann f → −∞. Man sagt, f hat einen einfachen Pol bei x = 1.
Somit hat g(x) jeweils einen einfachen Pol bei x = 1 und bei x = −1. Die Funktion
h(x) hat einen Doppelpol bei x = 1. Man sagt, eine Funktion f (x) hat bei x0 einen
n-fachen Pol (n ∈ N), wenn sie sich für x → x0 verhält wie
const
f (x) → .
(x − x0 )n
b) Wurzelsingularitäten: Beispiel:
const
f (x) = √ , x > 0.
x
Die Funktion divergiert für x → 0.
c) Logarithmische Singularitäten: Beispiel:
f (x) = const ln |x| , x 6= 0 .
Die Funktion divergiert für x → 0.

Funktionen mit einer singulären Stelle x0 des Typs a, b oder c divergieren verschieden
stark bei x0 . So divergiert eine Funktion mit einer Wurzelsingulärität offensichtlich
schwächer als 1/(x − x0 ) und der Logarithmus divergiert schwächer als jede Potenz
von x. Beispiele:
x
lim √ = 0 , lim xr ln x = 0, r > 0.
x&0 x x&0
Der erste Grenzwert ist offensichtlich; den zweiten Grenzwert zeigt man mit der
L’Hospitalschen Regel, siehe Abschnitt 2.3.6.
Klassifizierung von Funktionen:

Traditionell unterscheidet man in der mathematischen Physik (und in anderen Ge-
bieten) zwischen sog. elementaren Funktionen und sog. höheren transzendenten Funk-
tionen bzw. speziellen Funktionen.
2
Oft bezeichnet man jeden Punkt x0 , an dem eine Funktion f (x) unstetig ist, als singulären
Punkt.
A) Elementare Funktionen:
Dazu gehören die algebraischen Funktionen und die elementaren transzenden-
ten Funktionen.
A.1) Algebraische Funktionen:

A.1.1) Polynome.
y = P (x) = a0 + a1 x + ... + an xn , aj ∈ R , n ∈ N.
Die höchste Potenz n bezeichnet man als den Grad des Polynoms.
A.1.2) Gebrochen rationale Funktionen.
a0 + a1 x + ... + an xn P (x)
y= n
= .
b0 + b1 x + ... + bn x Q(x)
A.1.3) Nichtrationale Funktionen. Diese enthalten Wurzeln. Beispiele:
y = x7/8 ,
q √
y = (x2 + 5) x .
Allgemein ist eine algebraische Funktion y die Lösung einer algebraischen

Gleichung der Form
P0 (x) + P1 (x)y + ... + Pn (x)y n = 0,
wobei n ∈ N und die Pi (x) Polynome sind. Die Indizes i bezeichnen hier
nicht den Grad von Pi .
A.2) Elementare transzendente Funktionen:
A.2.1) Trigonometrische Funktionen.
sin x, cos x, tan x, cot x und ihre Umkehrfunktionen.
A.2.2) Exponentialfunktionen und Logarithmus-Funktionen.
ex , bx , ln |x|, logb |x| .
A.2.3) Hyperbelfunktionen.
ex − e−x ex + e−x
sinh x = , cosh x = ,
2 2
sinh x cosh x
tanh x = , coth x = ,
cosh x sinh x
und ihre Umkehrfunktionen
arsinhx ≡ sinh−1 x , arcoshx ≡ sinh−1 x ,
artanhx ≡ tanh−1 x , arcothx ≡ coth−1 x .
y y
f (x) f (x)
f (x2 ) Sekante
Tangente
f (x1 )
x x
x1 x2 x0
(a) Sekante durch (x1 , f (x1 )) und (x2 , f (x2 ). (b) Tangente an f bei x0 .
Abbildung 2.3: Geometrische Bedeutung des Differenzen- und Differentialquotienten.
Mit elementaren Funktionen kann man natürlich auch zusammengesetzte ele-

mentare Funktionen basteln. Seien f = f (y) und y = g(x) elementare Funk-
tionen, dann ist f (g(x)) ebenfalls eine elementare Funktion.
B) Höhere transzendente Funktionen (sog. spezielle Funktionen):
Dazu gehören z.B. die Gamma-Funktion (siehe unten), die elliptischen Integral-
Funktionen, die Bessel-Funktionen und die hypergeometrischen Funktionen.
Etliche dieser Funktionen werden Sie in den Vorlesungen Theoretische Physik
II, III, IV kennenlernen.
2.2 Differentialrechnung
Wir betrachten eine stetige Funktion y = f (x).
Differenzenquotient: Ein Differenzenquotient von f ist ein Verhältnis der Form
∆f (x) f (x1 ) − f (x2 )
≡ . (2.2.1)
∆x x1 − x2
Geometrische Bedeutung: Der Differenzenquotient ist die Steigung der Sekante, die
die Punkte (x1 , f (x1 )) und (x2 , f (x2 )) verbindet, siehe Abbildung 2.3(a).
Differentialquotient: Wir setzen x2 = x0 und x1 = x0 + h, wobei h ∈ R beliebig.
Wir halten x0 fest und lassen h → 0 gehen. Die Funktion f heißt an der Stel-
le x0 differenzierbar, wenn der folgende Limes (der Differentialquotient)
sowohl für positive als auch negative h → 0 existiert:

df (x) f (x0 + h) − f (x0 )
≡ lim . (2.2.2)
dx x=x0 h→0
h
Geometrische Bedeutung: Der Differentialquotient ist die Steigung der Tangente an
den Graphen von f bei x0 , siehe Abbildung 2.3(b).
2.2 Differentialrechnung 21
Notation:
dy df
y0 ≡ ≡ f 0 (x) ≡ .
dx dx
Man nennt den Differentialquotienten auch die (erste) Ableitung von f .
Beispiele:
y = axn ⇒ y0 = naxn−1 , n ∈ N,
y = sin x ⇒ y0 = cos x,
y = cos x ⇒ y0 = − sin x,
y = ex ⇒ y0 = ex .
Zur Herleitung der Ableitungen dieser elementaren Funktionen benutzt man in der
Definition (2.2.2) des Differentialquotienten folgendes: i) Bei der Ableitung von xn
verwendet man die binomische Formel3
n
n
X n
(x0 + h) = xn−k
0 hk . (2.2.3)
k
k=0
ii) Bei der Ableitung von sin x benutzt man, dass sin(x0 + h) − sin x0 = 2 cos(x0 +
h/2) sin(h/2) und zudem, dass sin(h/2)/(h/2) → 1 für h → 0, siehe (2.1.8). iii) Zur
Berechnung der Ableitung von cos x verwendet man, dass cos(x0 + h) − cos x0 =
−2 sin(x0 + h/2) sin(h/2) und wiederum, dass sin(h/2)/(h/2) → 1 für h → 0. iv)
Bei der Ableitung von ex verwendet man, dass (eh −1)/h → 1 für h → 0, siehe (2.1.9).
Hinweis: Die Stetigkeit von f (x) bei x0 ist keine hinreichende Voraussetzung für ihre
Differenzierbarkeit bei x0 . Ein Beispiel dafür ist die in Abbildung 2.2(b) dargestellte
Funktion, die bei x0 stetig ist. Wenn man den Limes der Differenzenquotienten
mit h → 0, h < 0 bildet, erhält man offensichtlich für den Differentialquotienten
(2.2.2) eine negative Zahl, während der Limes der Differenzenquotienten mit h → 0,
h > 0 eine positive Zahl liefert. Man kann im Sinne dieses Beispiels die links- und
rechtsseitige Ableitung von f an einer Stelle x0 definieren. Eine Funktion f ist dann
bei x0 differenzierbar, wenn die links- und rechtsseitige Ableitung existiert und beide
gleich sind.
Eine stetige Funktion
p muss nicht unbedingt einseitig differenzierbar sein. Beispiel:
die Funktion y = |x| ist insbesondere bei x0 = 0 stetig, aber es existieren keine
einseitigen Ableitungen an dieser Stelle (siehe Übungen).
3
Der Binomialkoeffizient

n n!
≡ , 0 ≤ k ≤ n.
k k!(n − k)!
Per Definition ist i) der Koeffizient null für k > n und ii) 0! = 1.
2.2.1 Rechenregeln
Man will bei der Differentiation komplizierter Funktionen natürlich nicht jedesmal
auf die Definition (2.2.2) zurückgreifen. Dazu benutzt man folgende Rechenregeln:
(f ± g)0 = f 0 ± g 0 , (2.2.4)
(f · g)0 = f 0 g + f g 0 (Produktregel), (2.2.5)
0
1 g0
=− 2 (2.2.6)
g g
0
f f 0g − f g0
= (Quotientenregel). (2.2.7)
g g2
Der Beweis der ersten Regel ist trivial. Zum Beweis der anderen Regeln siehe die
HöMaI-Vorlesung. Weitere wichtige Rechenregeln besprechen wir gleich.
Beispiele für die Anwendung der Quotientenregel:
sin x cos x cos x − sin x(− sin x) 1

y = tan x = ⇒ y0 = 2
= ,
cos x cos x cos2 x
cos x 1
y = cot x = ⇒ y0 = − 2 .
sin x sin x
Kettenregel: Sei y = f (z) und z = g(x) und somit y = f (g(z)). (Man nennt das
eine zusammengesetzte Funktion.) Dann ist
d df (g) dg
f (g(x)) = (Kettenregel). (2.2.8)
dx dg dx
In kompakter Schreibweise ist die Kettenregel:
(f (g(x)))0 = f 0 (g) g 0 (x).

Beispiele:
1. √
y = tan x2 + 1 ,
d.h. y = tan g, g = z 1/2 , z = x2 + 1. Die Ableitung ist dann
dy dy dg dz
=
dx dg dz dx
1 1 −1/2
= z 2x
cos2 g 2
1 x
= √ √ .
cos2 2 2
x +1 x +1
2. Allgemeine Exponentialfunktion
y = bx = ex ln b b ∈ R, b > 0.
Daher
dy
= ex ln b ln b = bx ln b.
dx
Differentiation von Umkehrfunktionen:

Sei y = f (x) differenzierbar und umkehrbar in einem bestimmten Gebiet x ∈ D. Ihre
Ableitung ist dxdy
= f 0 (x). Die Umkehrfunktion bezeichnen wir hier mit x = f˜(y),
anstelle von f −1 , um Missverständnisse zu vermeiden. Gemäß der Definition (2.1.4)
der Umkehrfunktion ist
x = f˜(f (x)).
Die Ableitung dieser Gleichung nach x ergibt unter Benutzung der Kettenregel:
d ˜ d df (x)
1= f (f (x)) = f˜(y)
dx dy dx
df˜(y) 1
⇒ = . (2.2.9)
dy df (x)/dx
Dies ist die sog. Umkehrfunktionsregel. Die Formel (2.2.9) ist wie folgt zu verstehen.
In (2.2.9) ist die Umkehrfunktion f˜ als Funktion der Variablen y dargestellt. Auf der
rechten Seite muss man nach der Berechnung der Ableitung df (x)/dx die Ersetzung
x = f˜(y) durchführen. Will man zur üblichen Konvention zurückkehren und f˜ als
Funktion von x darstellen, dann vertausche man y ↔ x in (2.2.9) und erhält
df˜(x) 1
= , (2.2.10)
dx df (y)/dy
wobei man auf der rechten Seite nach der Berechnung der Ableitung df /dy die Er-
setzung y = f˜(x) vornehmen muss.
Hinweis: Mit den Ableitungen von exp x, sin x, cos x, den Regeln (2.2.4) – (2.2.7),
der Kettenregel (2.2.8) und der Umkehrfunktionsregel (2.2.9) bzw. (2.2.10) kann
man alle (zusammengesetzten) elementaren Funktionen differenzieren. Nichtelemen-
tare Funktionen, die durch Potenzreihen – siehe Abschnitt 2.3 – dargestellt werden
können, kann man damit ebenfalls differenzieren. Die Ableitung
R x einer nichtelemen-
taren Funktion F (x), die in Form eines Integrals F (x) = a dtf (t) darstellbar ist
–siehe etwa das Beispiel (2.4.25) –, ist dF(x)/dx =f(x). Das wird in (2.4.20) gezeigt.
Eine andere Ableitungsregel für Funktionen, die durch ein Integral definiert sind, ist
(2.4.24) unten.
Beispiele:
1. y = ln x ist die Umkehrfunktion von x = ey mit der Ableitung dx/dy = ey .
Mit (2.2.10) erhalten wir (0 ≡ d/dx):
1 1 1
(ln x)0 = y
= ln x = .
e e x
2.
y = ln |x|,
d.h. y = ln x für x > 0 und y = ln(−x) für x < 0. Unter Benutzung des soeben
erzielten Ergebnisses erhalten wir
dy 1
= .
dx x
Für x < 0 wurde zudem die Kettenregel benutzt:
d 1 1
ln(−x) = (−1) = .
dx (−x) x
3.
y = xr = er ln x , r ∈ R.
Unter Benutzung der Kettenregel erhält man
r
(xr )0 = (r ln x)0 er ln x = xr = rxr−1 .
x
4. y = arcsin x ist die Umkehrfunktion von x = sin y. Mit (2.2.10) ergibt sich:
1 1 1
(arcsin x)0 = d sin y
= =p
dy
cos y 1 − sin2 y
1
=√ , |x| < 1 .
1 − x2
5. y = arccos x ist die Umkehrfunktion von x = cos y. Mit (2.2.10) erhält man:
1 1 1
(arccos x)0 = d cos y
= = −p
dy
− sin y 1 − cos2 y
1
= −√ , |x| < 1 .
1 − x2
Differential:
df
Man kann die Ableitung einer Funktion, dx = f 0 (x), als Differentialquotient ernst
nehmen. Multiplikation mit der infinitesimalen Größe dx ergibt:
df = f 0 (x)dx . (2.2.11)
Man bezeichnet df als das Differential von f an der Stelle x. Gl. (2.2.11) besagt,
dass sich die Funktion vom Wert f (x) zum Wert f (x) + df (x) infinitesmal ändert,
wenn man die Variable von x nach x + dx infinitesmal ändert.
Beispiel: y = xr ⇒ dy = rxr−1 dx.
2.2.2 Höhere Ableitungen

Sei f (x) eine differenzierbare Funktion und die Ableitung sei ebenfalls differenzier-
bar. Die 2. Ableitung von f erhält man, indem man die Ableitung – also den Diffe-
rentialquotienten (2.2.2) – der 1. Ableitung bildet. Notation:
d2 f (x)

d df (x)
≡ .
dx2 dx dx
Höhere Ableitungen sind rekursiv definiert. Die n-te Ableitung von f (x) erhält man
aus der (n − 1)-ten Ableitung:
dn f (x) d dn−1 f (x)

= n = 1, 2, 3, ...
dxn dx dxn−1
Wir nehmen hier natürlich an, dass diese Ableitungen existieren.
Man verwendet oft die Strich-Notation
d2 f dn f (x)
f 00 ≡ , . . . , f (n)
≡ .
dx2 dxn
In der Mechanik bestimmen wir typischerweise Bahnen von Körpern, d.h. wir
berechnen Koordinaten als Funktion der Zeit, z.B. x = x(t). Es interessieren uns
dx(t) d2 x(t)
die Geschwindigkeit und die Beschleunigung .
dt dt2
Zur Abkürzung verwendet man oft die Punkt-Notation
dx d2 x
ẋ(t) ≡ , ẍ(t) ≡ .
dt dt2
2.2.3 Lokale Extremwerte, stationäre Punkte

Sie kennen aus der Schule die Begriffe lokales Minimum und Maximum und Wen-
depunkt einer Funktion f (x). Wir betrachten eine (nicht notwendigerweise stetige)
Funktion f (x) in einer lokalen Umgebung Gx0 = {|x − x0 | < a} eines Punktes x0 .
Definition: Wenn es eine Umgebung Gx0 gibt, so dass
f (x0 ) ≤ f (x) ∀x ∈ Gx0 , dann heißt f (x0 ) lokales Minimum von f .
f (x0 ) ≥ f (x) ∀x ∈ Gx0 , dann heißt f (x0 ) lokales Maximum von f .
Ein lokales Minimum oder Maximum einer Funktion bezeichnet man auch als lokalen
Extremwert von f . Gemäß der obigen Definition muss es sich nicht notwendigerweise
um einen isolierten Punkt handeln – es kann auch ein Kontinuum von Minima oder
Maxima vorliegen.
Es sei f (x) in Df differenzierbar. Definition:
Wenn f 0 (x0 ) = 0 für x0 ∈ Df , dann heißt x0 stationärer Punkt von f .
Hinweise:
1. Bei einem stationären Punkt liegt nicht notwendigerweise ein lokales Mini-
mum oder Maximum von f . Beispiel: Die Funktion y = x3 hat bei x0 = 0
einen stationären Punkt, wird aber dort weder lokal minimal noch maximal.
In diesem Beispiel liegt bei x0 ein Wendepunkt (siehe das u.a. Kriterium).
2. Eine Funktion kann auch eine Kontinuum von stationären Punkten haben.
Beispiel: eine Gerade parallel zur x-Achse, f (x) = const. Nach der obigen
Definition sind alle x stationäre Punkte. Es handelt sich weder um Minima
oder Maxima noch um Wendepunkte.
Wenn die Funktion f zweimal stetig differenzierbar ist – d.h. f und ihre Ableitung
f 0 sind stetig und differenzierbar und f 00 ist stetig –, dann erhält man folgende
Aussagen, die Sie aus der Schule kennen:
Wenn f 0 (x0 ) = 0 und f 00 (x0 ) > 0 ⇒ lokales Minimum bei x0 .
Wenn f 0 (x0 ) = 0 und f 00 (x0 ) < 0 ⇒ lokales Maximum bei x0 .
Wenn f 0 (x0 ) = 0 und f 00 (x0 ) = 0 ⇒ lokales Min., Max. oder stat. Punkt bei x0 .
Das Kriterium f 00 (x0 ) > 0 (f 00 (x0 ) < 0) ist hinreichend, aber nicht notwendig für ein
lokales Minimum (Maximum). Wenn f 00 (x0 ) = 0, muss man weitere Untersuchungen
vornehmen, um den Typ des stationären Punktes festzulegen. Man kann sich dazu
verschiedener Methoden bedienen:
1. Zeichnen Sie (immer) die Funktion in der Umgebung eines stationären Punktes
– dann sehen Sie sofort, worum es sich bei f (x0 ) handelt. Die Definition eines
lokalen Minimums bzw. Maximums ist oben angegeben. Wenn die Funktion in
einer Umgebung Gx0 monoton steigt oder fällt, liegt bei x0 ein Wendepunkt
vor.
2.3 Potenzreihen und Taylorentwicklung 27
2. Vergleich der Vorzeichen der 1. Ableitung: Sei x ∈ Gx0 . Wenn f 0 (x) > 0 für
x < x0 und f 0 (x) < 0 für x > x0 (d.h. Steigung erst positiv, dann negativ),
dann liegt bei x0 ein Minimum vor. Wenn f 0 (x) < 0 für x < x0 und f 0 (x) > 0
für x > x0 , dann handelt es sich um ein Maximum. Wenn f 0 (x) in einer
Umgebung von x0 sein Vorzeichen nicht ändert, d.h. f in dieser Umgebung
monoton steigt oder fällt, dann handelt es sich um einen Wendepunkt.
3. Methode der höheren Ableitungen: Wenn die dritte und höhere Ableitungen
von f existieren, kann man anhand ihres Verhaltens ebenfalls den Typ des
stationären Punktes bestimmen. Z.B. wenn f 00 (x0 ) = 0 und f 000 (x0 ) 6= 0, dann
liegt bei x0 ein Wendepunkt (siehe z.B. das Buch von Bronstein et al.).
Beispiele:
1) f (x) = x4 . Die Funktion hat offensichtlich bei x0 = 0 ein (globales) Minimum.
Da f 00 (0) = 0, muss man sich einer der o.g. Methoden bedienen, um das formal zu
zeigen. Z.B. folgt die Aussage f (0) = Minimum aus dem Wechsel des Vorzeichens
von f 0 (x) = 4x3 von Minus nach Plus beim Wechsel von x < 0 nach x > 0.
2) f (x) = x5 . Bei x0 = 0 liegt ein Wendepunkt vor; denn i) f 0 (0) = f 00 (0) = 0 und
ii) f 0 (x) = 5x4 wechselt sein Vorzeichen beim Übergang von x < 0 nach x > 0 nicht.
Im Mechanik-Teil dieser Vorlesung analysieren wir z.B. die potentielle Energie

V (x) eines Teilchens in einem Kraftfeld – im einfachsten Fall für eine Bewegung
in einer Raumdimension – als Funktion der Ortskoordinate x und bestimmen die
stationären Punkte x0 von V . Wenn es sich bei V (x0 ) um ein lokales Minimum han-
delt, dann befindet sich das Teilchen am Ort x0 in einer stabilen Gleichgewichtslage.
Ist V (x0 ) ein lokales Maximum oder ein Wendepunkt, ist die Gleichgewichtslage x0
instabil.
2.3 Potenzreihen und Taylorentwicklung

Oft will man (in der Physik) komplizierte Funktionen f (x), die bei x0 hinreichend oft
stetig differenzierbar sind und sich in der Nähe dieses Punktes ,,anständig” verhal-
ten (stetig, beschränkt), in der Umgebung dieses Punktes näherungsweise darstellen.
Dies liefert die Taylorentwicklung. Sie ermöglicht es, f (x) in der Umgebung von x0
durch ein Polynom n-ten Grades zu approximieren. Wenn f (x) beliebig oft diffe-
renzierbar ist, kann man diese Funktion – in der Regel nur in einem bestimmten
Gebiet |x − x0 | < a – durch eine unendliche Reihe, eine sog. Potenzreihe darstel-
len. Andererseits kann eine Funktion auch durch Vorgabe einer Potenzreihe definiert
werden.
2.3.1 Folgen und Reihen

Zunächst einige Begriffe zu und Ergebnisse für reelle Zahlenfolgen und Reihen. Ei-
niges davon sollten Sie aus der Schule kennen. Details werden ausführlich in der
Vorlesung Höhere Mathematik I besprochen.

Endliche Zahlenfolge:
Das ist eine Folge von N + 1 (reellen) Zahlen
b 0 , b 1 , . . . , b i , . . . , bN .
Dass wir hier den Zählindex i mit i = 0 beginnen lassen, ist eine Konvention. Die
Summe (= endliche Reihe) dieser Folge ist die (reelle) Zahl
N
X
SN = b 0 + b 1 + . . . + b N = bi ,
i=0
P
wobei hier das Summenzeichen verwendet wurde.
Ein bekanntes Beispiel ist die geometrische Folge (auch geometrische Progression
genannt):
b0 = a, b1 = aq, b2 = aq 2 , . . . , bn = aq n .
Die Summe dieser n + 1 Glieder ist
a(1 − q n+1 )
Sn = a + aq + aq 2 + . . . + aq n = . (2.3.1)
1−q
Man erhält dieses Ergebnis, indem man zunächst Sn mit q multipliziert,
qSn = aq + aq 2 + aq 3 + . . . + aq n+1
und qSn von Sn subtrahiert:
S − qS = a − aq n+1 = a(1 − q n+1 ) .

| n {z n}
Sn (1−q)
Unendliche Folgen und Reihen:

Wir betrachten eine unendliche Zahlenfolge
b0 , b 1 , . . . , b i , . . . ≡ {bi }∞
i=0 .
Die Folge konvergiert (gegen die Zahl b), wenn
b = lim bi existiert.
i→∞
Die endlichen Summen n

X
Sn = bi
i=0
nennt man Partialsummen. Die mit der Folge assoziierte unendliche Reihe ist formal
gegeben durch
X∞
S≡ bi .
i=0
Die unendliche Reihe existiert, wenn die Folge der Partialsummen konvergiert, d.h.
wenn die Zahl S = lim Sn existiert, d.h. |S| < ∞ .

n→∞
Eine offensichtlich notwendige, aber nicht hinreichende Bedingung dafür, dass der
Grenzwert S existiert ist, dass die Folge der bi gegen Null konvergiert:
lim bi = 0 .
i→∞
Beispiele:
1) Für die geometrische Reihe {bi = aq i }∞
i=0 sind die Partialsummen Sn durch (2.3.1)
gegeben. Die Partialsummen konvergieren, wenn |q| < 1:
a
|q| < 1 ⇒ S = lim Sn = . (2.3.2)
n→∞ 1−q
Die geometrischen Reihe konvergiert somit für |q| < 1.
2) Wir betrachten die sog. harmonische Reihe und die sog. alternierende harmonische
Reihe: ∞ ∞
X 1 X (−1)k+1 1 1 1
und = 1 − + − ... (2.3.3)
k=1
k k=1
k 2 3 4
Die mit diesen Reihen assoziierten Folgen sind Nullfolgen; denn in beiden Fällen
ist limk→∞ bk = 0. Allerdings konvergiert nur die alternierende harmonische Reihe;
die harmonische Reihe ist divergent. Die Divergenz dieser Reihe kann man mit ele-
mentaren Mitteln zeigen. Die Konvergenz der alternierenden harmonischen Reihe
kann man z.B. mit dem Leibniz-Kriterium für alternierende Reihen beweisen – siehe
HöMa-Vorlesung. Wir werden unten auf diese Reihen zurückkommen.
Rechenregeln für konvergente Reihen: Bei einer konvergenten Reihe mit dem
Wert S darf man jedes Glied mit einer Zahl a ∈ R multiplizieren; die neue Reihe
ist wieder konvergent und hat den Wert aS. Zwei konvergente Reihen darf man
gliedweise addieren und subtrahieren. Man darf in einer konvergenten Reihe auch
beliebig viele Klammern setzen, ohne den Grenzwert der Reihe zu verändern.
Nun zum Begriff der absoluten Konvergenz einer Reihe. Wir betrachten
∞
X ∞
X
bk (R1) und |bk | . (R2)
k=1 k=1
Die Glieder in (R1) können verschiedene Vorzeichen haben. Wenn die Reihe (R2)
konvergiert, dann konvergiert offensichtlich auch die Reihe (R1). Man sagt, die Rei-
he (R1) konvergiert absolut. Wenn Reihe (R2) divergiert, ist zunächst nicht klar, ob
(R1) auch divergiert oder konvergiert. Falls (R1) konvergiert, bezeichnet man sie als
bedingt konvergent. Ein Beispiel dafür sind die beiden Reihen in (2.3.3). Die kon-
vergente alternierende harmonische Reihe entspricht (R1), die harmonische Reihe
(R2). Wie erwähnt, divergiert diese Reihe; deswegen ist die alternierende harmo-
nische Reihe bedingt konvergent. Im Gegensatz dazu ist die geometrische Reihe
absolut konvergent für |q| < 1.

Bei einer absolut konvergenten Reihe darf man die Glieder der Reihe, also ihre Sum-
manden beliebig umordnen, ohne dass man den Wert der Reihe ändert. Das ist bei
bedingt konvergenten Reihen i.A. nicht der Fall.
Es gibt eine Reihe von Kriterien, mit denen man feststellen kann, ob eine un-
endliche Reihe konvergiert. Wir erwähnen hier nur zwei dieser Kriterien:
Quotientenkriterium: Falls der Grenzwert n → ∞ des Verhältnisses |bn+1 /bn |
existiert, dann gilt:


bn+1
ρ < 1 ⇒ Reihe ist absolut konvergent,

Sei ρ = lim . Falls ρ = 1 ⇒ keine Aussage mit diesem K. möglich,
n→∞ bn 
ρ > 1 ⇒ Reihe ist divergent.

(2.3.4)
1
Wurzelkriterium: Falls der Grenzwert n → ∞ der n-ten Wurzel |bn | existiert,
n
dann gilt:

1
ρ < 1 ⇒ Reihe ist absolut konvergent,

Sei ρ = lim |bn | n . Falls ρ = 1 ⇒ keine Aussage mit diesem K. möglich,
n→∞ 
ρ > 1 ⇒ Reihe ist divergent.

(2.3.5)
2.3.2 Potenzreihen
Die Glieder der obigen Reihen und ihre Werte sind Konstanten – aber man kann
auch Reihen betrachten, deren Glieder Funktionen einer Variablen sind. Der ein-
fachste und am häufigsten auftretende Fall einer solchen Funktionenreihe ist der
einer Potenzreihe. Das ist eine unendliche Reihe der Form
∞
X ∞
X
n
an x oder S(x) = an (x − x0 )n , an , x0 , x ∈ R.
n=0 n=0
Die Zahlen an sind die Koeffizienten der Potenzreihe, x0 ist der Entwicklungspunkt
(siehe unten) und x bezeichnet eine reelle Variable. Die erste Reihe ist offensichtlich
ein Spezialfall (x0 = 0) der zweiten Reihe. Eine Potenzreihe ist – falls sie konvergiert
– eine Funktion S(x) der Variablen x. Solche Reihen können auf verschiedene Wei-
se verwendet werden. Man kann einerseits eine bekannte Funktion innerhalb eines
bestimmten Gebietes durch eine Potenzreihe darstellen. Das werden wir unten an-
hand etlicher wichtiger Beispiele tun. Man kann andererseits eine Potenzreihe durch
Vorgabe von Koeffizienten an auch zur Definition neuer Funktionen benutzen. Vie-
le nichtelementare Funktionen können auf diese Weise definiert werden. Wir gehen
darauf hier nicht ein.
Falls eine Potenzreihe nur endlich viele Glieder hat, d.h. wenn an = 0 ∀n > N , dann
handelt es sich offensichtlich um ein Polynom PN (x) vom Grad N .
Um festzustellen, ob eine Potenzreihe in einem bestimmten Bereich von x konver-

giert, kann man die entsprechenden Kriterien für unendliche Reihen benutzen –
insbesondere das o.g. Quotienten- oder Wurzelkriterium. Mit diesen Kriterien kann
der Konvergenzradius ρ der jeweiligen Reihe bestimmt werden. Wir betrachten i.F.
Potenzreihen mit ρ 6= 0. Im Gebiet
|x − x0 | < ρ
konvergiert die Potenzreihe S(x) absolut4 . In den Endpunkten x = x0 − ρ und

x = x0 + ρ kann die Reihe entweder konvergent oder divergent sein.
Beispiel: Wir betrachten die oben besprochene geometrische Reihe und setzen
q = x und a = 1. Die Partialsumme SN der Reihe ist
N
2 N
X 1 − xN +1
SN (x) = 1 + x + x + ... + x = xn = .
n=0
1−x
N →∞
Für |x| < 1 ⇒ xN +1 −−−→ 0, d.h.
1
S(x) = lim SN (x) = .
N →∞ 1−x
Fazit: Man kann die Funktion 1/(1 − x) für |x| < 1 durch folgende Potenzreihe
darstellen: ∞
1 X
= xn für |x| < 1.
1 − x n=0
Für |x| < 1 konvergiert diese Reihe absolut. Anhand der linken Seite dieser Gleichung
sehen wir, dass die Reihe auch bei x = −1 konvergiert, aber bei x = 1 divergiert.
Was hat man durch diese Darstellung gewonnen? Man kann die Funktion 1/(1 − x)
z.B. in der Umgebung von x0 = 0 näherungsweise durch eine endliche Summe, d.h.
ein Polynom darstellen, mit dem es sich in der Regel einfacher rechnen lässt. Je
mehr Glieder man berücksichtigt, desto genauer wird die Approximation.
1
1+x
1 + x + x2
..
.
Weitere Beispiele besprechen wir unten.
Ohne Beweis listen wir noch einige Aussagen auf, die für das Rechnen mit Po-
tenzeihen wichtig sind (Beweis siehe HöMa-Vorlesung):
4
Bei Funktionenreihen kommt noch der Begriff der gleichmäßigen Konvergenz der Reihe ins
Spiel. Wir gehen hier nicht darauf ein.
1. Zwei Potenzreihen darf man addieren, subtrahieren oder multiplizieren. Die

resultierende Potenzreihe konvergiert zumindest im Durchschnitt der Konver-
genzgebiete der beiden Ausgangsreihen.
2. Man kann auch den Quotienten zweier Potenzreihen bilden. Die Nennerreihe
darf aber entweder keine Nullstelle am Entwicklungspunkt x0 haben, d.h. es
muss a0 6= 0 sein, oder die Nullstelle n-ter Ordnung der Nennerreihe bei x0 wird
durch eine Nullstelle mindestens n-ter Ordnung der Zählerreihe aufgehoben.
3. Eine Potenzreihe darf innerhalb ihres Konvergenzgebietes gliedweise differen-

ziert oder integriert5 werden:
∞ ∞
d X X d
an (x − x0 )n = an (x − x0 )n .
dx n=0 n=0
dx
Z ∞
X ∞
X Z
n
dx an (x − x0 ) = an dx (x − x0 )n .
n=0 n=0
Vorsicht: Am Rand des Konvergenzgebiets konvergieren die rechten Seiten die-

ser Gleichungen nicht unbedingt gegen die Ableitung bzw. das Integral der
Funktion, die durch die Potenzreihe auf der linken Seite dargestellt wird.
2.3.3 Taylorentwicklung um x0 = 0
In vielen Anwendungen stellt sich folgendes Problem: Gegeben ist eine Funktion
f (x), die sich in der Umgebung eines Punktes x0 ,,anständig” verhält. Man möchte
diese Funktion bei x0 in eine Potenzreihe entwickeln.
Wir wollen zunächst eine Formel für den Fall x0 = 0 herleiten. Die Funktion f sei an
dieser Stelle unendlich oft differenzierbar. Die allgemeine Form der gesuchten Reihe
ist ∞
X
f (x) = an xn = a0 + a1 x + a2 x2 + ... (2.3.6)
n=0
Frage: Wie erhalten wir die Koeffizienten an aus f (x)?

Wir nehmen an, dass die Reihe in einem Gebiet um x0 = 0 konvergiert. Dann dürfen
wir sie gliedweise differenzieren (siehe oben).
1. x0 = 0 in (2.3.6) einsetzen liefert a0 = f (0).
2. Differenziere die linke und rechte Seite von (2.3.6):

∞
X
0
f (x) = nan xn−1 = a1 + 2a2 x + 3a3 x2 + ...
n=1
x0 = 0 einsetzen liefert a1 = f 0 (0).

5
siehe nächstes Kapitel
3. Zweifache Differentiation von (2.3.6):

∞
X
f 00 (x) = n(n − 1)an xn−2 = 2a2 + 3 · 2a3 x + ...
n=2
Man erhält a2 = f 00 (0)/2.
4. Dreifache Differentiation von (2.3.6):

∞
X
000
f (x) = n(n − 1)(n − 2)an xn−3 = 3! a3 + 4! a4 x + ...
n=3
Man erhält a3 = f 000 (0)/3!.
5. n-fache Differentiation von (2.3.6):
f (n) (x) = n! an + (n + 1)! an+1 x + ...
Man erhält
1 (n)
an = f (0). (2.3.7)
n!
Mit (2.3.7) erhalten wir aus (2.3.6) die Potenzreihenentwicklung einer Funktion f (x)
an der Stelle x0 = 0. Das ist die sog. Taylor-Reihe der Funktion bei x0 = 0:
∞
X f (n) (0)
f (x) = xn . (2.3.8)
n=0
n!
Beispiel: Taylorentwicklung von f (x) = ex um x0 = 0.
dn x
e = ex → f (n) (0) = 1 ∀n.
dxn
Somit
∞
x
X xn
e = . (2.3.9)
n=0
n!
Hinweis: Diese Potenzreihe konvergiert für alle x ∈ R, siehe HöMa I-Vorlesung..

Die Abbildung 2.4 zeigt, dass man die Exponentialfunktion in der Umgebung von
x0 = 0 bereits durch die ersten paar Summanden aus (2.3.9) gut approximieren
kann.
Exponentialfunktion, y=ex
8
y
ex
7 1
1+x
6 2
1+x+x
2
2 3
5 1+x+ +x
x
2 6
2 3 4
1+x+ +x + x
x
2 6 24
4
0
-2 -1.5 -1 -0.5 0 0.5 1 1.5 2
x
Abbildung 2.4: Die Funktion y = ex und Taylor-Approximationen um x0 = 0.

Abgebildet sind ex und die Taylor-Polynome von der nullten bis zur vierten Ordnung.
Allgemein: Approximiert man eine Funktion f (x) bei x0 = 0 durch die ersten N
Glieder ihrer Potenzreihe, dann schreibt man oft
N N
X f (n) (0) X f (n) (0)
f (x) = xn + O(xN +1 ) ≈ xn . (2.3.10)
n! n!
|n=0 {z } n=0
Näherungsformel für f (x)
O(xN +1 ) ist eine symbolische Schreibweise für das, was in der unendlichen Reihe weg-
gelassen wurde. Das Symbol zeigt an, dass der nichtberücksichtigte Term mindestens
von der Größenordnung = Ordnung xN +1 ist. Für dieses sogenannte Restglied gibt
es Abschätzungsformeln, in denen die (N + 1)-te Ableitung von f auftritt, siehe
HöMaI-Vorlesung.
2.3.4 Taylorentwicklung um einen beliebigen Punkt x0

Wir wollen nun eine (unendlich oft differenzierbare) Funktion f (x) an einem beliebi-
gen Punkt x0 durch eine Potenzreihe darstellen. Die allgemeine Form einer solchen
Reihe ist ∞
X
f (x) = bn (x − x0 )n bn ∈ R. (2.3.11)
n=0
Wir nehmen wieder an, dass der Konvergenzradius dieser Reihe verschieden von Null
ist. Dann dürfen wir die Reihe im Konvergenzgebiet gliedweise differenzieren.
1. x = x0 einsetzen ergibt b0 = f (x0 ).
2. Differenzieren von (2.3.11) führt auf

∞
X
0
f (x) = bn n(x − x0 )n−1 .
n=1
x = x0 einsetzen ergibt b1 = f 0 (x0 ).
3. Die n-fache Differentiation ergibt
f (n) (x) = n! bn + (n + 1)! bn+1 (x − x0 ) + ...
Einsetzen von x = x0 liefert

1 (n)
bn = f (x0 ). (2.3.12)
n!
Somit erhalten wir die Taylor-Reihe bei x0 :

∞
X f (n) (x0 )
f (x) = (x − x0 )n . (2.3.13)
n=0
n!
Setzen wir x − x0 = h, d.h. x = x0 + h, erhalten wir die zu (2.3.13) äquivalente Form

der Taylor-Reihe:
∞
X f (n) (x0 )
f (x0 + h) = hn . (2.3.14)
n=0
n!
Beispiel: Entwickle f (x) = ln x um x0 = 1, verwende dazu die Formel (2.3.13).
f (1) = 0
1
f 0 (x) = ⇒ f 0 (1) = 1
x
1
f 00 (x) = − ⇒ f 00 (1) = −1
x2
1
f 000 (x) = (−1)(−2) ⇒ f 000 (1) = 2
x3
..
.
Somit ist
1 1
ln x = 0 + (x − 1) − (x − 1)2 + (x − 1)3 + O (x − 1)4 .

2 3
Weitere Beispiele in den Übungen.
2.3.5 Elementare transzendente Funktionen als Potenzrei-

hen
Wir leiten für einige dieser Funktionen, die häufig in der Physik vorkommen, ihre
Potenzreihendarstellung um x0 = 0 her.
• Für f (x) = ex haben wir das bereits in (2.3.9) getan; das Ergebnis war
∞
x
X xn
e = .
n=0
n!
• f (x) = ln x. Da ln 0 = −∞, existiert für diese Funktion keine Entwicklung um

x0 = 0. Wir betrachten ln x in der Umgebung von x = 1. Anstelle von ln x
betrachten wir
f (x) = ln(1 + x)
und entwickeln diese Funktion um x0 = 0. Wir verwenden die Formel (2.3.8).
f (0) = ln 1 = 0
1
f 0 (x) = ⇒ f 0 (0) = 1
1+x
1
f 00 (x) = (−1) ⇒ f 00 (0) = −1
(1 + x)2
1
f 000 (x) = (−1)(−2) ⇒ f 000 (0) = 2
(1 + x)3
..
.
1
f (n) (x) = (−1)n−1 (n − 1)! ⇒ f (n) (0) = (−1)n−1 (n − 1)! .
(1 + x)n
Einsetzen in (2.3.8) ergibt

∞
X xn x2 x3
ln(1 + x) = (−1)n−1 =x− + + O(x4 ). (2.3.15)
n=1
n 2 3
Hinweis: Diese Potenzreihe konvergiert absolut für −1 < x < 1, siehe HöMaI-
Vorlesung. Die Reihe konvergiert bei x = 1; dort entspricht sie der alternie-
renden harmonischen Reihe in (2.3.3). Die Reihe divergiert bei x = −1; dort
entspricht sie der harmonischen Reihe in (2.3.3). Anhand von (2.3.15) sieht
man, dass der Wert der alternierenden harmonischen Reihe S = ln 2 ist.
Hyperbolische Funktionen
Für cosh x und sinh x erhalten wir die Potenzreihenentwicklung um x0 = 0 mit Hilfe
der Potenzreihendarstellung (2.3.9) von ex .
"∞ ∞
# ∞
ex + e−x (2.3.9) 1 X xn X (−x)n 1X xn
cosh x = = = + = [1 + (−1)n ]
2 2 n=0 n! n=0 n! 2 n=0 n!
∞
X x2n
= .
n=0
(2n)!
(2.3.16)
Analog findet man
∞
ex − e−x X x2n+1
sinh x = = . (2.3.17)
2 n=0
(2n + 1)!
Hinweis: Diese beiden Potenzreihen konvergieren absolut für alle x ∈ R.
Bemerkung: Für tanh x und coth x haben die Koeffizienten der Glieder ihrer
Potenzreihe eine kompliziertere Form, aber man kann die ersten Terme der entspre-
chenden Reihen problemlos berechnen, siehe Übungen.
Trigonometrische Funktionen
Wir entwickeln f (x) = sin x um x0 = 0.
f (0) = 0
0
f (x) = cos x ⇒ f 0 (0) = 1
f 00 (x) = − sin x ⇒ f 00 (0) = 0
f 000 (x) = − cos x ⇒ f 000 (0) = −1
f (4) (x) = sin x ⇒ f (4) (0) = 0
..
.
Die geradzahligen Ableitungen bei x0 = 0 sind 0, die ungeradzahligen sind abwech-

selnd +1 und −1. Einsetzen in die Formel (2.3.8) ergibt
∞
X x2n+1 x3 x5
sin x = (−1)n =x− + + O(x7 ). (2.3.18)
n=0
(2n + 1)! 3! 5!
Für cos x finden wir analog:

∞
X x2n x2 x4
cos x = (−1)n =1− + + O(x6 ). (2.3.19)
n=0
(2n)! 2! 4!
Hinweise:
1. Die beiden Potenzreihen konvergieren absolut für alle x ∈ R.
2. Die Koeffizienten in der Potenzreihenentwicklung von tan x und cot x haben

eine kompliziertere Form, aber man kann sie ebenfalls problemlos berechnen.
3. Wir benutzten hier bei der Herleitung der Potenzreihendarstellung insbeson-

dere der Funktionen ex , sin x, und cos x die Ableitungen dieser Funktionen.
Diese Ableitungen berechneten wir mit Hilfe der beiden Grenzwerte (2.1.8),
(2.1.9). Wir wiesen darauf hin, dass man mit diesen Ableitungen und dem
Differentialquotienten von xn die Ableitungen aller (elementaren) Funktionen
bestimmen kann.
In vielen Mathematikbüchern und -Vorlesungen wird der Aufbau der Differen-
tialrechung von Funktionen einer Variablen anders durchgeführt. Es wird – vor
Einführung des PDifferentialquotienten einer Funktion – gezeigt, dass ex gleich
der Potenzeihe ∞ n
n=0 x /n! ist, bzw. sin x, cos x gleich den rechten Seiten von
(2.3.18), (2.3.19). (Für diese Herleitungen benötigt man mehr als eine Zeile!)
Mit Hilfe dieser Potenzreihen erhält man rasch die Grenzwerte (2.1.8), (2.1.9)
und mit deren Hilfe die Ableitungen von ex , sin x, und cos x.
2.3.6 Anwendungen
Taylor-Approximation:
Die Entwicklung von Funktionen in Potenzreihen ist in der (theoretischen) Physik
gang und gäbe. In vielen Anwendungen braucht man aber nicht die exakte Darstel-
lung der Funktion als unendliche Reihe, sondern nur eine näherungsweise Darstellung
als endliche Reihe (= Polynom) bis zu einer bestimmten Ordnung. Man spricht dann
von von einer Taylor-Approximation. Bei der Taylor-Approximation einer Funktion
zur N -ten Ordnung in der Umgebung eines Punktes x0 muss die Funktion bei x0
nur N -fach differenzierbar sein. Aus Formel (2.3.13) erhalten wir
N N
X f (n) (x0 ) X f (n) (x0 )
f (x) = (x − x0 )n + O (x − x0 )N +1 ≈ (x − x0 )n . (2.3.20)
n! n!
|n=0 {z } n=0
Näherungsformel für f (x)
Für das Restglied gibt es wie gesagt Abschätzungsformeln, in denen die (N + 1)-te
Ableitung von f auftritt, siehe HöMaI-Vorlesung.
Hinweise:
1. Die Approximation der Funktion f (x) durch das Polynom N -ter Ordnung
auf der rechten Seite von (2.3.20) macht i.A. nur für x-Werte Sinn, für die
|x − x0 | < 1 gilt. Dann ist der weggelassene Term, der von der Größenordnung
(x − x0 )N +1 ist, in der Regel hinreichend klein.
2. In Anwendungen in der Physik ist x in der Regel dimensionsbehaftet, d.h. die
Aussage ,,x bzw. (x−x0 ) klein” oder ,,x bzw. (x−x0 ) groß” muss sich auf einen
Vergleich mit einer für das jeweilige physikalische Problem charakteristischen
Größe beziehen, die dieselbe physikalische Dimension wie x hat.
Beispiel: Sei
r
V (x) =
(a + x)2
die potentielle Energie eines Teilchens mit der Koordinate x. Es ist [x] =
[a] =Länge und [r]=Energie×Länge2 . Wir wollen V (x) für ,,kleine” x durch
Taylorapproximation bis zur 1. Ordnung nähern – präzise, für |x| |a|, d.h.
|x/a| 1. Stures Anwenden der Taylorformel für x0 = 0, d.h. (2.3.8) bzw.
(2.3.10) bis zur 1. Ordnung ergibt
r 2r
V (x) = 2
− 3 x + O(x2 ) .
a a
Die Abschätzung des vernachlässigten Restgliedes durch die dimensionsbe-
haftete Größe x2 macht wenig Sinn. Geschickter ist es, eine dimensionslose
Variable z = x/a einzuführen. Damit erhalten wir
r r
⇒ V (z) = 2 1 − 2rz + O(z 2 ) .

V (z) = 2 2
a (1 + z) a
3. Will man eine Funktion, die aus Produkten von Funktionen besteht, bis zu
einer bestimmten Ordnung entwickeln, ist es in der Regel am geschicktesten,
die Taylorentwicklung der Produkte zu verwenden, und diese konsistent bis
zur gewünschten Ordnung auszumultiplizieren.
Beispiel: Bestimme die Taylor-Approximation der Funktion ex sin x bis zur
Ordnung x3 bei x0 = 0.
x2 x3 x3

x 4 5
e sin x = 1 + x + + + O(x ) x − + O(x )
2! 3! 3!
3x2 x3
=x+ − + O(x4 ) .
2 6
4. Analog kann man vorgehen, wenn man eine Funktion der Form f (x)/g(x)
entwickeln will.
L’Hospitalsche Regel:
Diese Regel ist sehr nützlich, wenn man Funktionen der Form f (x)/g(x) an einer
Stelle x0 auswerten will, an der sowohl der Zähler als auch der Nenner beide null
oder beide unendlich werden – man erhält dann 0/0 bzw. ∞/∞. Bei Produkten
f (x)g(x) kann eine unbestimmte Form 0 · ∞ auftreten. In vielen dieser Fälle kann
der Grenzwert x → x0 mit der sog. L’Hospitalschen Regel durchgeführt werden. Sie
besagt, dass
f (x) f 0 (x)
lim = lim 0 , wenn f (x0 ) = g(x0 ) = 0 . (2.3.21)
x→x0 g(x) x→x0 g (x)
Man differenziert somit zunächst die Funktionen im Zähler und Nenner und bildet
erst dann den Grenzwert. Wenn der Ausdruck auf der rechten Seite von (2.3.21) wie-
der eine unbestimmte Form 0/0 bzw. ∞/∞ liefert, wendet man die Regel nochmal
an – und zwar so lange, bis man entweder einen wohldefinierten Limes erhält oder
feststellt, dass der Grenzwert divergiert.
Man kann (2.3.21) einfach beweisen, indem man die Taylor-Formel (2.3.13) für die
Funktionen f (x) und g(x) benutzt. Wir wollen das hier nicht tun. Stattdessen be-
trachten wir einige Beispiele:
ex − 1 sin x
f1 (x) = , f2 (x) = , f3 (x) = xr ln x , r > 0 .
x x
Wir wollen f1 bei x = 0 auswerten. Wir hatten bereits in (2.1.9) – ohne Verwendung
von dex /dx = ex – gezeigt, dass f1 (0) = 1. Mit Hilfe von (2.3.21) können wir uns im
Nachhinein davon überzeugen. Es ist (ex − 1)0 /(x)0 = ex , also f1 (0) = 1.
In (2.1.8) hatten wir gezeigt, dass f2 (0) = 1. Bei der Herleitung von d sin x/dx =
cos x hatten wir benutzt, Auch hiervon können wir uns im Nachhinein mit (2.3.21)
überzeugen.
2.4 Integralrechnung 41
Die Auswertung von f3 bei x = 0 ergibt die unbestimmte Form 0·∞. Zur Anwendung
von (2.3.21) schreiben wir f3 = f /g, wobei f = ln x und g = x−r . Dann
f (x) x−1 xr r>0

lim = lim = lim = 0.
x→0 g(x) x→0 −rx−r−1 x→0 −r
Dies zeigt, dass der Logarithmus ln x für x → 0 schwächer divergiert als jede negative
Potenz x−r .
2.4 Integralrechnung
Nun zur Integralrechnung mit Funktionen, die von einer Variablen abhängen. Die
Grundbegriffe und elementaren Rechenregeln sollten Sie bereits aus der Schule ken-
nen. Das unbestimmte Integral einer Funktion ist die Umkehrung ihrer Differentia-
tion. Das bestimmte Integral einer Funktion weist der Funktion eine reelle Zahl (ggf.
komplexe Zahl) zu. In Anwendungen in der Physik hängt die physikalische Bedeu-
tung dieser Zahl (Fläche, Geschwindigkeit, Ort, Arbeit, etc.) von der physikalischen
Bedeutung der Funktion und der Variablen ab, über die integriert wird.
2.4.1 Stammfunktion = unbestimmtes Integral
Gegeben sei die Ableitung f einer Funktion y:
d
y 0 = f (x) 0
≡ . (2.4.1)
dx
Gesucht ist die Lösung dieser Gleichung6 . Mit anderen Worten, wir suchen eine
Funktion y(x) = F (x), so dass
F 0 (x) = f (x).
Diese Funktion nennt man Stammfunktion oder unbestimmtes Integral von f (x). Es
ist klar, dass F nur bis auf eine additive Konstante c festgelegt ist. Wenn F (x) eine
Stammfunktion von f (x) ist, dann ist auch F (x) + c eine Stammfunktion.
6
Hinweis: Die Gleichung (2.4.1) ist der einfachste Typ einer Differentialgleichung 1. Ordnung
– siehe Kapitel 4.
Beispiele:
Funktion f (x) Stammfunktion (SF) F (x)
1
xn , n 6= −1 xn+1 + c
n+1
1
sin(ax), a 6= 0 − cos(ax) + c
a
1
cos(ax), a = 6 0 sin(ax) + c
a
1 ax
eax , a 6= 0 e +c
a
1
ln |x| + c
x
1
arctan x + c
1 + x2
Notation: Für die Stammfunktion = unbestimmtes Integral F (x) einer Funktion

f (x) sind folgende Bezeichnungen gebräuchlich:
Z
F (x) = f (x)dx ≡ SF [f (x)] .
Die Notation SF [f (x)] wird z.B. im Skript von Prof. Meden verwendet. Wir be-
nutzen sie
R in diesem Abschnitt ebenfalls, verwenden dann aber das häufig benutzte
Symbol f (x)dx. Bei diesem Symbol steht x für die Variable, von der die Stamm-
funktion abhängt. Das Symbol sollte Sie in Bezug auf Definition des bestimmten
Integrals (siehe unten) nicht verwirren – dort steht die Variable hinter dem Integral-
zeichen für diejenige, die ,,ausintegriert” wird.
Rechenregeln zur Bestimmung von Stammfunktionen:

1. Ist F SF von f und G SF von g, dann gilt für konstante a, b:
aF (x) + bG(x) ist SF von af (x) + bg(x). (2.4.2)
Beispiel:
1 1
f (x) = sin2 x = − cos(2x)
2 2
1 1
⇒ F (x) = x − sin(2x) + c.
2 4
2. Partielle Integration:
Aus der Produktregel der Differentiation,
(f (x)g(x))0 = f 0 (x)g(x) + f (x)g 0 (x) ,
erhalten wir sofort, dass
SF [f 0 g + f g 0 ] = f (x)g(x)
oder
SF [f g 0 ] = f (x)g(x) − SF [f 0 g]
In der üblichen Schreibweise lautet diese Formel: (2.4.3)
Z Z
0
f (x)g (x) dx = f (x)g(x) − f 0 (x)g(x) dx.
Beispiel: Bestimme die SF von y = x sin x. Zur Anwendung von (2.4.3) stellen
wir y in der Form y = f g 0 dar, wobei
f = x, g 0 = sin x ⇒ g = − cos x + c.
Dann ist
SF [x sin x] = −x cos x + c − (−1)SF [1 · cos x] = −x cos x + sin x + c.
3. Substitutionsmethode:
Sei F (x) eine SF von f (x) und g(x) eine differenzierbare Funktion. Wir erin-
nern uns an die Kettenregel der Differentiation, Gl. (2.2.8):
dF (g(x)) dF dg
= = f (g(x))g 0 (x).
dx dg |{z}
dx
|{z}
f g0
Somit ist
SF [f (g(x))g 0 (x)] = F (g(x))
Das ist die sog. Substitutionsregel. In der üblichen Schreib-

weise formuliert man diese Regel wie folgt: Die zu integrie- (2.4.4)
rende Funktion sei f (x) und es sei x = g(t).
⇒ dx = g 0 (t)dt (0 ≡ dtd ), und es gilt
Z Z
f (x) dx = f (g(t))g 0 (t) dt.
Beispiel: Gesucht ist die SF von y = x sin x2 . Wir verwenden die obere Formel
in (2.4.4). Wir setzen
f (g) = sin g wobei g(x) = x2 , ⇒ g 0 = 2x,
und somit
1
x sin x2 = g 0 (x) sin g(x).
2
Die Stammfunktion von f (g) ist
F (g) = − cos g + c.
Damit erhalten wir, dass

1 (2.4.4) 1
SF x sin x2 = SF [g 0 sin g] = − cos x2 + c.

2 2
Da capo: Wir verwenden nun die untere Formel in (2.4.4). Setze x2 = t, d.h.
√ √ 1
x= t, g(t) = t ⇒ g 0 (t) = t−1/2 .
2
Somit
Z Z √ Z
1 1 1
2
x sin x dx = t sin t t−1/2 dt = sin t dt = − cos t + c
2 2 2
1
= − cos x2 + c.
2
Integration gebrochen rationaler Funktionen:

Wir besprechen nun eine Methode zur Bestimmung der Stammfunktion einer ge-
brochen rationalen Funktion. Eine solche Funktion ist, wie oben erwähnt, von der
Form
P (x)
f (x) = , (2.4.5)
Q(x)
wobei P (x) ein Polynom vom Grad m und Q(x) ein Polynom vom Grad n ist.
Vorbemerkung 1: Wenn m ≥ n, dann kann f (x) immer auf die Form
p2 (x)
f (x) = p1 (x) + (2.4.6)
Q(x)
gebracht werden, wobei p1 (x) ein Polynom vom Grad m − n und p2 (x) ein Polynom
mit einem Grad kleiner als der von Q(x) ist. Die Form (2.4.6) erhält man durch
Division von P (x) durch Q(x). Wir überzeugen uns davon anhand eines Beispiels in
den Übungen.
Wir nehmen deshalb im Folgenden an, dass
Grad von P (x) < Grad von Q(x).

Vorbemerkung 2: Der Grad des Polynoms Q sei n und Q ist o.B.d.A. von der Form
Q(x) = b0 + b1 x + . . . + xn , bj ∈ R ,
siehe die Bemerkung in der Fußnote7 . Wir verwenden im Folgenden die Aussage, dass
ein reelles Polynom Q(x) vom Grad n maximal n reelle Nullstellen, d.h. maximal
n reelle Lösungen der Gleichung Q(x) = 0 hat. Es kann sich a) um n einfache
Nullstellen handeln; b) es können auch mehrfache Nullstellen auftreten, wobei eine
i-fache Nullstelle i-fach gezählt wird; c) es kann auch sein, dass die Zahl der reellen
Nullstellen kleiner als n ist. Welcher der drei Fälle realisiert ist, hängt von den
Werten der reellen Zahlen bj ab. Wir kommen darauf im Kapitel 3 über komplexe
Zahlen zurück.
Methode der Partialbruchzerlegung:

Fall a) Die Nullstellen ai des Nenners Q(x) seien reell und einfach. Dann hat Q die
folgende Produktdarstellung:
Q(x) = (x − a1 )(x − a2 ) · · · (x − an ) , ai 6= aj , ai ∈ R .
Die sog. Partialbruchzerlegung von (2.4.5) hat die Form
P (x) A1 A2 An
= + + ... + . (2.4.7)
Q(x) x − a1 x − a2 x − an
Die Koeffizienten A1 , ..., An erhält man, indem man die rechte Seite auf den Haupt-
nenner bringt und die Koeffizienten der Potenzen von x in den Zählern der Quoti-
enten auf der linken und rechten Seite der Gleichung vergleicht.
Beispiel:
2x + 3 2x + 3 A1 A2 A3
= = + + . (2.4.8)
x3 2
+ x − 2x x(x − 1)(x + 2) x x−1 x+2
Rechte Seite auf den Hauptnenner bringen:
A1 (x − 1)(x + 2) + A2 x(x + 2) + A3 x(x − 1) ! 2x + 3
= .
x(x − 1)(x + 2) x(x − 1)(x + 2)
Der Koeffizientenvergleich der Potenzen von x der Zähler auf der rechten und linken
Seite der Gleichung ergibt

x 2 : A1 + A2 + A3 = 0 
3 5 1
x : A1 + 2A2 − A3 = 2 ⇒ A1 = − , A 2 = , A 3 = − .
2 3 6
x0 : −2A1 = 3

7
Im Allgemeinen ist Q(x) = cn xn + ... Durch Ausklammern der Konstanten cn in Q, d.h.
P (x)
f (x) = cn Q(x)/cn
können wir o.B.d.A. von Q(x) = xn + ... ausgehen.
Das unbestimmte Integral (die Stammfunktion) von (2.4.8),

Z
2x + 3
F (x) = dx ,
x + x2 − 2x
3
erhält man durch Integration der rechten Seite von (2.4.8) unter Verwendung von
Z
A
dx = A ln |x − a| + c.
x−a
Fall b) Q(x) hat n reelle Nullstellen, einige davon seien mehrfache Nullstellen.
Anhand eines Beispiels sei erläutert, wie man in diesem Fall die Partialbruchzerle-
gung vornehmen muss.
Beispiel:
x3 + 1 A1 A2 A3 A4
3
= + + 2
+ . (2.4.9)
x(x − 1) x x − 1 (x − 1) (x − 1)3
Der Koeffizientenvergleich der Potenzen von x ergibt
A1 = −1, A2 = 2, A3 = 1, A4 = 2.
Das unbestimmte Integral von (2.4.9) ist somit
x3 + 1

−1
Z Z
2 1 2
dx = dx + + +
x(x − 1)3 x x − 1 (x − 1)2 (x − 1)3
1 1
= − ln |x| + 2 ln |x − 1| − − + c.
x − 1 (x − 1)2
Fall c) Das Polynom Q hat die Produktdarstellung:
Q(x) = (x − a1 )k1 · · · (x − ar )kr (x2 + p1 x + q1 )l1 · · · (x2 + ps x + qs )ls ,
| {z }
sollen keine reellen Nullstellen haben
wobei k1 + . . . + kr + 2l1 + . . . + 2ls = n. In diesem Fall erhält man die Partialbruch-

zerlegung von f (x), Gl. (2.4.5), folgendermaßen: Für jeden Faktor (x − a)k ist die
Summe von Brüchen
A1 A2 Ak
+ 2
+ ... +
x − a (x − a) (x − a)k
anzusetzen. Für jeden Faktor (x2 + px + q)l ist die Summe von Brüchen
B1 x + C1 Bl x + Cl
2
+ ... + 2
x + px + q (x + px + q)l
anzusetzen.
Nun zur Berechnung der Stammfunktionen dieser Brüche. Für l = 1 erhält man:
!
−
Z
Bx + C B 2C pB 2x + p
dx = ln |x2 + px + q| + p arctan p + const.
x2 + px + q 2 4q − p2 4q − p2
(2.4.10)
wobei 4q − p2 > 0. Wir beweisen diese Formel in den Übungen, Blatt 3.

Für l > 1, d.h. zur Berechnung des unbestimmten Integrals
Z
Bx + C
dx , l = 2, 3, ...
(x + px + q)l
2
verwendet man folgenden Trick: Wir differenzieren das folgende Integral, dessen
Integrand vom Parameter q abhängt, nach diesem Parameter:
Z Z
d Bx + C d Bx + C
dx = dx
dq (x2 + px + q)l−1 dq (x2 + px + q)l−1
Z
Bx + C
= −(l − 1) dx.
(x2 + px + q)l
Somit ist
Z Z
Bx + C 1 d Bx + C
2 l
dx = dx. (2.4.11)
(x + px + q) (1 − l) dq (x2 + px + q)l−1
Durch sukzessive Anwendung dieser Formel können wir uns bis l − 1 = 1 “herunter-
hangeln” und dann die Formel (2.4.10) anwenden.
Beispiel:
Z Z
Bx + C (2.4.11) d Bx + C
2 2
dx = −1 2
dx . (2.4.12)
(x + px + q) dq x + px + q
Das Integral auf der rechten Seite ist durch (2.4.10) gegeben. Wir müssen (2.4.10)
nur noch nach −d/dq differenzieren, um das unbestimmte Integral auf der rechten
Seite von (2.4.12) zu erhalten.
Weitere Methoden:
Es gibt eine Reihe weiterer Methoden, d.h. Substitutionen = Variablentransforma-
tionen zur Berechnung unbestimmter Integrale. Hier seien nur zwei Beispiele ge-
nannt.
• Integrale der Form
Z
P (u, v)
R(sin x, cos x)dx , wobei R(u, v) = ,
Q(u, v)
lassen sich mit der Variablentransformation (sog. Halbwinkelmethode)
x
t = tan
2
auf ein Integral einer rationalen Funktion zurückführen.
• Integrale der Form Z √
R(x, x2 + a2 )dx
lassen sich mit

x = a sinh t oder x = a tan t
bearbeiten. Beispiele dazu und weitere Transformationsformeln findet man etwa bei
I.N. Bronstein et al., Taschenbuch der Mathematik.
Es gibt auch eine Reihe ausführlicher Handbücher, in denen das teilweise mehrere
Jahrhunderte alte Wissen über Integrale gesammelt ist; z. B.
I.S. Gradshteyn und I.M. Ryzhik, Table of Integrals, Series, and Products, Academic
Press (inzwischen in der 7. Auflage, 2007).
Die Computeralgebra-Programme Mathematica und Maple ,,kennen” die bekannten
Stammfunktionen ebenfalls. Allerdings sollten Sie diesen Programmen bei der Inte-
gration komplizierter Funktionen nie blind vertrauen.
,,Das Differenzieren ist ein Handwerk – aber das Integrieren eine Kunst.” Dieser
Spruch bringt pointiert eine Erfahrung zum Ausdruck, die Sie vermutlich ebenfalls
schon gemacht haben bzw. noch machen werden. Während man mit den Regeln aus
Abschnitt 2.2.1 – und (2.4.20), (2.4.21) und (2.4.24) unten – jede in analytischer
Form vorliegende Funktion ,,nach Schema F” differenzieren kann, erfordert die Be-
stimmung des Integrals einer komplizierten Funktion eine oder mehrere mehr oder
weniger raffinierte Transformationen. In vielen Fällen gelingt es nicht, das Integral
einer Funktion in analytischer Form durch elementare Funktionen auszudrücken –
obwohl das Integral existiert. Solche Integrale waren oft Anlass zur Definition neuer,
nichtelementarer Funktionen; siehe Abschnitt 2.4.2.
2.4.2 Bestimmtes Integral

Das sog. bestimmte Integral einer Funktion f (x) zwischen den Grenzen a ≤ x ≤ b
ist eine Zahl, oder anders gesagt eine Vorschrift, die der Funktion eine Zahl zuweist.
Da wir hier reelle Funktionen betrachten, die von einer reellen Variablen abhängen,
ist diese Zahl reell. Die geometrische Interpretation eines bestimmten Integrals ist
die einer Fläche (siehe jedoch den Hinweis unten). Das bestimmte Integral
Zb
f (x)dx = Fläche zwischen f (x) und x-Achse von a bis b, (2.4.13)
a
siehe Abbildung 2.5. Sie kennen das aus der Schule.

Das bestimmte Integral ist durch eine Grenzprozedur definiert. Man wählt zunächst
eine endliche Zahl (N + 1) von Stützstellen xn , n = 0, ..., N der Funktion zwischen
den Grenzen a und b:
a = x 0 < x 1 < x 2 < . . . < xn < . . . < xN = b .
Der Abstand ∆xn = xn − xn−1 kann beliebig gewählt werden; wir wählen hier als
Beispiel äquidistante Intervalle
(b − a)
∆x = .
N
f(x) = 20 x2 e-x
f(x)
10
0
0 1 2 3 4 5
x
Abbildung 2.5: Beispiel für die Berechnung eines bestimmten Integrals. Die Funktion
f (x) = 20x2 e−x wurde im Intervall 1 ≤ x ≤ 4 in N +1 äquidistante Stützstellen x0 =
1, . . . , xN = 4 eingeteilt
PN (hier N = 25). Die Summe der Flächen der abgebildeten
Rechtecksäulen ist n=1 f (a + n∆x)∆x, wobei ∆x = (b − a)/N .
Im Inneren oder auch am Rand eines jeden Elementarintervalls [xn−1 , xn ] wählt man
einen beliebigen Punkt zn , berechnet die Rechtecksfläche f (zn )∆xn und addiert die
N Flächen. Wir wählen hier die rechten Stützpunkte der jeweiligen Rechtecke, siehe
das Beispiel in Abbildung 2.5.
zn = a + n∆x , n = 1, ..., N.
Das bestimmte Integral, das man auch das Riemann-Integral nennt, ist definiert
durch den Grenzwert N → ∞ und folglich ∆xn → 0 bzw. ∆x → 0:
Zb N
X
f (x)dx = lim f (a + n∆x)∆x . (2.4.14)
N →∞
a n=1
Bemerkungen:
1) Das bestimmte Integral existiert, wenn der Grenzwert eine endliche Zahl ergibt,
die unabhängig von der Wahl der Stützstellen ist.
2) Damit der Grenzwert existiert, muss f (x) im Intervall [a, b] nicht stetig sein. Für
in [a, b] unstetige aber beschränkte Funtionen existiert (2.4.14) ebenfalls. Das be-
stimmte Integral existiert sogar, wenn f in [a, b] einen oder mehrere singuläre Punkte
besitzt, an denen f ,,hinreichend schwach divergiert”, siehe das Beispiel unterhalb
Gl. (2.4.15). Präzisere Aussagen dazu erhalten Sie in der HöMaII-Vorlesung.
3) Das Bilden der Riemann-Summe, d.h. die Berechnung der endlichen Summe
P N
0 f (zn )∆xn ist ein praktisches Verfahren zur näherungsweisen Berechnung eines
bestimmten Integrals. Im Gaußschen Näherungsverfahren (und seinen diversen Va-
rianten) zur numerischen Berechnung eines bestimmten Integrals wird die Stützstel-
lenwahl dahingehend optimiert, dass man für eine bestimmte Klasse von Funktionen
einen möglichst guten Näherungswert für das bestimmte Integral bei nicht zu vielen
Stützstellenauswertungen erhält.
Sei F (x) eine Stammfunktion von f (x), d.h. es ist F 0 (x) = f (x). Dann gilt der
Hauptsatz der Differential- und Integralrechnung:
Zb
f (x)dx = F (b) − F (a) . (2.4.15)
a
Beispiele: √ √
1) Die Stammfunktion von f (x) = 1/ x ist F (x) = 2 x + c. Somit ist
Z1 √ √
1
dx √ = 2( 1 − 0) = 2 .
x
0
Obwohl f (x) bei x = 0 divergent ist, existiert das bestimmte Integral.

2) Es sei 0 < a < b und f (x) = 1/x.
Zb
1
dx = ln b − ln a
x
a
Hier existiert das bestimmte Integral für a → 0 nicht.
Hinweis:
Das bestimmte Integral (2.4.13) bzw. (2.4.15) ist nur dann eine Fläche im Sinne
ihrer eigentlichen geometrischen Bedeutung, wenn z.B. x und f (x) die Dimension
einer Länge haben, [x] = [dx] = [f ] = Länge bzw. [F ] =Fläche. In Anwendungen,
z.B. in der Physik, haben x und f oft andere Bedeutungen. Z.B. kann x für die
Zeit und f (x) für die Beschleunigung eines Körpers als Funktion der Zeit stehen.
(Wir verwenden dann in der Regel die Variable t und a(t).) Dann ist das bestimmte
Integral, d.h. die rechte Seite von (2.4.15) die Differenz der Geschwindigkeiten des
Körpers zu den Zeiten b und a.
Ein anderes Beispiel ist die Arbeit, die eine auf einen Körper einwirkende Kraft an
dem Körper verichtet. Die Kraft wirke in x-Richtung und beschleunige den Körper
von x = a nach x = b. Hier ist [x] = [dx] = Länge, [f ] = Kraft und das bestimmte
Integral bzw. F haben die Dimension einer Energie, [F ] = Energie = Arbeit. Das
bestimmte Integral (2.4.15) ergibt dann die Differenz der Energien des Körpers an
den Punkten b und a.
Elementare Regeln:
1. Beispiel: Sei f (x) von der Form wie in der Skizze dargestellt.
Es ist
f
Zb
f (x) = Fläche ⊕ −Fläche .
a
⊕
D.h. der Beitrag zu einem be- a x
stimmten Integral, bei dem b
f (x) < 0 ist, hat ein negatives
Vorzeichen.
2. Intervalladdition: Es gilt
Zb Zc Zc
f (x)dx + f (x)dx = f (x)dx. (2.4.16)
a b a
3. Aus (2.4.16) folgt, dass

Zb Za
f (x)dx = − f (x)dx. (2.4.17)
a b
Diese Regeln folgen aus der Linearität des (bestimmten) Integrals.
Weitere Rechenregeln für bestimmte Integrale:

Die Rechenregeln zur Bestimmung von Stammfunktionen gelten natürlich auch für
bestimmte Integrale, insbesondere die Regeln, die in Abschnitt 2.4.1 besprochen
wurden.
Partielle Integration:
Zb Zb
0
b
f (x)g(x)dx = f (x)g(x)a − f (x)g 0 (x)dx . (2.4.18)
| {z }
a f (b)g(b)−f (a)g(a) a
Substitutionsregel:
Oft kann die Variable x einer Funktion f (x) als Funktion x = g(t) einer anderen
Variablen betrachtet werden. Die Funktion g sei im Integrationsgebiet umkehrbar,
die Umkehrfunktion ist t = g̃(x). Dann gilt:
Zb Zg̃(b)
f (x)dx = f (g(t))g 0 (t)dt . (2.4.19)
a g̃(a)
Beispiel:
Zb
2
I= xe−cx dx.
0
2
Substitution t = −cx . Dann
dt 1
= −2cx ⇒ xdx = − dt .
dx 2c
Transformation der Integrationsgrenzen:
x=0 → t(0) = 0,
x=b → t(b) = −cb2 .
Somit
Z 2
−cb
1 t 1 t −cb2 1 −cb2 1
I=− dt e = − e 0 = − e − − .
2c 2c 2c 2c
0
Variable Integrationsgrenzen, Differentiation nach den Grenzen:

Wir können in einem bestimmten Integral die obere oder untere Grenze als variabel
auffassen und so mit dem bestimmten Integral eine Funktion einer Variablen defi-
nieren; insbesondere dann, wenn die Stammfunktion F von f nicht in analytischer
Form angegeben werden kann. Zum Beispiel sei die obere Grenze b variabel; wir
nennen b = x. Die untere Grenze a sei fest. Dann definiert
Zx
f (x0 )dx0 = F (x) − F (a)
a
die Funktion F (x). Es ist klar, dass die Integrationsvariable und die variable (obere)
Grenze verschieden voneinander sind; d.h. man muss verschiedene Symbole benut-
zen.
Die Differentiation nach der oberen Grenze ergibt
Zx
d dF (x) d
f (x0 )dx0 = − F (a) = f (x). (2.4.20)
dx | dx |dx {z }
a
{z }
Per Def. f (x) =0, da
a=const.
Analog ist
Zb
d d dF (x)
f (x0 )dx0 = F (b) − = −f (x). (2.4.21)
dx dx dx
x
Für viele Funktionen f (x) kennt man die analytische Form der Stammfunktion
nicht. Man kann, wie gesagt, über ein Integral der Form
Zx
I(x) = dx0 f (x0 ) (2.4.22)
x0
eine Funktion I(x) definieren, von der man dann eben nur ihre Integraldarstellung
analytisch kennt. Eine andere Möglichkeit zur Definition einer Funktion J(x) ist
Zb
J(x) = dt f (t, x) . (2.4.23)
a
Differentiation unter dem Integralzeichen:

Wenn eine Funktion J(x) in der Form (2.4.23) gegeben ist, erhält man ihre Ableitung
folgendermaßen:
Zb Zb
dJ(x) d ∂f (t, x)
= dt f (t, x) = dt , (2.4.24)
dx dx ∂x
a a
wobei hier ∂f (t, x)/∂x die sog. partielle Ableitung der Funktion f (t, x) zweier Va-
riablen nach x ist. Diese partielle Ableitung bildet man wie die oben besprochene
gewöhnliche Ableitung von Funktionen einer Variablen; die Variable t wird dabei
festgehalten, d.h. als Konstante betrachtet. Voraussetzung für die Anwendung von
(2.4.24) ist, dass f in einem zweidimensionalen Gebiet partiell nach x differenzier-
bar ist und diese Ableitung dort stetig ist. Wir behandeln partielle Ableitungen von
Funktionen mehrerer Variablen im Detail in Kapitel 7; siehe auch das Beispiel 3)
unten.
Beispiele:
1) Beispiel zu (2.4.22): Die aus der Statistik bekannte Gaußsche Fehlerfunktion
Zx
2 2
erf (x) ≡ √ e−t dt , (2.4.25)
π
0
siehe die Vorlesung Datenverarbeitung. Obwohl die Stammfunktion der ,,Gauß-Glocke”

2
e−t (eine völlig harmlose elementare Funktion) existiert, kann man die Stamm-
funktion nicht in analytischer Form durch elementare Funktionen ausdrücken. Mit
2 √
(2.4.20) erhalten wir, dass d erf (x)/dx = 2e−x / π.
2) Beispiel zu (2.4.23): Die Gamma-Funktion Γ(x) ist die Verallgemeinerung der
Fakultät n! ≡ 1 · 2 · · · n auf reelle Zahlen x. Eine Integraldarstellung dieser Funktion
für positive reelle Zahlen ist
Z∞
Γ(x) = tx−1 e−t dt , x > 0. (2.4.26)
0
Wir untersuchen diese Funktion in einer Übung etwas näher. Die Ableitung dΓ(x)/dx
berechnet man mit (2.4.24).
3) Beispiel zu (2.4.24): Wir betrachten das Integral
Z1
t
J(x) = dt arctan .
x
0
Für x > 0 können wir J nach x mit (2.4.24) differenzieren:
Z1 Z1
x2

dJ(x) ∂ t t 1
= dt arctan =− dt 2 = ln .
dx ∂x x t + x2 2 1 + x2
0 0
Dieses Beispiel ist relativ trivial insofern, als das Integral J(x) auch in analytischer
Form berechenbar ist (tun Sie das zu Hause).
Uneigentliche Integrale:
Die beiden Haupttypen der sog. uneigentlichen Integrale sind
A) Integrale, bei denen eine oder beide Integrationsgrenzen im Unendlichen liegen.

Im Sinne dieses Begriffes ist die Integraldarstellung (2.4.26) der Gamma-Funktion
ein uneigentliches Integral. Man erhält ein solches Integral z.B. dadurch, dass man
eine der Integrationsgrenzen – oder beide – eines bestimmten Integrals gegen ∞
bzw. −∞ schickt:
Zb Zb
z.B.
f (x) dx −→ lim f (x) dx .
b→∞
a a
Analog definiert man uneigentliche Integrale auf der Halbachse (−∞, b] oder der
ganzen reellen Zahlengeraden (−∞, ∞). Wir wollen hier nicht darauf eingehen, un-
ter welchen Voraussetzungen ein solches Integral existiert, siehe dazu z.B. das Buch
von Bronstein et al. Notwendigerweise muss f (x) → 0 für x → ±∞. Wir begnügen
uns mit einigen Beispielen:
Z∞ Zb
dx dx
1) = lim = lim ln b = ∞ ,
x b→∞ x b→∞
1 1
d.h. dieses uneigentliche Integral existiert nicht.
Z∞ Zb
dx dx 1
2) = lim = lim − + 1 = 1 .
x2 b→∞ x2 b→∞ b
1 1
Z∞
2 √ √
3) e−x dx = π lim erf (y) = π.
y→∞
−∞
Dieses Ergebnis leiten wir in einer Übung zu Kapitel 7.8 her.
B) Integrale unstetiger Funktionen: Der Definitionsbereich der Funktion f (x) sei

ein halboffenenes Intervall [a, b); im Punkt b sei der Grenzwert lim f (x) = ∞. Man
x→b
definiert das uneigentliche Integral
Zb Zb−
f (x) dx = lim+ f (x) dx . (2.4.27)
→0
a a
Die Exsitenz (d.h. Endlichkeit) des Grenzwertes hängt von der Schwäche bzw. Stärke
der Singularität von von f (b − ) für → 0+ ab.
Analog: Sei f (x) im halboffenen Intervall (a, b] definiert und divergiere für x → a.
Dann
Zb Zb
f (x) dx = lim+ f (x) dx . (2.4.28)
→0
a a+
√
Beispiel: Die Funktion f (x) = 1/ x ist bei x = 0 singulär. Es ist
Zb Zb √ √
dx dx √
√ = lim √ = lim (2 b − 2 ) = 2 b .
x →0+ x →0+
0
Für das Integral der Funktion f (x) = x−r , r > 0 mit denselben Integrationsgrenzen
findet man, dass dieses uneigentliche Integral für für r < 1 existiert, während es für
r ≥ 1 unendlich wird.
Kapitel 3
Komplexe Zahlen
Sie wissen aus der Schule, dass viele quadratische Gleichungen – oder algebraische
Gleichungen höheren Grades – keine reellen Lösungen haben. Beispiele:
x2 + 1 = 0 oder x2 + px + q = 0, wenn p2 − 4q < 0.
Dies war der Anlass zur Erweiterung der reellen Zahlen auf die Menge der komplexen
Zahlen:
R ⊂ C.
Menge der reellen Zahlen Menge der komplexen Zahlen
Man führt die sog. imaginäre Einheit i ein, die definiert ist durch
imaginäre Einheit: i2 ≡ −1 .
Somit ist die Lösung von z 2 + 1 = 0 gegeben durch z = ±i. Aus i2 ≡ −1 folgt
i3 = i2 i = −i
i4 = i2 i2 = (−1)(−1) = +1
i5 = i4 i = i
etc.
Eine beliebige komplexe Zahl z ∈ C ist darstellbar als
z = x + iy, wobei x, y ∈ R . (3.0.1)
Man bezeichnet
x = Re z als den Realteil von z,

y = Im z als den Imaginärteil von z.
2
√
Hinweis: Aus√ i = −1 folgert man naiv, dass i = ± √−1. Vereinbarungsgemäß setzt
man i = + −1, aber Vorsicht: Die Wurzelfunktion z muss für eine komplexe Zahl
erst definiert werden; siehe Abschnitt 3.3 am Ende dieses Kapitels.
Im z Im z
z1 + z2
b z = a + ib z1
b1
a Re z
b2 z2
Re z
a1 a2
(a) Komplexe Ebene. (b) Addition zweier komplexer Zahlen z1 , z2 .
Abbildung 3.1: Kartesische Darstellung von komplexen Zahlen.
3.1 Kartesische Darstellung

Man bezeichnet (3.0.1) als die kartesische Darstellung einer komplexen Zahl z. Der
Grund ist die geometrische Interpretation dieser Gleichung. Während reelle Zahlen
als Punkte auf einer Geraden darstellbar sind, lassen sich komplexe Zahlen durch
Punkte in einer Ebene, der Gaußschen Zahlenebene veranschaulichen, siehe Abbil-
dung 3.1(a). Wählt man ein kartesisches Koordinatensystem (zwei zueinander senk-
rechte Achsen), so sind x = Re z, y = Im z die Projektionen von z auf die reelle
bzw. imaginäre Achse.
Addition/Subtraktion:
z1 ± z2 = (a1 + ib1 ) ± (a2 + ib2 ) = a1 ± a2 + i(b1 ± b2 ), (3.1.1)

bzw., wenn wir eine komplexe Zahl z durch das Zahlenpaar z = (a, b) darstellen:
z1 ± z2 = (a1 , b1 ) ± (a2 , b2 ) = (a1 ± a2 , b1 ± b2 ). (3.1.2)
Stellen wir die Addition/Subtraktion zweier komplexer Zahlen in der Zahlenebene

dar, so sehen wir, dass die Addition/Subtraktion von komplexen Zahlen, wie in
Abbildung 3.1(b) gezeigt, der Addition/Subtraktion zweier Vektoren entspricht –
siehe Kapitel 5.
Multiplikation:
z1 z2 = (a1 + ib1 )(a2 + ib2 ) = a1 a2 + ib1 a2 + ia2 b1 + i2 b1 b2

(3.1.3)
= (a1 a2 − b1 b2 ) + i(a1 b2 + a2 b1 ).
3.2 Darstellung in Polarkoordinaten 59
Definition der komplexen Konjugation:

Die zu z = a + ib konjugierte komplexe Zahl z ∗ ist definiert durch1
z ∗ ≡ a − ib. (3.1.4)
D.h. zwei zueinander konjugiert komplexe Zahlen haben identische Realteile und
ihre Imaginärteile unterscheiden sich nur durch ein Vorzeichen.
Ihr Produkt
zz ∗ = (a + ib)(a − ib) = a2 + b2
ist eine reelle Zahl ≥ 0.
Es gilt
(z1 + z2 )∗ = z1∗ + z2∗ , (z1 z2 )∗ = z1∗ z2∗ .
Nachprüfen!
Division:
Den Quotienten z1 /z2 berechnet man, indem man mit dem komplex konjugierten
des Nenners erweitert.

z1 a1 + ib1 a1 + ib1 a2 − ib2 a1 a2 + b1 b2 a2 b1 − a1 b2
= = = 2 2
+i 2 . (3.1.5)
z2 a2 + ib2 a2 + ib2 a2 − ib2 a2 + b2 a2 + b22
Hinweis:
Beachten Sie folgendes: Seien z1 , z2 zwei komplexe Zahlen. Dann ist im Allgemeinen
Re(z1 z2 ) 6= Re z1 Re z2 , Im(z1 z2 ) 6= Im z1 Im z2 ; (3.1.6)
denn
Re(z1 z2 ) = Re z1 Re z2 − Im z1 Im z2 , Im(z1 z2 ) = Re z1 Im z2 + Im z1 Re z2 ,
wie man sofort an Gl. (3.1.3) ablesen kann. Nur wenn eine der beiden Zahlen reell
ist, z.B. z1 = a ∈ R, z2 = z ∈ C, dann
Re(az) = aRe z , Im(az) = aIm z .
Diese elementaren Resultate sollten Sie verinnerlichen – wir benötigen sie beispiels-
weise in Kapitel 4.2.
3.2 Darstellung in Polarkoordinaten

Oft ist es bequemer, mit komplexen Zahlen in der sog. Polarkoordinatendarstellung
zu rechnen. Das gilt vor allem für die Multiplikation und Division.
1
Hinweis: Anstelle von z ∗ ist auch die Notation z̄ verbreitet.
z = a + ib ⇒ z̄ ≡ z ∗ = a − ib.
b z
ρ
z
b
ρ
φ φ
a a
− arctan(b/a)
φ φ
a a
ρ
ρ
b b
z z
Abbildung 3.2: Polarkoordinatendarstellung komplexer Zahlen, die in den vier ver-

schiedenen Quadranten der Zahlenebene liegen.
3.2 Darstellung in Polarkoordinaten 61
Eine komplexe Zahl z kann festgelegt werden durch ihren Absolutbetrag

√
ρ ≡ |z| = a2 + b2 (3.2.1)
und den Winkel zwischen der Geraden durch die Punkte 0 und z und der positiven
Achse +Re z, siehe Abbildung 3.2. Diesen Winkel nennt man die Phase oder das
Argument von z:
φ = arg (z) . (3.2.2)
Das ist die Polarkoordinatendarstellung eines Punktes in einer Ebene.
Der Zusammenhang zwischen a, b und ρ, φ ist gegeben durch
a = ρ cos φ b = ρ sin φ. (3.2.3)
Den Abbildungen 3.2 ist außerdem zu entnehmen, dass

  0 für a > 0, b > 0,
b 
π für a < 0, b > 0,
φ = arctan + (3.2.4)
a 
 π für a < 0, b < 0,
2π für a > 0, b < 0,

wobei man auf die Addition von 2π in der letzten Zeile verzichten kann, weil cos(φ +
2π) = cos φ und sin(φ + 2π) = sin φ.
Beachte: Das Argument φ einer komplexen Zahl ist nur bis auf ganzzahlige Vielfa-
che von 2π festgelegt, wie aus (3.2.3) ersichtlich ist.
Mit a = ρ cos φ und b = ρ sin φ erhalten wir die Darstellung von z in Polarkoor-
dinaten:
z = a + ib = ρ cos φ + iρ sin φ = ρeiφ . (3.2.5)
Die letzte Gleichung, die sog. Euler-Formel
eix = cos x + i sin x (3.2.6)
müssen wir noch beweisen. Dazu benutzen wir die Potenzreihenentwicklungen der
Exponentialfunktion, Gl. (2.3.9), des Sinus, Gl. (2.3.18), und des Kosinus, Gl. (2.3.19).
∞ ∞ ∞
X (ix)n X (ix)2n X (ix)2n+1
eix = = +
n=0
n! n=0
(2n)! n=0
(2n + 1)!
∞ ∞
X xn n
X x2n+1
= (−1) +i (−1)n
n=0
(2n)! n=0
(2n + 1)!
= cos x + i sin x.
Aus (3.2.6) folgt, dass die Exponentialfunktion einer rein imaginären Variablen
z = iφ eine periodische Funktion mit Periode 2π ist:
ei(φ+2πk) = eiφ , k = 0, ±1, ±2, ... (3.2.7)
Daraus folgt, dass jede Zahl z unendlich viele Exponentialdarstellungen besitzt:
z = ρei(φ+2πk) , k = 0, ±1, ±2, ... (3.2.8)

Multiplikation:
Nun nochmal zur Multiplikation und Division zweier komplexer Zahlen, die in der
Darstellung (3.2.5) besonders einfach durchgeführt werden können.
z1 z2 = ρ1 eiφ1 ρ2 eiφ2 = ρ1 ρ2 ei(φ1 +φ2 ) . (3.2.9)
Komplexe Konjugation:
(3.2.5)
z = eiφ ⇒ z ∗ = e−iφ (3.2.10)
Geometrisch entspricht die komplexe Konjugation von z der Spiegelung von z an
der reellen Achse. D.h.
z ∗ = ρ cos(−φ) + iρ sin(−φ) = ρ cos φ − iρ sin φ .
Absolutbetrag:
1/2
|z| = (zz ∗ )1/2 = ρeiφ ρe−iφ = ρ. (3.2.11)
Division:
z1 ρ1 eiφ1 ρ1 i(φ1 −φ2 )
= iφ
= e . (3.2.12)
z2 ρ2 e 2 ρ2
Als Erweiterung der Euler-Formel (3.2.6) erhält man die Formel von Moivre
für die n-te Potenz einer komplexem Zahl:
z n = ρn einφ = ρn (cos(nφ) + i sin(nφ)) . (3.2.13)
3.3 Funktionen einer komplexen Variablen

Wie für reelle Zahlen kann man auch Funktionen von komplexen Zahlen z betrach-
ten. Der Funktionswert ist im Allgemeinen wieder eine komplexe Zahl.
Beispiel:
f (z) = ez = ex+iy = ex eiy = ex cos y + iex sin y.
Weitere Beispiele besprechen wir unten. Das mathematische Gebiet, in dem komple-
xe Funktionen, ihre Differentiation und Integration untersucht werden, heißt Funk-
tionentheorie. Einen Einblick in diesen Zweig der Mathematik erhalten Sie in der
Vorlesung Höhere Mathematik IV.
Wir erwähnen hier ein grundlegendes Ergebnis, den sogenannten Fundamental-
satz der Algebra (der von C.F. Gauß bewiesen wurde). Jedes Polynom N -ten Grades
PN (x) = a0 + a1 z + a2 z 2 + ... + aN z N , (3.3.1)
wobei die ai im Allgemeinen komplexe Koeffizienten sind, hat in der komplexen

Ebene genau N Nullstellen zi , d.h. PN (zi ) = 0, wobei n-fache Nullstellen n-mal
3.3 Funktionen einer komplexen Variablen 63
k=2 k=1
π
k=3 3 k=0
1
k=4 k=5
Abbildung 3.3: Die sechs komplexen Wurzeln der Gleichung z 6 = 1.
gezählt werden.
Beispiel: Die reelle Gleichung x6 − 1 hat 2 relle Nullstellen x1,2 = ±1. Die komplexe
Gleichung z 6 − 1 = 0 hat 4 weitere komplexe Nullstellen.
Zum Auffinden dieser Lösungen benutzen wir die Exponentialdarstellung, z = ρeiφ .
z 6 = 1 ⇒ (z 6 )∗ = (z ∗ )6 = 1
!
⇒ (zz ∗ )6 = ρ12 = 1
⇒ ρ = 1, da ρ ≥ 0.
Somit sind die gesuchten Nullstellen von der Form z = eiφ . Es muss gelten:
!
z 6 = ei6φ = 1 = ei2πk k ∈ Z, vgl. (3.2.8)
⇒ 6φ = 2πk
π
⇒ φ= k k = 0, ±1, ±2, ...
3
Wir erhalten somit die 6 Nullstellen
z0 = 1, z1 = eiπ/3 , z2 = ei2π/3 , ..., z5 = ei5π/3 ,
siehe Abbildung 3.3. Die Lösungen für k = 1 und k = 5 bzw. k = 2 und k = 4 sind
komplex konjugiert zueinander. Für k = 6 ergibt sich dieselbe Lösung wie für k = 0,
die Lösung für k = 7 ist identisch mit der Lösung für k = 1, die Lösung für k = −1
ist identisch mit der für k = 5, etc.
Wir benutzten die Aussage des Fundamentalsatzes der Algebra bereits in Kapi-
tel 2.4, und zwar für den Fall, dass die Koeffizienten ai des Polynoms (3.3.1) reell
sind. In diesem Fall ist die Zahl nr der reellen Nullstellen xj des Polynoms PN (x)
kleiner oder gleich N . Wenn nr < N , dann sind die verbleibenden Nullstellen paar-
weise konjugiert komplex zueinander – d.h. deren Anzahl (N − nr ) ist eine gerade
Zahl.
Potenzfunktionen und Wurzelfunktionen: Wir betrachten die Potenzfunk-

tion w = z n , n ∈ N etwas näher. Der Definitionsbereich dieser Funktion ist die
Menge der komplexen Zahlen; die Funktionswerte sind wieder komplexe Zahlen. In
der Polarkoordinatendarstellung ist diese Funktion
w = z n = |z|n einφ , wobei φ = argz .
Anhand dieser Darstellung sieht man folgendes: Wenn z = |z| exp(iφ) die Menge der
komplexen Zahlen z 6= 0 durchläuft, 0 < |z| < ∞, 0 ≤ φ < 2π, dann überdeckt die
Funktion w = z n die komplexe Zahlenebene n-mal2 . Jeweils n verschiedene z-Werte
zk ,
2π 2π
zk = ρeiφk , φk = φ + k , k = 0, . . . , n − 1 , 0 ≤ φ <
n n
n
liefern
√ denselben Funktionswert w = z . Das bedeutet, dass die Umkehrfunktion
z = w für n > 1 mehrdeutig ist.
n
Für die Funktion w = z 2 stellt sich das wie folgt dar. Wir variieren z in der kom-
plexen Ebene längs eines Kreises mit festem Radius um den Nullpunkt, d.h. festem
|z|. Die Phase von z wird in mathematisch positiver Richtung = Gegenuhrzeiger-
richtung geändert, siehe Abbildung 3.4. Der Bildpunkt w = z 2 variiert ebenfalls auf
einem Kreis mit Radius |z|2 um den Nullpunkt, aber doppelt so schnell. Mit anderen
Worten: wenn durch Variation von z die komplexe Ebene einmal überdeckt wird,
wird durch w = z 2 die Bildebene
√ zweimal überdeckt.
Für die Umkehrfunktion z = w bedeutet dies:
√
w = ρeiφ , z= ρeiφ/2 . (3.3.2)
Bei einer kompletten Umkreisung des Nullpunktes in der w-Ebene sind wir wieder
beim selben w, aber z nimmt einen anderen Wert an:
√ √
w = ρei(φ+2π) = ρeiφ , aber z = ρei(φ+2π)/2 = − ρeiφ/2 .
Bei einer zweifachen kompletten Umkreisung des Nullpunktes in der w-Ebene erhal-
ten wir allerdings wieder denselben Wert von z wie in (3.3.2):
√ √
w = ρei(φ+4π) = ρeiφ , z= ρei(φ+4π)/2 = + ρeiφ/2 .
Um hier eine Umkehrfunktion zu definieren, die eindeutig in die ganze komple-

xe z-Ebene C abbildet, wird eine auf B. Riemann zurückgehende Konstruktion
2
Mit anderen Worten: Bereits bei Beschränkung auf das n-te Segment |z| ≥ 0, 0 ≤ φ < 2π/n,
überdeckt w = z n ganz C.
3.3 Funktionen einer komplexen Variablen 65
Abbildung 3.4: Umlauf auf einen Kreis um den Nullpunkt in der z-Ebene in mathe-
matisch positiver Richtung.
durchgeführt, die wir uns anhand dieses Beispiels klarmachen. Man schneidet die
beiden übereinander liegend gedachten w-Ebenen längs der negativen rellen Ach-
se auf und denkt sich die beiden ,,Ufer” des Schnittes im oberen Blatt mit den
beiden Ufern des Schnittes im unteren Blatt gemäß Abbildung 3.5 verklebt.
√ Die
3
so konstruierte Fläche heisst Riemannsche Fläche der Funktion z = w. Wir
nennen diese Fläche hier R2 . Das Aufschneiden der Ebenen längs der negativen
reellen Achse ist eine (allgemein übliche) Konvention – man könnte den Schnitt
auch längs einer beliebigen anderen Geraden von Null nach Unendlich legen. Die
komplexen Zahlen w mit −π < φ ≤ π liegen auf dem unteren Blatt von R2 ;
dann wandert man in das obere Blatt von R2 , das den komplexen Zahlen w mit
π < φ ≤ 3π entspricht. Bei √ φ = 3π geht es wieder in das untere Blatt, etc. Was
machen die Bildpunkte z = w ? Wir betrachten Zahlen w auf dem Einheitskreis
|w| = 1. Im ersten Blatt startet man konventionsgemäß mit Zahlen w = exp(iφ) mit
φ > −π. (Für das nicht im ersten Blatt liegende φ = −π, d.h. w = exp(−iπ) = −1
wäre z = exp(−iπ/2) = −i.) Am Ende der Umkreisung des ersten Blattes ist
w = exp(iπ) = −1 und somit z = exp(iπ/2) = i. Am Ende der Umkreisung des
√ Blattes ist w = exp(i3π) = −1 und z = exp(−i3π/2) = −i. Somit definiert
zweiten
z = w eine eindeutige Abbildung von R2 7→ C.
Wie man anhand dieses

√ Beispiels erahnen kann, hat die Riemannsche Fläche der
n-ten Wurzel,
√ z = n
w, n Blätter. Die dreiblättrige Riemannsche Fläche der Funk-
tion z = w ist in Abbildung 3.6 dargestellt.
3
Transzendente Funktionen: Hier nur der Vollständigkeit halber ein paar kurze
Bemerkungen zu den Umkehrfunktionen der komplexen Exponentialfunktion und
der trigonometrischen Funktionen.
Die komplexe Exponentialfunktion
w = ez = ex eiy
3
Der Nullpunkt ist ein sog. Verzweigungspunkt dieser Funktion. (Der andere ist z = ∞.) Man
√ anderen Punktes w 6= 0 bei dieser Funktion
kann sich überlegen, dass die Umkreisung irgend eines
zu keinen Mehrdeutigkeiten führt. Bei der Funktion w − w0 ist w0 der Verzweigungspunkt.
√
Abbildung 3.5: Die zweiblättrige Riemannsche Fläche der Funktion z = w.
√
Abbildung 3.6: Die dreiblättrige Riemannsche Fläche der Funktion z = 3
w.
3.4 Anwendungen 67
bildet unendlich viele verschiedene z, nämlich

z = x + iy mit y = y0 + 2kπ , k = 0, ±1, ±2, ...
auf das gleiche w ab, vgl. (3.2.7). Deswegen ist die Umkehrfunktion
z = Ln w
mehrdeutig. (Man beachte die Großschreibung des Symbols.) Mit w = ρ exp(iφ) =
ρ exp[i(φ + 2kπ)] erhält man
Ln w = ln ρ + i(φ + 2kπ) , k = 0, ±1, ±2, ...
Man beschränkt sich üblicherweise auf den sog. Hauptwert ln w von Ln w:
ln w = ln ρ + iφ , −π < φ ≤ π . (3.3.3)
Die Funktion Ln w bzw. ln w ist für alle komplexen Zahlen w 6= 0 definiert.
Die Riemannsche Fläche Rln von Ln w hat unendlich viele Blätter. Die Funktion
Ln w definiert eine eindeutige Abbildung von Rln 7→ C.
Die Umkehrfunktionen der komplexen Funktionen sin z, sin z, tan z, cot z sind eben-
falls unendlich vieldeutig. Das sollte aufgrund der Diskussion der entsprechenden
reellen Funktionen in Kapitel 2 nicht verwundern. Wir gehen hier nicht weiter da-
rauf ein.
Hinweis: Für unsere Zwecke benötigen wir das Konzept der Riemannschen Fläche
nicht. Wenn wir den Logarithmus oder insbesondere die Wurzel einer komplexen Zahl
z berechnen müssen, legen wir das Argument der Variablen z durch
− π < arg z ≤ π (3.3.4)
fest4 . Somit wird ln z gemäß (3.3.3) berechnet. Wollen wir die Wurzel aus einer
negativen reellen Zahl z = −a, a > 0 ziehen, wird diese Zahl demzufolge durch
a exp(iπ)
√ dargestellt
√ – aber nicht√durch a exp(−iπ) oder durch
√ a exp(i3π) etc. Somit
ist −a = a exp(iπ/2) = +i a. Die Funktion w = z bildet für Werte z mit
der in (3.3.4) gewählten Festlegung die komplexe Zahlenebene C auf die rechte
Halbebene {w| − π/2 < argw ≤ π/2} ab.
3.4 Anwendungen
Von den vielfältigen mathematischen Anwendungen komplexer Zahlen seien hier nur
zwei einfache, für uns relevante Beispiele erwähnt. Man kann die trigonometrischen
Additionstheoreme
sin(x ± y) = sin x cos y ± cos x sin y , cos(x ± y) = cos x cos y ∓ sin x sin y ,
4
Beachten Sie, dass es bei der Festlegung von argz nur darum geht, keine ganzzahligen Vielfachen
von 2π zuzulassen. Man könnte argz beispielsweise auch durch π/2 ≤ argz < 5π/2 festlegen.
wobei x, y reell oder komplex sein können, schnell mit Hilfe der Darstellungen
1 ix 1 ix
e + e−ix e − e−ix ,

cos x = sin x = (3.4.1)
2 2i
die man aus der Euler-Formel erhält, beweisen. Wir machen das in einer Übung.
Wozu braucht man komplexe Zahlen und/oder komplexe Funktionen in der Phy-
sik? Wie Sie wissen, sind die Messwerte physikalischer Observablen durch reelle
Zahlen gegeben. In vielen Gebieten der (theoretischen) Physik ist es allerdings be-
quem und nützlich, bestimmte Messgrößen zunächst durch komplexe Zahlen bzw.
durch komplexwertige Funktionen darzustellen und damit zu rechnen. So beschreibt
man beispielsweise in der Elektrodynamik zeitabhängige elektromagnetische Felder,
die sich als Lösungen der zeitabhängigen Maxwell-Gleichungen im Vakuum oder in
linearen Medien ergeben, vorzugsweise durch komplexwertige Funktionen. In der
Quantentheorie ergibt sich die Aufenthaltswahrscheinlichkeitsdichte |ψ|2 eines Teil-
chens an einem Ort zu einer bestimmten Zeit aus einer i.A. komplexwertigen ,,Wel-
lenfunktion” ψ. (Auch in der theoretischen Hydro- und Aerodynamik, die nicht Teil
des Bachelor-Curriculums sind, findet man Anwendungen der Theorie der komple-
xen Funktionen.) Im Rahmen der Mechanik benutzen wir komplexe Zahlen bzw.
Funktionen vornehmlich bei der Lösung linearer Schwingungsdifferentialgleichungen
– siehe nächstes Kapitel. Wir benötigen im Wesentlichen nur die elementaren alge-
braischen Operationen mit komplexen √ Zahlen, die Euler- und Moivre-Formeln, die
z
Exponentialfunktion e , die Wurzel z und den Zusammenhang (3.4.1) zwischen
dem Sinus und Kosinus und exp(±ix) für reelle x.
Kapitel 4
Gewöhnliche
Differentialgleichungen
Differentialgleichungen (DGL) spielen in der Physik eine überragende Rolle. Viele

Gesetze der Physik, insbesondere die Bewegungsgesetze (Dynamik) sind als Diffe-
rentialgleichungen formulierbar. Man unterscheidet
Gewöhnliche Differentialgleichungen: Sei y = y(x) eine Funktion einer reellen

Variablen x. Eine gewöhnliche DGL n-ter Ordnung ist eine Gleichung, in der
y(x) und die Ableitungen dieser Funktion bis zur n-ten Ordnung y (n) vorkom-
men:
F (x, y, y 0 , ..., y (n) ) = 0, (4.0.1)
wobei F einen funktionalen Zusammenhang zwischen der unabhängigen Va-
riablen x und der Funktion y und ihren Ableitungen bezeichnet. Die DGL, die
uns hier interessieren, sind sog. explizite DGL n-ter Ordnung. Diese sind von
der Form
y (n) = F (x, y, y 0 , ..., y (n−1) ) . (4.0.2)
Partielle Differentialgleichungen: Hier betrachtet man eine Funktion y, die von

mehreren reellen Variablen abhängt, y = y(x1 , ..., xn ). Eine partielle DGL n-
ter Ordnung ist eine Gleichung, in der y und ihre partiellen Ableitungen (siehe
Kapitel 7) bis zur n-ten Ordnung vorkommen. In dieser Vorlesung benötigen
wir nur gewöhnliche DGL. Einige für die Physik wichtige partielle DGL wer-
den in den Vorlesungen über Theoretische Physik ab dem 3. Semester bespro-
chen. Prominente Beispiele sind die Maxwell-Gleichungen, die Laplace- und
Poisson-Gleichung, die Wellengleichung (Theoretische Physik II: Elektrodyna-
mik), die Schrödinger-Gleichung (Theoretische Physik III: Quantenmechanik)
und die Wärmeleitungsgleichung bzw. Diffusionsgleichung (Theoretische Physk
IV: Statistische Physik).
Im Folgenden behandeln wir nur gewöhnliche DGL, vor allem gewöhnliche DGL
1. und 2. Ordnung. Die Dynamik von Punktteilchen und starren Körpern wird
durch die Newtonschen Bewegungsgleichungen bzw. den Lagrange- und Hamilton-

Gleichungen, die Sie in der Vorlesung Theoretische Physik I kennenlernen werden,
beherrscht. Dies sind – in der Regel mehrere – gewöhnliche DGL 2. Ordnung, wobei
die Zeit t die Rolle der unabhängigen Variablen übernimmt, von der die Bahnkoor-
dinaten des/der betrachteten Objekts/Objekte abhängen.
Einige Beispiele aus der Physik:

a) Eine typische Aufgabe der theoretischen Mechanik ist die Berechnung von Bah-
nen als Funktion der Zeit mit Hilfe des Newtonschen Bewegungsgesetzes. Hier
ist die Zeit t die unabhängige Variable, und die Bahnkoordinaten x(t), y(t), z(t)
sind Funktionen von t. Man verwendet üblicherweise die Notation
dx
ẋ(t) = x-Komponente der Geschwindigkeit,
dt
d2 x
ẍ(t) = 2 x-Komponente der Beschleunigung,
dt
und analog für die Zeitableitungen der Bahnkoordinaten y(t) und z(t).
Das Newtonsche Gesetz lautet in einer Raumdimension 1 :
mẍ = F (x, ẋ, ẍ, t), (4.0.3)
wobei m die Masse des Objektes ist, auf das die Kraft2 F wirkt. Die Kraft kann
im Allgemeinen von x, ẋ, ẍ und auch explizit von t abhängen. (Abhängigkei-
ten von höheren Zeitableitungen treten in der Regel nicht auf.) Die Gleichung
(4.0.3) ist eine DGL 2. Ordnung. Die Kräfte, die wir im Mechanik-Teil der Vor-
lesung betrachten, sind entweder konstant oder hängen von Ort und/oder der
Geschwindigkeit des Teilchens, aber nicht von seiner Beschleunigung ẍ ab.
Spezialfall: Teilchen, das im Schwerefeld

der Erde senkrecht fällt.
F = mg,
g = 9, 81 m/s2 Erdbeschleunigung,
m
dx
v(t) = Geschwindigkeit.
dt x
g
1
In drei Raumdimensionen erhalten wir für x(t), y(t) und z(t) drei Differentialgleichungen, die
im Allgemeinen – je nach funktionaler Abhängigkeit der Komponenten des Kraftvektors F von den
Bahnkoordinaten und/oder ihren Ableitungen – gekoppelt sind. In diesem einführenden Kapitel
in die Thematik behandeln wir keine DGL-Systeme, sondern nur eindimensionale Bewegungen.
2
Die Kraft ist ein Vektor, d.h. hat in drei Raumdimensionen drei Komponenten - siehe nächstes
Kapitel. In diesem Kapitel behandeln wir, wie gesagt, als physikalische Beispiele der Einfachheit
halber nur eindimensionale Bewegungen.
KAPITEL 4. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 71
Da in diesem Beispiel die Kraft nicht von x abhängt, können wir (4.0.3) durch
die Ersetzung ẋ = v in eine DGL 1. Ordnung bezüglich v(t) umwandeln:
mẍ = mv̇ = mg
⇒ v̇ = g.
Diese DGL 1. Ordnung für v löst man durch Integration, d.h. Bestimmung der
Stammfunktion. Das Ergebnis ist
v(t) = gt + C,
wobei C eine beliebige reelle Konstante ist.
An diesem simplen Beispiel sehen wir folgenden Sachverhalt: Eine gewöhnliche
DGL 1. Ordnung des Typs (4.0.2) hat in der Regel eine Schar von Lösungen (d.h.
unendlich viele Lösungen), die durch eine beliebige Konstante C parametrisiert
ist. Um eine Vorhersage machen zu können, muss die Lösung eindeutig sein. Dies
erreichen wir dadurch, dass wir v zu einer bestimmten Zeit vorgeben, d.h. kennen
müssen. Sei also v(t0 ) = v0 gegeben. Dann ist die Lösung für v(t) eindeutig.

v(t) = gt + C
⇒ v0 = gt0 + C
v(t0 ) = v0
⇒C = v0 − gt0 .
Um die Bahn x(t) zu berechnen, müssen wir den Ausdruck für v(t) integrieren,
was man sofort machen kann. Wir sehen, dass dabei wieder eine willkürliche
Integrationskonstante C 0 auftritt. Diese wird festgelegt, indem wir uns den Ort
des Teilchens zu einer bestimmten Zeit vorgeben, x(t0 ) = x0 .
Fazit: Dieses einfache Beispiel illustriert folgenden wichtigen, recht allgemeinen
Sachverhalt: Viele – aber nicht alle – gewöhnlichen DGL n-ter Ordnung des Typs
(4.0.2) besitzen eine Schar von Lösungen = allgemeine Lösung. Diese hängt von
n willkürlichen Integrationskonstanten ab. Diese Konstanten werden festgelegt
durch Vorgabe von n Anfangs- oder Randbedingungen an die Funktion bzw.
ihrer Ableitungen; siehe unten.
238
b) Radioaktiver Zerfall: Wir betrachten ein radioaktives Material, z.B. Uran U,
das instabil ist:
238
92 U −→ 234 90 Th + 4
2 He .
|{z}
sog. α-Teilchen
Es sei N (t) die Anzahl der zur Zeit t noch nicht zerfallener Atomkerne. Das Zer-
fallsgesetz ergibt sich aus folgenden Sachverhalten: Während eines Zeitintervalls
dt finden im statistischen Mittel dN Kernzerfälle statt. Diese mittlere Änderung
ist proportional zur Zahl N (t) der zur Zeit t noch vorhandener Kerne und zum
Zeitintervall dt. Die Zahl N (t) nimmt mit der Zeit ab; d.h. dN/dt ist negativ.
Somit ist das Zerfallsgesetz:
d
N (t) = −λN (t) , λ > 0, (4.0.4)
dt
wobei λ die Zerfallskonstante bzw. Zerfallsrate pro zur Zeit t noch vorhandener
Kerne N (t) ist; [λ] = 1/Zeit. Gl. (4.0.4) ist eine lineare DGL 1. Ordnung. Die
allgemeine Lösung von (4.0.4) erhält man entweder durch Erraten,
N (t) = Ce−λt , C beliebige Konstante, (4.0.5)
oder mit Hilfe einer systematischen Lösungsmethode, der sog. Trennung der Va-
riablen, siehe unten.
Durch Vorgabe einer Anfangsbedingung N (t = 0) = N0 wird C fixiert. Einsetzen
in (4.0.5) ergibt
N (t) = N0 e−λt . (4.0.6)
Die Beispiele a) und b) sind Beispiele für lineare DGL.
Zurück zur Mathematik. Im Folgenden bezeichnen wir die unabhängige Varia-

ble wieder mit x und die gesuchte Funktion mit y = y(x). Man unterscheidet
• Nichtlineare DGL n-ter Ordnung:
F (x, y, y 0 , ..., y (n) ) = 0. (4.0.7)
Hier treten y und/oder die Ableitungen von y nichtlinear auf, z.B.
p
y2, y 0 , etc.
3
Beispiel: y 00 + a(x)(y 0 )4 + b(x)y 2 = 0.
• Lineare DGL n-ter Ordnung: Diese sind von der Form
a0 (x)y(x) + a1 (x)y 0 (x) + ... + an (x)y (n) (x) = f (x). (4.0.8)
Wenn f (x) 6= 0 ist, heißt die DGL inhomogen. Falls f (x) = 0 heisst die DGL
homogen. Falls die ai , i = 0, . . . , n konstant sind, handelt es sich um eine
lineare inhomogene DGL mit konstanten Koeffizienten.
In der Physik treten vor allem (nicht)lineare DGL 1. und 2. Ordnung auf.
Existenz einer Lösung:

Bei einer DGL stellt sich zunächst die Frage, ob bzw. unter welchen Vorausset-
zungen eine Lösung existiert, und falls ja, vieviele Lösungen es gibt. Diese essen-
tiellen Fragen, mit der sich die Mathematiker befassen, lassen sich für DGL der
Form (4.0.1) bzw. (4.0.2) nicht völlig allgemein, sondern nur fallweise bzw. nur für
bestimmte DGL-Klassen beantworten. Wir argumentieren hier pragmatisch bzw.
empirisch. Die DGL, die uns interessieren, entsprechen Naturgesetzen, insbesonde-
re dem Newtonschen Bewegungsgesetz mit in der Natur auftretenden Kräften. Die
Naturbeobachtung zeigt uns, dass Lösungen dieser DGL existieren3 .
3
Diese lapidare Feststellung soll aber nicht den Eindruck erwecken, dass die Ausssagen zur
Existenz und Eindeutigkeit von Lösungen einer DGL für die Physik irrelevant sind. Wir können
hier nur nicht darauf eingehen.
4.1 Beispiele für Differentialgleichungen 1. Ordnung 73
Lösungsmethoden:
Um eine DGL zu lösen, muss man sie auf irgendeine Weise ,,integrieren”. Wir wissen
bereits aus Kapitel 2, dass man ein Integral oft nicht in analytischer Form angeben
kann, obwohl man weiss, das es existiert. Genauso verhält es sich bei vielen DGL.
Manchmal helfen Transformationen der unabhängigen Variablen und/oder der ge-
suchten Funktion, um die DGL in eine analytisch lösbare Form zu bringen. Man
kann in jedem Fall (wenn man sich über die Existenz einer Lösung im Klaren ist)
numerische Verfahren anwenden, auf die wir hier nicht eingehen können. Diese Ver-
fahren sind aber in der Praxis (extrem) wichtig – Sie sollten sich im Laufe Ihres
Studiums einen Einblick in diese Methoden gönnen.
Für alle linearen DGL n-ter Ordnung mit konstanten Koeffizienten und für etliche
Typen nichtlinearer DGL 1. Ordnung lassen sich glücklicherweise allgemeine ana-
lytische Lösungsverfahren angeben. Wir besprechen im Folgenden nur einige dieser
Methoden, die wir zur Lösung einfacher Probleme der Mechanik brauchen.
4.1 Beispiele für Differentialgleichungen 1. Ord-

nung
4.1.1 DGL des Typs y 0 (x) = f (x)
Der einfachste DGL-Typ hat die Form
y 0 (x) = f (x). (4.1.1)
Die allgemeine Lösung ist natürlich die Menge der Stammfunktionen von f (x).
Zx
y(x) = f (x0 )dx0 = F (x) −F (a) = F (x) + C. (4.1.2)
| {z }
a C
Die untere Integrationsgrenze a bzw. äquivalent dazu die Konstante C ist beliebig.
Eine eindeutige Lösung erhält man durch Vorgabe eines Anfangswertes y(x0 ) = y0 .
C = y0 − F (x0 ). (4.1.3)
Wir wissen bereits, dass sich für komplizierte Funktionen f (x) die analytische Form
der Stammfunktion möglicherweise nicht angeben lässt. Man kann aber in jedem
Fall das Integral in (4.1.2) numerisch auswerten.
4.1.2 DGL des Typs y 0 (x) = H(x, y)

Wir betrachten Differentialgleichungen 1. Ordnung des Typs
y 0 (x) = H(x, y) . (4.1.4)

Für beliebige H(x, y) gibt es keine allgemeine analytische Lösungsmethode. Wenn

jedoch H von der Form
H(x, y) = f (x) g(y) (4.1.5)
ist, und somit
dy
= f (x) g(y) , (4.1.6)
dx
dann kann man diese DGL durch sog. Separation der Variablen lösen. Multipli-
ziere (4.1.6) mit (1/g(y)) dx. Man erhält
1
dy = f (x)dx. (4.1.7)
g(y)
Wir integrieren beide Seiten:
Zy Zx
1
0
dy 0 = f (x0 )dx0 , (4.1.8)
g(y )
y0 x0
wobei wir hier schon die Anfangsbedingung y(x0 ) = y0 verwendet haben.

Wir überprüfen, ob wir diese Anfangsbedingung korrekt in (4.1.8) eingebaut haben.
Dazu setzen wir im rechten Integral die obere Grenze gleich der unteren, x = x0 .
Dann verschwindet die rechte Seite. Im linken Integral muss wegen der gewählten
Anfangsbedingung y = y0 gesetzt werden. D.h. auch die linke Seite ist gleich null.
Nun zur weiteren Auswertung von (4.1.8). Die Stammfunktion von 1/g(y) sei G(y).
Wir nehmen an, dass wir sie in analytischer Form kennen. Die Stammfunktion von
f (x) sei F (x). Damit lässt sich (4.1.8) schreiben als
G(y) − G(y0 ) = F (x) − F (x0 )

⇒ G(y) = F (x) − F (x0 ) + G(y0 ). (4.1.9)
Mit Hilfe der Umkehrfunktion G̃ von G können wir diese algebraische Gleichung
nach y auflösen und erhalten die gesuchte Lösung von (4.1.4):
y = G̃ (F (x) − F (x0 ) + G(y0 )) . (4.1.10)
Hinweise:
(i) Diese Lösung ist eindeutig, weil wir in (4.1.8) die Anfangsbedingung schon
einsetzten. Hätten wir das nicht getan, d.h., hätten wir in (4.1.8) unbestimmte
Integrale verwendet, dann würde Gl. (4.1.9) ersetzt werden durch
G(y) + c1 = F (x) + c2 ⇒ G(y) = F (x) + c2 − c1 .

| {z }
C
Die freie Konstante C wird durch die gewählte Anfangsbedingung y(x0 ) = y0

festgelegt, d.h. C = G(y0 ) − F (x0 ).
(ii) Man kann die Umkehrfunktion G̃ von G nicht immer berechnen. Die gesuchte
Lösung y ist dann implizit durch die algebraische Gleichung (4.1.9) gegeben.
(iii) Beachte, dass DGL 1. Ordnung des Typs (4.1.6) sowohl linear als auch nicht-
linear sein können.
Beispiel: Eindimensionale Bewegung eines großen Objekts (Tennisball, Fußball)

der Masse m in Luft.
FL
Der Luftwiderstand führt zu einer Reibungskraft FL . Das empirische Gesetz für FL

ist im Fall großer Objekte mit Geschwindigkeit v das sog. Newtonsche Reibungsge-
setz:
FL = −av 2 a > 0.
Wir vernachlässigen in diesem Beispiel die Schwerkraft. Die Newtonsche Bewegungs-
gleichung lautet dann
mẍ = FL .
Da FL nur von v abhängt, können wir diese DGL 2. Ordnung in x unter Verwendung
von ẍ = v̇ umschreiben:
dv
m = −av 2 . (4.1.11)
dt
Dies ist eine nichtlineare, homogene DGL 1. Ordnung für v, die man durch Trennung
der Variablen löst. Aus (4.1.11) folgt
dv
m = −a dt
vZ2 Z
1
⇒ m dv = −a dt
v2
m
⇒ − + c1 = −at + c2
v
m
⇒ = at + c1 − c2 .
v | {z }
c
Die allgemeine Lösung ist also

m
v(t) = . (4.1.12)
at + c
Die Konstante c wird festgelegt durch Angabe der Geschwindigkeit zu einem be-
stimmten Zeitpunkt, z.B. zur Zeit t0 = 0. Die Anfangsbedingung sei v(0) = v0 .
Einsetzen in In (4.1.12) ergibt c = m/v0 . Somit erhalten wir für die Geschwindigkeit
des Objekts
v0 m
v(t) = τ≡ , (4.1.13)
1 + t/τ av0
wobei τ ein das Problem charakterisierender Parameter ist; [τ ] = Zeit. Wie erwartet
wird das Objekt immer langsamer; für t τ geht v(t) → 0.
4.1.3 DGL des Typs y 0 + a(x)y = 0

Bei DGL der Form
y 0 + a(x)y = 0 , mit y(x0 ) = y0 (4.1.14)
handelt es sich um lineare, homogene DGL 1. Ordnung mit nichtkonstanten Koeffi-
zienten (weil a = a(x)). Das ist ein Spezialfall der Gleichung (4.1.6). Die Lösungs-
methode ist wieder Separation der Variablen.
dy 1
= −a(x)y · dx

dx y
dy
⇒ = −a(x) dx
y
Z Zx
dy
⇒ = − a(x0 ) dx0
y
x0
Zx
⇒ ln |y| + c = − a(x0 ) dx0
x0
 
Zx
e−c exp −
⇒ |y| = |{z} a(x0 ) dx0  .
c̃>0 x0
Unterscheide
 
Zx
y > 0 ⇒ |y| = y ⇒ y = c̃ exp − a(x0 ) dx0  ,
x0
 
Zx
y < 0 ⇒ |y| = −y ⇒ y = −c̃ exp − a(x0 ) dx0  .
x0
Fazit: Die allgemeine Lösung von (4.1.14) ist vor Implementierung der Anfangs-
bedingung:  x 
Z
y(x) = C exp − a(x0 ) dx0  , (4.1.15)
x0
mit beliebiger, reeller Konstanten C. Die Berücksichtigung der Anfangsbedingung

y(x0 ) = y0 ergibt
y(x0 ) = Ce−0 = C
⇒ C = y0 .
4.1.4 DGL des Typs y 0 + a(x)y = f (x)

Bei
y 0 + a(x)y = f (x) , mit y(x0 ) = y0 (4.1.16)
handelt es sich um eine lineare, inhomogene DGL 1. Ordnung.
Lösungsmethode: Man findet die Lösung von (4.1.16) durch die sogenannte Varia-
tion der Konstanten. Damit ist folgender Ansatz gemeint: Die allgemeine Lösung
der mit (4.1.16) assoziierten homogenen DGL y 0 + a(x) y = 0 ist (4.1.15), wobei
C = const. Wir ersetzen nun C durch eine unbekannte Funktion C(x), d.h. wir
machen den Ansatz  x 
Z
y(x) = C(x) exp − a(x0 ) dx0  . (4.1.17)
x0
Die Differentiation nach x ergibt

 x   x 
Z Z
y 0 (x) = C 0 (x) exp − a(x0 ) dx0  −C(x)a(x) exp − a(x0 ) dx0  . (4.1.18)
x0 x0
| {z }
−a(x)y
Setzt man Gleichungen (4.1.17) und (4.1.18) in (4.1.16) ein, erhält man
 x   x 
Z Z
C 0 (x) exp − a(x0 ) dx0  − a(x)y + a(x)y = f (x) · exp + a(x0 ) dx0 

x0 x0
(4.1.19)
 
Zx
dC
⇒ = f (x) exp + a(x0 ) dx0  . (4.1.20)
dx
x0
Das ist eine Differentialgleichung für die gesuchte Funktion C(x), die durch Integrie-
ren – d.h. durch Bestimmung der Stammfunktion der rechten Seite – gelöst werden
kann. Für C(x) erhalten wir
Zx R x00
00 + a(x0 ) dx0
C(x) = f (x )e x0
dx00 + C0 , (4.1.21)
x0
wobei C0 eine Integrationskonstante ist. Wir setzen C(x) in (4.1.17) ein und benut-
zen, dass
Zx0 Zx Zx
− a(x ) dx − a(x ) dx = − a(x0 ) dx0 .
0 0 0 0
x00 x0 x00
Somit erhalten wir als allgemeine Lösung von (4.1.16):

Zx Rx
a(x0 )dx0
Rx
a(x0 )dx0 −
y(x) = f (x00 )e− x00 dx00 + C0 e x0 (4.1.22)
| {z }
x0 Das ist die allgemeine Lösung
| {z } der homogenen DGL y 0 +
Das ist eine spezielle Lösung a(x)y = 0
(wenn C0 = 0) der inhomoge-
nen DGL (4.1.16)
Dieser Sachverhalt gilt allgemein für lineare DGL, siehe unten und Abschnitt 4.4.2.
Aus der allgemeinen Lösung (4.1.22) der inhomogenen (!) DGL (4.1.16) müssen wir
noch diejenige Lösung bestimmen, welche die Anfangsbedingung y(x0 ) = y0 erfüllt.
y0 = 0 + C0 · 1 ⇒ C0 = y0 . (4.1.23)
Satz: Das in (4.1.22) dargestellte Ergebnis lässt sich in folgendem Satz zusammen-
fassen. Die allgemeine Lösung y einer inhomogenen, linearen DGL n-ter Ordnung
ist die Summe aus der allgemeinen Lösung yhom der zugehörigen homogenen DGL
und einer speziellen Lösung ys der inhomogenen DGL
y(x) = yhom (x) + ys (x). (4.1.24)
Der Beweis wird in der Vorlesung HöMa II geliefert. Wir überzeugen uns hier nur
davon, wie sich diese Aussage im Falle der DGL (4.1.16) darstellt. Dazu setzen wir
(4.1.24) in (4.1.16) ein:
0
yhom + ys0 + ayhom + ays = f
0
⇒ yhom + ayhom + ys0 + ays = f .
| {z } | {z }
= 0 per Definition von löst diese DGL per Defi-
yhom nition von ys
4.1.5 DGL des Typs y 0 + ay = f (x), a = const.

Bei der DGL
y 0 + ay = f (x) a = const. (4.1.25)
mit Anfangsbedingung y(x0 ) = y0 handelt es sich um eine lineare, inhomogene DGL
1. Ordnung mit konstanten Koeffizienten. Das ist ein Spezialfall der DGL (4.1.16).
In diesem Fall können wir das Integral in den in der allgemeinen Lösung (4.1.22)
auftretenden Exponentialfaktoren sofort ausführen:
Rx
a dx0
Rx
adx0 00 00 −
e− x00 = e−ax+ax = eax e−ax und e x0
= e−ax+ax0 = eax0 e−ax . (4.1.26)
Einsetzen von (4.1.26) in (4.1.22) ergibt die allgemeine Lösung der DGL (4.1.25):
Zx
−ax 00
y(x) = e f (x00 )eax dx00 + C0 eax0 e−ax . (4.1.27)
x0
Die Lösung, welche die Anfangsbedingung y(x0 ) = y0 erfüllt, ergibt sich wieder mit
C0 = y0 .
Beispiel aus der Physik: Senkrechte Bewegung

eines kleinen Teilchens mit konstanter4 Masse m
unter dem Einfluss der Schwerkraft Fg der Erde
und dem Luftwiderstand, d.h. der Reibungskraft
FR . Die Newtonsche Bewegungsgleichung lautet m
mẍ = Fg + FR , (4.1.28)
bv
wobei Fg = mg mit g = 9, 81 m/s2 (Erdbeschleuni- mg
gung). Für kleine Teilchen ist die mit der Luftrei- x
bung assoziierte Kraft gegeben durch das Stokes-
sche Reibungsgesetz FR = −bv, b > 0.
Da die rechte Seite von (4.1.28) nur von der Geschwindigkeit v(t), aber nicht von
x(t) abhängt, verwenden wir den gleichen ,,Trick” wie in Gleichung (4.1.11): Wir
benutzen auf der linken Seite von (4.1.28), dass ẍ = v̇, d.h.
mv̇ = mg − bv. (4.1.29)
Somit haben wir aus der DGL 2. Ordnung in der Ortsvariablen eine DGL 1. Ordnung
in der Geschwindigkeit gemacht. Aus (4.1.29) folgt:
1
v̇ + v = g, (4.1.30)
τ
wobei τ ≡ m/b, [τ ] = Zeit. Die DGL (4.1.30) ist von der Form (4.1.25), mit a = 1/τ
und f (x) = g = const.
Nun zur Lösung dieser DGL:
1. Die allgemeine Lösung von (4.1.30) ist gegeben durch (4.1.22), wobei (4.1.26)
benutzt werden kann. Die Berücksichtigung der Anfangsbedingung v(t0 = 0) =
v0 ergibt, dass C0 = v0 . Somit ist die gesuchte Lösung von (4.1.29) gegeben
4
Die Abbildung sollte nicht missverstanden werden. Ein Wassertröpfchen, das in feuchter Luft
fällt, sammelt durch Kondensation von Wasserdampf Masse auf; d.h. seine Masse nimmt im Laufe
der Zeit zu. Bewegungsgleichungen für den Fall zeitabhängiger Massen behandeln wir im Mechanik-
Teil der Vorlesung.
durch
 
Zt Zt
1
v(t) = v0 e−t/τ + g exp − dt0  dt00
τ
0 00
| {z t }
00 00
exp(− τt + tτ )=e−t/τ e+t /τ
Zt
00
⇒ v(t) = v0 e−t/τ + ge −t/τ
et /τ dt00
|0 {z }
00 t
τ |
et /τ =τ et/τ −τ
0
⇒ v(t) = v0 e−t/τ + gτ 1 − e−t/τ .

(4.1.31)
2. Man muss die Formel (4.1.22) für die allgemeine Lösung nicht auswendig ken-
nen. Merken sollte man sich aber die Schritte und Methoden zur Lösung ei-
ner inhomogenen linearen DGL 1. Ordnung. i) Bestimmung der allgemeinen
Lösung yhom der assoziierten homogenen DGL. ii) Bestimmung einer Lösung
ys (x) der inhomogenen DGL durch Variation der Konstanten. iii) Implemen-
tierung der Anfangsbedingung y(x0 ) = y0 in die allgemeine Lösung y(x) =
yhom (x) + ys (x) der inhomogenen DGL.
Zu i): Die zu (4.1.30) gehörende homogene DGL ist
1
v̇ + v = 0 .
τ
Diese DGL löst man durch Trennung der Variablen.
1 1
dv = − dt ⇒ v(t) = Ce−t/τ .
v τ
Zu ii): Ansatz zur Suche einer Lösung der inhomogenen DGL (4.1.29). Wir er-
setzen die Integrationskonstante C durch C(t) und machen den Lösungsansatz
v(t) = C(t) exp(−t/τ ). Diesen setzen wir in (4.1.29) ein. Wir erhalten
1 1
Ċe−t/τ − Ce−t/τ + Ce−t/τ = g ,
τ τ
und somit
Ċe−t/τ = g ⇒ Ċ = ge+t/τ ⇒ C(t) = gτ e+t/τ + C0
Wir sehen, dass wir wie im allgemeineren Fall (4.1.21) nicht nur eine Lösung,
sondern eine Lösungsschar erhalten. Somit ist die allgemeine Lösung von (4.1.29):
v(t) = C(t)e−t/τ = gτ + C0 e−t/τ .
Man sieht, dass diese Lösung die Struktur (4.1.24) hat; ys = gτ ist eine spe-
zielle Lösung der inhomogenen DGL und C0 e−t/τ die allgemeine Lösung der
4.2 Beispiele für lineare DGL 2. und höherer Ordnung 81
homogenen DGL.
Zu iii): Festlegung der Integrationskonstanten durch die Anfangsbedingung
v(t0 = 0) = v0 :
v0 = v(0) = gτ + C0 ⇒ C0 = v0 − gτ .
Die so fixierte, eindeutige Lösung von (4.1.29) stimmt natürlich mit der obigen
Lösung (4.1.31) überein.
Bahn und Diskussion der Lösung:
• Die Bahn x(t) des Teilchens erhält man sofort durch Integration der Geschwindig-
keit (4.1.31). Die dabei auftretende Integrationskonstante wird durch Vorgabe eines
Anfangswertes x(t0 = 0) = x0 festgelegt.
• Für Zeiten t τ geht e−t/τ → 0 und somit
t→∞ mg
v(t) −−−→ vfinal := gτ = konstante Geschwindigkeit.
b
D.h. die Gravitationskraft, die beschleunigt, und die bremsende Luftreibungskraft
linear in v kompensieren sich für Zeiten t τ nahezu.
4.2 Beispiele für lineare DGL 2. und höherer Ord-

nung
Wir betrachten hier in einigem Detail nur DGL n-ter Ordnung der Form
y (n) + an−1 y (n−1) + ... + a0 y = 0 , wobei a0 , ..., an−1 Konstanten , (4.2.1)
bzw. den Spezialfall einer DGL 2. Ordnung:
y 00 + ay 0 + by = 0, a, b reelle Konstanten. (4.2.2)
Das sind lineare, homogene DGL n-ter bzw. 2. Ordnung mit konstanten Koeffizi-
enten. Beachte, dass wir Differentialgleichungen dieses Typs immer auf die Form
(4.2.1) bzw. (4.2.2) bringen können (durch Division der jeweiligen Gleichung durch
den Koeffizienten von y 00 , falls dieser verschieden von 1 ist).
4.2.1 Drei allgemeine Aussagen

I. Superpositionsprinzip:
Sind y1 (x) und y2 (x) verschiedene Lösungen von (4.2.1), so ist auch
y = A1 y 1 + A2 y 2 , A1 , A2 Konstanten (4.2.3)
eine Lösung von (4.2.1).

Beweis für die DGL 2. Ordnung: Wir setzen (4.2.3) in (4.2.2) ein:
A1 y100 + A2 y200 + a(A1 y10 + A2 y20 ) + b(A1 y1 + A2 y2 ) = 0

⇒ A1 (y100 + ay10 + by1 ) +A2 (y200 + ay20 + by2 ) = 0 .
| {z } | {z }
0 nach Voraussetzung 0 nach Voraussetzung
Hinweise:
1. Mit ,,verschiedene Lösungen” sind sog. linear unabhängige Lösungen gemeint,

das sind Lösungen, für die y2 (x) 6= Ay1 (x), A = const. Für y2 = Ay1 wäre die
Aussage trivial.
2. Das Superpositionsprinzip gilt nicht nur für DGL der Form (4.2.2), sondern
für alle linearen, homogenen DGL n-ter Ordnung, wobei die Koeffizienten auch
Funktionen von x sein können.
an (x)y (n) + an−1 (x)y (n−1) + ... + a0 (x)y = 0. (4.2.4)
D.h. die Überlagerung (Superposition) von Lösungen einer linearen, homo-

genen DGL (4.2.4) ist wieder eine Lösung dieser DGL. Dieses simple, aber
grundlegende Ergebnis ist von enormer Bedeutung in der Physik.
3. Für nichtlineare DGL gilt dieses Prinzip nicht.
II. Lösungsmethode:
Zum Lösen einer linearen, homogenen DGL n-ter Ordnung mit konstanten Koeffi-
zienten, also der DGL (4.2.1), gibt es eine Standardmethode, nämlich den Ansatz
y(x) = C eλx , wobei C, λ beliebige Konstanten. (4.2.5)
Differenziere y n-mal:
y (n) = Cλn eλx .
Setze dies in (4.2.1) ein und teile durch C. Man erhält
λn + an−1 λn−1 + ... + a1 λ + a0 = 0. (4.2.6)
Die linke Seite dieser algebraischen Gleichung ist ein Polynom n-ten Grades in λ.
Man nennt es das charakteristische Polynom der DGL (4.2.1). Nach dem Fundamen-
talsatz der Algebra aus Kapitel 3 hat dieses Polynom n Nullstellen λi , die – selbst
wenn die aj alle reell sind – auch komplex sein können.
• Wenn die Lösungen λi von (4.2.6) alle verschieden voneinander sind,
λi 6= λj ∀i, j = 1, ..., n,
dann sind die n Lösungen von (4.2.1)

yi (x) = Ci eλi x (4.2.7)
linear unabhängig – d.h. keine der Lösungen yi ist ein konstantes Vielfaches
einer anderen, yi (x) 6= Ayj (x). Wegen des Superpositionsprinzips erhalten wir
somit in diesem Fall, dass die allgemeine Lösung der DGL (4.2.1) gegeben ist
durch die Linearkombination
n
X
y(x) = Ci eλi x . (4.2.8)
i=1
Die allgemeine Lösung hängt von n beliebigen Konstanten C ab. Eine eindeu-
tige Lösung erhält man durch Festlegung der Konstanten. Bei physikalischen
Anwendungen bestimmt die jeweilige physikalische Situation nicht nur nur die
Form der DGL, sondern auch wie diese Konstanten festgelegt werden. Eine
typische Problemstellung ist das sogenannte Anfangswertproblem: Man sucht
eine Lösung der DGL (4.2.1), die den n Anfangsbedingungen
y(x0 ) = y0 , y 0 (x0 ) = y1 , ..., y (n−1) (x0 ) = yn−1 (4.2.9)
genügt. Einsetzen der n Anfangswerte (4.2.9) in die allgemeine Lösung (4.2.8)
bzw. in deren Ableitungen ergibt ein lineares Gleichungssystem, d.h. n Glei-
chungen für die gesuchten Ci , die dadurch festgelegt sind.
• Das charakteristische Polynom (4.2.6) kann mehrfache Nullstellen haben. In
diesem Fall sind die entsprechenden Lösungen (4.2.7) nicht mehr linear un-
abhängig. Tritt zum Beispiel eine zweifache Nullstelle auf, λ1 = λ2 , dann ist
eλ1 x = eλ2 x .
Wie man in diesem Fall n linear unabhängige Lösungen konstruiert, besprechen
wir im nächsten Abschnitt am Beispiel der DGL 2. Ordnung, Gl. (4.2.2).
III. Reelle Lösungen im Fall reeller Koeffizienten aj :

Einige oder alle Nullstellen λj des charakteristischen Polynoms (4.2.8) können kom-
plex sein. Dann sind die zugehörigen Lösungen
yj (x) = Cj eλj x = Cj e(Re λj )x ei(Im λj )x (4.2.10)
komplex, d.h. komplexwertige Funktionen der reellen Variablen x. (Zur Erinnerung:
i ist die imaginäre Einheit.) Bei Anwendungen in der Physik sind die Koeffizienten
aj in der Regel reell. Wir sind letztendes nur an reellen Lösungen der DGL interes-
siert, weil physikalische Größen durch reelle Zahlen bzw. Funktionen charakterisiert
werden. Da die DGL (4.2.1) linear ist, ist – falls die aj alle reell sind – auch der
Realteil von yj (x),
yj,phys (x) = Re yj (x), (4.2.11)
eine Lösung dieser DGL. Wir zeigen dieses grundlegende Ergebnis anhand der DGL
2. Ordnung, Gl. (4.2.2), wobei wie gesagt a, b reell sein müssen. Es sei
y(x) = Re y + iIm y
eine komplexwertige Lösung dieser DGL. Einsetzen ergibt
0 = y 00 + ay 0 + by = (Re y 00 + aRe y 0 + bRe y) +i (Im y 00 + aIm y 0 + bIm y) .

| {z } | {z }
reell reell
Die rechte Seite dieser Gleichung ist eine komplexe Zahl bzw. eine komplexwertige
Funktion. Sie kann nur verschwinden, wenn sowohl ihr Realteil als auch ihr Ima-
ginärteil verschwinden5 , d.h. wenn die beiden Klammern separat null sind. Dieses
Argument kann sofort auf die DGL n-ter Ordnung, Gl. (4.2.1) übertragen werden.
Außerdem sollte klar sein, dass die obige Aussage auch für homogene lineare DGL
mit reellen Koeffizientenfunktionen aj (x) (j = 0, . . . , n − 1) gilt.
4.2.2 Lösung von y 00 + ay 0 + by = 0

Nun zur allgemeinen Lösung des Spezialfalls (4.2.2), d.h. der homogenen DGL 2.
Ordnung mit konstanten Koeffizienten:
y 00 + ay 0 + by = 0 a, b relle Konstante, (4.2.12)
wobei wie bereits oben betont wurde, wir letztendes nur an der allgemeinen reellen
Lösung dieser DGL interessiert sind.
Setzt man den Ansatz (4.2.5)
y(x) = C eλx
in (4.2.12) ein, erhält man das charakteristische Polynom bzw. die charakteristische
Gleichung 2. Grades,
λ2 + aλ + b = 0 , (4.2.13)
mit den zwei Lösungen
a a2 1/2
λ1,2 = − ± −b . (4.2.14)
2 4
| {z }
≡d Diskriminante
Drei Fälle sind zu unterscheiden:

1. Falls d > 0, dann sind λ1,2 zwei reelle Nullstellen des charakteristischen Poly-
noms. Die beiden linear unabhängigen Lösungen von (4.2.12)
y1 = C1 eλ1 x , y2 = C2 eλ2 x
5
Beachte: wenn a und/oder b komplex sind, dann sind die Terme oberhalb der beiden Klammern
i.A. nicht reell, d.h. entsprechen nicht dem Real- und Imaginärteil des Ausdrucks auf der rechten
Seite der Gleichung; siehe (3.1.6) in Kapitel 3.
wachsen oder fallen in diesem Fall exponentiell mit x. Die allgemeine Lösung
von (4.2.12) ist gegeben durch
y(x) = C1 eλ1 x + C2 eλ2 x , (4.2.15)
wobei C1 , C2 zwei beliebige reelle Konstante sind (weil wir nur an reellen
Lösungen interessiert sind). Diese beiden Konstanten werden durch Vorgabe
von zwei Anfangsbedingungen festgelegt:
y(x0 ) = y0 , y 0 (x0 ) = y1 .
Zur Implementierung dieser Anfangsbedingungen müssen wir (4.2.15) noch
differenzieren: y 0 = C1 λ1 eλ1 x + C2 λ2 eλ2 x . Einsetzen der Anfangsbedingungen
in y und y 0 ergibt
C1 eλ1 x0 + C2 eλ2 x0 = y0 , C1 λ1 eλ1 x0 + C2 λ2 eλ2 x0 = y1 .
Dieses lineare, inhomogene algebraische Gleichungssystem (zwei Gleichungen,
zwei Unbekannte) lässt sich problemlos nach C1 und C2 auflösen.
2. Falls d < 0, dann
s r
a a2 a a2
λ1,2 =− ± (−1) b − =− ±i b− .
2 4 2 | {z 4 }
≡ω>0
Die beiden Nullstellen6 sind somit zueinander konjugiert komplex:

a
λ1,2 = − ± iω , λ1 = λ∗2 .
2
Diese beiden Nullstellen liefern zwei linear unabhängige Lösungen von (4.2.12)
der Form (4.2.7), und die allgemeine Lösung ist – siehe (4.2.8):
a
y = C1 eλ1 x + C2 eλ2 x = e− 2 x C1 eiωx + C2 e−iωx ,

(4.2.16)
| {z }
≡u
wobei C1 und C2 beliebige, i.A. komplexe Konstanten sind. Mit der Euler-
Formel aus Kapitel 3 ist
u(x) = C1 (cos ωx + i sin ωx) + C2 (cos ωx − i sin ωx)
= (C1 + C2 ) cos ωx + (iC1 − iC2 ) sin ωx.
Mit der Umbenennung
A1 := C1 + C2
beliebig komplex
A2 := iC1 − iC2
6
√
Wir benutzten hier die in Kapitel
√ 3.3 besprochene Definition der der Wurzel z einer komple-
√
xen Zahl. Demzufolge ist −1 = eiπ = eiπ/2 = +i.
erhalten wir
u(x) = A1 cos ωx + A2 sin ωx,
und die allgemeine Lösung von (4.2.12) hat die Form
a
y(x) = e− 2 x u(x). (4.2.17)
Im Allgemeinen sind A1 , A2 komplexe Konstanten, d.h. y(x) ist eine komple-
xe Funktion der reellen Variablen x. Da die DGL (4.2.12) linear ist und a, b
reell sein sollen, ist wie bereits oben gezeigt der Realteil von y(x) ebenfalls
eine Lösung von (4.2.12) – und das ist die allgemeine reelle, d.h. physikalisch
relevante Lösung von (4.2.12) im Falle von d < 0:
a
yphys (x) = Re y(x) = e− 2 x (a1 cos ωx + a2 sin ωx), (4.2.18)
wobei a1 = Re A1 , a2 = Re A2 zwei beliebige reelle Konstanten sind. Die
Anfangsbedingung an y und y 0 wird analog zur Vorgehensweise in 1) imple-
mentiert.
3. Falls d = 0, dann hat das charakteristische Polynom (4.2.13) die doppelte
Nullstelle
a
λ1 = λ2 = − .
2
Das liefert nur eine Lösung von (4.2.12):
a
y1 (x) = C e− 2 x . (4.2.19)
Wie erhalten wir in diesem Fall eine zweite, linear unabhängige Lösung? Man
benutzt die Methode Variation der Konstanten. Wir machen den Ansatz
a
y(x) = C(x) e− 2 x . (4.2.20)
Dann ist
a a a
y 0 = C 0 e− 2 x − C e− 2 x
2
a a a a a a2 a
y 00 = C 00 e− 2 x − C 0 e− 2 x − C 0 e− 2 x + C e− 2 x .
2 2 4
Wir setzen y und diese Ableitungen in die DGL (4.2.12) ein und erinnern uns
daran, dass wir den Fall d = 0, d.h. b = a2 /4 diskutieren. Das ergibt
a a a2 − a x a a2 a a2 a
C 00 e− 2 x − aC 0 e− 2 x + Ce 2 + aC 0 e− 2 x − Ce− 2 x + Ce− 2 x = 0.
4 2 4
Die Terme proportional zu C 0 und zu C kürzen sich weg und wir verbleiben
mit der folgenden, einfach zu lösenden DGL 2. Ordnung:
C 00 (x) = 0 .
⇒ C 0 (x) = A1 ,
⇒ C(x) = A1 x + A2 . (4.2.21)
4.3 Beispiele aus der Physik 87
FH
0
Masse m FH
Ruhelage Auslenkung
Abbildung 4.1: Federpendel in einer Raumdimension im schwerelosen Raum.
Setzen wir (4.2.21) in (4.2.20) ein, erhalten wir als Lösung von (4.2.12):
a
y(x) = (A1 x + A2 ) e− 2 x .
Der zweite Term und die Lösung (4.2.19) sind linear abhängig, während der
erste Term und (4.2.19) linear unabhängig sind. Somit ist die allgemeine reelle
Lösung von (4.2.12) im Falle d = 0:
a a
y(x) = (A1 x e− 2 x + A2 e− 2 x ) A1 , A2 reell. (4.2.22)
Die Anfangsbedingung an y und y 0 wird analog zur Vorgehensweise in 1) implemen-

tiert.
4.3 Beispiele aus der Physik

Wir betrachten nun zwei elementare, aber wichtige Beispiele aus der Mechanik. In
diesen Beispielen wird die Bewegung eines Objekts durch eine lineare, homogene
DGL 2. Ordnung mit konstanten Koeffizienten beschrieben.
4.3.1 Eindimensionales Federpendel im schwerelosen Raum

Wir betrachten die eindimensionale Schwingung eines ,,Massenpunktes” m, der an
einer Feder hängt – siehe Fig. 4.1. Die Schwingungsamplitude x(t) ist durch die
Newtonsche Bewegungsgleichung bestimmt,
mẍ = F , (4.3.1)
wobei F die auf den Massenpunkt wirkende Gesamtkraft bezeichnet. Die Feder be-
finde sich irgendwo im schwerlosen Raum – somit wirkt auf die Masse m keine
Gravitationskraft, sondern nur die rücktreibende Kraft der Feder. Wenn die Feder
nicht überdehnt wird, gilt das Hookessche Gesetz:
FH = −k(x − x0 ), x0 = 0 , (4.3.2)
wobei k > 0 und sich die Ruhelage des Pendels o.B.d.A. bei x0 = 0 befinden soll.
Gl. (4.3.2) in (4.3.1) eingesetzt ergibt
mẍ + kx = 0 ,
⇒ ẍ + ω 2 x = 0 , (4.3.3)
wobei ω 2 ≡ k/m > 0. Man findet die Lösung dieser linearen DGL 2. Ordnung mit
Hilfe des Standard-Ansatzes (4.2.5):
x(t) = C eλt
⇒ λ2 + ω 2 = 0
⇒ λ1,2 = ±iω.
Die allgemeine Lösung von (4.3.3) ist somit
x(t) = C1 eiωt + C2 e−iωt . (4.3.4)
Die physikalisch relevante Lösung ist gegeben durch den Realteil von x(t) – siehe
Gl. (4.2.18).
xphys (t) = Re x(t) = a1 cos ωt + a2 sin ωt. (4.3.5)
Die reellen Konstanten a1 , a2 werden festgelegt durch Berücksichtigung der Anfangs-
bedingungen. Wir geben uns den Ort und die Geschwindigkeit des Massenpunktes
zu einer bestimmten Zeit t0 vor:
x(t0 ) = x0 , ẋ(t0 ) = v0 .
Einsetzen in (4.3.5) bzw. in die 1. Zeitableitung liefert zwei Gleichungen für a1 und
a2 .
Die DGL (4.3.3) ist das einfachste Beispiel einer Schwingungsdifferentialgleichung
– sie beschreibt eine eine freie, ungedämpfte Schwingung mit der Kreisfrequenz ω
in einer Raumdimension. Die Amplitude der Schwingung als Funktion der Zeit ist
gegeben durch die Lösung (4.3.5), wobei a1,2 wie gesagt durch die jeweilige Anfangs-
bedingung festgelegt sind. Man bezeichnet ein System, das der Bewegungsgleichung
(4.3.3) genügt, als eindimensionalen ungedämpften harmonischen Oszillator. Dieses
simple mechanische Beispiel dient als Modell für viele ungedämpfte eindimensionale
Schwingungen in der Physik.
Beachte: Die Differentialgleichung

ẍ − rx = 0 , r>0
beschreibt einen völlig anderen Vorgang, nämlich exponentiell mit der Zeit anstei-
gende bzw. fallende Amplituden.
4.4 Allgemeine Hinweise 89
4.3.2 Eindimensionales Federpendel im schwerelosen Raum

mit Reibung
Das Pendel befinde sich in einem mit Flüssigkeit oder Gas gefüllten Behälter. Die
von diesem Medium auf den Massenpunkt ausgeübte Reibungskraft sei proportional
zu v (siehe oben).
FR = −κẋ , κ > 0. (4.3.6)
Somit ist die Newtonsche Bewegungsgleichung
mẍ = FH + FR
= −kx − κẋ ,
d.h.
κ k
ẍ + ẋ + x = 0. (4.3.7)
m m
Dies ist die DGL einer eindimensionalen Schwingung mit einem Dämpfungsterm.
Die allgemeine Lösung fanden wir bereits im Abschnitt 4.2.2. Wie dort müssen wir
drei Fälle unterscheiden:
κ2 k κ2 k κ2 k
1) 2
> , 2) 2
< , 3) 2
= .
4m m 4m m 4m m
Diese Fälle beschreiben drei verschiedene physikalische Vorgänge, nämlich (1) dem
sog. überdämpften Fall, (2) den Fall einer gedämpften Schwingung und (3) den sog.
aperiodischen Grenzfall. Wir werden sie im Detail in den Übungen behandeln und
nochmal im Mechanik-Teil der Vorlesung darauf eingehen. Dort besprechen wir auch
den Fall, dass auf den Oszillator noch eine zusätzliche äußere Kraft einwirkt. Das
führt zu einer inhomogenen DGL 2. Ordnung. In diesem Fall müssen wir zusätzlich
zur allgemeinen Lösung der assoziierten homogenen DGL noch eine spezielle Lösung
der inhomogenen DGL finden.
4.4 Allgemeine Hinweise

Zum Schluss dieses Kapitels fassen hier noch einmal einige allgemeine Aussagen über
gewöhnliche DGL zusammen, ohne dafür Beweise zu geben. (Diese werden in der
Vorlesung HöMa II bzw. in Spezialvorlesungen über DGL geliefert.)
4.4.1 Anfangs- und Randbedingungen

Wir sahen, dass die jeweilige allgemeine Lösung der von uns behandelten DGL-
Typen 1. Ordnung von einer beliebigen Konstanten C, und die der oben bespro-
chenen DGL 2. Ordnung von zwei beliebigen Konstanten C1 , C2 abhängt. Viele
(nicht)lineare DGL n-ter Ordnung der Form
y (n) (x) = F x, y(x), y 0 (x), ..., y (n−1) (x)

(4.4.1)
besitzen ebenfalls eine Schar von Lösungen. Wir nehmen an, dass diese Lösungen
existieren. Das ist unter relativ milden Anforderungen an F der Fall. Diese allge-
meine Lösung hängt von n beliebigen Konstanten C1 , ..., Cn ab:
y = y(x, C1 , ..., Cn ). (4.4.2)
Die allgemeine Lösungsschar (4.4.2) ist wenig aussagekräftig. In Anwendungen (in
der Physik, Chemie, Biologie, den Ingenieurwissenschaften, usw.) ist das Ziel, eine
eindeutige Lösung zu bestimmen – nur diese ermöglicht eine Vorhersage. Dazu muss
man Anfangs- oder Randbedingungen vorgeben, die die gesuchte Lösung erfüllen
soll. Diese Bedingungen werden vom jeweiligen Problem, in unserem Kontext von
der Physik diktiert!
Anfangswertproblem:
Unter relativ allgemeinen Voraussetzungen an die Eigenschaften der DGL (4.4.1)
erhält man eine eindeutige Lösung dieser DGL durch Vorgabe der n Anfangswerte:
y(x0 ) = y0 ,
y 0 (x0 ) = y1 ,
.. (4.4.3)
.
y (n−1) (x0 ) = yn .
Einsetzen dieser Anfangswerte in die allgemeine Lösung (4.4.2) bzw. deren Ablei-
tungen ergibt n algebraische Gleichungen für die Konstanten C1 , ..., Cn , die zu lösen
sind. Die Suche nach einer eindeutigen Lösung von (4.4.1), welche den Anfangsbe-
dingungen (4.4.3) genügt, nennt man ein Anfangswertproblem 7 .
Randwertproblem:
Hier sucht man eine eine eindeutige Lösung von (4.4.1) durch Vorgabe von n Be-
dingungen an y und/oder ihren Ableitungen an den Rändern x = a und x = b
des Lösungsintervalls a ≤ x ≤ b. Ein Beispiel dafür ist die Temperaturverteilung
längs eines eindimensionalen Stabes der Länge L, der sich in einem Medium befin-
det, dessen Temperatur TM sei. Die beiden Enden des Stabes sollen auf konstanter
Temperatur T1 bzw. T2 mit T1 6= T2 gehalten werden. Nach einer gewissen Zeit stellt
sich ein stationärer Zustand ein, d.h. die Temperaturverteilung T hängt nur von der
Ortsvariablen x, aber nicht mehr von der Zeit ab. Zu lösen ist dann das folgende
Randwertproblem:
T 00 (x) = a2 (T (x) − TM ) mit T (0) = T1 , T (L) = T2 6= T1 .
7
Nicht jedes Anfangswertproblem hat eine eindeutige Lösung. Ein Gegenbeispiel ist
√
y 0 (x) = y mit y(0) = 0 , wobei 0 ≤ x < ∞ .
Sowohl y(x) = 0 als auch die Schar yλ (x) = 0 für 0 ≤ x ≤ λ, yλ (x) = (x − λ)2 /4 für λ < x < ∞
lösen dieses Anfangswertproblem.
Auf die physikalische Herleitung dieser DGL gehen wir hier nicht ein. Dieses Beispiel
soll nur zeigen, dass in der Physik auch Randwertprobleme mit gewöhnlichen DGL
eine Rolle spielen.
Das wohl berühmteste Beispiel für ein Randwertproblem ist die DGL einer schwin-
genden Saite, die an ihren Enden x = a und x = b fixiert ist. (Es handelt sich dabei
aber um eine partielle DGL.) Mit diesem Problem schlugen sich Großmeister von
Pythagoras bis hin zu Euler, J. und D. Bernoulli, d’Alembert und Lagrange herum.
Eine Saite ist ein elastischer, nicht-starrer Körper – man behandelt solche Objekte
in der Kontinuumsmechanik.
Randwertaufgaben sind nicht immer lösbar. Es gibt auch einfache Beispiele dafür,
dass eine Randwertaufgabe zwar eine Lösung besitzt, die Lösung aber nicht eindeutig
ist. Da wir uns im Mechanik-Teil dieser Vorlesung nur mit Anfangswertproblemen
für Massenpunkte bzw. in der Vorlesung Theoretische Physik I für starre Körper
befassen, gehen wir darauf nicht ein.
4.4.2 Zusammenfassung: lineare Differentialgleichungen

Hier fassen wir noch einmal einige wichtige, bereits oben erläuterte Aussagen über
DGL des Typs
an (x)y (n) + an−1 (x)y (n−1) + ... + a0 (x)y = f (x) (4.4.4)
zusammen.
• Die allgemeine Lösung einer linearen, inhomogenen DGL n-ter Ordnung ist
die Summe aus der allgemeinen Lösung der assoziierten homogenen DGL und
einer speziellen Lösung der inhomogenen DGL,
y(x) = yhom (x) + ys (x).
Im Falle einer DGL 1. Ordnung haben wir uns davon schon überzeugt – siehe
oben. Inhomogene, lineare DGL 2. Ordnung werden wir im Mechanik-Teil der
Vorlesung lösen. Beachten Sie, dass die Anfangswerte (bzw. die Randwerte)
nicht yhom , sondern der allgemeinen Lösung y der inhomogenen Gleichung
aufgeprägt werden müssen!
• Für lineare, homogene DGL n-ter Ordnung, d.h. f (x) = 0 in (4.4.4), gilt das
Superpositionsprinzip: Jede Überlagerung von linear unabhängigen Lösungen
der DGL ist wieder eine Lösung. Die allgemeine Lösung der DGL erhält man
durch Überlagerung der n linear unabhängigen Lösungen mit freien Koeffizien-
ten Ci . Die Anfangsbedingungen selektieren dann aus dieser Lösungsschar eine
eindeutige Lösung; die Koeffizienten Ci ergeben sich als Lösung eines linearen
inhomogenen algebraischen Gleichungssystems8 .
8
Wie man ein lineares inhomogenes algebraisches Gleichungssystem – n Gleichungen, n Unbe-
kannte – löst, besprechen wir in Kapitel 6. Im Mechanik-Teil der Vorlesung behandeln wir nur DGL
(4.4.4) von höchstens 2. Ordnung – das resultierende Gleichungssystem kann man mit elementaren
Methoden lösen.
• Lineare, homogene DGL n-ter Ordnung mit konstanten Koeffizienten,
y (n) + an−1 y (n−1) + ... + a0 y = 0 , a0 , a1 , ...an−1 Konstanten , (4.4.5)
löst man mit dem Ansatz

y = C eλx . (4.4.6)
Nach Einsetzen von (4.4.6) in die DGL (4.4.5) erhält man das charakteristische
Polynom bzw. die charakteristische Gleichung der DGL:
λn + an−1 λn−1 + ... + a0 = 0. (4.4.7)
Diese hat n Lösungen λi , von denen einige oder alle komplex sein können.
* Falls alle λi einfache Nullstellen des charakteristischen Polynoms sind,
erhält man die n linear unabhängigen Lösungen
yi = Ci eλi x , i = 1, . . . , n .
* Bei mehrfachen Nullstellen des charakteristischen Polynoms ist die Be-

stimmung der unabhängigen Lösungen etwas komplizierter, siehe das obi-
ge Beispiel.
* Im Falle einer komplexen Nullstelle λj ist die zugehörige Lösung (4.4.6) ei-
ne komplexwertige Funktion yj . Falls die Koeffizienten al der DGL (4.4.5)
alle reell sind, erhält man eine reelle Lösung dieser DGL wie oben gezeigt
durch Bilden des Realteils von yj .
Abschließender Hinweis: Systeme gewöhnlicher DGL

Im Mechanik-Teil der Vorlesung befassen wir uns vor allem mit der Lösung der New-
tonschen Bewegungsgleichung für Probleme nicht nur in einer, sondern natürlich
auch in zwei bzw. drei Raumdimensionen. In diesen Fällen müssen wir ein im All-
gemeinen gekoppeltes System von zwei bzw. drei gewöhnlichen DGL lösen. In drei
Raumdimensionen hat dieses System die Form
mẍ1 =F1 (xi , ẋi , t) ,
mẍ2 =F2 (xi , ẋi , t) , (4.4.8)
mẍ3 =F3 (xi , ẋi , t) ,
wobei die Komponenten Fi der (bekannten) Kraft, je nach Problem, von den Orts-
und/oder Geschwindigkeitskomponenten eines Objekts (der Masse m) und ggf. auch
explizit von der Zeit t abhängen.
Man muss versuchen, dieses System durch geeignete Manipulationen zu entkoppeln,
d.h. in DGL überzuführen, die jeweils nur noch von einer der drei unbekannten
Funktionen xi (t) und ihren Ableitungen abhängen. Wir werden bei den Problemen,
die wir im Mechanik-Teil der Vorlesung behandeln, durch geeignete Addition, Sub-
traktion, etc. der Gleichungen die resultierenden entkoppelten DGL lösen. Durch
Vorgabe von 3 × 2 = 6 Anfangsbedingungen xi (t0 ) und ẋi (t0 ), i = 1, 2, 3, wird dann

die Lösung des jeweiligen Problems eindeutig festgelegt.
Wenn die Kraftkomponenten Fi linear von den xi und ẋi abhängen, handelt es
sich bei (4.4.8) um ein lineares System von drei gewöhnlichen DGL 2. Ordnung.
Wenn in (4.4.8) keine Koeffizientenfunktionen aj (xi ), sondern nur konstante Koef-
fizienten aj auftreten, kann man unter Zuhilfenahme von Methoden der Linearen
Algebra Formeln für die allgemeine Lösung von (4.4.8) herleiten. Wir werden in die-
ser Vorlesung nicht darauf eingehen (abgesehen von einem kurzen Hinweis am Ende
von Kapitel 6); wir benötigen diese Formeln i.F. auch nicht.
Sie sollten sich aber Folgendes merken: Auch für ein System von linearen inhomo-
genen DGL (wobei die Koeffizienten nicht konstant sein müssen) gilt:
Die allgemeine Lösung des inhomogenen Systems =

allgemeine Lösung des homogenen Systems
+ eine spezielle Lösung des inhomogenen Systems.
Auch hier ist wieder zu beachten, dass die Anfangswerte (bzw. die Randwerte) nicht
der allgemeinen Lösung des homogenen Systems, sondern der allgemeinen Lösung
des inhomogenen Systems aufgeprägt werden müssen!
Kapitel 5
Vektorrechnung
Meßgrößen (Observable) der Physik können hinsichtlich ihrer vollständigen Fest-

legung in verschiedene Klassen eingeteilt werden. Zur Festlegung der Masse eines
Körpers oder der Temperatur eines physikalischen Systems genügt eine Zahl (bezo-
gen auf ein gewähltes Maßsystem); man nennt eine solche Observable einen Skalar.
Zur Festlegung der Geschwindigkeit eines Körpers oder einer Kraft bedarf es ne-
ben der Angabe der Stärke, d.h. des Betrags der jeweiligen Meßgröße noch einer
Richtungsangabe. Eine solche Observable nennt man einen Vektor. (Es gibt auch
Meßgrößen, zu deren Festlegung die Angabe einer Zahl und einer Richtung nicht
ausreicht; das sind sog. Tensoren 2. oder höherer Stufe. Wir gehen aber auf solche
Observablen nur am Rande in Kapitel 6 ein.)
Wir besprechen zunächst die in der nichtrelativistischen Physik üblichen, an-

schaulichen Definitionen eines Skalars und eines Vektors, geben einige Beispiele,
behandeln dann elementare algebraische Operationen mit Vektoren und die Darstel-
lung eines Vektors durch seine Komponenten bezüglich eines Koordinatensystems.
Danach besprechen wir, auf welche Weise man Vektoren miteinander multiplizieren
kann. Vieles davon werden Sie bereits aus der Schule kennen. Zum Schluss dieses
Kapitels behandeln wir vektorwertige Funktionen einer reellen Variablen; insbeson-
dere wie man solche Funktionen differenziert und integriert. Die für uns wichtigsten
vektorwertigen Funktionen sind der Ortsvektor eines Massenpunktes, der die Bahn
des Massenpunktes im Raum beschreibt, seine Geschwindigkeit und seine Beschleu-
nigung. Diese Vektoren betrachtet man in der Regel als Funktionen der Zeit.
Im Laufe dieser Vorlesung und in der Vorlesung Theoretische Physik I wird präzi-
siert, wie die Begriffe Skalar und Vektor in der nichtrelativistischen und in der rela-
tivistischen Physik definiert und benutzt werden. Die folgenden Beispiele beziehen
sich auf die nichtrelativistische Physik, insbesondere auf die nichtrelativistische Me-
chanik.
5.1 Skalare und Vektoren 95
5.1 Skalare und Vektoren

Im Folgenden benutzen wir elementare Konzepte der euklidischen Geometrie, wie
Gerade, Parallele, Winkel, usw.
Skalare
Anschauliche Definition: Ein Skalar ist eine Größe, die durch Angabe einer
einzigen Zahl – bezogen auf die jeweilige Maßeinheit der physikalischen Größe –
gekennzeichnet ist. Diese Zahl darf nicht von Bezugssystem1 abhängen, in dem man
die Größe misst.
Beispiele:
• Zahl der Atome in einem Stück Materie,
• Masse m eines Körpers,
• Temperatur T eines physikalischen Systems,
• Zeit t bzw. Zeitdauer eines Vorgangs,
• Abstand zweier Körper2 .
Vektoren:
Anschauliche Definition: Ein Vektor ist – in der nichtrelativistischen Physik –
eine Größe, die gekennzeichnet ist durch eine nichtnegative Zahl – das ist der Betrag
der Größe in der jeweiligen Maßeinheit – und durch eine Richtung 3 im Raum.
Beispiele aus der nichtrelativistischen Physik:

• Geschwindigkeit,
• Beschleunigung,
• Kraft,
• elektrische Feldstärke,
1
Ein Bezugssystem ist ein Koordinatensystem versehen mit Uhren, in dem physikalische Pro-
zesse untersucht werden. Von grundlegender Bedeutung sind sog. Inertialsysteme – siehe den
Mechanik-Teil der Vorlesung. In diesen Systemen nehmen die Grundgesetze der Physik eine einfa-
che Form an.
2
Die Zeit und der räumliche Abstand zweier Punkte sind nur in der nichtrelativistischen Physik
skalare Größen – nicht aber in der relativistischen Physik.
3
In der Regel beziehen wir uns auf den dreidimensionalen Raum, in dem sich das physikalische
Geschehen abspielt. Der Begriff des Vektors lässt sich aber problemlos auf einen n-dimensionalen
Raum (n = 1, 2, 3, 4, ...) verallgemeinern bzw. noch abstrakter fassen (siehe unten).
• magnetische Feldstärke.
Vektoren stellt man graphisch durch Pfeile dar, z.B. durch die gerichtete gerad-
linige Verbindung zwischen zwei Punkten.
Q1
~a
P1 −−−→
a = P1 Q 1
−−−→
P2 b = P2 Q 2
~b Q2
Die Länge eines Pfeils entspricht dem Betrag des Vektors.
Notation: Um Vektoren nicht mit skalaren Größen zu verwechseln, benutzt man in

der Physik-Literatur in der Regel die Pfeilnotation −
→
a oder, wie in diesem Skriptum,
Fettbuchstaben: Vektor a mit Betrag |a| ≡ a.
Beispiele:
• Geschwindigkeit v mit Betrag |v|, z. B. |v| = 100 m/s,
• Kraft F mit Betrag |F |, z. B. |F | = 7, 1 N,
• Elektrische Feldstärke E mit Betrag |E|, z. B. |E| = 12 V/m.
Freie und gebundene Vektoren: Die obige Definition besagt, dass ein Vektor
−−→
P Q nicht davon abhängt, wo der Punkt P , von dem der Vektor ausgeht, im Raum
liegt. Die geometrische Interpretation eines Vektors4 ist die einer Parallelverschie-
bung, der jeden Punkt P im Raum in eine feste Richtung um eine feste Strecke
−−−→ −−−→
verschiebt. Zwei Vektoren, d.h. zwei Verschiebepfeile P1 Q1 , P2 Q2 sind gleich, wenn
sie gleichsinnig parallel sind und die gleiche Länge, d.h. den gleichen Betrag haben.
In der Physik- und Ingenieur-Literatur bezeichnet man Bezugspunkt-unabhängige
Vektoren als freie Vektoren. Als Beispiel sei die Geschwindigkeit genannt. Wenn ein
Pkw in Aachen und ein anderer in Köln jeweils mit 100 km/h strikt nach Westen
fahren, ordnen wir beiden Fahrzeugen den gleichen Geschwindigkeitsvektor v zu.
Analog gilt das z.B. auch für die Beschleunigung oder für eine von Ort unabhängige
Kraft. Die Operationen mit Vektoren, die im nächsten Abschnitt besprochen werden,
gelten für freie Vektoren.
Im Gegenssatz dazu ist ein sog. gebundener Vektor, wie z.B. der Ortsvektor eines
Massenpunktes, an einen Bezugspunkt gebunden, von dem er ausgeht. Wir kommen
in Abschnitt 5.3 auf den Ortsvektor zurück.
4
Wir reden hier von konstanten, nicht von ortsabhängigen Vektoren.
5.2 Elementare Operationen, Vektorräume 97
~b ~a
~a + ~b
~a + ~b
~a ~b
Abbildung 5.1: Die Addition zweier Vektoren a und b ist kommutativ.
5.2 Elementare Operationen, Vektorräume

Addition von Vektoren:
Die Addition zweier Vektoren ist in Abbildung 5.1 dargestellt. Offensichtlich gilt:
a1) Die Addition ist kommutativ: a + b = b + a.
a2) Die Addition ist assoziativ: (a + b) + c = a + (b + c).
a3) Es gibt einen Nullvektor 0, d.h. |0| = 0, Angriffs- und Zielpunkt fallen beim
Nullvektor zusammen. Es gilt a + 0 = a.
a4) Zu jedem Vektor a gibt es einen Vektor −a (mit gleicher Länge wie a, aber
entgegengesetzter Richtung), so dass a − a = 0.
Multiplikation eines Vektors a mit einer reellen Zahl λ ∈ R

Offensichtlich gilt wegen der obigen Regeln zur Vektoraddition folgendes:
ist ein Vektor mit gleicher Richtung wie a,
a+a
aber doppelter Länge,
ist ein Vektor mit gleicher Richtung wie a,

a
| +a+
{z ... + a} aber n-facher Länge.
n-mal
Das legt folgende Definition nahe: Multipliziert man einen Vektor a mit einer reellen
Zahl λ, so ist das Ergebnis der Vektor λa. Dieser Vektor hat die gleiche Richtung
wie a (er ist parallel zu a), wenn λ > 0, bzw. die zu a entgegengesetzte Richtung
(er ist antiparallel zu a), wenn λ < 0. Für seine Länge (Betrag) gilt:
|λa| = |λ||a|.
Aus dieser Definition ergeben sich sofort folgende Regeln für die Multiplikation von
Vektoren mit reellen Zahlen λ, α ∈ R:
m1) 1 · a = a.
m2) α(λa) = (αλ)a.
m3) λ(a + b) = λa + λb.
m4) (α + λ)a = αa + λa.
Die Menge der Vektoren in drei Raumdimensionen, für die die Additionsregeln
a1) – a4) und die Multiplikationsregeln m1) – m4) mit reellen Zahlen gelten, bil-
den einen sogenannten Vektorraum; präziser, einen dreidimensionalen Vektorraum
V3 über dem sogenannten Körper der reellen Zahlen R. Die Dimension eines Vek-
torraums wird unten im Abschnitt über lineare Unabhängigkeit definiert.
In der Physik ist es nützlich, Vektoren auch in ein, zwei oder allgemein in d Raumdi-
mensionen zu betrachten. Diese Vektoren bilden einen d-dimensionalen Vektorraum
Vd .
Notation: Vd = Rd = R × R × . . . × R.
Diese Notation bringt zum Ausdruck, dass die Menge der Verschiebepfeile im d-
dimensionalen ,,Anschauungsraum” isomorph5 zum ,,d-fachen Produkt der reellen
Zahlenmenge” ist. Das wird in Abschnitt 5.3 erläutert.
Hinweise:
1. In der Mathematik wird der Begriff eines Vektors bzw. eines Vektorraums ab-
strakter gefasst. Man bezeichnet eine Menge V von Objekten, in der die Additi-
onsregeln a1) – a4) und die Multiplikationsregeln m1) – m4) gelten (mit reellen
Zahlen, oder mit komplexen Zahlen, oder allgemeiner mit Objekten aus einem
Körper K), als Vektorraum. So bildet z.B. die Menge {f (x)} der auf dem In-
tervall [a, b] integrierbaren reellen Funktionen einen (unendlich-dimensionalen)
Vektorraum. Die Addition f + g zweier Vektoren f und g und die Multipli-
kation mit reellen Zahlen α, β ist durch αf (x) + βg(x) definiert. Vektorräume
dieser Art werden Ihnen auch in den Vorlesungen über Theoretische Physik in
den höheren Semestern begegnen.
2. Wenden wir die Multiplikationsregeln m1)– m4) auf die oben eingeführten
Begriffe Skalar und Vektor an, so besagen diese Regeln, dass
Skalar · Vektor → Vektor.
In der Physik werden Vektoren – die im Allgemeinen dimensionsbehaftet sind –

nicht nur mit dimensionslosen Zahlen, sondern auch mit dimensionsbehafteten
Skalaren multipliziert. Das Ergebnis ist zwar wieder ein Vektor, hat aber eine
5
Isomorph bedeutet strukturgleich. Zwei Räume bezeichnet man als isomorph, wenn man ihre
Elemente umkehrbar eindeutig aufeinander abbilden kann und die Rechenregeln in beiden Räumen
übereinstimmen.
5.2 Elementare Operationen, Vektorräume 99
andere physikalische Dimension.

Beispiel:
m a = F.
↑ ↑ ↑
Masse Beschleunigung Kraft
Skalar Vektor Vektor
3. Die Additionsgesetze a1) – a4) machen natürlich nur für Vektoren mit dersel-
ben physikalischen Dimension Sinn.
Lineare Unabhängigkeit
Wir betrachten den Vektorraum Vd = Rd . Eine Anzahl von n Vektoren g 1 , ..., g n
heißt linear unabhängig, wenn die Gleichung
λ1 g 1 + λ2 g 2 + ... + λn g n = 0
nur dann gilt, wenn alle Koeffizienten λi = 0 sind. Falls es mindestens eine reelle
Zahl λj 6= 0 gibt, so dass diese Gleichung gilt, heissen die Vektoren g 1 , ..., g n linear
abhängig.
Beispiele:
1. V1 = R. Hier gibt es nur einen linear unabhängigen Vektor, wir nennen ihn g.
Alle anderen Vektoren sind Vielfache von g:
b = λg λ ∈ R.
M.a.W.: In V1 = R sind zwei oder mehr Vektoren immer linear abhängig.
2. V2 = R2 . Hier gibt es maximal zwei linear unabhängige Vektoren.
~g1
Beispiel: ~g 2
Jeder weitere Vektor in der Ebene kann als Linearkombination von g 1 und g 2
dargestellt werden:
b = λ1 g 1 + λ2 g 2 .
M.a.W.: In V2 = R2 sind drei oder mehr Vektoren immer linear abhängig.
3. Vd = Rd . Hier gibt es maximal d linear unabhängige Vektoren.
Definition: Als Basis in Vd = Rd bezeichnet man einen Satz g 1 , g 2 , ..., g d

von d linear unabhängigen Vektoren. Die Dimension d eines Vektorraums ist
gleich der Maximalzahl der linear unabhängigen Vektoren. Jeder Vektor b ∈ Vd
kann als Linearkombination der d Basisvektoren dargestellt werden:
b = b1 g 1 + b2 g 2 + ... + bd g d , bi ∈ R. (5.2.1)
5.3 Bezugssysteme
Die Gleichung (5.2.1) besagt, dass jeder Vektor b ∈ V = Rn eindeutig durch den
Satz von Zahlen
b1 , ..., bd ←→ b (5.3.1)
bezüglich der gewählten Basis g 1 , ..., g d festgelegt ist. Die Zahlen (5.3.1) heißen Kom-
ponenten oder Koordinaten des Vektors b bezüglich der Basis {g i }. Der Einfachheit
halber wählt man in der Regel sogenannte Orthonormalbasen. Das sind d Einheits-
vektoren, die alle senkrecht6 aufeinander stehen:
e1 , e2 , ..., ed
(5.3.2)
mit |ei | = 1 ∀i = 1, ..., n und ei ⊥ ej ∀i 6= j.
Im Folgenden betrachten wir den dreidimensionalen Raum V = R3 , gelegentlich

auch den zweidimensionalen Raum R2 . Eine Orthonormalbasis (ONB)
{e1 , e2 , e3 } , (5.3.3)
also eine Basis mit der Eigenschaft (5.3.2), definiert ein sog. kartesisches Koordi-
natensystem im R3 .
1. Man wählt einen beliebigen Punkt O im Raum, bei dem die Pfeile e1 , e2 , e3
der Länge Eins beginnen. Den Punkt O nennt man Nullpunkt oder Koordi-
natenursprung. Die Winkel ∠(ei , ej ) sind jeweils 90◦ . Die Verlängerung der
Pfeile ergeben die Koordinatenachsen, die mit Maßzahlen versehen werden.
2. Für die ONB (5.3.3) sind zwei Orientierungen möglich, siehe Abbildung 5.2.
Rechts- und linkshändige ONB können nicht durch Drehungen ineinander
übergeführt werden.
∧ ∧ ∧
e1 = positive x- e2 = positive y- e3 = positive z-
Achse Achse Achse
∧ ∧ ∧
rechtshändig ori- = Daumen der = Zeigefinger der = Mittelfinger der
entiertes System rechten Hand rechten Hand rechten Hand
∧ ∧ ∧
linkshändig orien- = Daumen der lin- = Zeigefinger der = Mittelfinger der
tiertes System ken Hand linken Hand linken Hand
Wir wählen in der Regel ein rechtshändig orientiertes System = Rechtssystem.
6
Man muss im Allgemeinen zunächst im jeweiligen Vektorraum das Skalarprodukt zweier Vek-
toren definieren. Mit einem Skalarprodukt kann man festlegen, was Orthogonalität zweier Vektoren
bedeuten soll. Im euklidischen Rd können wir allerdings auf geometrische Weise zueinander senk-
rechte Vektoren konstruieren.
5.3 Bezugssysteme 101
z z
y
y
~e3 ~e3
~e2 ~e2
~e1 x x ~e1
(a) Rechtshändig orientiertes Koordi- (b) Linkshändig orientiertes Koordi-

natensystem. natensystem.
Abbildung 5.2: Die beiden möglichen Orientierungen einer 3-dim. Orthonormal-

basis. Rechts- und linkshändige ONB können nicht durch Drehungen ineinander
übergeführt werden.
Hinweis: Bei der Konstruktion eines Bezugssystems, insbesondere eines kartesi-

schen Systems, bleiben offensichtlich folgende Eigenschaften unbestimmt, d.h. sind
frei wählbar: i) Die Lage des Ursprungs im Raum und ii) die Lage des orthogo-
nalen ,,Dreibeins” e1 , e2 , e3 im Raum. Es bedürfte eines weiteren Bezugssystems,
um diese Eigenschaften festzulegen. Dieses Bezugssystem hätte aber wiederum die
genannten Freiheiten. Mit anderen Worten, ein Koordinatensystem ist frei in Bezug
auf i) Verschiebungen (Translationen) und ii) Drehungen im Raum.
Koordinatendarstellung von Vektoren:

Jeder Vektor a im Raum hat bezüglich einer vorgegebenen ONB (5.3.3) die eindeu-
tige Zerlegung
a = a1 e1 + a2 e2 + a3 e3 , (5.3.4)
Algebraisch sollte diese Gleichung aufgrund von (5.2.1) klar sein. Geometrisch in-
terpretiert bedeutet (5.3.4) folgendes. Wenn a ein freier Vektor, also frei im Raum
parallel-verschiebbar ist, kann man seinen Anfangspunkt in den Ursprung O des
Koordinatensystems legen, siehe Abbildung 5.3. Wenn a ein Ortsvektor ist, ist O
per Definition sein Anfangspunkt.
Deshalb bietet sich die folgende Darstellung von a an:
 
a1
a =  a2  ≡ a . (5.3.5)
a3
Dies ist Darstellung von a in kartesischen Koordinaten. Sie kennen sie vermutlich
aus der Schule.
~a
a3
a1
x a2
y
Abbildung 5.3: Bezüglich einer vorgegebenen ONB (5.3.3) hat ein Vektor die ein-
deutige Zerlegung (5.3.4).
Auf diese Weise werden die obigen geometrischen Überlegungen auf algebraische
Betrachtungen und somit auf das Rechnen mit reellen Zahlen zurückgeführt. Die
Rechenregeln a1) – a4) und m1) – m4) lassen sich sofort auf (5.3.5) übertragen.
Seien a, b ∈ V3 = R3 und α, β ∈ R, dann
       
c1 a1 b1 αa1 + βb1
c = αa + βb ⇔  c2  = α  a2  + β  b2  =  αa2 + βb2  . (5.3.6)
c3 a3 b3 αa3 + βb3
Völlig analog stellt man Vektoren aus Vd = Rd dar und rechnet mit ihnen. Das
Symbol Rd sollte nun klar sein. Es bezeichnet die Menge der d-komponentigen reellen
Spaltenvektoren.
Schreibweise: Einige Bemerkungen zur Notation in (5.3.5). Man sollte verinnerli-

chen, dass Vektoren basisunabhängige Objekte sind – dieser Sachverhalt wird durch
das Symbol a zum Ausdruck gebracht. Das Symbol a bzw. das dreikomponentige
Objekt in der Mitte von (5.3.5) zeigt an, dass es sich um die Darstellung von a
bezüglich einer Basis handelt. Um Platz zu sparen, schreibt man den dreikompo-
nentigen Spaltenvektor gelegentlich auch als Zeilenvektor (a1 , a2 , a3 ).
Genaugenommen sollte man immer durch entsprechende Symbole zwischen einem
Vektor und seiner Darstellung bezüglich einer Basis unterscheiden; wir werden das
auch im Folgenden oft, aber nicht immer tun. In der Regel wird in der Literatur für
beide Fälle nur das Symbol a bzw. −→
a benutzt, um die Notation nicht zu überladen
– man erkennt aus dem Kontext, welcher Fall gemeint ist.
Die Grundgesetze der Physik, z.B. das Newtonsche Bewegungsgesetz, gelten in-
nerhalb einer Klasse von Bezugssystemen, den sogenannten Inertialsystemen, un-
abhängig von der Wahl des speziellen Systems (siehe den obigen Hinweis). Deswegen
5.4 Skalarprodukt, Vektorprodukt, Mehrfachprodukte von Vektoren 103
formuliert man diese Grundgesetze in der Regel basisunabhängig – d.h. mit Vekto-
ren unabhängig von ihrer Koordinatendarstellung bezüglich einer bestimmten Basis.
Zum Beispiel lautet das Newtonsche Bewegungsgesetz in Bezugssystem-unabhängi-
ger Vektordarstellung:
d2
m 2 x(t) = F . (5.3.7)
dt
Dieses Gesetz gilt in jedem Inertialsystem (dies wird im Mechanik-Teil behandelt).
Für konkrete Rechnungen ist es aber meistens notwendig, ein geeignetes Koordina-
tensystem (KS) zu wählen. Wählt man ein kartesisches KS mit der ONB (5.3.2),
dann ist
3
X X3
x(t) = xi (t)ei , F = Fi ei ,
i=1 i=1
und die Bewegungsgleichung (5.3.7) nimmt bezüglich des gewählten KS die Form
d2
m x(t) = F
dt2
an.
5.4 Skalarprodukt, Vektorprodukt, Mehrfachpro-

dukte von Vektoren
In diesem Abschnitt behandeln wir, auf welche Weise man Vektoren miteinander
multiplizieren kann. Das unten eingeführte Skalarprodukt zweier Vektoren ist so
definiert, dass die Längen- und Winkelmessung der euklidischen Geometrie auf al-
gebraische Rechenoperationen im R3 bzw. Rd übertragen werden. Auch das u.a.
Vektorprodukt hat eine geometrische Bedeutung.
Wir besprechen die basisunabhängigen Definitionen der jeweiligen Produkte und
ihre Darstellung durch die Vektorkomponenten bezüglich der rechtshändigen ONB
{e1 , e2 , e3 } aus Abbildung 5.2(a).
5.4.1 Skalarprodukt zweier Vektoren a, b

Das Skalarprodukt zweier Vektoren a, b – auch inneres Produkt genannt – ordnet
den beiden Vektoren eine reelle Zahl zu. Seine basisunabhängige Definition ist:
~b
φab a · b = |a| |b| cos φab , (5.4.1)
~a
wobei 0 ≤ φab ≤ π der Winkel zwischen den Vektoren a und b ist. Weil cos φab =
cos(2π − φab ), spielt es keine Rolle, welchen der beiden Winkel zwischen a und b
man nimmt.
Wenn der in der Abbildung gezeigte Winkel
φab spitz ⇒ a · b > 0,
φab stumpf ⇒ a · b < 0,
π
φab = d.h. a ⊥ b ⇒ a · b = 0.
2
Beispiel aus der Physik: Die mechanische Arbeit A, die an einem Körper bei Bewe-
gung um eine kleine Strecke ∆r = r 2 −r 1 gegen eine Kraft F bzw. unter Einwirkung
einer Kraft verrichtet werden muss, ist A = F · ∆r.
Das Skalarprodukt ist
kommutativ a · b = b · a (5.4.2)
und
distributiv (a + b) · c = a · c + b · c. (5.4.3)
Die Eigenschaft (5.4.2) ist offensichtlich. Den Beweis der Eigenschaft (5.4.3) finden
Sie z.B. im zitierten Buch von S. Großmann.
Da φab = 0 zur Folge hat, dass a · a = |a||a| cos 0 = |a||a|, kann man die Länge
eines Vektors a mit Hilfe des Skalarproduktes ausdrücken.
√
|a| = a · a. (5.4.4)
Das Skalarprodukt erfüllt die Schwarzsche Ungleichung
|a · b| ≤ |a||b| , (5.4.5)
die sich in einer Vielzahl von Anwendungen als nützlich erweist. Diese Ungleichung
folgt sofort aus der Definition (5.4.1) und | cos φab | ≤ 1.
Komponentendarstellung des Skalarprodukts

Nun zu unserer ONB {e1 , e2 , e3 } mit der Eigenschaft (5.3.2). Diese Eigenschaften
implizieren, dass
e1 · e1 = e2 · e2 = e3 · e3 = 1
(5.4.6)
und ei · ej = 0 für i 6= j.
Gleichung (5.4.6) lässt sich kompakt mit Hilfe des sogenannten Kronecker-Symbols
δij ausdrücken, das wie folgt definiert ist:
(
1 für i = j
δij ≡ ei · ej = (5.4.7)
0 für i 6= j.
Aus (5.4.6) folgt, dass das Skalarprodukt zweier Vektoren a und b durch ihre Kom-
ponenten bezüglich dieser Basis gegeben ist durch
a · b = (a1 e1 + a2 e2 + a3 e3 ) · (b1 e1 + b2 e2 + b3 e3 )
(5.4.7) (5.4.8)
= a1 b1 + a2 b2 + a3 b3 .
~b
φ̃ab
~a
nicht dieser Winkel

für das Vektorprodukt
Abbildung 5.4: Der Winkel φ̃ab in der Definition (5.4.10) ist der kleinere der beiden
Winkel zwischen a und b.
In der Komponentendarstellung von a und b schreibt man

   
a1 b1
 a2  ·  b2  = a1 b1 + a2 b2 + a3 b3 .
a3 b3
Die Länge, also der Betrag eines Vektors a folgt aus (5.4.8):
√ q
a ≡ |a| = a · a = a21 + a22 + a23 . (5.4.9)
Dieses Ergebnis erhält man auch aus Abbildung 5.3 durch zweimalige Anwendung
des Satzes von Pythagoras.
Hinweis: Man nennt den Vektorraum Rd versehen mit dem Skalarprodukt (5.4.1)
einen d-dimensionalen euklidischen Raum. Der Grund für diese Namensgebung
sollte klar sein – in diesem Raum werden die Regeln der euklidische Geometrie auf
algebraische Rechenoperationen zurückgeführt.
5.4.2 Vektorprodukt zweier Vektoren a, b

Das Vektorprodukt a × b – auch äußeres Produkt genannt – ordnet den beiden
Vektoren a und b einen Vektor zu, der folgendermaßen definiert ist:
a × b = n|a||b| sin φ̃ab ,

wobei n ein Einheitsvektor ist, |n| = 1, mit n ⊥ a und n ⊥ b.
Die Richtung von n muss so gewählt werden, dass a, b, n in dieser
Reihenfolge rechtshändig orientiert sind – siehe Abbildung 5.2(a). (5.4.10)
Der Winkel φ̃ab bezeichnet den kleineren der beiden Win-
kel7 zwischen a und b. Somit 0 ≤ φ̃ab ≤ π, d.h. sin φ̃ab ≥ 0, siehe
Abbildung 5.4.
Merkregel: Wenn der Daumen der rechten Hand in Richtung von a zeigt und der
Zeigefinger der rechten Hand, den Handrücken verlängernd ausgestreckt, in Richtung
von b zeigt, dann zeigt der senkrecht dazu von der Handinnenfläche weg ausgestreck-
te Mittelfinger der rechten Hand in Richtung von n, also in die Richtung von a × b.
~b
|~b| sin φ̃ab
φ̃ab
~a
Abbildung 5.5: Das von a und b aufgespannte Parallelogramm hat die Fläche F =
ab sin φ̃ab = |a × b|.
Aus der Definition (5.4.10) folgt, dass das Vektorprodukt zweier paralleler oder
antiparalleler Vektoren null ist.
a (anti)parallel zu b ⇔ a × b = 0. (5.4.11)
Parallele oder antiparallele Vektoren bezeichnet man als kollineare Vektoren.
Weitere Eigenschaften:
a×b=− b×a (5.4.12)

(λ1 a) × (λ2 b) = λ1 λ2 a × b λ1 , λ2 ∈ R. (5.4.13)
Die Relationen (5.4.12) und (5.4.13) folgen unmittelbar aus der Definition (5.4.10).
Gl. (5.4.12) besagt, dass das Vektorprodukt nicht kommutativ ist – wegen des
Minuszeichens in (5.4.12) bezeichnet man das Vektorprodukt als antikommutativ.
Das Vektorprodukt ist jedoch distributiv; denn es gilt
a × (b + c) = a × b + a × c. (5.4.14)
Diese Relation kann man z.B. mit der Komponentendarstellung (5.4.18) des Vektor-
produkts herleiten.
Geometrische Bedeutung des Vektorprodukts:

Aus Abbildung 5.5 geht hervor, dass der Betrag des Vektorprodukts gleich der Fläche
des von a und b aufgespannten Parallelogramms ist.
|a × b| = |a| |b| sin φ̃ab . (5.4.15)
Komponentendarstellung des Vektorprodukts:

Dazu benötigen wir zunächst die Vektorprodukte der Basisvektoren. Aus der Defi-
nition (5.3.2) der rechtshändigen Basis {e1 , e2 , e3 } und der Definition des Vektor-
1 1
3 2 3 2
(1, 2, 3); (2, 3, 1); (3, 1, 2) (1, 3, 2); (3, 2, 1); (2, 1, 3)
(a) Zyklische Vertauschungen (b) Antizyklische Vertau-
von (1, 2, 3). schungen von (1, 2, 3).
Abbildung 5.6: (Anti-)zyklische Vertauschungen.
produkts (5.4.10) folgt, dass

e1 × e1 = e2 × e2 = e3 × e3 = 0,
e1 × e2 = −e2 × e1 = e3 ,
(5.4.16)
e2 × e3 = −e3 × e2 = e1 ,
e3 × e1 = −e1 × e3 = e2 .
Die Relationen (5.4.16) können folgendermaßen zusammengefasst werden:

ei × ej = ek ,
wobei (i, j, k) = (1, 2, 3) oder eine zyklische Vertauschung dieser (5.4.17)
drei Zahlen ist, siehe Abbildung 5.6.
Mit Hilfe von (5.4.16) bzw. (5.4.17) können wir das Vektorprodukt zweier Vektoren
in der Komponentendarstellung berechnen:
a × b = (a1 e1 + a2 e2 + a3 e3 ) × (b1 e1 + b2 e2 + b3 e3 )
= (a1 b2 − a2 b1 )(e1 × e2 ) + (a1 b3 − a3 b1 )(e1 × e3 ) + (a2 b3 − a3 b2 )(e2 × e3 )
= (a2 b3 − a3 b2 )e1 + (a3 b1 − a1 b3 )e2 + (a1 b2 − a2 b1 )e3 .
(5.4.18)
Anwendungen in der Physik:

In der Mechanik wird das Vektorprodukt beispielsweise zur Definition der Mess-
größen Drehimpuls und Drehmoment benötigt. Auf ein Teilchen der Masse m wirke
am Ort r eine Kraft F . Der Impuls des Teilchens ist p = mv, wobei v die Geschwin-
digkeit des Teilchens ist. Dann sind der Drehimpuls L des Teilchens und das auf das
Teilchen wirkende Drehmoment N gegeben durch8
L = r × p, N =r×F .
8
Für den Drehimpuls eines Körpers gilt die Bewegungsgleichung dL/dt = N , die aus der New-
tonschen Bewegungsgleichung folgt – siehe den Mechanik-Teil der Vorlesung.
~c
Volumen
F ·h
h = ~n · ~c
~b
~n k ~a × ~b F = |~a × ~b|
φ̃ab
~a
Abbildung 5.7: Spatprodukt V (a, b, c) ≡ (a × b) · c. |V | = |a × b| n · c = F · h ist

das Volumen des Parallelepipeds.
Der Drehimpuls und das Drehmoment sind wie der Ortsvektor vom Bezugspunkt O
des Koordinatensystems – aber nicht von der Orientierung seiner Achsen – abhängig,
sind also weitere Beispiele für gebundene Vektoren.
5.4.3 Mehrfachprodukte von Vektoren

Seien a, b, c drei Vektoren.
1. (a · b)c ist ein Vektor in Richtung ±c. Beachte, dass
(a · b)c 6= a(b · c) ;
denn die rechte Seite ist ein Vektor in Richtung ±a.
2. Spatprodukt: Dies ist eine Zahl – d.h. ein Skalar – definiert durch
V (a, b, c) ≡ (a × b) · c. (5.4.19)
Geometrische Bedeutung des Spatprodukts: Sein Betrag |V | ist das Volumen

des durch a, b, c aufgespannten Körpers; das ist ein sogenanntes Parallelepi-
ped, siehe Abbildung 5.7.
Eigenschaften des Spatproduktes:
(a × b) · c = c · (a × b) (5.4.20)
(a × b) · c = 0 ⇔ a, b, c liegen in einer Ebene (5.4.21)
(a × b) · c = (c × a) · b = (b × c) · a. (5.4.22)
Die Relation (5.4.20) folgt aus der Kommutativität des Skalarprodukts. Gl. (5.4.21)
folgt aus der Definition des Vektor- und des Skalarprodukts. Gl. (5.4.22) be-
weisen wir in einer Übungsaufgabe; am bequemsten mit Hilfe des in (5.4.26)
definierten -Symbols.
3. Dreifaches Vektorprodukt a × (b × c). Dies ist ein Vektor, und zwar gilt
a × (b × c) = b(a · c) − c(a · b). (5.4.23)
Merkregel: “bac minus cab”. Die Relation (5.4.23) beweisen wir auf Sei-
te 110. Beachten Sie, dass hier das Assoziativgesetz nicht gilt!
(a × b) × c 6= a × (b × c). (5.4.24)
Der Vektor in (5.4.23) liegt in der von b und c aufgespannten Ebene, während
(5.4.23)
(a × b) × c = −c × (a × b) = −a(c · b) + b(c · a) (5.4.25)
ein Vektor in der von a und b aufgespannten Ebene ist.
5.4.4 Definition und Eigenschaften des -Tensors

Die Eigenschaft (5.4.17) der rechtshändigen ONB {e1 , e2 , e3 } können wir auch fol-
gendermaßen darstellen: Wir definieren das Spatprodukt

 +1 wenn i, j, k = 1, 2, 3 und zyklisch,

ijk ≡ ei · (ej × ek ) = −1 wenn i, j, k = 2, 1, 3 und zyklisch, (5.4.26)

 0 sonst.
Das Symbol ijk heißt total antisymmetrischer -Tensor9 , oder total antisymmetri-
sches -Symbol oder Levi-Civita-Symbol. Es handelt sich um ein Objekt bestehend
aus 3 · 3 · 3 = 27 Zahlen. Aus der Definition folgt, dass
123 = 312 = 231 = +1,
(5.4.27)
213 = 321 = 132 = −1,
und dass der Wert des Symbols null ist, wenn mindestens zwei Indizes gleich sind:
iik = iji = ijj = 0. (5.4.28)
Gl. (5.4.27) und (5.4.28) besagen, dass
ijk = kij = jki , (5.4.29)
und dass ijk antisymmetrisch unter Vertauschung zweier benachbarter Indizes ist:
ijk = −jik , ijk = −ikj , etc. (5.4.30)
Es gilt folgende für Anwendungen wichtige Formel:

3
X
kij klm = δil δjm − δim δjl . (5.4.31)
k=1
9
In Kapitel 6 wird erklärt, warum man dieses Objekt als Tensor bezeichnet.
Man beweist diese Formel z.B. durch explizites Einsetzen der Werte des -Symbols
und Verwendung seiner Antisymmetrieeigenschaften.
Anwendungen:
1) Zunächst stellen wir fest, dass wir die Relationen (5.4.16) mit dem -Symbol
folgendermaßen kompakt darstellen können:
ei × ej = ijk ek , i, j, k = 1, 2, 3 . (5.4.32)
2) Als nächstes betrachten wir das Vektorprodukt b × c, das mit (5.4.32) die Form
3
X 3
X
b×c= bi cj ei × ej = ijk bi cj ek (5.4.33)
i,j=1 i,j,k=1
annimmt.
3) Mit (5.4.33), (5.4.32) und (5.4.31) beweisen wir nun die Relation (5.4.23).
3
! 3
!
X X
a × (b × c) = al el × ijk bi cj ek
l=1 i,j,k=1
3 3
X (5.4.31) X
= al bi cj ijk lkm em = − al bi cj em (δil δjm − δim δjl )
|{z}
i,j,k,l,m=1 −lmk i,j,l,m=1
3
X
=− (ai bi cj ej − aj cj bi ei ) = b(a · c) − c(a · b) .
i,j
Natürlich kann man diese Relation auch auf Fußgängerart herleiten, soll heißen durch
zweimalige Anwendung von (5.4.18) unter Verwendung von (5.4.16).
5.5 Vektorwertige Funktionen, Raumkurven

Die Bahn eines Massenpunktes beschreibt man analytisch durch seinen Ortsvek-
tor r. In der Physik interessieren wir uns typischerweise dafür, wie ein Massen-
punkt/Körper seine Bahn im Laufe der Zeit t durchläuft. Dies wird durch die Kennt-
nis des Ortsvektors als Funktion der Zeit geliefert, r = r(t). In geometrischer Termi-
nologie handelt es sich dabei um eine Kurve im Raum. M.a.W: Eine Raumkurve ist
analytisch beschreibbar durch eine vektorwertige Funktion einer reellen Variablen.
Definition: Eine vektorwertige Funktion einer reellen Variablen t im d-dimensionalen

Raum ist eine Abbildung
t∈I⊂R 7→ d-dimensionaler Vektor f (t) ∈ W ⊂ Rd .
Hinweise:
5.5 Vektorwertige Funktionen, Raumkurven 111
x2
~r(t)
x1
0
Abbildung 5.8: Eine Bahnkurve ist eine vektorwertige Funktion r(t).
1. Der Parameter t in der obigen Definition muss nicht die Zeit sein; je nach
Zweckmäßigkeit kann eine Koordinate, ein Winkel, die Bogenlänge, usw. zur
Parametrisierung einer vektorwertigen Funktion benutzt werden – siehe unten.
2. Der Ortsvektor r = r(t) beschreibt analytisch die Bahnkurve eines Teilchens
im Ortsraum. Natürlich kann jede vektorwertige Funktion geometrisch als Kur-
ve in einem abstrakten Raum interpretiert werden. So beschreibt z.B. die Ge-
schwindigkeit v = v(t) eines Massenpunktes eine Kurve im ,,Geschwindigkeits-
raum”, eine nicht vom Ort abhängige Kraft F = F (t) eine Kurve im ,,Raum
der Kraftvektoren”, usw.
5.5.1 Parametrisierung von Bahnkurven

Im Folgenden sei f (t) = r(t) der Ortsvektor in drei Raumdimensionen10 . Die folgen-
den Überlegungen gelten analog für jede vektorwertige Funktion in d Dimensionen.
Wir wählen im R3 (allgemein im Rd ) ein kartesisches Koordinatensystem, d.h.
einen beliebigen, aber festen Koordinatenursprung O und eine kartesische ONB
{e1 , e2 , e3 }. Wie bereits betont wurde, steht dieses kartesische Dreibein beliebig aber
fest im Raum, d.h. die Einheitsvektoren ei sind nicht vom Parameter t abhängig11
Die Bahnkurve, Abbildung 5.8, d.h. die Änderung des Ortes P eines Teilchens bei
Änderung des Parameters t (typischerweise t = Zeit) ist durch den Ortsvektor r(t)
bestimmt.
r(t) = x1 (t)e1 + x2 (t)e2 + x3 (t)e3 , (5.5.1)
bzw. in Komponentendarstellung12 :
r(t) = (x1 (t), x2 (t), x3 (t)). (5.5.2)
10
Die Abbildungen dieses Abschnittes wurden der Einfachheit halber in zwei Dimensionen ge-
zeichnet.
11
In Kapitel 7 und im Mechanik-Teil der Vorlessung betrachten wir auch ortsabhängige ONB,
nämlich die Polarkoordinaten- und Zylinderkoordinatenbasen. Da der Ort eines Teilchens i.A. von
der Zeit abhängt, sind die Basisvektoren dieser ONB i.A. t-abhängig.
12
Die kartesischen Koordinanten eines Ortsvektors bezeichnen wir oft auch mit x, y, z.
x2
~r
R
φ x1
Abbildung 5.9: Kreisbahn in der x1 x2 -Ebene.
Gleichung (5.5.1) bzw. (5.5.2) beschreibt die Trajektorie (= Bahn = Raumkurve)

des Teilchens.
Bahnkurve: {r(t), ta ≤ t ≤ te }. (5.5.3)
Gleichung (5.5.1) bzw. (5.5.2) bezeichnet man als Parameterdarstellung einer Raum-
kurve; die unabhängige Variable t heißt Parameter. Das Kerngeschäft der Theore-
tischen Mechanik ist die Berechnung der durch Kräfte verursachte Bahn eines Teil-
chens als Funktion der Zeit t, z.B. mit Hilfe der Newtonschen Bewegungsgleichung.
Das ist das Grundproblem der Dynamik von Massenpunkten. Zur analytischen Be-
schreibung der Form einer Raumkurve (das ist Teil der Kinematik von Massen-
punkten), mit der wir uns hier befassen, kann man aber auch andere Parameter
verwenden – insbesondere muss man dazu keine Bewegungsgleichung lösen.
Beispiel: Kreisbahn in der x1 x2 -Ebene, Abbildung 5.9.

1. Parametrisierung durch den Winkel φ.
r(φ) = (R cos φ, R sin φ, 0) 0 ≤ φ ≤ 2π.
2. Parametrisierung durch die Koordinate x1 .

q
r(x1 ) = (x1 , ± R2 − x21 , 0) − R ≤ x1 ≤ R,
wobei das Pluszeichen für die obere, das Minuszeichen für die untere Halbebene
gilt.
3. Parametrisierung durch die Koordinate x2 .
q
r(x2 ) = (± R2 − x22 , x2 , 0) − R ≤ x2 ≤ R,
wobei eine Bemerkung analog zu 2) zu beachten ist.

5.5.2 Differentiation und Integration vektorwertiger Funk-

tionen
Wir betrachten hier stetige vektorwertige Funktionen, wobei der Hinweis genügen
soll, dass eine stetige Funktion r(t) einer kontinuierlichen Kurve, d.h. einer Kurve
ohne Sprünge entspricht.
Differentiation:
Eine vektorwertige Funktion r(t) ist differenzierbar, wenn der Limes
d dr(t) r(t + ∆t) − r(t)

r(t) ≡ = lim . (5.5.4)
dt dt ∆t→0 ∆t
unabhängig von der Folge ∆t → 0. Die Ableitung dr(t)/dt ist wieder eine vektor-
wertige Funktion. In der Darstellung (5.5.1) durch t-unabhängige Basisvektoren ist
r(t) stetig und differenzierbar, wenn alle Komponenten xi (t) in (5.5.1) stetig und
differenzierbar sind. In dieser Komponetendarstellung ist die 1. Ableitung
dr(t) dx1 (t) dx2 (t) dx3 (t)

= e1 + e2 + e3 . (5.5.5)
dt dt dt dt
Man überzeugt sich mit Hilfe der Differentiationsregeln für gewöhnliche Funktionen
f (t), dass folgende Differentiationsregeln für Vektorfunktionen a(t), b(t) gelten:
d da db
a(t) + b(t) = + , (5.5.6)
dt dt dt
d da db
a(t) · b(t) = ·b+a· , (5.5.7)
dt dt dt

d da db
a(t) × b(t) = ×b+a× , (5.5.8)
dt dt dt
d df da
f (t)a(t) = a + f , (5.5.9)
dt dt dt
d da df
a f (t) = . (5.5.10)
dt df dt
Die Regeln (5.5.7), (5.5.8) und (5.5.9) sind Produktregeln, (5.5.10) ist die Kettenre-
gel.
Höhere Ableitungen: Wie bei gewöhnlichen Funktionen sind höhere Ableitun-

gen von Vektorfunktionen rekursiv definiert.
dn d dn−1

r(t) = r(t) . (5.5.11)
dtn dt dtn−1
Beispiel: Wenn r(t) der Ortsvektor eines Teilchens und die Variable t die Zeit ist,
dann sind
dr(t) d2 r(t)
v(t) ≡ ≡ ṙ(t) und a(t) ≡ ≡ r̈(t) (5.5.12)
dt dt2
die Geschwindigkeit und die Beschleunigung des Teilchens zur Zeit t.
Integration:
Nun zur Integration vektorwertiger Funktionen f (t). Wir entwickeln f (t) nach einer
t-unabhängigen Basis:
f (t) = f1 (t)e1 + f2 (t)e2 + f3 (t)e3 .
Definition: Das (unbestimmte oder bestimmte) Riemann-Integral über eine vek-
torwertige Funktion f (t) ist derjenige Vektor, dessen Komponenten die jeweiligen
Integrale über die Komponentenfunktionen sind. Das unbestimmte Integral ist
Z Z Z Z
f (t) dt = e1 f1 (t) dt + e2 f2 (t) dt + e3 f3 (t) dt . (5.5.13)
Seien Fi (t) Stammfunktionen der Funktionen fi (t), dann

Z
f (t) dt = (F1 (t) + c1 )e1 + (F2 (t) + c2 )e2 + (F3 (t) + c3 )e3 . (5.5.14)
Man erhält somit drei voneinander unabhängige Integrationskonstante ci .

Das bestimmte Integral ist
Zt2
f (t) dt = F1 (t)|tt21 e1 + F2 (t)|tt21 e2 + F3 (t)|tt21 e3 . (5.5.15)
t1
Beispiel:
Von einem Teilchen sei seine Beschleunigung a = a(t) als Funktion der Zeit t be-
kannt, und außerdem seine Geschwindigkeit v(0) und sein Ort r(0) zur Zeit t = 0.
Man berechne seine Geschwindigkeit und seine Bahn als Funktionen der Zeit.
Da a(t) = dv(t)/dt, ist
Zt
v(t) = a(t0 )dt0 + v(0) .
0
Die Addition von v(0) auf der rechten Seite sorgt dafür, dass die Geschwindigkeit
bei t = 0 den vorgegebenen vektoriellen Wert annimmt. Da v = dr/dt, erhält man
die Bahn durch Berechnung des Integrals
Zt
r(t) = v(t0 )dt0 + r(0) .
0
Die Länge s(t) der zur Zeit t zurückgelegten Bahn berechnet man mit der Formel
(5.5.19) unten.
x2
ta = t0
t1
t2
~r(ta )
t = tN
~r(t)
x1
Abbildung 5.10: Bahnkurve angenähert durch Polygonzug.
5.5.3 Charakteristische Größen einer Kurve

Wir betrachten glatte Kurven und besprechen einige Größen, die eine solche Kurve
charakterisieren. ,,Glatt” heißt, dass die Kurve und ihre 1. Ableitung stetig sind.
Bogenlänge:
Die Bogenlänge s ist die Länge der Raumkurve, die, ausgehend von einem (willkürlich
gewählten) Anfangspunkt Pa , entlang der Kurve gemessen wird. Man wählt eine dis-
∧ ∧
krete Anzahl von Punkten Pn = r(tn ) auf der Kurve, beginnend bei Pa = r(ta ) und
∧
endend bei PN = r(tN ) – siehe Abbildung 5.10. Wir setzen
t − ta
∆t = > 0,
N (5.5.16)
tn = ta + n∆t , n = 0, 1, 2, ..., N.
Die geradlinige Verbindung der Punkte ergibt einen Polygonzug der Länge
N
X −1
LN (ta , t) = |r(tn+1 ) − r(tn )|
n=0
N −1 (5.5.17)
X r(tn+1 ) − r(tn )
= ∆t.
n=0
∆t
Im Limes N → ∞, d.h. ∆t → 0, erhalten wir die Bogenlänge
s(t) = lim LN (ta , t). (5.5.18)

N →∞
∆t→0
In diesem Limes geht der Differenzenquotient aus (5.5.17) über in die Ableitung

r(tn+1 ) − r(tn ) ∆t→0 dr
−−−→
∆t dt t=tn
und aus der Summe in (5.5.17) wird ein Riemann-Integral – siehe (2.4.14):
Zt Zt q
dr(t0 ) 0

s(t) = dt = ẋ21 + ẋ22 + ẋ23 dt0 . (5.5.19)
dt0
ta ta
Mit dieser Formel wird die Bogenlänge berechnet.

Die differentielle Änderung der Bogenlänge ist positiv, wie die Differentiation
von (5.5.19) nach t zeigt:
ds(t) dr(t)
= > 0. (5.5.20)
dt dt
Somit ist s(t) eine streng monoton wachsende Funktion und demzufolge umkehrbar,
also eindeutig nach t auflösbar:
s = s(t) ⇒ t = t(s).
Durch Einsetzen in r(t) erhalten wir die Parametrisierung einer Raumkurve durch
die Bogenlänge:
r(t) → r(t(s)) = r(s) . (5.5.21)
Beispiel: Wir betrachten eine ebene Kreisbewegung, siehe das Beispiel auf Sei-
te 112. Die Bewegung soll mit konstanter Winkelgeschwindigkeit erfolgen, d.h. der
Winkel φ in der Parametrisierung 1) auf Seite 112 ist φ = ωt, wobei die Kreisfrequenz
ω konstant ist.
r(t) = (R cos ωt, R sin ωt, 0)
dr
⇒ = (−Rω sin ωt, Rω cos ωt, 0)
dt
dr
⇒ = Rω
dt
Zt
⇒ s(t) = Rωdt0 = Rωt (setze ta = 0)
0
s
⇒ t(s) =
Rω
Damit ist die Parametrisierung dieser Kreisbewegung durch die Bogenlänge gegeben
durch s s
r(s) = R cos , R sin ,0 .
R R
Nach einem Umlauf muss s/R = 2π sein. Das entspricht der Bogenlänge s = 2πR,
also dem Umfang des Kreises.
x2 d~r
dt
∆~r
~r(t)
~r(t + ∆t)
x1
Abbildung 5.11: Der Vektor dr/dt ist parallel zur Tangente im Kurvenpunkt r(t).
Tangenteneinheitsvektor, Bahnkrümmung:
Nun zur geometrischen Bedeutung des Vektors dr/dt. Wir betrachten den Differenz-
vektor – siehe Abbildung 5.11:
∆r = r(t + ∆t) − r(t).
Division durch den Skalar ∆t ergibt den Vektor
∆r ∆t→0 dr
−−−→ .
∆t dt
∧
Der Vektor dr/dt ist parallel zur Tangente im Kurvenpunkt P = r(t). Die Division
dieses Vektors durch seinen Betrag ergibt den Tangenteneinheitsvektor t.
dr/dt
t≡ , |t| = 1. (5.5.22)
|dr/dt|
Wir parametriseren nun r durch die Bogenlänge, r = r(s). Verwendet man das
Resultat (5.5.20) in der Formel (5.5.22), erhält man
dr/dt dr dt dr
t≡ = = . (5.5.23)
ds/dt dt ds ds
Diese Formel liefert den Tangenteneinheitsvektor t als Funktion von s, t = t(s).
Der Vektor t hat per Definition den Betrag 1; er kann aber seine Richtung mit
t bzw. mit s ändern. Diese Richtungsänderung ist ein Maß für die Krümmung der
Bahn. Man definiert deshalb

dt(s)
Krümmung: κ ≡ ,
ds (5.5.24)
−1
Krümmungsradius: ρ ≡ κ .
Wenn die Bahn eine Gerade ist, dann ist κ = 0 und der Krümmungsradius ρ = ∞.
Normaleneinheitsvektor:
Nach der obigen Definition von t ist
t(s) · t(s) = 1.
Die Differentiation dieser Gleichung ergibt
dt dt dt
·t+t· =0 ⇒ t· = 0.
ds ds ds
Demzufolge ist der Vektor
dt
N≡ ⊥ t.
ds
Der sog. Normaleneinheitsvektor, auch Hauptnormale oder Krümmungsvektor gen-
nannt (vgl. (5.5.24)) genannt, ist der normierte Vektor N :
dt(s)/ds (5.5.24) 1 dt
n≡ = = n(s). (5.5.25)
|dt/ds| κ ds
Man definiert einen dritten Vektor, die sogenannte Binormale b(s), durch
b ≡ t × n. (5.5.26)
Offensichtlich ist b ⊥ t und b ⊥ n und
π
|b| = |t × n| = |t| |n| sin = 1. (5.5.27)
|{z} |{z} | {z2}
1 1
1
Die drei Einheitsvektoren t(s), n(s), b(s) bilden ein rechtshändiges ONS, das mit
einem Massenpunkt auf seiner Bahnkurve r(s) mitwandert und i.A. ständig seine
Richtung ändert. Man nennt dieses ONS das begleitende Dreibein.
Hinweise:
1. Bei einer ebenen Bewegung ist b ein konstanter Einheitvektor, der immer senk-
recht auf der Bahnebene steht.
2. Ein Maß für eine nichtebene Bewegung ist die sog. Torsion. Die Differentiation
von b nach der Bogenlänge liefert unter Verwendung von db/ds ⊥ b (siehe z.B.
das Lehrbuch von Lang und Pucker, Kapitel 7):
db
= −τ n .
ds
Diese Formel definiert die Torsion oder Windung τ an einen Kurvenpunkt P ,
dem der Wert s entspricht. Sie charakterisiert in der unmittelbaren Umgebung
von P die Abweichung der Kurve von einer ebenen Kurve. Ein Beispiel für eine
Kurve mit τ 6= 0 ist die in einer Übungsaufgabe behandelte Schraubenlinie
(Helix).
3. Bei einer Geraden verschwinden sowohl die Krümmung als auch die Torsion.
Anwendung: Geschwindigkeit und Beschleunigung eines Massenpunktes. Die Bahn

eines Massenpunktes ist gegeben durch seinen Ortsvektor r = r(t), t sei die Zeit.
Die Geschwindigkeit v(t) ist stets tangential zur Bahnkurve r(t), denn
dr dr ds (5.5.23) ds
v(t) = = = t. (5.5.28)
dt ds dt dt
Gleichung (5.5.20) besagt, dass ds/dt der Betrag der Geschwindigkeit ist:
ds
v(t) ≡ |v(t)| = . (5.5.29)
dt
Nochmaliges Differenzieren von (5.5.28) nach t ergibt die Beschleunigung a(t):
d2 r dt dt ds
a(t) = 2
= v̇t + v = v̇t + v . (5.5.30)
dt dt ds dt
Unter Verwendung von (5.5.25), (5.5.24) und (5.5.29) erhält man
d2 r v2
a(t) = = v̇t + n. (5.5.31)
dt2 ρ
Man nennt die Komponente längs t die Tangentialbeschleunigung
at ≡ v̇ ,
und die Komponente längs n die Normal- oder Zentripetalbeschleunigung
v2
an ≡ ,
ρ
siehe Abbildung 5.12.
Hinweis: Die Formeln (5.5.29) und (5.5.31) liefern per se natürlich keine Vorher-
sage der Beträge v(t) und v̇(t) der Geschwindigkeit und der Beschleunigung eines
Teilchens, das sich unter dem Einfluß einer Kraft bewegt. Um durch Rechnung her-
auszufinden, ob das Teilchen eine Tangential- und/oder eine Normalbeschleunigung
erfährt, muss man zunächst die Newtonsche Bewegungsgleichung
mr̈(t) = F
lösen, d.h. die Bahn r = r(t) für vorgegebene Anfangsbedingungen r(t0 ) = r 0 und
ṙ(t0 ) = v 0 bestimmen. Dies besprechen wir im Mechanik-Teil der Vorlesung.
x2
~b
~t
·
~n v2
ρ
~b
v̇ ·
~n ~t
v2
v̇ ρ
x1
Abbildung 5.12: Tangential- und Normalbeschleunigung v̇ und v 2 /ρ.

Kapitel 6
Matrizen, Determinanten,
Eigenwertproblem
Den Begriffen Matrix und Determinante einer Matrix begegnet man in der Mathe-
matikausbildung in der Regel zum ersten Mal bei der Lösung linearer algebraischer
Gleichungssysteme. Ein solches System lässt sich mit Hilfe einer Matrix in kompak-
ter Form darstellen. Die Determinante dieser Matrix liefert ein Kriterium dafür, ob
das Gleichungssystem lösbar ist.
Wir führen hier Matrizen in einem anderen Kontext ein. Drehungen von Koor-
dinatenystemen im Raum werden durch einen bestimmten Typ von Matrizen be-
schrieben. Dies bietet uns die Möglichkeit zu präzisieren, wie die Begriffe Skalar und
Vektor in der nichtrelativistischen Physik verwendet werden. Danach besprechen
wir die Eigenschaften bestimmter Matrix-Typen und behandeln die Lösung linearer
Gleichungssysteme. Zum Schluss dieses Kapitels behandeln wir das sog. Eigenwert-
problem. Diese Problemstellung tritt in vielen Gebieten der Mathematik und Physik
auf.
6.1 Drehungen eines Koordinatensystems

Euklidischer Raum:
In diesem Abschnitt werden wir die Begriffe Skalar und Vektor prägnanter fassen,
und zwar in Bezug auf das Verhalten dieser Größen unter Koordinatentransforma-
tionen im euklidischen Raum. Wie bereits in Kapitel 5 erwähnt wurde, wird als
dreidimensionaler (allgemeiner, als d-dimensionaler) euklidischer Raum der Vektor-
raum R3 bezeichnet, in dem das Skalarprodukt zweier Vektoren a und b durch
a · b = |a| |b| cos φab . (6.1.1)
definiert ist. Mit diesem Skalarprodukt werden die Regeln der euklidischen Geome-
trie auf algebraische Rechenoperationen im R3 zurückgeführt. Insbesondere erhält
man
• a·b=0 ⇔ a ⊥ b,
• der Abstand zwischen zwei Punkten mit Koordinaten (x1 , x2 , x3 ) und (y1 , y2 , y3 )
bezüglich einer ONB ist gegeben durch
p p
d = |x − y| = (x − y) · (x − y) = (x1 − y1 )2 + (x2 − y2 )2 + (x3 − y3 )2 ,
• die Summe der Winkel eines Dreiecks ist immer 180◦ .

Der euklidische Raum ist der adäquate mathematische Raum zur Beschreibung der
Phänomene der nichtrelativistischen Physik. In diesem Kontext muss noch betont
werden, dass in der nichtrelativistischen Physik die Zeit als universeller Parameter,
d.h. als skalare Größe aufgefasst wird. Die Annahme, dass synchronisierte Uhren
die gleiche Zeit bzw. die gleiche Zeitdifferenz für zwei Ereignisse anzeigen, erweist
sich als tragbar, solange die Uhren sich relativ zueinander mit einer Geschwindigkeit
bewegen, die klein gegenüber der Lichtgeschwindigkeit ist. Demzufolge ist beispiels-
weise die Geschwindigkeit v = dr/dt ein Vektor; denn wenn die Zeitdifferenz dt als
Skalar aufzufassen ist, ist der Quotient des Differenzvektors dr und dt wieder ein
Vektor.
Gelegentlich benutzt man das Symbol E3 (allgemein Ed ) für den dreidimensionalen
euklidischen Raum, um herauszustellen, dass der R3 mit dem Skalarprodukt (6.1.1)
versehen wurde.
Drehungen von kartesischen Koordinatensystemen:

In der Physik ist es oft zweckmäßig, ein und denselben Vorgang von verschiedenen
Koordinatensystemen aus zu beschreiben. Ein wichtiger Spezialfall ist der, dass die
beiden Systeme denselben Ursprung haben, aber gegeneinander verdreht sind. Wir
betrachten deshalb zwei Koordinatensysteme K und K 0 mit gemeinsamen Nullpunkt
O, aber voneinander verschiedenen kartesischen ONB {e1 , e2 , e3 } und {e01 , e02 , e03 }.
Ein gegebener Vektor x (Ortsvektor, Geschwindigkeit, etc.) ist dann bezüglich der
Basis von K oder von K 0 darstellbar.
Der Einfachheit halber besprechen wir zunächst den Fall zweier Raumdimensio-
nen, siehe Abbildung 6.1.
x = x1 e1 + x2 e2 = x01 e01 + x02 e02 . (6.1.2)
Unser Ziel ist, den Zusammenhang zwischen den Koordinaten x0i (i = 1, 2) und
xj (j = 1, 2) zu finden. Zunächst bestimmen wir, wie die x0i aus den xj berechnet
werden. Dazu entwickeln wir die Basisvektoren e0i nach den Basisvektoren ej :
e01 = a11 e1 + a12 e2 ,
(6.1.3)
e02 = a21 e1 + a22 e2 .
Durch skalare Multiplikation (d.h. Bilden des Skalarprodukts) der zwei Vektorglei-
chungen in (6.1.3) mit e1 bzw. mit e2 erhalten wir unter Benutzung von ei · ej = δij :
aij = e0i · ej = |e0i | |ej | cos φij = cos φij , i, j = 1, 2. (6.1.4)
6.1 Drehungen eines Koordinatensystems 123
20
x2 ~x
10
φ21
x01
x02
φ22
= φ12
φ
φ11 = φ 1
0 x1
Abbildung 6.1: Drehung eines kartesischen Koordinatensystems in zwei Raumdimen-

sionen.
Wir multiplizieren nun Gl. (6.1.2) skalar mit e01 und benutzen (6.1.4):
x1 e1 · e01 +x2 e2 · e01 = x01 . (6.1.5)

| {z } | {z }
a11 a12
Skalare Multiplikation von (6.1.2) mit e02 ergibt
x1 e1 · e02 +x2 e2 · e02 = x02 . (6.1.6)

| {z } | {z }
a21 a22
Die Gleichungen (6.1.5) und (6.1.6) enthalten das gewünschte Ergebnis:

x01 = a11 x1 + a12 x2 ,
(6.1.7)
x02 = a21 x1 + a22 x2 .
Wir ordnen die 2 · 2 = 4 Zahlen aij in folgendes 2 × 2 Schema. Das Objekt

a11 a12
A = (aij ) = . (6.1.8)
a21 a22
ist eine sog. 2 × 2 Matrix. Die reellen Zahlen aij nennt man Matrixelemente von
A. Der erste Index bei aij gibt die Zeile, der zweite Index die Spalte der Matrix A
an, in der die Zahl aij steht.
Die beiden Gleichungen (6.1.7) kann man auch anders darstellen, z.B. durch
2
X
x0i = aij xj i = 1, 2, (6.1.9)
j=1
oder in der Spaltenvektorschreibweise,

0
x1 a11 a12 x1
= (6.1.10)
x02 a21 a22 x2
oder in kompakter Matrixform durch
x0 = A x, (6.1.11)
wobei x0 und x die Spaltenvektoren gebildet aus den Komponenten des Vektors x
bezüglich der beiden ONB bezeichnen. Wir benutzen hier diese bereits in (5.3.5),
Kapitel 5 eingeführte Notation, um zwischen dem Vektor x und seinen Komponen-
ten x bzw. x0 bezüglich der ONB {ei } bzw.{e0i } explizit zu unterscheiden.
Fazit: Bei einem Wechsel der ONB, die einer Drehung des Koordinatensystems
in zwei Raumdimensionen entspricht, ändern sich die Komponenten des Vektors x
gemäß (6.1.11). Der Vektor x bleibt unverändert.
Die Matrix A in (6.1.11) ist eine 2 × 2 Drehmatrix. Die Eigenschaften dieser Dreh-
matrix und die Umkehrung von (6.1.11) besprechen wir im folgenden Abschnitt.
6.1.1 Eigenschaften einer Drehmatrix

Drehmatrizen in d = 2 Raumdimensionen:
Die Matrixelemente aij der obigen Drehmatrix A sind durch (6.1.3) bzw. (6.1.4)
festgelegt. Aus (6.1.3) folgt:
e01 · e01 = a11 e01 · e1 +a12 e01 · e2 ,

| {z } | {z } | {z }
1 a11 a12
e02· = e02 0
a21 e2 · e1 0
+a22 e2 · e2 .
| {z } | {z } | {z }
1 a21 a22
Somit
1 = a211 + a212 ,
(6.1.12)
1 = a221 + a222 ,
oder kompakt
2
X
a2ij = 1 i = 1, 2. (6.1.13)
j=1
Wir multiplizieren die erste Gleichung in (6.1.3) mit e02 , die zweite Gleichung mit e01
und benutzen, dass e01 ⊥ e02 . Wir erhalten
0 = a11 a21 + a12 a22 ,

(6.1.14)
0 = a21 a11 + a22 a21 .
Die Gleichungen (6.1.12) bzw. (6.1.13) und (6.1.14) können folgendermaßen zusam-
mengefasst werden:
X2
aik ajk = δij i, j = 1, 2. (6.1.15)
k=1
Dies sind Bedingungsgleichungen für die Matrixelemente einer 2 × 2 Drehmatrix A

kodiert. Weitere Bedingungen, die A charakterisieren, besprechen wir unten.
Explizite Form einer 2 × 2 Drehmatrix: Aus Gleichung (6.1.4) und Abbildung

6.1 erhalten wir (φij = ∠(e0i , ej )):
a11 = cos φ11 = cos φ ,

π
a12 = cos φ12 = cos − φ = sin φ ,
2 π
a21 = cos φ21 = cos φ + = − sin φ ,
2
a22 = cos φ22 = cos φ .
Somit
cos φ sin φ
2 × 2 Drehmatrix A = . (6.1.16)
− sin φ cos φ
Man überzeugt sich sofort davon, dass die Matrixelemente in (6.1.16) die Gleichun-
gen (6.1.15) erfüllen.
Drehmatrizen in d = 3 Raumdimensionen:
Die obigen Gleichungen (6.1.2) bis (6.1.15) lassen sich sofort auf d = 3 Dimensionen
(bzw. d > 3) verallgemeinern. Wir betrachten zwei kartesische Koordinatensysteme
K und K 0 , definiert durch die ONB {e1 , e2 , e3 } bzw. {e01 , e02 , e03 } mit demselben
Ursprung. K und K 0 seien gegeneinander im Raum verdreht. Die Entwicklung eines
gegebenen Vektors x nach den beiden ONB ist
x = x1 e1 + x2 e2 + x3 e3 = x01 e01 + x02 e02 + x03 e03 . (6.1.17)
Die Komponenten x0i erhalten wir aus den Komponenten xj durch die Verallgemei-
nerung von Gleichung (6.1.9) auf drei Raumdimensionen:
3
X
x0i = aij xj i = 1, 2, 3, (6.1.18)
j=1
wobei
aij = e0i · ej = cos φij i, j = 1, 2, 3, (6.1.19)
siehe (6.1.4). In Matrixschreibweise
x0 = Ax , (6.1.20)
wobei  
a11 a12 a13
A =  a21 a22 a23  . (6.1.21)
a31 a32 a33
Die Matrixelemente aij einer 3 × 3 Drehmatrix A sind durch (6.1.19) festgelegt.
Analog zu (6.1.15) gelten die folgenden 9 Gleichungen (drei dieser Gleichungen sind
redunant):
X3
aik ajk = δij i, j = 1, 2, 3. (6.1.22)
k=1
Eine Drehmatrix, d.h. eine Matrix mit der Eigenschaft (6.1.22) bzw. (6.1.15) bezeich-
net man auch als orthogonale Matrix. Diese Gleichungen besagen folgendes: Setzt
man i = j erhält man ak 2 = 1 für k = 1, 2, 3, d.h. die Länge jedes Zeilenvektors
einer orthogonalen Matrix ist eins. Für i 6= j besagt (6.1.22), dass die drei Zeilen-
vektoren orthogonal sind. Unten werden wir sehen, dass diese beiden Aussagen auch
für die Spaltenvektoren einer orthogonalen Matrix gelten. Drehmatrizen sind spezi-
elle orthogonale Matrizen, die noch die Zusatzbedingung det A = +1 erfüllen, siehe
Punkt 6 auf Seite 136) unten. Diese Bedingung entspricht folgendem Sachverhalt.
Drehungen führen Rechtssysteme (RS) in Rechtsysteme und Linkssysteme (LS) in
Linkssysteme über, aber niemals RS ↔ LS. Um das zu bewerkstelligen, muss man
neben einer Drehung noch eine (allgemein eine ungerade Anzahl von) Spiegelung(en)
an einer (der) Koordinatenebene(n) durchführen. Diese Transformation wird durch
eine orthogonale Matrix mit det A = −1 vermittelt, siehe unten.
Hintereinanderausführen zweier Drehungen:

Wir betrachten einen Vektor x in R3 und drei kartesische Koordinatensysteme K,
K 0 und K 00 mit demselben Urspung, die gegeneinander verdreht sind. Die Transfor-
mation der Koordinaten von x werde vermittelt durch
Drehmatrix A Drehmatrix B
K −−−−−−−−→ K 0 −−−−−−−−→ K 00 .
Frage: Wie hängen die Komponenten von x bezüglich K 00 und bezüglich K zusam-
men?
Aus (6.1.18) erhält man

X3

x0j = ajk xk 



 3
k=1
X
00
3
⇒ xi = bij ajk xk ,
X 
j,k=1
x00i = bij x0j 




j=1
bzw.
3
X 3
X
x00i = cik xk , wobei cik = bij ajk . (6.1.23)
k=1 j=1
Gleichung (6.1.23) liefert die 3 × 3 Matrix C = (xij ), die die obige Drehung in einem
Schritt vermittelt:
C
K− → K 00 .
Gleichung (6.1.23) ist gerade die Matrix-Multiplikationsregel für das Produkt BA
der beiden Matrizen – siehe Gl. 6.4.1 unten. Somit haben wir in kompakter Schreib-
weise
x00 = C x = BA x. (6.1.24)
Rückdrehung, inverse Drehmatrix:

Die Drehung eines Koodinatensystems K → K 0 werde durch die Matrix A vermit-
telt. Die Matrix, die die Rückdrehung (= inverse Drehung) K 0 → K beschreibt,
nennt man die zu A inverse Matrix und bezeichnet sie mit A−1 .
Drehmatrix A inverse Matrix A−1
K −−−−−−−−→ K 0 −−−−−−−−−−−→ K.
Wir betrachten einen beliebigen Vektor x in R3 . Für seine Koordinaten gilt (a)
x0 = Ax und (b) A−1 x0 = x.
)
(b) eingesetzt in (a) ⇒ x0 = AA−1 x0
⇒ AA−1 = A−1 A = I, (6.1.25)
(a) eingesetzt in (b) ⇒ x = A−1 Ax
wobei  
1 0 0
I = (δij ) =  0 1 0  (6.1.26)
0 0 1
die dreidimensionale Einheitsmatrix ist.
Die Matrixgleichung (6.1.25) definiert allgemein die zu einer Matrix A inverse
Matrix A−1 – falls diese existiert. Wie man sie im allgemeinen Fall berechnet, bespre-
chen wir in den Abschnitten 6.4.2 und 6.5.3. Im vorliegenden Fall einer orthogonalen
Matrix A können die Matrixelemente (A−1 )ij von A−1 leicht berechnet werden.
3
X
AA−1 = I ⇔ aik (A−1 )kj = δij . (6.1.27)
| {z }
k=1 ajk
Die Identität
(A−1 )kj = ajk (6.1.28)
folgt aus dem Vergleich von (6.1.27) mit der die orthogonalen Matrizen charakteri-
sierenden Gleichungen (6.1.22). Das heißt, die Matrixelemente der inversen Drehma-
trix A−1 erhält man durch Vertauschen der Zeilen und Spalten von A. Das Ergebnis
bezeichnet man als die zu A transponierte Matrix AT .
2
~x0
~x
~e2
1
~e1
Abbildung 6.2: Drehung eines Vektors x in einem Koordinatensystem.
Die Transponierte einer allgemeinen 3 × 3 (bzw. n × n) Matrix A ist:

   
a11 a12 a13 a11 a21 a31
T
A=  a21 a22 a23  ⇒ A =  a12 a22 a32  , (6.1.29)
a31 a32 a33 a13 a23 a33
d.h. (AT )ij = aji . Im Falle einer orthogonalen Matrix A besagt das Ergebnis (6.1.28),
dass die Inverse einer orthogonalen Matrix A durch A−1 = AT gegeben ist.
Sei A orthogonale 3 × 3 Matrix: Dann A−1 = AT .

(6.1.30)
Somit gilt für diese Matrix: AAT = AT A = I .
Bemerkung: Die Matrixgleichungen (6.1.30) gelten allgemein für orthogonale n×n

Matrizen – man kann sie als Definitionsgleichungen für diese Klasse von Matrizen
auffassen.
6.2 Passive und aktive Transformationen

Im Abschnitt 6.1 hatten wir ein und denselben Vektor x von zwei verschiedenen,
durch eine Rotation verknüpfte Koordinatensysteme K und K 0 aus betrachtet. Wir
fanden, dass die Komponenten von x in K und in K 0 verknüpft sind durch
3
X
x0i = Rij xj , (6.2.1)
j=1
wobei R = (Rij ) die zugehörige Drehmatrix ist. (Im Folgenden bezeichnen wir or-
thogonale Matrizen, insbesondere Drehmatrizen, mit R.) Eine solche Transformation
wird passive Transformation genannt.
6.3 Skalare und Vektoren im euklidischen Raum 129
Die folgende Operation bezeichnet man als aktive Transformation. Wir be-
trachten einen Vektor x in einem durch e1 , e2 , e3 definierten Koordinatensystem
K. Der Vektor x werde nun in K gedreht; das Ergebnis ist der Vektor x0 – siehe
Abbildung 6.2.
Drehung
x −−−−→ x0 .
Die Entwicklung von x und x0 nach der ONB {ei } ergibt
x = x1 e1 + x2 e2 + x3 e3 ,
(6.2.2)
x0 = x01 e1 + x02 e2 + x03 e3 .
Die Koordinaten hängen folgendermaßen zusammen:

3
X
x0i = R̃ij xj , (6.2.3)
j=1
wobei R̃ die orthogonale Matrix ist, die die gewünschte Drehung vermittelt. Die
Transformationsgesetze (6.2.1) und (6.2.3) sind formal identisch, haben aber ver-
schiedene Bedeutungen. In der Physik wendet man sowohl passive als auch aktive
Transformationen an. Eine passive Transformation kommt zum Zuge, wenn man die
Vektoren eines physikalischen Systems bezüglich zweier gegeneinander verdrehter
Koordinatensysteme analysiert. Eine aktive Transformation verknüpft zwei physi-
kalische Systeme, die durch eine Drehung ineinander übergeführt werden können.
6.3 Skalare und Vektoren im euklidischen Raum

Wir können nun den Begriff eines Vektors im euklidischen Raum prägnanter fassen:
Wir betrachten ein kartesisches Koordinatenystem mit der ONB {e1 , e2 , e3 } im R3 .
Definition: Die drei Größen xi (i = 1, 2, 3) bilden die kartesischen Komponenten
eines Dreier-Vektors (= euklidischer Vektor – in der nichtrelativistischen Physik
einfach Vektor genannt), wenn sie bei einer Drehung des KS transformieren wie
3
X
x0i = Rij xj . (6.3.1)
j=1
Diese Definition bezieht sich nicht nur auf passive, sondern auch auf aktive Trans-
formationen; R ist die zugehörige Drehmatrix.
Das Transformationsgesetz gilt offensichtlich für die kartesischen Komponenten
der uns bereits bekannten Vektoren , z.B. für die Komponenten
(x1 , x2 , x3 ) eines Ortsvektors x,

(v1 , v2 , v3 ) eines Geschwindigkeitsvektors v,
(F1 , F2 , F3 ) eines Kraftvektors F .
Beliebige, zu einem dreikomponentigen Objekt zusammengefasste Größen, z.B. (x1 , x2 , |x|)

oder drei Abfahrtszeiten (t1 , t2 , t3 ) eines Zuges bilden offensichtlich keinen Vektor.
Definition: Ein Skalar (= Dreier-Skalar = euklidischer Skalar) ist eine Größe, die
sich bei Drehungen des Koordinatensystems nicht ändert.
Beispiele:
• Masse, Temperatur, Zeit.
• Das Skalarprodukt a · b von zwei Vektoren a, b.
• Der Abstand |x − y| zweier Vektoren x, y.
Die beiden letztgenannten Aussagen zeigen wir in einer Übungsaufgabe.
Dreier-Tensoren: Der Vollständigkeit halber gehen wir hier noch auf den Begriff
des Dreier-Tensors (oder euklidischen Tensors) ein. Sie benötigen Objekte dieser Art
aber erst in der Vorlesung Theoretische Physik I im Kapitel über Starre Körper.
Definition: Ein Dreier-Tensor 2. Stufe ist ein Objekt T = (tij ) (i, j = 1, 2, 3)
bestehend aus 3×3 = 9 Komponenten, das sich bei einer Drehung eines kartesischen
Koordinatensystems wie folgt transformiert:
3
X
t0ij = Rik Rjl tkl . (6.3.2)
k,l=1
Beispiele:
• Seien x1 , x2 , x3 die Komponenten eines Dreier-Vektors, d.h. sie transformieren
unter orthogonalen Transformationen wie (6.3.1). Dann transformiert sich das
9-komponentige Objekt (xi xj ) wie (6.3.2) und ist somit ein Dreier-Tensor 2.
Stufe.
• Das in (5.4.7), Kapitel 5 definierte Kronecker-Delta-Symbol transformiert wie
ein Dreier-Tensor 2. Stufe - und zwar ist dieses Objekt invariant unter ortho-
gonalen Transformationen. Wir wenden das Transformationsgesetz (6.3.2) auf
δkl = ek · el an und erhalten
3 3
X X (6.1.27)
δij0 = Rik Rjl δkl = Rik Rjk = δij . (6.3.3)
k,l=1 k=1
Definition: Ein Dreier-Tensor n-ter Stufe ist ein 3n -komponentiges Objekt (ti1 ,i2 ,...,in ),
das sich bei einer Drehung eines kartesischen Koordinatensystems wie folgt trans-
formiert:
3
X
t0i1 ...in = Ri1 k1 . . . Rin kn tk1 ...kn . (6.3.4)
k1 ,...,kn =1
6.4 Rechenregeln für Matrizen 131
Merkregel: Bei einem Tensor n-ter Stufe (ti1 i2 ...in ) transformiert sich jeder Index il
wie ein Vektorindex. In der Tensor-Terminologie ist ein Vektor (präziser: die Kom-
ponenten eines Vektors) ein Tensor 1. Stufe und ein Skalar ein Tensor 0. Stufe.
Dreier-Skalare und -Vektoren bzw. allgemein Dreier-Tensoren n-ter Stufe sind somit
durch ihr Transformationsverhalten unter räumlichen Drehungen, bzw. etwas allge-
meiner, unter orthogonalen Transformationen im dreidimensionalen Raum definiert.
Die definierenden Transformationsgesetze (6.3.1), (6.3.2) bzw. allgemein (6.3.4) be-
sagen, dass das transformierte Objekt zwar i.A. verschieden vom Ausgangsobjekt
ist, aber in jedem Fall die gleiche Form hat. Man sagt, Dreier-Tensoren n-ter Stu-
fe transformieren sich kovariant (= forminvariant) unter räumlichen Drehungen.
Skalare, also Tensoren 0. Stufe sind nicht nur kovariant, sondern invariant unter
diesen Transformationen. Das Kronecker-Delta ist ein invarianter Tensor 2. Stufe.
Ein weiterer invarianter Tensor ist das -Symbol, siehe unten.
Die Begriffe Dreier-Skalar und -Vektor bzw. Dreier-Tensor dienen vor allem da-
zu, diese Objekte von sog. Vierer-Skalaren, Vierer-Vektoren bzw. Vierer-Tensoren
zu unterscheiden. Das sind Objekte, die durch ihr Verhalten bezüglich Lorentz-
Transformationen definiert sind. Diese Transformationen werden im Rahmen der
Vorlesungen über Theoretische Physik erst am Ende der Vorlesung Theoretische
Physik I im Kapitel über Spezielle Relativitätstheorie besprochen. In der nichtrelati-
vistischen Physik bezeichnet man Dreier-Skalare und -Vektoren einfach als Skalare
bzw. Vektoren.
Zum Schluss dieses Abschnitts noch eine Bemerkung zum -Symbol (5.4.26) aus
Kapitel 5, das auch total antisymmetrischer -Tensor 3. Stufe genannt wird. Diese
Bezeichnung rührt daher, dass sich dieses Objekt unter orthogonalen Transforma-
tionen folgendermaßen transformiert:
3
X
0i1 i2 i3 = Ri1 k1 Ri2 k2 Ri3 k3 k1 k2 k3 = (det R) i1 i2 i3 . (6.3.5)
k1 ,k2 ,k3 =1
Dies wird in einer Übungsaufgabe bewiesen. Gl. (6.3.5) besagt, dass der -Tensor
unter räumlichen Drehungen (det R = +1) invariant ist, aber bei orthogonalen
Transformationen mit det R = −1 sein Vorzeichen wechselt.
6.4 Rechenregeln für Matrizen

Seien A, B zwei m × n Matrizen, d.h. Matrizen mit m Zeilen und n Spalten.
A=B ⇔ aij = bij ∀i, j .
Die Matrixelemente einer Matrix können reelle oder komplexe Zahlen sein. Wir
betrachten hier in der Regel nur reelle Matrizen.
6.4.1 Spezielle Matrizen

1. Nullmatrix 0: Alle Elemente sind null.
2. Eine symmetrische Matrix ist eine n × n Matrix mit aij = aji , d.h. A = AT .
3. Einheitsmatrix:  
1 0
 1 
I = (δij ) =  .
 
 ... 
0 1
4. Diagonalmatrix:
 
d1 0
 d2 
D = (di δij ) =  .
 
..
 . 
0 dn
Um Platz zu sparen, benutzt man für Diagonalmatrizen auch die Darstellung
D = diag(d1 , . . . , dn ) .
5. Die transponierte Matrix AT einer m × n Matrix A = (aij ) erhält man

durch Vertauschen der Zeilen und Spalten von A.
 
a11 a21 · · · am1
AT = ((AT )ij ) =  ... .. ..
.
 
. .
a1n a2n · · · amn
AT ist eine n × m Matrix.
6. Eine orthogonale Matrix R ist eine n × n Matrix mit den Eigenschaften
(6.1.30).
7. Eine Drehmatrix R ist eine orthogonale Matrix mit der zusätzlichen Eigen-
schaft det R = +1 – siehe Abschnitt 6.5.
 
a1
8. Der Spaltenvektor  ...  ist eine n × 1 Matrix.
 
an
9. Der Zeilenvektor (a1 , a2 , ..., an ) ist eine 1 × n Matrix. Bei pedantischer An-
wendung der Transpositionsregel ist
 T
a1
(a1 , a2 , ..., an ) =  ...  .
 
an
Die Transposition eines Zeilenvektors ergibt einen Spaltenvektor.
6.4 Rechenregeln für Matrizen 133
Spalte k
k
 
 
ai1 · b1k
   
   
a a(i−1)2 a(i−1)3 ...   
 (i−1)1   +ai2 · b2k   
 ai1 ai2 ai3 ...
     
Zeile i  
+ai3 · b3k 
=

cik

    i 
a(i+1)1 a(i+1)2 a(i+1)3 ...
     
    
.. ..
     
   



 . .  
A B C
Abbildung 6.3: Multiplikation AB = C zweier Matrizen A, B. Man multipliziert

den i-ten Zeilenvektor der Matrix A skalar mit dem k-ten Spaltenvektor der Matrix
B. Dies ergibt das Element cik der Matrix C.
6.4.2 Rechenregeln
1. C = A + B ist definiert durch cij = aij + bij ∀i, j.
2. λA ≡ (λaij ), wobei λ eine reelle oder komplexe Zahl ist. Jedes Matrixelement
wird mit λ multipliziert.
3. Matrixmultiplikation: Es sei A eine m × n Matrix und B eine n × r Matrix.

Die Matrixelemente cik der Produktmatrix C = AB = (cik ) erhält man gemäß
3
X
cik = aij bjk = ai1 b1k + ai2 b2k + ... + ain bnk , (6.4.1)
j=1
siehe Abbildung 6.3. Die Matrix C ist eine m × r Matrix.

Beachte: Im Allgemeinen ist AB 6= BA.
4. Die Transponierte eines Matrixprodukts AB ist
(AB)T = B T AT . (6.4.2)
Zum Beweis dieser Matrixgleichung transponiert man einerseits die Produkt-

matrix AB durch Vertauschen i ↔ j der Zeilen- und Spaltenindizes in (6.4.2)
und man berechnet andererseits das Matrixprodukt B T AT gemäß der obigen
Multiplikationsregel.
Inverse Matrix
Für quadratische, also n × n Matrizen A kann man sich fragen, ob die zu A inverse
Matrix A−1 existiert. Diese Matrix muss, wie bereits oben erwähnt, die folgenden
Matrixgleichungen erfüllen:
AA−1 = A−1 A = I. (6.4.3)
Für eine spezielle Klasse von quadratischen Matrizen, den Drehmatrizen R, ha-
ben wir bereits gesehen, dass R−1 existiert; und zwar ist R−1 = RT , siehe (6.1.30).
Wir fragen hier i) nach dem Kriterium für die Existenz der Inversen A−1 einer all-
gemeinen quadratischen Matrix und ii) danach, wie man A−1 berechnet.
Die Matrix A−1 hat n2 Matrixelemente. Gl. (6.4.3) ist in der Tat ein lineares Glei-
chungssystem bestehend aus n2 Gleichungen für diese n2 unbekannten Matrixele-
mente. Die Lösung eines solchen Gleichungssystems ist für n > 2 ohne ein systema-
tisches Verfahren sehr mühevoll. Bei der systematischen Lösungsmethode, die unten
besprochen wird, tritt eine neue mathematische Größe auf, die sog. Determinante
einer Matrix A, die wir im nächsten Abschnitt behandeln. Wir werden sehen, dass
i) der Wert der Determinante von A darüber entscheidet, ob A−1 existiert, ii) dass
bei der Berechnung dieser Matrix ebenfalls diese Determinante auftritt.
6.5 Determinanten
Den Begriff der Determinante einer quadratischen Matrix kennen Sie vermutlich
schon aus der Schule; er tritt bei der Lösung von linearen Gleichungssystemen auf
(siehe unten).
Sei A eine n × n Matrix. Die Determinante von A ist eine Zahl, die die Matrix
A kennzeichnet. Wir definieren sie hier durch folgende rekursive Vorschrift:

a11 · · · a1n

.. ..
det A ≡ |A| = = a11 M11 − a12 M12 + a13 M13 − ... + (−1)n+1 a1n M1n .

. .
an1 · · · ann
(6.5.1)
Dabei sind die Mkl die sogenannten Unterdeterminanten der Untermatrizen A(kl) . 1
Die Matrix A(kl) erhält man aus der Matrix A durch Streichen der Zeile k und der
Spalte l. Das ergibt eine (n − 1) × (n − 1) Matrix. Mkl bezeichnet die Determinante
dieser Matrix A(kl) .
Die Formel (6.5.1) ist rekursiv. Sie führt eine Determinante n-ten Grades auf eine
Summe von Determinanten (n − 1)-ten Grades zurück, usw., solange bis man bei
1 × 1 Matrizen angelangt ist, deren Determinante durch das jeweilige Matrixelement
gegeben ist.
Vorsicht: Verwechseln Sie die Notation |A| nicht mit dem Betragszeichen. Wenn A
eine reelle Matrix ist, dann ist det A eine reelle Zahl, diese kann größer, kleiner oder
gleich Null sein.
Wir machen uns die Formel (6.5.1) für 2 × 2 und 3 × 3 Matrizen klar.
1
Der Doppelindex (kl) ist hier ein Zählindex – nicht zu verwechseln mit dem Doppelindex für
die Matrixelemente einer Matrix.
6.5 Determinanten 135
Determinante einer 2 × 2 Matrix A:

Wir wenden die obige Berechnungsvorschrift an und erhalten

a11 a12
det A ≡
= a11 a22 − a12 a21 . (6.5.2)
a21 a22
Als Merkregel zur Berechnung der Determiante einer 2 × 2 Matrix erhalten wir:
det A ist das Produkt der beiden Hauptdiagonalemelemente minus dem Produkt
der beiden Nebendiagonalelemente.
Determinante einer 3 × 3 Matrix A:

Die Anwendung der obigen Berechnungsvorschrift ergibt:

a11 a12 a13

a11 a12 a13

a11 a12 a13

a11 a12 a13

det A ≡ a21 a22 a23 = a11 a21 a22 a23 − a12 a21 a22 a23 + a13 a21 a22 a23

a31 a32 a33 a31 a32 a33 a31 a32 a33 a31 a32 a33

a22 a23 a21 a23 a21 a22
= a11

− a12

+ a13

a32 a33 a31 a33 a31 a32

= a11 a22 a33 − a11 a23 a32 − a12 a21 a33 + a12 a23 a31 + a13 a21 a32 − a13 a22 a31
(6.5.3)
Merkregel (Sarrus-Regel):

a11 a12 a13 a11 a12 a13 a11 a12

a21 a22 a23 ⇐⇒ a21 a22 a23 a21 a22

a31 a32 a33 a31 a32 a33 a31 a32

(−) (−) (−) (+) (+) (+)

Dieses einfache Schema funktioniert nicht mehr für höherdimensionale Matrizen;
man muss (6.5.1) oder (6.5.5) anwenden.
Darstellung mit Hilfe des -Symbols: Unter Benutzung der Werte des total
antisymmetrischen -Symbols aus Kapitel 5 sieht man sofort, dass die Determinante
(6.5.3) einer 3 × 3 Matrix auch folgendermaßen dargestellt werden kann:
3
X 3
X
det A = ijk ai1 aj2 ak3 = ijk a1i a2j a3k . (6.5.4)
i,j,k=1 i,j,k=1
Diese Relationen zeigt man durch explizites Ausschreiben und Vergleich mit (6.5.3).
Die zweite Gleichung belegt am Beispiel einer 3 × 3 Matrix, dass det A = det(AT ),
siehe unten.
Ausgehend von dieser Darstellung kann man die oben erwähnte Relation (6.3.5)
beweisen.
6.5.1 Einige Rechenregeln für Determinanten

Die folgenden Rechenregeln gelten für Determinanten beliebiger n×n Matrizen. Wir
beweisen sie hier nicht für den allgemeinen Fall – man kann die folgenden Regeln
allerdings anhand der obigen Berechnungsvorschrift bzw. Merkregeln sofort für die
Fälle n = 2 und n = 3 nachprüfen. Tun Sie das zu Hause!
1. Die Vertauschung zweier benachbarter Zeilen (zweier benachbarter Spalten)

ändert das Vorzeichen der Determinante.
2. det(αA) = αn det A, wobei α eine Zahl ist.
3. Sei D = (di δij ) eine n × n Diagonalmatrix. Dann ist
det D = d1 · d2 · · · dn .
Insbesondere ist
det I = 1.
4. det(AT ) = det A.
5. Multiplikationsgesetz:
det(AB) = det A · det B .
6. Sei R eine orthogonale Matrix, d.h. es gilt RT R = I. Dann ist
det(RT R) = det RT det R = (det R)2 = 1.
Somit
det R = ±1.
Drehmatrizen sind definiert durch die Zusatzbedingung det R = +1. Beschreibt
R eine Spiegelung an einer Koordinatenebene oder die Spiegelung am Ursprung
eines dreidimensionalen Koordinatensystems, dann ist det R = −1.
Weitere nützliche Rechenregeln lernen Sie in der Vorlesung über Höhere Mathematik.
6.5.2 Entwicklungssatz
Die Berechnungsvorschrift (6.5.1) kann man verallgemeinern. Anstelle nach Zeile 1
kann man nach einer beliebigen Zeile i entwickeln. Es gilt
det A = (−1)i−1 ai1 Mi1 − ai2 Mi2 + ... + (−1)n+1 ain Min

n
X (6.5.5)
= (−1)i+j Mij aij .
j=1
Beweis: Wenn i = 1, dann ist (6.5.5) identisch mit (6.5.1). Wenn i > 1, dann
vertauschen wir die i-te Zeile mit der (i − 1)-ten, usw., solange bis die i-te Zeile zur
ersten Zeile geworden ist und wenden dann (6.5.1) an. Die Vertauschungen erzeugen
nach der Rechenregel 1 jedesmal einen Faktor (−1), also erhält man insgesamt den
Faktor (−1)i−1 .
6.5.3 Anwendungen
Zunächst zwei simple, aber nützliche Anwendungen.
Vektorprodukt:
Das Vektorprodukt
a × b = e1 (a2 b3 − a3 b2 ) + e2 (a3 b1 − b3 a1 ) + e3 (a1 b2 − a2 b1 ). (6.5.6)
kann als Determinante dargestellt werden.

e1 e2 e3

a × b = a1 a2 a3 . (6.5.7)
b1 b2 b3
Man prüft das sofort z.B. mit Hilfe der o.g. Sarrus-Regel nach.
Spatprodukt:
Das Spatprodukt kann ebenfalls als Determinante geschrieben werden:

a1 a2 a3 a1 b1 c1

a · (b × c) = b1 b2 b3 = a2 b2 c2 . (6.5.8)
c1 c2 c3 a3 b3 c3
Hier sind, wie üblich, die ai , bi , ci die Komponenten der jeweiligen Vektoren bezüglich
einer ONB. Die erste Gleichung ergibt sich sofort aus der Darstellung von b×c durch
(6.5.6) bzw. (6.5.7) oder durch direktes Ausrechnen. Das zweite Gleichheitszeichen
folgt aus det A = det(AT ).
Gleichung (6.5.8) impliziert einen wichtigen Sachverhalt: Wir wissen, dass
a · (b × c) = 0, wenn z.B. zwei der drei Vektoren kollinear sind oder allgemeiner,
wenn die drei Vektoren in einer Ebene liegen (man sagt, die drei Vektoren sind
koplanar), also linear abhängig sind. Aus der Darstellung (6.5.8) folgt somit, dass
die Determinante einer 3 × 3 Matrix A gleich null ist,
det A = 0, (6.5.9)
wenn ein Zeilenvektor (Spaltenvektor) ein Vielfaches eines anderen Zeilenvektors
(Spaltenvektors) ist, oder wenn er eine Linearkombination der beiden anderen Zei-
lenvektoren (Spaltenvektoren) ist.
Diese Aussagen gelten auch für n × n Matrizen A.
Die zu einer n × n Matrix A inverse Matrix A−1 :

Die Inverse einer quadratischen Matrix ist definiert durch (siehe (6.4.3)):
AA−1 = A−1 A = I.
Zunächst müssen wir uns fragen, unter welcher Bedingung A−1 existiert. Dazu be-
rechnen wir die Determinante der Matrizen auf der linken und rechten Seite dieser
Definitionsgleichung:
1 = det I = det(AA−1 ) = det A det(A−1 )

1
⇒ det(A−1 ) = .
det A
Somit erhalten wir folgende Aussage:
A−1 existiert genau dann, wenn det A 6= 0. (6.5.10)
Die Matrixelemente von A−1 sind durch folgende Formel gegeben (ohne Beweis):
(−1)i+j
(A−1 )ij = Mji . (6.5.11)
det A
Die Mji sind die unterhalb von (6.5.1) definierten Unterdeterminanten. Beachten
Sie die Anordnung der Indizes auf der linken und rechten Seite von (6.5.11)! Einen
Beweis dieser Formel findet man z.B. in den zitierten Büchern von Großmann und
Nolting.
Beispiel:
1 4
A= ⇒ det A = −18.
5 2
Die Anwendung der Formel (6.5.11) ergibt für die Matrixelemente von A−1 :
1 2

−1 2
(A )11 = − (−1) M11 = −  
18 18 

1 4


−1 3
(A )12 = − (−1) M21 = + 


18 18 ⇒ A−1 A = AA−1 = I.
1 5
(A−1 )21 = − (−1)3 M12 = +  
18 18 


−1 1 4 1 

(A )22 = − (−1) M22 = − 

18 18
Lineare Gleichungssysteme:
Wir betrachten hier nur den Fall n linearer Gleichungen mit n Unbekannten.
a) Inhomogenes Gleichungssystem:
a11 x1 + · · · + a1n xn = b1
.. .. .. (6.5.12)
. . .
an1 x1 + · · · + ann xn = bn ,
wobei die aij , bk gegeben und die xl gesucht sind. Eine kompakte Schreibweise
von (6.5.12) ist
Ax = b. (6.5.13)
Frage: Wann ist (6.5.12) bzw. (6.5.13) lösbar?

Antwort: Wenn det A 6= 0, dann gibt es eine eindeutige Lösung x.
Beweis: Wenn det A 6= 0, dann existiert die zu A inverse Matrix A−1 . Multi-
pliziere die Matrixgleichung (6.5.13) von links mit A−1 .
−1 −1
|A{zA} x = A b
I
⇒ x = A−1 b. (6.5.14)
Das ist die gesuchte Lösung, die offensichtlich eindeutig ist.

Den Lösungsvektor x erhält man gemäß (6.5.14) durch Berechnung von A−1 .
Schneller zum Ziel kommt man in der Regel durch Anwendung der sog. Cra-
merschen Regel. Diese Regel besagt, dass
det Ai
xi = , i = 1, 2, ..., n. (6.5.15)
det A
Die Matrix Ai erhält man durch Ersetzung des i-ten Spaltenvektors von A
durch b, d.h.
 
a11 · · · a1(i−1) b1 a1(i+1) · · · a1n
Ai =  ... .. .. .. ..  .

. . . . 
an1 · · · an(i−1) bn an(i+1) · · · ann
Eine Herleitung von (6.5.15) findet man z.B. im zitierten Buch von Nolting.
Beispiel: Wir betrachten das Gleichungssystem
x1 + x2 + x3 = 2,
3x1 + 2x2 + x3 = 4,
5x1 − 3x2 + x3 = 0.
Die Matrizen A, Ai , bzw. ihre Determinanten sind

   
1 1 1 2 1 1
A= 3 2 1  A1 =  4 2 1 
5 −3 1 0 −3 1
⇒ det A = −12 ⇒ det A1 = −6
   
1 2 1 1 1 2
A2 =  3 4 1  A3 =  3 2 4 
5 0 1 5 −3 0
⇒ det A2 = −12 ⇒ det A3 = −6.
Die Cramersche Regel liefert

det A1 1 det A2 det A3 1
x1 = = , x2 = = 1, x3 = = .
det A 2 det A det A 2
Dies ist die Lösung des obigen Gleichungssystems.
Hinweis: Wenn bei einem inhomogenen Gleichungsssystem det A = 0, dann

ist das Gleichungssystem entweder widersprüchlich, d.h. es existiert keine Lösung,
oder es existiert keine eindeutige Lösung, sondern eine Lösungsmenge – d.h.
eine Gerade oder eine Ebene oder im Falle n > 3 eine Hyperebene.
Betrachten wir als Beispiel ein inhomogenes Gleichungssystem von drei Glei-
chungen mit drei Unbekannten.
• Beispielsweise seien zwei der drei Gleichungen von Ax = b:
x1 + x2 + x3 = 2, 3x1 + 3x2 + 3x3 = 9 .
Diese beiden Gleichungen beschreiben zwei parallele Ebenen. Offensicht-

lich kann kein Punkt x gefunden werden, der gleichzeitig auf beiden Ebe-
nen liegt; d.h. das Gleichungssystem Ax = b hat keine Lösung.
• Wenn det A = 0, können die drei Gleichungen aber auch dergestalt sein,
dass sich als Schnittmenge eine Gerade oder eine Ebene ergibt.
Details dazu in der Vorlesung Höhere Mathematik.
b) Homogenes Gleichungssystem:
Ax = 0. (6.5.16)
Dieses System hat immer die triviale Lösung
x1 = x2 = ... = xn = 0. (6.5.17)
6.6 Eigenwerte, Eigenvektoren, Diagonalisierung reell-symm. Matrizen 141
Frage: Hat (6.5.16) nichttriviale Lösungen? Antwort:

Ja, wenn det A = 0. (6.5.18)
Diese Bedingung muss offensichtlich erfüllt sein; denn im Falle von det A 6= 0
folgt aus (6.5.14), dass (6.5.16) die eindeutige Lösung x = 0 hat. Wenn det A =
0, erhält man als Lösung von (6.5.16) eine Lösungsmenge – im Falle von n = 3
ist das eine Gerade oder eine Ebene, die durch x = 0 gehen.
Zur systematischen Diskussion der Lösung von (6.5.13) und von (6.5.16) benötigt
man noch den Begriff des Rangs einer Matrix. Wir können hier aus Zeit-
gründen nicht darauf eingehen, siehe dazu die Vorlesung Höhere Mathematik.
Wir benötigen im Folgenden nur die Aussage (6.5.18).
Beispiel: Wir betrachten folgendes homogene Gleichungssystem:

2x1 + x2 = 0 2 1 x1
⇔ = 0.
6x1 + 3x2 = 0 6 3 x2
| {z }
A
Es ist det A = 0. Deshalb hat das Gleichungssystem nichttriviale Lösungen,
nämlich die Menge aller Punkte {x1 , x2 }, die die Gleichung
x2 = −2x1
erfüllen. Das ist die Gleichung einer Geraden durch den Ursprung.
6.6 Eigenwerte, Eigenvektoren, Diagonalisierung

reell-symmetrischer Matrizen
Die folgende mathematische Problemstellung und ihre Lösung wird in vielen Ge-
bieten der Mathematik und der (theoretischen) Physik benötigt. Sie wird Ihnen
spätestens in der Vorlesung Theoretische Physik I: Mechanik bei der Behandlung
des sog. Trägheitstensors starrer Körper begegnen2 .
Problemstellung: Gegeben sei eine quadratische n × n Matrix A. Frage: Gibt es
Spaltenvektoren v 6= 0, so dass die Anwendung von A auf v diesen Vektor bis auf
eine Zahl λ reproduziert?
Av = λv. (6.6.1)
Wenn ja, nennt man λ einen Eigenwert und v den zugehörigen Eigenvektor von A.
Im Folgenden beschränken wir uns auf reelle symmetrische Matrizen A:
A = (aij ) , aij = aji ∈ R, d.h. A = AT . (6.6.2)
Konkrete Rechnungen führen wir nur für reell-symmetrische 2×2 und 3×3 Matrizen
durch – nur für solche Matrizen müssen wir das Problem (6.6.1) in der Mechanik-
Vorlesung behandeln. Mit dieser Einschränkung wird die obige Fragestellung als
Eigenwertproblem für reell-symmetrische Matrizen bezeichnet.
2
Eine Anwendung des Eigenwertproblems besprechen wir in Kapitel 7.3.2, eine andere in einer
Übungsaufgabe zur Berechnung eines bestimmten Typs von n-dimensionalen Integralen.
Notation: Wir benutzen hier, d.h. in (6.6.1) und im Folgenden das Symbol v
anstelle von v, um Spaltenvektoren zu kennzeichnen – sonst werden die Formeln
ziemlich hässlich. Somit
 
v1
v =  v2  Spaltenvektor,
v3
v T = (v1 , v2 , v3 ) Zeilenvektor.
Zur Kennzeichnung des Skalarprodukts empfiehlt es sich hier, die Matrixnotation
pedantisch anzuwenden:
 
w1 X3
T
v
| {zw} = (v1 , v2 , v3 )  w2  = vi wi = v · w.
Zeilenvektor × w3 i=1
Spaltenvektor
Auf der rechten Seite steht die übliche Skalarproduktnotation.
Die Lösung des oben formulierten Eigenwertproblems erfolgt in zwei Schritten:

1) Berechnung der Eigenwerte von A und 2) die Berechnung des (der) zu einem
Eigenwert gehörigen Eigenvektors (Eigenvektoren).
In einem dritten Schritt kann mit den Eigenvektoren von A eine orthogonale Ma-
trix R konstruiert werden, mit deren Hilfe A auf eine Diagonalmatrix transformiert
werden kann. Dies bezeichnet man als Hauptachsentransformation.
6.6.1 Berechnung der Eigenwerte

Wir bringen die Matrixgleichung (6.6.1) in die Form eines homogenen Gleichungs-
systems:
(A − Iλ)v = 0. (6.6.3)
Die Bestimmung der Eigenwerte und Eigenvektoren von A läuft somit auf die Be-
antwortung folgender Frage hinaus: Für welche λi gibt es eine nichttriviale Lösung
bzw. Lösungen v von (6.6.3)? Gemäß (6.5.18) existieren solche Lösungen nur, wenn
det(A − Iλ) = 0 . (6.6.4)
Für 2 × 2 Matrizen ergibt das eine Gleichung 2. Grades, für 3 × 3 Matrizen eine
Gleichung 3. Grades, etc. Man bezeichnet
P (λ) ≡ det(A − Iλ) (6.6.5)
als das charakteristische Polynom der Matrix A. Gesucht sind somit die Null-
stellen dieses Polynoms – das sind die Eigenwerte von A.
Satz (ohne Beweis): Für reell-symmetrische n × n Matrizen A hat die Gleichung

(6.6.4) immer n reelle Lösungen λi , wobei eine k-fache Nullstelle von P (λ) wie
üblich k-fach gezählt wird3 .
3
Bei reellen nichtsymmetrischen Matrizen treten i.A. auch komplexe Eigenwerte auf.
Beispiele:
1.

10 −3
A=
−3 2

10 − λ −3
⇒ det(A − λI) = det = λ2 − 12λ + 11.
−3 2−λ
Das charakteristische Polynom hat die Nullstellen λ1 = 1, λ2 = 11.
2.
a 0
A= Diagonalmatrix
0 b
Es ist det(A − λI) = (a − λ)(b − λ). D.h. die Diagonalelemente einer Dia-
gonalmatrix sind identisch mit ihren Eigenwerten; in diesem Beispiel λ1 = a,
λ2 = b.
3. Wenn das charakteristische Polynom einer 2 × 2 Matrix A eine doppelte Null-

stelle hat, λ1 = λ2 = λ, dann muss A von der Form

λ 0
A=
0 λ
sein, siehe Seite 147 unten.
Bei reell-symmetrischen 3 × 3 Matrizen A ist das charakteristische Polynom det(A −

λI) ein Polynom 3. Grades, das drei reelle Nullstellen λ1 , λ2 , λ3 hat. Es können drei
Fälle auftreten:
1. λ1 6= λ2 6= λ3 6= λ1 .
2. Es gibt eine doppelte Nullstelle, d.h. zwei Eigenwerte sind gleich
3. λ1 = λ2 = λ3 = λ. In diesem Fall muss A von der Form

 
λ 0 0
A=  0 λ 0 
0 0 λ
sein, siehe Seite 147 unten.
Bei der Berechnung der Eigenvektoren einer reell-symmetrischen 3 × 3 Matrix A

müssen diese drei Fälle unterschieden werden.
6.6.2 Berechnung der Eigenvektoren

Nach der Bestimmung der Eigenwerte λi von A werden im zweiten Schritt die zu-
gehörigen Eigenvektoren berechnet. Zunächst einige allgemeine Aussagen.
1) Wenn v ein Eigenvektor von A zum Eigenwert λ ist, dann ist auch cv mit
c ∈ R Eigenvektor4 von A zum selben Eigenwert, denn
A(cv) = cAv = cλv = λ(cv) c ∈ R, c 6= 0. (6.6.6)
Somit ist ein Eigenvektor nur bis auf einen Faktor eindeutig definiert. Deswe-
gen ist es sinnvoll, v auf Eins zu normieren, |v| = 1. Im Folgenden bezeichnen
die v i normierte Eigenvektoren,
|v i | = 1. (6.6.7)
2) Seien v i 6= v j zwei Eigenvektoren von A zu den Eigenwerten λi bzw. λj , d.h.

diese Vektoren erfüllen die Matrixgleichungen
Av j = λj v j . (6.6.8)
Wir multiplizieren diese Gleichung von links mit v Ti und benutzen, dass nach
Voraussetzung AT = A. Die linke Seite von (6.6.8) geht über in
Regel 4
v Ti Av j = AT v i )T v j = (λi v Ti )v j = λi v i · v j .
(|{z} (6.6.9)
S. 133
A
Die rechte Seite von (6.6.8) geht über in
λj v i · v j . (6.6.10)
Da (6.6.9) und (6.6.10) gleich sind, folgt
(λi − λj )v i · v j = 0. (6.6.11)
Es gibt zwei Möglichkeiten, um diese Gleichung zu erfüllen:
(a) λi 6= λj ⇒ vi ⊥ vj .
(b) λi = λj = λ. In diesem Fall können v i und v j beliebig sein. Die Möglich-
keit der linearen Abhängigkeit, v i = cv j , ist durch die Normierungsbe-
dingung (6.6.7) jedoch ausgeschlossen, siehe die Vereinbarung unter 1).
Somit müssen v i , v j linear unabhängig sein, d.h. sie spannen eine zwei-
dimensionale Ebene E auf. Jeder Vektor x ∈ E lässt sich deshalb als
Linearkombination dieser beiden Vektoren darstellen:
x = av i + bv j a, b ∈ R.
4
Die Zahl c kann auch komplex sein.
Demzufolge ist jeder Vektor x ∈ E Eigenvektor zum Eigenwert λ, denn
Ax = A(av i + bv j ) = aλv i + bλv j = λx.
Man kann deshalb zwei beliebige, normierte Vektoren aus E wählen, die
senkrecht aufeinander stehen.
Folgerungen:
Aus (a) folgt: Wenn die Eigenwerte einer reell-symmetrischen n×n Matrix alle paar-
weise verschieden sind, dann gehört zu jedem Eigenwert λi genau ein Eigenvektor
v i , der einen eindimensionalen Raum, den sog. Eigenraum Ei zum Eigenwert λi auf-
spannt. Die verschiedenen Eigenräume sind orthogonal.
Wenn ein Eigenwert einer reell-symmetrischen n × n Matrix (n ≥ 3) dreifach ent-
artet ist, λi = λj = λk = λ, dann folgt analog zu (b), dass in diesem Fall der zu-
gehörige Eigenraum dreidimensional ist. Dieser Eigenraum wird aufgespannt durch
drei beliebige, linear unabhängige Vektoren v i , die Lösungen des Gleichungssystems
Av i = λv i sind. Man wählt o.B.d.A. orthogonale Vektoren. Der Fall einer l-fachen
Entartung (l ≤ n) sollte klar sein.
Fazit: Die obigen Betrachtungen 1) und 2) zeigen, dass für eine reell-symmetrische
n × n Matrix A folgendes gilt: Zu den n reellen Eigenwerten dieser Matrix gibt es n
normierte Eigenvektoren v i , die senkrecht aufeinander stehen.
v i · v j = δij , |v i | = 1, i, j = 1, ..., n. (6.6.12)
Für reell-nichtsymmetrische Matrizen ist das nicht unbedingt der Fall!
Beispiel: Wir machen uns anhand der Matrix A aus Beispiel 1 auf Seite 143
klar, wie man die zu den Eigenwerten λ1 = 1 und λ2 = 11 von A gehörenden
Eigenvektoren berechnet. Wir müssen die beiden folgenden Gleichungssysteme lösen:
Av 1 = v 1 und Av 2 = 11v 2 .
• λ1 = 1 :
9 −3 v1,1
(A − 1I)v 1 = 0 ⇒ = 0.
−3 1 v1,2
Alle Werte (v1,1 , v1,2 ), die 3v1,1 = v1,2 erfüllen, sind Lösungen dieses Glei-
chungsystems. Wir setzen

v1,1 = t t Normierung 1 1
⇒ v1 = −→ v 1 = √ .
v1,2 = 3t 3t 10 3
• λ2 = 11 :

−1 −3 v2,1
(A − 11I)v 2 = 0 ⇒ = 0.
−3 −9 v2,2
Wir setzen

v2,1 = t t Normierung 1 3
⇒ v2 = −→ v2 = √ .
v2,2 = − 3t − 3t 10 −1
Offensichtlich ist v 1 ⊥ v 2 . Beachten Sie, dass die Vorzeichen von v 1 und v 2 frei
wählbar sind.
6.6.3 Diagonalisierung (Hauptachenstransformation)

Das Ergebnis (6.6.12) besagt, dass die normierten Eigenvektoren {v 1 , v 2 , ..., v n }
einer reell-symmetrischen Matrix A eine Orthonormalbasis bilden. Diese ONB ist
durch eine orthogonale Transformation mit der ONB {e1 , e2 , ..., en } verknüpft. Wir
konstruieren nun die Transformationsmatrix R, die zwischen diesen beiden Basen
vermittelt, und zwar wieder für den Fall reell-symmetrischer 3 × 3 Matrizen A.
Wir bilden aus den normierten Eigenvektoren v 1 , v 2 , v 3 von A die folgende
Matrix:    T 
v1,1 v1,2 v1,3 v1
R =  v2,1 v2,2 v2,3  =  v T2  , (6.6.13)
T
v3,1 v3,2 v3,3 v3
 
v1,1 v2,1 v3,1
RT =  v1,2 v2,2 v3,2  = (v 1 , v 2 , v 3 ). (6.6.14)
v1,3 v2,3 v3,3
Offensichtlich gilt wegen (6.6.12):



1 0 0
RRT = RT R =  0 1 0  , (6.6.15)
0 0 1
d.h. R ist eine orthogonale Matrix.

Beachte: R muss keine reine Drehung sein. Im Allgemeinen ist R von der Form:
Drehung × Spiegelung.
Hinweis: Die Transformation ei → v i wird durch RT vermittelt. Es ist
v 1 = RT e1 , v 2 = RT e2 , v 3 = RT e3 , (6.6.16)
nachrechnen!.
Diagonalisierung von A: Wir bilden das folgende Matrixprodukt und verwen-

den bei der Berechnung des Produkts die Eigenwertgleichung Av i = λi v i :

 T   T 
v1 v1
T T 
RAR =  v2 A (v 1 , v 2 , v 3 ) =  v T2  (λ1 v 1 , λ2 v 2 , λ3 v 3 )
v T3 v T3
   
λ1 v 1 · v 1 λ2 v 1 · v 2 λ3 v 1 · v 3 λ1 0 0
=  λ1 v 2 · v 1 λ2 v 2 · v 2 λ3 v 2 · v 3  =  0 λ2 0  .
λ1 v 3 · v 1 λ2 v 3 · v 2 λ3 v 3 · v 3 0 0 λ3
Diese Rechnung zeigt folgendes: Wir können jede reell-symmetrische Matrix A mit
Hilfe der gemäß (6.6.13) aus ihren Eigenvektoren v 1 , ..., v n gebildeten, orthogona-
len Matrix R auf eine Diagonalmatrix transformieren. Die Diagonalelemente dieser
Matrix sind die Eigenwerte λi von A.
 
λ1 0 0
RART =  0 λ2 0  . (6.6.17)
0 0 λ3
| {z }
Λ
Die Physiker nennen das Hauptachsentransformation. Der Begriff wird unten erklärt.
Beispiele:
1) Wir betrachten wieder die Matrix A aus Beispiel 1 auf Seite 143. Die normierten
Eigenvektoren dieser Matrix wurden auf Seite 145 berechnet. Wir bilden mit diesen
Eigenvektoren die in (6.6.13) definierte orthogonale Matrix

v1,1 v1,2 1 1 3 T 1 1 3
R= =√ ⇒ R =√
v2,1 v2,2 10 3 −1 10 3 −1

T 1 1 3 10 −3 1 3 1 0
⇒ RAR = = .
10 3 −1 −3 2 3 −1 0 11
Hinweis: R ist zwar eine orthogonale Matrix, aber in diesem Beispiel keine reine
Drehmatrix, weil det R = −1. Wie bereits betont wurde, ist das Vorzeichen der
Eigenvektoren v 1 und v 2 jedoch beliebig; wir hätten z.B.

1 3 0 1 −3
anstelle von v 2 = √ den Eigenvektor v 2 = √
10 −1 10 +1
wählen können. Die resultierende Matrix

0 1 1 −1
R =√ ⇒ det R0 = +1
10 3 1
ist eine Drehmatrix. Das Resultat der Hauptachsentransformation bleibt gleich:
R0 AR0T = diag(1, 11).
2) Sei A eine reell-symmetrische n × n Matrix, deren Eigenwerte n-fach entartet
sind: λ1 = . . . = λn = λ. Sei R die orthogonale Matrix, die A diagonalisiert, d.h.
RART = λI. Daraus folgt, dass A = λRT IR = λI.
Fazit: In diesem Schritt haben wir gezeigt, wie man für eine gegebene reell-symme-
trische Matrix A aus ihren normierten Eigenvektoren eine orthogonale Matrix R
konstruieren kann, so dass RART = Λ eine Diagonalmatrix ist. Diese Matrixtrans-
formation entspricht geometrisch dem Übergang in ein neues Koordinatensystem.
Das sieht man wie folgt. In der ,,alten” Basis lautet die Eigenwertgleichung:
Av i = λi v i . (6.6.18)
Man erinnere sich, dass v i den Spaltenvektor bezeichnet, dessen Komponenten die
Entwicklungskoeffizienten des jeweiligen Eigenvektors nach der alten Basis sind. Wir
formen die Gleichung (6.6.18) mit Hilfe der Identität I = RT R folgendermaßen um:
Av i = AIv i = ART Rv i . (6.6.19)
Wir setzen (6.6.19) in (6.6.18) ein und multiplizieren von links mit R. Dann
T
RAR Rv i = λi Rv i
| {z } |{z} |{z}
Λ ṽ i ṽ i
⇒ Λṽ i = λi ṽ i ,
wobei Λ die diagonalisierte Matrix und ṽ i = Rv i der Eigenvektor v i in der neuen

Basis ist. Der Spaltenvektor ṽ i hat die Form ṽ Ti = (0, ..0, 1, 0, ..0), wobei die Eins in
der i-ten Zeile steht. Die neue Basis, bezüglich der RART diagonal ist, bezeichnet
man als die Hauptachsen des jeweiligen Problems.
Hinweis: Beachten Sie, dass das Transformationsgesetz RART der Hauptachsen-

transformation (6.6.17) auf der hier gewählten Definition (6.6.13) der orthogonalen
Matrix R beruht. Alternativ kann man R auch durch
R = (v 1 , v 2 , v 3 ) (6.6.20)
definieren. Dann ist  

v T1
RT =  v T2  .
v T3
Das Transformationsgesetz lautet jetzt RT AR; denn gemäß der Regeln der Matrix-
multiplikation wirkt A auf die Spaltenvektoren der rechts von ihr stehenden Matrix,
in diesem Fall also auf die v i . Unter Verwendung der Eigenwertgleichung Av i = λi v i
erhält man
RT AR = diag(λ1 , λ2 , λ3 ) .
Kapitel 7
Funktionen mehrerer reeller

Variablen
Wir besprechen in diesem Kapitel einige für uns wichtige Aspekte der Differential-
und Integralrechnung für reelle Funktionen mehrerer reeller Variablen
f (x1 , x2 , ..., xn ), x1 , x2 , ..., xn ∈ R . (7.0.1)
Zunächst zum Begriff des Feldes in der Physik.
7.1 Felder in der Physik

In der Physik hängen viele Größen von den Koordinaten des Ortes ab, an dem die
jeweilige Größe gemessen wird; manche Größen hängen zudem noch vom Zeitpunkt
t ab, zu dem sie gemessen werden. Eine solche Größe bezeichnet man in der Physik
als Feld.
Beispiele:
1. Temperatur an einem Punkt (x1 , x2 , x3 ) der Erdatmosphäre zur Zeit t:
T = T (x1 , x2 , x3 , t). (7.1.1)
2. Die Massendichte eines (in)homogenen Körpers:

ρ = ρ(x1 , x2 , x3 ). (7.1.2)
3. Eine ortsabhängige, aber nicht explizit zeitabhängige Kraft, z.B. die Gravita-
tionskraft zwischen zwei Massenpunkten mit Massen m1 , m2 , die sich an den
Orten r 1 , r 2 befinden. Die Gravitationskraft, die das Teilchen 2 auf das Teil-
chen 1 ausübt, ist
(r 1 − r 2 )
F G,2→1 (r 1 , r 2 ) = −Gm1 m2 , (7.1.3)
|r 1 − r 2 |3
wobei G die Gravitationskonstante bezeichnet. Diese Formel wird im Mechanik-

Teil der Vorlesung besprochen; siehe dazu auch (7.4.11).
Hinweis: Die Gravitationskraft hängt über die Ortsvektoren der Massen im-
plizit von der Zeit t ab:
r 1 = r 1 (t) , r 2 = r 2 (t).
4. Kräfte, die vom Ort und explizit vom Zeitpunkt ihrer Wirkung abhängen:
F = F (x1 , x2 , x3 , t) ≡ F (r, t). (7.1.4)
Konkrete Beispiele dazu im Mechanik-Teil der Vorlesung.
Felder, die nicht explizit von der Zeit abhängen, nennt man stationäre oder statische
Felder.
7.1.1 Skalares Feld

In der nichtrelativistischen Physik bezeichnet man eine Größe φ = φ(x, t) als ska-
R
lares Feld, wenn das Feld bei einer Drehung KS → KS’ des Koordinatensystems,
3
X
x0i = Rij xj R Drehmatrix, (7.1.5)
j=1
folgendes Transformationsgesetz erfüllt:
φ0 (x01 , x02 , x03 , t) = φ(x1 , x2 , x3 , t). (7.1.6)
Dabei ist φ0 das skalare Feld, also die Funktion der Koordinaten x0i , mit der die
physikalische Größe vom gedrehten Koordinatensystem aus beschrieben wird.
Beispiele:
• Das Temperaturfeld T (r, t) aus obigem Beispiel 1.
• Die Dichte ρ(r) aus obigem Beispiel 2.
• φ(r) = a · r, wobei a ein konstanter Vektor ist.
Die funktionale Form von φ0 erhält man durch Einsetzen der Rücktransformation
KS’ → KS, d.h.
3
X
xi = (R−1 )ij x0j (7.1.7)
j=1
in φ(x1 , x2 , x3 , t).
7.1 Felder in der Physik 151
7.1.2 Vektorfeld
In der nichtrelativistischen Physik bezeichnet man eine dreikomponentige Größe
A1 (r, t), A2 (r, t), A3 (r, t)
als Vektorfeld, wenn sie sich bei Drehungen (7.1.5) des Koordinatensystems trans-
formiert wie
3
X
A0i (x01 , x02 , x03 , t) = Rij Aj (x1 , x2 , x3 , t) i = 1, 2, 3. (7.1.8)
j=1
Die funktionale Form der A0i erhält man durch Einsetzen von (7.1.7) in die rechte
Seite von (7.1.8).
Kompakte Notation:
A0 (r 0 , t) = RA(r, t), (7.1.9)
wobei r und r 0 die jeweiligen Koordinatenvektoren bezeichnen; siehe unten.
Beispiele:
• Kraftfelder, etwa das obige Beispiel 2,
• Elektrisches Feld E(r, t),
• Magnetisches Feld B(r, t),
• Geschwindigkeitsfeld v(r, t) einer Flüssigkeit.
Ein Vektorfeld bezeichnet man in der Mathematik auch als vektorwertige Funktion
mehrerer reeller Variablen.
Physikalische Felder sind dimensionsbehaftet. Beispiele:
Temperaturfeld T (r, t) [T ] = Kelvin

Masse
Dichte ρ(r) [ρ] = = kg/m3
Volumen
Kraftfeld K(r, t) [K] = kg m/s2 = N
etc.
Nun zurück zur Mathematik. Im Folgenden kümmern wir uns nicht um die Di-
mension des jeweiligen Feldes, d.h. der jeweiligen Funktion mehrerer reeller Varia-
blen.
7.2 Stetigkeit, partielle Ableitungen, totales Dif-

ferential
Notation: Im Folgenden bezeichnen wir die unabhängigen Variablen mit x, y, z, ...
oder x1 , x2 , x3 , .... In kompakter Notation:
r ≡ (x, y, z, ...),
oder r ≡ (x1 , x2 , x3 , ..., xn ), (7.2.1)
oder x ≡ (x1 , x2 , x3 , ..., xn ).
Wir betrachten eine reelle Funktion mehrerer reeller Variablen
f (x, y, z, ...) ≡ f (r), (7.2.2)
oder einen Satz reeller Funktionen
fi (x1 , x2 , ..., xn ), i = 1, ..., m, (7.2.3)
die die Komponenten eines Vektorfeldes bilden:
f (r) = f1 e1 + f2 e2 + ...fm em . (7.2.4)
• In der Mechanik treten typischerweise zwei- oder dreikomponentige Vektorfel-

der auf.
• Bis auf weiteres benutzen wir kartesische ONB
ei · ej = δij , ei konstante Vektoren. (7.2.5)
• Später betrachten wir auch ONB, bei denen die Basisvektoren ei von den
Ortskoordinaten abhängen, insbesondere die Polarkoordinaten- und Zylinder-
koordinatenbasis.
• Anstelle von (7.2.5) benutzen wir oft die Spalten- oder Zeilenvektordarstellung
 
f1
f =  ...  oder f = (f1 , f2 , ..., fm ) .
 
fm
D.h. wir kennzeichnen in der Regel nicht mehr explizit den Unterschied zwi-
schen einem Vektorfeld f und seiner Komponentendarstellung f .
7.2 Stetigkeit, partielle Ableitungen, totales Differential 153
Zunächst betrachten wir eine reelle Funktion f (r). Die Funktion definiert eine Ab-
bildung
f : Ω ⊆ Rn 7→ R .
Wenn das Definitionsgebiet Ω der Funktion nicht der ganze Rn ist, soll es sich um
eine nichtdisjunkte = wegzusammenhängende Teilmenge des Rn handeln, die offen
ist. Mit wegzusammenhängend bezeichnet man eine Teilmenge Ω ⊂ Rn , bei der sich je
zwei Punkte x, y ∈ Ω durch einen Weg = Kurve verbinden lassen, der ganz in Ω liegt.
Beachten Sie, dass im Fall n > 1 ein wegzusammenhängendes Gebiet Ω durchaus
Löcher haben kann. Im Fall n > 2 können auch Volumina aus Ω herausgeschnitten
sein. Offen heisst, dass der Rand der Teilmenge Ω weggelassen wird. Wenn man
abgeschlossene Teilmengen zulässt, kann man die unten eingeführten Eigenschaften
der Stetigkeit und (partiellen) Differenzierbarkeit von Funktionen an einem Punkt
x0 auf dem Rand nur mit Einschränkungen definieren, nämlich für Annäherungen
an x0 innerhalb des Definitionsgebiets (vergleiche mit einseitiger Stetigkeit im Falle
von Funktionen einer Variablen, Kapitel 2). Wir wollen das hier vermeiden; deshalb
soll der Definitionsbereich Ω im Folgenden, falls nicht explizit anders definert, immer
die genannten Eigenschaften haben.
Im Abschnitt 7.7 benötigen wir noch den Begriff des einfach zusammenhängenden
Gebiets.
Möglichkeiten der graphischen Darstellung von f (r):
1. Wenn die Funktion f nur von zwei Variablen abhängt, f = f (x, y) dann ist
eine Darstellung als Fläche über der xy-Ebene möglich; siehe die in den Ab-
bildungen 7.1, 7.2 und 7.3 gezeigten Beispiele. Diese Abbildungen entsprechen
Projektionen von Raumpunkten (x, y, f ) auf die Sichtfläche, die ein Compu-
terprogramm1 – z.B. root, Mathematica oder Maple – für uns erledigen kann.
Man kann sich aber auch durch strikt zweidimensionale Zeichnungen graphisch
einen Einblick in die Eigenschaften einer Funktion f (x, y) verschaffen. Dazu
zeichnet man Höhenlinien, in der Mechanik und Elektrostatik Äquipotential-
linien, bei Temperaturverteilungen T (x, y) Isothermen, bei Luftdruckvertei-
lungen Isobaren genannt. Diese Höhenlinien erhält man folgendermaßen. Man
zeichnet in der xy-Ebene die Menge aller Punkte x, y, die die Gleichung
f (x, y) = c
für einen festen Wert c erfüllen. Diese Menge aller Punkte x, y ist eine Kurve,
die sog. Höhenlinie, auf der die Funktion f (x, y) den Wert c annimmt2 . Man
variiert dann c äquidistant, d.h. man zeichnet ebenfalls die zu 2c, 3c, 4c, etc.
gehörenden Höhenlinien. Die ,,Dichte” der Höhenlinien in der xy-Ebene ist ein
1
Die Abbildungen 7.1, 7.2 und 7.3 wurden mit dem Programm root erstellt, das in der Teil-
chenphysik verbreitet ist.
2
Die Werte c, für die die Gleichung f (x, y) = c erfüllbar ist, hängen offensichtlich von den
Eigenschaften der jeweiligen Funktion f ab. Wenn beispielsweise f (x, y) ≥ 0 ∀x, y ∈ R, dann muss
natürlich c ≥ 0 gewählt werden.
2 2
e-x -y
f(x,y)
0.8
0.6
0.4
0.2
0
2
y 1.5
1
0.5
0 1.5 2
-0.5 0.5
1 x
-1 0
-0.5
-1.5 -1
-2 -2 -1.5
2 −y 2
Abbildung 7.1: f (x, y) = e−x .
Maß dafür, wie stark bzw. wie wenig man die Variablen x, y ändern muss, damit
sich der Funktionswert f (x, y) um eine ,,Einheit” c ändert. In Fig. 7.9 sind
Höhenlinien (= Äquipotentiallinien) für die Funktionen aus den Abbildungen
7.1, 7.2 und 7.3 dargestellt. Bei den beiden ersten Beispielen sind das Kreise,
beim dritten Beispiel Hyperbeln.
2. Für Funktionen, die von n ≥ 3 Variablen abhängen, ist eine graphische Ge-
samtdarstellung nicht möglich. Funktionen f = f (x, y, z), die von drei Varia-
blen abhängen, können z.B. folgendermaßen graphisch dargestellt werden:
• Als zweidimensionale Schnitte. Man hält eine Variable fest, beispielsweise
z = z0 und stellt f = f (x, y, z0 ) als Fläche über der xy-Ebene dar.
• Als Niveaufläche, in der Mechanik Äquipotentialfläche genannt. Eine Ni-
veaufläche ist die Menge aller Punkte im R3 , für die die Funktion f einen
vorgegebenen konstanten Wert annimmt: f (x, y, z) = const. Diese Glei-
chung beschreibt eine Fläche im Raum. Wenn f eine lineare Funktion in
x, y, z ist, handelt es sich um eine Ebene.
7.2.1 Stetigkeit
Eine Funktion f (x1 , ..., xn ) von n Variablen heißt stetig im Punkt (x01 , ...x0n ), wenn
f (x1 , ..., xn ) → f (x01 , ...x0n )
x2+y2
f(x,y)
200
180
160
140
120
100
80
60
40
20
0
10
y 8
6
4
2 10
0 8
-2 4 6 x
-4 0 2
-6 -2
-8 -6 -4
-10 -10 -8
Abbildung 7.2: f (x, y) = x2 + y 2 .
x2-y2
f(x,y)
100
50
-50
-100
10
y 8
6
4
2 10
0 8
-2 4 6 x
-4 0 2
-6 -2
-8 -6 -4
-10 -10 -8
Abbildung 7.3: f (x, y) = x2 − y 2 .

konvergiert, und zwar für beliebige x → x0 aus Ω wobei der Abstand

v
u n
uX
d = t (xi − x0i )2 → 0 .
i=1
Die in den Abb. 7.1, 7.2 und 7.3 dargestellten Funktionen sind stetig.
Als Beispiel für eine Unstetigkeitsstelle einer Funktion betrachten wir
xy
f (x, y) = falls (x, y) 6= (0, 0) und f (0, 0) = 0 . (7.2.6)
x2 + y2
Diese Funktion ist an der Stelle x0 = (0, 0) unstetig. Zwar ist
lim f (x, 0) = 0 , lim f (0, y) = 0 ,

x→0 y→0
aber
1
lim f (x, x) = lim f (y, y) =
.
x→0 y→0 2
Dieses Beispiel belegt, dass eine Funkion f (x) bei x0 nur dann stetig ist, wenn der
Funktionswert f (x0 ) bei Annäherung an x0 aus allen Richtungen in Ω angenommen
wird.
7.2.2 Partielle Ableitungen

Wir betrachten eine der in den Abb. 7.1, 7.2 und 7.3 gezeigten Funktionen an einem
Punkt x, y. Es werde y festgehalten. Frage: Wie ändert sich f (x, y), wenn wir x
ändern? Die Steigung der Tangente3 an f im Punkt x, y in x-Richtung, d.h.
x, y → x + h, y h ∈ R, h → 0,
ist durch die Ableitung von f (x, y) nach x bei festgehaltenem y gegeben, die man
völlig analog zur Ableitung von Funktionen einer Variablen berechnet. Man nennt
diese Ableitung die partielle Ableitung nach x. Sie ist definiert durch
∂f (x, y) f (x + h, y) − f (x, y)
≡ lim . (7.2.7)
∂x h→0 h
Beispiel:
2 +y 2 )
f (x, y) = e−(x ,
siehe Abbildung 7.1. Die partielle Ableitung nach x ist
∂f (x, y) 2 2
= −2xe−(x +y ) . (7.2.8)
∂x
3
Diese Tangente liegt in der Ebene y = const, das ist die Ebene parallel zur xz-Ebene, in der
der Punkt (x, y) liegt.
Die partielle Ableitung nach y bei festgehaltenem x ist analog definiert:
∂f (x, y) f (x, y + h) − f (x, y)

≡ lim . (7.2.9)
∂y h→0 h
Für das obige Beispiel erhalten wir
∂f (x, y) 2 2
= −2ye−(x +y ) . (7.2.10)
∂y
Oft verwendet man folgende Notation: Es sei
f = f (x1 , x2 , ..., xn ).
Die partielle Ableitung nach einer Variablen xi bei festgehaltenen anderen Va-
riablen wird durch die Symbole
∂
f ≡ ∂xi f ≡ ∂i f (7.2.11)
∂xi
gekennzeichnet. Wir nehmen hier an, dass die Funktionen f hinreichend glatt sind,
so dass die partiellen Ableitungen 1. Ordnung (7.2.11) existieren.
Fazit: Die partielle Ableitung nach einer Variablen xi wird wie die gewöhnliche Ab-
leitung einer Funktion einer Variablen bestimmt – d.h. man kann die Rechenregeln
für die Ableitung aus Kapitel 2 benutzen –, die anderen Variablen werden bei der
Berechnung von ∂xi f wie Konstante behandelt.
7.2.3 Totales Differential, Differenzierbarkeit

Wir betrachten Funktionen f = f (x1 , x2 , ..., xn ), für die ihre partiellen Ableitun-
gen bei x existieren und stetig sind. Das totale Differential df (auch vollständiges
Differential genannt) am Punkt x ist definiert durch
n
X ∂f
df ≡ dxi . (7.2.12)
i=1
∂x i
Wir erinnern uns an die analoge Größe bei einer Funktion einer Variablen, f = f (x):
df
df = dx.
dx
Salopp gesprochen gibt das totale Differential df die infinitesimale Funktionsände-

rung bei einer infinitesimalen Änderung dx von x an.
z
z = f (x0 , y)
y
x
f (x, y)
(x0 , y0 ) ∂f
z = f (x, y0 ) ∂x
dx
Ebene entlang des dy

Koordinatensystems dx
∂f ∂f
∂f
df = ∂x
dx + ∂y
dy
∂y
dy Tangentialebene
Abbildung 7.4: Das totale Differential liefert die Gleichung der Tangentialebene an
die Hyperfläche f in einem Punkt P = (x0 , y0 , z0 = f (x0 , y0 )).
Geometrische Interpretation: Die Funktion f = f (x1 , ..., xn ) beschreibt eine

Hyperfläche über der Menge x ∈ Ω ⊆ Rn . Zu x gehört der Punkt (x1 , ..., xn , f ) ≡
P auf dieser Hyperfläche. Das totale Differential (7.2.12) liefert die Gleichung der
Tangential(hyper)ebene an die Hyperfläche im Punkt P , siehe Abbildung 7.4. Im
Fall zweier Variablen ist das vollständige Differential
df = ∂x f (x0 , y0 )dx + ∂y f (x0 , y0 )dy .
Man setzt nun dx = x − x0 , dy = y − y0 , df = z − z0 . Damit erhält man die

Ebenengleichung
z − z0 = ∂x f (x0 , y0 )(x − x0 ) + ∂y f (x0 , y0 )(y − y0 ) .
Diese Gleichung beschreibt die in Fig. 7.4 dargestellte Tangentialebene im Punkt

P = (x0 , y0 , z0 ).
Das totale Differential hat viele Anwendungen, z.B. bei der Fehlerrechnung für eine
Observable f , die von mehreren Variablen xj abhängt. Die xj werden durch Mes-
sungen bestimmt und sind mit Messfehlern behaftet.
Differenzierbarkeit:
Wir besprachen bisher die partiellen Ableitungen einer Funktion mehrerer Variablen.
Wenn eine oder alle partiellen Ableitungen von f existieren, heisst f partiell differen-
zierbar. Wann bezeichnet man eine Funktion als differenzierbar an einem Punkt x0 ?
Salopp gesprochen dann, wenn der jeweilige Differentialquotient bei Annäherung

an f (x0 ) aus jeder Raumrichtung existiert (siehe Vorlesung Höhere Mathematik).
Wir begnügen uns hier damit, auf folgenden Satz (ohne Beweis) hinzuweisen: Eine
Funktion f = f (x1 , . . . , xn ) heißt differenzierbar an der Stelle x0 , wenn alle partiel-
len Ableitungen ∂i f an dieser Stelle existieren und stetig sind.
Allein aus der Existenz der partiellen Ableitungen von f folgt noch nicht ihre Dif-
ferenzierbarkeit. Wir betrachten als Beispiel die bereits oben untersuchte Funktion
(7.2.6). Für diese Funktion existieren die partiellen Ableitungen ∂x f , ∂y f für alle
(x, y) ∈ R2 ; insbesondere ist ∂x f (0, 0) = ∂y f (0, 0) = 0. Prüfen Sie die letztgenannte
Aussage unter Benutzung der Definitionen (7.2.7), (7.2.9) der partiellen Ableitungen
zu Hause nach! Allerdings zeigten wir oben, dass f bei (0, 0) nicht stetig ist. Somit
können auch die partiellen Ableitungen an dieser Stelle nicht stetig sein und f ist
nach dem soeben zitierten Satz bei (0, 0) nicht differenzierbar.
7.2.4 Regeln für die partiellen Ableitungen

Wir besprechen nun einige für die Praxis wichtige Regeln zur Berechnung partieller
Ableitungen. Seien f = f (x1 , ..., xn ) und g = g(x1 , ..., xn ) differenzierbare Funktio-
nen, also hinreichend glatt.
1. Summenregel:
∂i (f + g) = ∂i f + ∂i g .
2. Produktregel:
∂i (f g) = (∂i f )g + f (∂i g) .
3. Quotientenregel:

f g∂i f − f ∂i g
∂i = , falls g(x) 6= 0 .
g g2
Diese Regeln können direkt aus der Differentialrechnung für Funktionen einer Va-
riablen übernommen werden.
Kettenregel:
Wir erinnern uns zunächst an diese Regel für Funktionen einer Variablen: f = f (u)
und u = u(t):
df (u(t)) df du
= . (7.2.13)
dt du dt
Nun zu Funktionen mehrerer Variablen – o.B.d.A. betrachten wir Funktionen, die
von drei Variablen abhängen. Es sei
f = f (x1 , x2 , x3 ) und x1 = x1 (t1 , t2 , t3 ), x2 = x2 (t1 , t2 , t3 ), x3 = x3 (t1 , t2 , t3 ) .

Berechnet werden sollen die partiellen Ableitungen von f nach t1 , t2 und t3 . Da alle
xj von diesen Variablen abhängen, erhalten wir
∂f ∂f ∂x1 ∂f ∂x2 ∂f ∂x3

= + + , i = 1, 2, 3 . (7.2.14)
∂ti ∂x1 ∂ti ∂x2 ∂ti ∂x3 ∂ti
Die Formel sollte plausibel sein; den Beweis sollten Sie in der Vorlesung über Höhe-
re Mathematik erhalten. Die Verallgemeinerung auf Funktionen von n Variablen ist
evident. Die Kettenregel benötigt man beispielsweise, wenn wir eine physikalische
Größe, etwa die potentielle Energie V eines Teilchens, als Funktion der kartesi-
schen Ortskoordinaten xi des Teilchens kennen. Manchmal ist es sinnvoll, andere
Koordinaten zu wählen, z.B. Kugelkoordinaten r, θ, φ. Man drückt dann die karte-
sischen Koordinaten durch diese Variablen aus, xi = xi (r, θ, φ), siehe Abschnitt 7.5.
Will man z.B. die Änderung von V bei Änderung des Winkels θ bestimmen (bei
festgehaltenen Variablen r und φ), wird ∂V /∂θ mit Hilfe der Kettenregel (7.2.14)
berechnet.
Man benötigt die Kettenregel (7.2.14) oft für verschiedene Spezialfälle, die für uns
von Interesse sind. Dewegen besprechen wir diese Fälle explizit.
1. Spezialfall 1: Sei f = f (u) und u = u(x1 , . . . , xn ). Dann erhalten wir mit

(7.2.14):
df (u)
∂xi f = ∂xi u . (7.2.15)
du
Beispiele: 1) f (x, y) = exp(−x2 − y 2 ), siehe Seite 156. Zur Berechnung von ∂x f
und ∂y f ist es offensichtlich zweckmässig, f als zusammengesetzte Funktion
aufzufassen, f = exp u mit u = −x2 − y 2 und (7.2.15) anzuwenden.
2) Bei der Berechnung der partiellen Ableitungen nach den Ortskoordinaten
xi einer Funktion f = f (r), die nur vom Betrag r = (x21 + x22 + x23 )1/2 des
Ortsvektors abhängt, wird (7.2.15) ebenfalls benutzt – siehe etwa die Beispiele
3 und 4 auf Seite 174.
2. Spezialfall 2: Wir betrachten o.B.d.A. eine Funktion f , die von zwei Variablen
abhängt, f = f (x1 , x2 ), und es sei x1 = x1 (t1 ), x2 = x2 (t2 ). In diesem Fall sind
x1 , x2 Funktionen von zwei verschiedenen, voneinander unabhängigen Varia-
blen ti . Bei einer Änderung von t1 (t2 ) ändert sich nur x1 (x2 ), aber nicht x2
(x1 ). Dann ist die partielle Ableitung von f nach t1 als Spezialfall von (7.2.14)
gegeben durch
∂f (x1 (t1 ), x2 (t2 )) ∂f dx1
= . (7.2.16)
∂t1 ∂x1 dt1
Analog ist
∂f (x1 (t1 ), x2 (t2 )) ∂f dx2
= . (7.2.17)
∂t2 ∂x2 dt2
3. Spezialfall 3: Wir betrachten den Fall, dass alle Variablen xi von der selben
Variablen t abhängen. Beispiel:
f = f (x1 (t), x2 (t)).
Wenn sich t ändert, ändern sich somit beide Variablen x1 , x2 ; d.h. f hängt
offensichtlich nur von einer unabhängigen Variablen t ab. Die gewöhnliche
Ableitung, df /dt, kann man ebenfalls als Spezialfall der allgemeinen Ketten-
regel (7.2.14) erhalten. Wir wollen hier aber df /dt durch Anwendung der De-
finition der Ableitung einer Funktion einer Variablen herleiten. Wir erhalten
df f (x1 (t + ∆t), x2 (t + ∆t)) − f (x1 (t), x2 (t))

= lim
dt ∆t→0 ∆t
0
z }| {
f (x1 + ∆x1 , x2 + ∆x2 ) −f (x1 ,x2 +∆x2 )+f (x1 ,x2 +∆x2 ) −f (x1 , x2 )
= lim
∆t→0 ∆t
f (x1 + ∆x1 , x2 + ∆x2 ) − f (x1 , x2 + ∆x2 ) ∆x1
= lim
∆t→0 ∆x1 ∆t
f (x1 , x2 + ∆x2 ) − f (x1 , x2 ) ∆x2
+ lim .
∆t→0 ∆x2 ∆t
Im Limes ∆t → 0:
∆t→0
∆xi ≡ xi (t + ∆t) − xi (t) −−−→ 0 , i = 1, 2
und
∆xi ∆t→0 dxi
−−−→ .
∆t dt
Somit:
df (x1 (t), x2 (t)) f (x1 + ∆x1 , x2 ) − f (x1 , x2 ) dx1
= lim
dt ∆t→0 ∆x1 dt
f (x1 , x2 + ∆x2 ) − f (x1 , x2 ) dx2
+ lim (7.2.18)
∆t→0 ∆x2 dt
∂f dx1 ∂f dx2
= + .
∂x1 dt ∂x2 dt
Dieses Ergebnis erhält man, wie gesagt, auch als Spezialfall von (7.2.14).
Dieses Resultat lässt sich sofort auf n Variablen übertragen. Es sei
f = f (x1 (t), x2 (t), ..., xn (t)).
Dann ist
n
df X ∂f dxi
= . (7.2.19)
dt i=1
∂xi dt
Wenn f noch zudem explizit von t abhängt,
f = f (x1 (t), x2 (t), ..., xn (t), t),
dann
n
df X ∂f dxi ∂f
= + . (7.2.20)
dt i=1
∂xi dt ∂t
Dies ist wiederum ein Spezialfall der allgemeinen Kettenregel (7.2.14).

Beispiel für eine Anwendung in der Mechanik: Die potentielle Energie V eines
Systems aus n0 Massenpunkten im R3 , das keinen weiteren Einschränkungen
unterliegt, hängt von den 3n0 = n Ortskoordinaten dieser Massenpunkte ab,
die Funktionen der Zeit t sind. Falls eine oder mehrere Kräfte, die die Dynamik
des Systems bestimmen, explizit von der Zeit abhängen, hängt V zudem noch
explizit von der Zeit ab. Mit Hilfe von (7.2.19) bzw. (7.2.20) berechnet man
die zeitliche Änderung dV /dt der potentiellen Energie des Systems.
Partielle Ableitungen höherer Ordnung:

Diese sind wie die höheren Ableitungen von Funktionen einer Variablen rekursiv
definiert. Es gibt jetzt aber i. A. eine Vielzahl von Möglichkeiten, partielle Ableitun-
gen höherer Ordnung zu bilden. Wir nehmen an, dass f = f (x1 , . . . , xn ) hinreichend
glatt ist, so dass diese höheren Ableitungen auch existieren. Betrachten wir das obi-
2 2
ge Beispiel, f (x, y) = e−(x +y ) . Wir können ∂f /∂x, Gl. (7.2.8), nach x oder nach y
ableiten:
∂2

∂ ∂f 2 2 2 2
≡ 2
f = −2e−(x +y ) + 4x2 e−(x +y ) ,
∂x ∂x ∂x
∂2

∂ ∂f 2 2
≡ f = +4xye−(x +y ) .
∂y ∂x ∂y∂x
Ebenso können wir ∂f /∂y, Gleichung (7.2.10), nach x oder nach y ableiten.
∂ ∂f 2 2
= +4xye−(x +y ) ,
∂x ∂y
∂ ∂f 2 2 2 2
= −2e−(x +y ) + 4y 2 e−(x +y ) .
∂y ∂y
Der Vergleich dieser Resultate zeigt, dass
∂ ∂ ∂ ∂
f= f. (7.2.21)
∂y ∂x ∂x ∂y
Frage: Ist das immer so? Auskunft darüber gibt der folgende
Satz (von H.A. Schwarz): Es sei f (x) in einer Umgebung von x0 zweifach stetig dif-
ferenzierbar, d.h. alle ersten partiellen Ableitungen ∂xi f seien stetig differenzierbar
7.3 Taylorentwicklung 163
und alle zweiten partiellen Ableitungen ∂xi ∂xj f seien stetig. Dann kann die Reihen-
folge beim Bilden der gemischten zweiten Ableitungen vertauscht werden:
∂xj ∂xi f |x0 = ∂xi ∂xj f |x0 .
Ein Beispiel, bei dem die Voraussetzungen dieses Satzes nicht erfüllt sind, behandeln
wir in den Übungen.
Notation:
∂ ∂ ∂2
f≡ f ≡ ∂xi ∂xj f ≡ ∂i ∂j f. (7.2.22)
∂xi ∂xj ∂xi ∂xj
7.3 Taylorentwicklung
In Analogie zu Funktionen einer Variablen, f = f (x), wollen wir nun Funktionen
mehrerer Variablen, f = f (x1 , ..., xn ), an einem bestimmten Punkt x0 = (x01 , ..., x0n )
in eine Potenzreihe entwickeln. Das setzt natürlich voraus, dass diese Funktionen be-
liebig oft differenzierbar sind.
In praktischen Anwendungen brauchen wir in der Regel nur die ersten Glieder
dieser Reihe. Deswegen ist unser Ziel hier nur die näherungsweise Darstellung von f
durch ein Polynom in den xi bis zu einer gewünschten Ordnung n. Bei der Taylor-
Entwicklung einer Funktion f bis zur n-ten Ordnung muss die Funktion (n + 1)-fach
differenzierbar sein, siehe unten.
7.3.1 Taylor-Formeln
Wir leiten zunächst die Taylor-Formeln für die Entwicklung von Funktionen zweier
und von drei Veriablen bis zur 2. Ordnung her und geben dann die Formel für die
Potenzreihenentwickung (= Taylor-Reihe) einer Funktion von n Variablen an.
Taylor-Formel für f = f (x, y):

Wir entwickeln eine Funktion f = f (x, y) in eine Potenzreihe in der Umgebung
des Punktes (x0 , y0 ) In Anwendungen ist, wie gesagt, oft nur die explizite Form der
Glieder bis zur einer bestimmten Ordnung von Interesse. Wir bestimmen hier als
Beispiel die explizite Form dieser Glieder bis einschliesslich der 2. Ordnung. Die
Form dieser Reihe ist durch den folgenden Ansatz gegeben:
f (x, y) = c00 + c10 (x − x0 ) + c01 (y − y0 )

+ c20 (x − x0 )2 + c11 (x − x0 )(y − y0 ) + c02 (y − y0 )2 (7.3.1)
+ O (∆xi )3 .

Das Symbol O ((∆xi )3 ) bezeichnet die nicht angegebenen Terme der Potenzreihe,
die mindestens von 3. Ordnung in den kleinen Größen (x − x0 ), (y − y0 ) sind. Das
sind Terme, die die Potenzen
(x − x0 )3 , (x − x0 )2 (y − y0 ), (x − x0 )(y − y0 )2 , (y − y0 )3
und höhere Potenzen enthalten.

Die unbekannten Koeffizienten cij in (7.3.1) erhält man analog zum Fall f = f (x)
folgendermaßen:
(a) Einerseits wertet man f , ihre partiellen Ableitungen ∂x f , ∂y f und die höherer
Ordnung bei (x0 , x0 ) aus.
(b) Andererseits wertet man die rechte Seite von (7.3.1) und ihre entsprechenden
partiellen Ableitungen bei (x0 , x0 ) aus und vergleicht mit (a). Man erhält:
(1) f (x0 , y0 ) = c00

(2)
∂x f = c10 + 2c20 (x − x0 ) + c11 (y − y0 ) + ......

|{z}
enthält mindestens
einen Faktor (y−y0 )
⇒ ∂x f (x0 , y0 ) = c10
(3)
∂y f = c01 + c11 (x − x0 ) + 2c02 (y − y0 ) + ...

⇒ ∂y f (x0 , y0 ) = c01
etc.
Einsetzen der soeben hergeleiteten Koeffizienten cij in (7.3.1) liefert die Taylor-
Formel für die Entwicklung einer Funktion zweier Variablen an einen beliebigen
Punkt (x0 , y0 ), wobei die Taylor-Entwicklung hier nur bis zur 2. Ordnung durch-
geführt wurde:
f (x, y) = f (x0 , y0 )
+ (x − x0 )∂x f (x0 , y0 ) + (y − y0 )∂y f (x0 , y0 )
1
(x − x0 )2 ∂x2 f (x0 , y0 ) + 2(x − x0 )(y − y0 )∂x ∂y f (x0 , y0 ) + (y − y0 )2 ∂y2 f (x0 , y0 )

+
2!
+ O (∆xi )3 .

(7.3.2)
Für das Restglied O ((∆xi )3 ) kann eine Abschätzungsformel angegeben werden, in
der die partiellen Ableitungen ∂i ∂j ∂k f aufteten; siehe z.B. das zitierte Taschenbuch
der Mathematik von I.N. Bronstein et al.
Taylor-Formel für f = f (x1 , x2 , x3 ):
Für eine Funktion von drei Variablen, f = f (x1 , x2 , x3 ), erhält man völlig ana-
log die Taylorentwicklung inklusive der Terme 2. Ordnung an einen Punkt x0 =
(x01 , x02 , x03 ):
f (x1 , x2 , x3 ) = f (x0 )
+ (x1 − x01 )∂1 f (x0 ) + (x2 − x02 )∂2 f (x0 ) + (x3 − x03 )∂3 f (x0 )
1h
+ (x1 − x01 )2 ∂12 f (x0 )
2!
+ (x2 − x02 )2 ∂22 f (x0 )
+ (x3 − x03 )2 ∂32 f (x0 ) (7.3.3)
+ 2(x1 − x01 )(x2 − x02 )∂1 ∂2 f (x0 )
+ 2(x1 − x01 )(x3 − x03 )∂1 ∂3 f (x0 )
i
+ 2(x2 − x02 )(x3 − x03 )∂2 ∂3 f (x0 )
+ O (∆xi )3 .

Die Abschätzungsformel für das Restglied O ((∆xi )3 ) enthält die partiellen Ablei-
tungen 3. Ordnung (siehe Bronstein et al.). Bei Vernachlässigung des Restglieds
wird die Funktion f (x) durch die Formeln (7.3.2) bzw. (7.3.3) in der Umgebung
des Punktes x0 durch ein Polynom 2. Grades in den Variablen x, y bzw. x1 , x2 , x3
approximiert. Die Güte der Approximation lässt sich durch die Mitnahme höherer
Ordnungen der Taylorentwicklung erhöhen – vorausgesetzt, die Taylorreihe (also die
unendliche Reihe) konvergiert in einer Umgebung von x0 . Auf Konvergenzfragen
gehen wir hier nicht ein.
Der Vollständigkeit halber geben wir hier noch die Formel für die Taylorreihe
einer Funktion f = f (x1 , x2 , ..., xn ) von n Variablen an der Entwicklungsstellle x0 an.
Wir nehmen an, dass f beliebig oft partiell in einer Umgebung von x0 differenzierbar
ist und die folgenden unendlichen Summen in einer Umgebung von x0 konvergieren.
Die Taylorformel für die Potenzreihenentwicklung in n Variablen ist
∞ X
∞ ∞
X X 1 ∂ i1 +i2 +...+in
f (x) = ... (x1 − x01 )i1 · · · (xn − x0n )in i1 i2 f (x0 ).
i1 =0 i2 =0 in =0
i 1 !i 2 ! · · · i n ! ∂x 1 ∂x 2 · · · ∂x
in
n
(7.3.4)
Durch explizites Hinschreiben der ersten Terme dieser Reihe im Falle von zwei bzw.
drei Variablen überzeugt man sich, dass diese Formel die in (7.3.2) bzw. (7.3.3) an-
gegebenen Glieder reproduziert.
Sie müssen sich diese Formel nicht merken – allerdings sollten Sie die Formeln (7.3.2)
bzw. (7.3.3), d.h. die Taylor-Entwicklung von Funktionen zweier und von drei Va-
riablen bis zur 1. oder 2. Ordnung verinnerlichen. Wir werden diese Formeln anhand
etlicher Beispiele in den Übungen anwenden.
7.3.2 Lokale Extremwerte, stationäre Punkte

Die Abbildungen 7.1, 7.2 und 7.3 zeigen, dass
2 −y 2
1. f (x, y) = e−x bei (x0 , y0 ) = (0, 0) ein Maximum hat,
2. f (x, y) = x2 + y 2 bei (x0 , y0 ) = (0, 0) ein Minimum hat,
3. f (x, y) = x2 − y 2 bei (x0 , y0 ) = (0, 0) einen sog. Sattelpunkt hat.
Bei einem Sattelpunkt x0 nimmt f (x, y) im Punkt x0 bezüglich einer Richtung ein
relatives Minimum an – im Beispiel 3 ist diese Richtung durch die Gerade y = 0
gegeben –, aber bezüglich einer anderen Richtung ein relatives Maximum – im Bei-
spiel 3 längs der Geraden x = 0.
Bedingung für einen lokalen Extremwert: Eine Funktion f = f (x) von n reel-
len Variablen hat im Punkt x0 = (x01 , x02 , ..., x0n ) ein lokales Minimum (Maximum),
wenn es ein r > 0 gibt, so dass
f (x0 ) ≤ f (x) (f (x0 ) ≥ f (x)) für alle x ∈ Kr (x0 ) . (7.3.5)
Hier bezeichnet Kr (x0 ) o.B.d.A. eine offene Kugelmenge mit Radius r um x0 :
Kr (x0 ) = {x ∈ Ω mit |x − x0 | < r} .
Ein lokales Minumum oder Maximum heißt auch lokaler Extremwert 4 . Beachten Sie,
dass die Bedingung (7.3.5) nicht bedeutet, dass es sich bei x0 um einen isolierten
Punkt handeln muss.
Die Bedingung (7.3.5) gilt natürlich auch für n = 1. In diesem Fall findet man lokale
Extremwerte einer Funktion f = f (x) am einfachsten durch Zeichnen des Funk-
tionsgraphen. Das ist im Fall mehrerer Variablen schwierig (n = 2) bzw. unmöglich
(n > 2).
Analog zum Fall einer Variablen findet man lokale Extremwerte einer Funktion auf
analytische Weise durch Untersuchung der partiellen Ableitungen von f – voraus-
gesetzt, f ist differenzierbar. Das führt uns auf den allgemeineren Begriff des stati-
onären Punktes. Ein Punkt x0 heißt stationärer Punkt einer differenzierbaren Funk-
tion f , wenn er eine Lösung der folgenden n Gleichungen ist:
∂
f (x0 ) = 0 ∀i = 1, 2, ..., n . (7.3.6)
∂xi
Hinweise:
1) Diese Bedingung ist offensichtlich notwendig, aber nicht hinreichend für einen
lokalen Extremwert einer differenzierbaren Funktion. Ein Kriterium dafür, wann ein
4
In den obigen Beispielen 1 und 2 ist (x0 , y0 ) = (0, 0) auch das absolute Maximum bzw.
Minimum der Funktion. Das ergibt sich aber erst aus der globalen Betrachtung der jeweiligen
Funktion.
isoliertes Minimum oder Maximum vorliegt, geben wir unten an.

2) Beachten Sie, dass es sich bei diesen Gleichungen i.A. um nichtlineare algebraische
Gleichungen handelt. Die Lösung eines solchen Gleichungssystems ist i.A. hochgra-
dig nichttrivial. Auf Lösungsstrategien können wir hier nicht eingehen. Auf jeden Fall
sollte man durch diverse Untersuchungen von f herausfinden, in welchem Teilgebiet
oder Teilgebieten des Definitionsbereichs von f man stationäre Punkte erwarten
kann. Beispielsweise kann man das Definitionsgebiet von f mit einem Gitter über-
ziehen, f an diesen Punkten mit Hilfe eines Computers numerisch auswerten und
dann durch Inspektion der Funktionswerte nach einem Indiz für einen stationären
Punkt fahnden.
3) Je nach Funktion hat dieses Gleichungssystem entweder keine Lösung, Lösungen
in Form eines oder mehrerer isolierter Punkte x0 oder Lösungsmengen, die Kurven
oder (Hyper)Flächen entsprechen – siehe den nächsten Hinweis.
4) Bei stationären Punkten muss es sich nicht um isolierte Punkte x0 handeln.
Beispielsweise können bei Funktionen zweier Variablen ganze Kurven von Maxima
und/oder Minima und/oder Wendepunkten (Sattelpunkten) auftreten5 . Ein Beispiel
ist in Abbildung 7.5 gezeigt. Bei Funktionen von n > 2 Variablen kann die Menge
der stationären Punkte auch einer oder mehreren (Hyper)flächen entsprechen.
Taylorentwicklung um einen stationären Punkt x0 :

Wenn x0 ein stationärer Punkt von f ist, dann verschwinden in der Taylorentwick-
lung von f um x0 aufgrund von (7.3.6) alle Terme der 1. Ordnung – beispielsweise
in den Formeln (7.3.2) und (7.3.3). Somit
f (x) = f (x0 ) + O (∆xi )2 ,

(7.3.7)
wenn x0 ein stationärer Punkt von f ist.
Beispiel: Sei (x0 , y0 ) ein stationärer Punkt von f (x, y). Dann ist die Taylorentwick-
lung von f an dieser Stelle gegeben durch
1h
f (x1 , x2 ) =f (x01 , x02 ) + (x1 − x01 )2 ∂12 f (x0 )
2!
+ 2(x1 − x01 )(x2 − x02 )∂1 ∂2 f (x0 )
i (7.3.8)
2 2
+ (x2 − x02 ) ∂2 f (x0 )
+ O (∆xi )3 .

In der Physik, insbesondere in der Mechanik untersucht man oft eine physikalische
Größe f , die beispielsweise von den Ortskoordinaten eines Teilchens abhängt, in der
Umgebung eines stationären Punktes x0 von f durch Taylor-Entwicklung um x0 –
siehe den Hinweis am Ende des nächsten Abschnittes.
5
Beim Trivialbeispiel einer konstanten Funktion, f (x, y) = const., d.h. einer Ebene parallel zur
xy-Ebene, sind natürlich alle Punkte des R2 stationäre Punkte der Funktion.
sin(x2+y2)
f(x,y)
0.5
-0.5
-1
1.5
y
1
0.5
0 1.5
1 x
-0.5 0.5
0
-1 -0.5
-1.5 -1.5 -1
Abbildung 7.5: Darstellung der Funktion f (x, y) = sin(x2 + y 2 ) in der Umgebung

von (x, y) = (0, 0). Dieser Punkt ist ein isoliertes Minimum von f . Man sieht, dass
der Kreis x2 + y 2 = π/2 eine Linie von Maxima bildet. Weitere Linien von Maxima
(Minima) bilden die Kreise x2 + y 2 = (2n + 1)π/2 (x2 + y 2 = nπ), n ∈ N.
Kriterium für ein isoliertes Minimum/Maximum: Um auf analytische Wei-

se herauszufinden, um welchen Typ es sich bei einem stationären Punkt x0 handelt,
muss man die Matrix der 2. Ableitungen von f an der Stelle x0 berechnen:
 
∂12 f (x0 ) ∂1 ∂2 f (x0 ) · · · ∂1 ∂n f (x0 )
 ∂2 ∂1 f (x0 ) ∂ 2 f (x0 ) · · · ∂2 ∂n f (x0 ) 
(2) 2
D (x0 ) ≡  . (7.3.9)
 
.. .. ..
 . . . 
∂n ∂1 f (x0 ) ∂n ∂2 f (x0 ) · · · ∂n2 f (x0 )
Bei dieser Matrix, die man auch Hesse-Matrix nennt, handelt es sich offensichtlich
(2) (2)
um eine reell-symmetrische Matrix, Dij = Dji . Wie wir in Kapitel 6.6 lernten,
kann diese Matrix diagonalisiert werden; alle Eigenwerte λi dieser Matrix sind reell.
Kriterium: Wenn alle Eigenwerte λi der Matrix der 2. Ableitungen bei x0 posi-
tiv (negativ) sind, dann ist x0 ein isoliertes Minimum/Maximum. Wenn das nicht
der Fall ist, ist die Bestimmung des Typs des stationären Punktes x0 komplizierter.
Wenn sowohl positive als auch negative λi auftreten, aber alle λi 6= 0, dann handelt
es sich bei x0 um einen Sattelpunkt. Wenn ein oder mehrere λi = 0 und alle λi ≥ 0
(alle λi ≤ 0), dann ist x0 Element eines Kontinuums von Minima (Maxima).
Geometrisch ist diese Diagonalisierung folgendermaßen zu interpretieren: Man

kann die Variablen x1 , . . . , xn als Koordinaten eines Vektors bezüglich einer karte-
sischen ONB auffassen. Die Diagonalisierung von D(2) entspricht dem Übergang zu
einer neuen ONB, dem Hauptachsensystem {v i } von D(2) . Bezüglich dieser neuen
0
P
ONB sind die Koordinaten xi = j Rij xj , wobei R die orthogonale Matrix ist, mit
der D(2) (x0 ) diagonalisiert wird. Es istP f 0 (x0 ) = f (x), wobei man die funktionale
Form von f 0 durch Einsetzen von xi = j (RT )ij xj in f (x) erhält. Man betrachtet
nun die 1. partielle Ableitung ∂f 0 /∂x0i als Funktion der Koordinate x0i in der Um-
gebung des Punktes P0 = (x1 , . . . , xn ), der in der neuen Basis die Koordinaten x0j
hat. D.h. man betrachtet f in Richtung v i . Der i-te Eigenwert λi ist die Steigung
der Tangente in v i -Richtung an die Funktion ∂f 0 /∂x0i im Punkt P0 – vergleichen Sie
mit der analogen Diskussion für Funktionen einer Variablen in Kapitel 2.2.3.
Beispiele:
1) Wir berechnen die Hesse-Matrizen der 2. Ableitungen der in den Abbildungen
7.1, 7.2, 7.3 und 7.5 dargestellten Funktionen bei (x0 , y0 ) = (0, 0). Diese Matrizen
sind in der Reihenfolge der genannten Funktionen:
D(2) (0, 0) = diag(−2, −2), diag(2, 2), diag(2, −2), diag(2, 2) .
Da diese Matrizen bereits diagonal sind, kann man die Eigenwerte λ1 , λ2 unmittelbar
ablesen. Die Rechnung bestätigt, was wir den Abbildungen unmittelbar entnehmen
können: Bei (x0 , y0 ) = (0, 0) haben die Funktionen Fig. 7.2 und 7.5 ein lokales Mi-
nimum, die Funktion Fig. 7.1 ein lokales Maximum und die Funktion Fig. 7.3 einen
Sattelpunkt.
2) Wir berechnen die Hesse-Matrix der Funktion Fig. 7.5 an irgendeinem Punkt x0
auf dem Kreis x2 + y 2 = π/2. Die Berechnung der beiden Eigenwerte dieser Matrix
ergibt, dass ein Eigenwert negativ und der andere Eigenwert null ist. (Zu Hause
nachprüfen!) Dies bestätigt formal, dass die Funktion auf dem Kreis x2 + y 2 = π/2
eine Linie von Maxima besitzt.
Die eingehende Untersuchung der stationären Punkte von Funktionen f (x1 , ..., xn )
ist für n > 2, insbesondere für n 1 eine (numerisch) anspruchsvolle Aufgabe.
Die Problemstellung hat viele Anwendungen, nicht nur in der Physik. Wir untersu-
chen im Mechanik-Teil der Vorlesung nur für relativ einfache Systeme, ob stationäre
Punkte vorliegen; wir merken uns die Gleichungen (7.3.6) bis (7.3.8). Beispielsweise
entsprechen die stationären Punkte x0 der potentiellen Energie V = V (x1 , . . . , xn )
eines mechanischen Systems aus n0 Massenpunkten im Raum (3n0 = n), das kei-
nen weiteren Einschränkungen unterliegt, den Gleichgewichtslagen des Systems. Nur
wenn es sich bei x0 um ein Minimum handelt, befinden sich die Massenpunkte bei
x0 in einem stabilen Gleichgewicht – falls sich bei x0 um einen anderen Extremwert
handelt, ist die Gleichgewichtslage instabil gegenüber kleinen Störungen.
7.4 Gradient, Divergenz, Rotation

7.4.1 Gradient
Im Abschnitt 7.2 sahen wir, dass die partiellen Ableitungen von f = f (x, y) folgende
Bedeutung haben:
∂
f (x, y) ↔ Steigung am Punkt (x, y) in x-Richtung bei konstantem y,
∂x
∂
f (x, y) ↔ Steigung am Punkt (x, y) in y-Richtung bei kontantem x.
∂y
Man definiert nun einen Vektor – präziser: ein Vektorfeld – das die gesamte Infor-
mation über die Steigungen von f in beliebiger Richtung in der xy-Ebene enthält:
∂f
 
∂f ∂f  ∂x 
grad f (x) ≡ ex + ey = . (7.4.1)
 
∂x ∂y  ∂f 
∂y
Das Symbol “grad” steht für Gradient.

In unserer Terminologie aus Abschnitt 7.1 ist f (x) ein skalares Feld. Somit ist
grad f (x) offensichtlich ein Vektorfeld. Man bezeichnet es auch als das Gradienten-
feld von f .
Die Verallgemeinerung auf n Variable ist evident.
7.4 Gradient, Divergenz, Rotation 171
-x2-y2
grad(e )
2
y
1.5
0.5
-0.5
-1
-1.5
-2
-2 -1.5 -1 -0.5 0 0.5 1 1.5 2
2 −y 2
Abbildung 7.6: Gradientenfeld von f (x, y) = e−x .
!
∂f (x,y)
∂x −2x exp(−x2 − y 2 )
∇f (x, y) = ∂f (x,y) =
∂y
−2y exp(−x2 − y 2 )
Definition: Sei f (x) ≡ f (x1 , x2 , ..., xn ) ein stetig differenzierbares skalares Feld.
Diesem Feld wird durch folgende Vorschrift an jeder Stelle x ein Vektorfeld, das
sogenannte Gradientenfeld grad f , zugeordnet:
 
∂1 f
n  ∂2 f 
X ∂f
grad f (x) ≡ ei =  ..  . (7.4.2)
 
i=1
∂xi  . 
∂n f
Es ist üblich und bequem – warum, wird im Laufe der Vorlesung klar – in die-
sem Kontext den sogenannten Nabla-Operator ∇ einzuführen. Das ist ein Vektor-
Differentialoperator6 , der bezüglich einer kartesischen ONB {ei } folgendermaßen
definiert ist: n
∂ ∂ X
∇ ≡ e1 + ... + en = ei ∂i
∂x1 ∂xn i=1
 
∂1 (7.4.3)
 .. 
bzw. ∇ =  .  ,
∂n
6
In der Mathematik versteht man unter einem Operator eine Rechenvorschrift; in diesem Fall
die Vorschrift (7.4.4)
grad(x2+y2)
10
y
8
-2
-4
-6
-8
-10
-10 -8 -6 -4 -2 0 2 4 6 8 10
Abbildung 7.7: Gradientenfeld von f (x, y) = x2 + y 2 .
!
∂f (x,y)
∂x 2x
∇f (x, y) = ∂f (x,y) =
∂y
2y
grad(x2-y2)
10
y
-2
-4
-6
-8
-10
-10 -8 -6 -4 -2 0 2 4 6 8 10
Abbildung 7.8: Gradientenfeld von f (x, y) = x2 − y 2 .
!
∂f (x,y)
∂x 2x
∇f (x, y) = ∂f (x,y) =
∂y
−2y
wobei in der Spaltenvektordarstellung zu beachten ist, dass sich diese Darstellung

auf die gewählte kartesische ONB {ei } bezieht.
Anwendung von ∇ auf f bedeutet folgende Rechenvorschrift: Bilde die partiellen
Ableitungen und forme daraus einen Vektor gemäß (7.4.3), d.h.
n
X
∇f (x) = ei ∂i f (x). (7.4.4)
i=1
Die Rechenoperationen grad f und ∇f sind somit identisch.

n
X ∂f
grad f (x) ≡ ∇f (x) = ei . (7.4.5)
i=1
∂xi
Am Symbol ∇ erkennt man das Transformationsverhalten von (7.4.2) unter Dre-

hungen auf Anhieb:
∇(skalares Feld) = Vektorfeld.
Bevor wir einige Beispiele behandeln, noch ein Hinweis zur graphischen Dar-
stellung von Vektorfeldern V (x). In zwei bzw. drei Dimensionen kann man in die
Ebene bzw. in den Raum ein äquidistantes kartesisches Gitter legen und an jedem
Gitterpunkt (x1 , x2 ) bzw. (x1 , x2 , x3 ) den Vektor V (x) als Pfeil einzeichnen. Die
Richtung des Pfeils zeigt die Richtung von V bei x an und die Länge des Pfeils ist
proportional zum Betrag |V (x)|. Auf diese Weise sind in den Abbildungen 7.6, 7.7
und 7.8 die Gradientenfelder ∇f einiger Funktionen f (x, y) dargestellt.
Rechenregeln:
Sei f = f (x), g = g(x). Offensichtlich gelten die Summen-, Produkt- und Quo-
tientenregel der partiellen Differentiation, siehe die entsprechenden Regeln für die
partiellen Ableitungen auf Seite 7.2.4:
∇(f + g) = ∇f + ∇g , (7.4.6)
∇(f g) = (∇f )g + f ∇g , (7.4.7)

f 1
∇ = 2 (g∇f − f ∇g) , g 6= 0 . (7.4.8)
g g
Außerdem gilt die Kettenregel (7.2.14) bzw. ihre besprochenen Spezialfälle.
Beispiele:
1. Unterhalb der Abbildungen 7.6, 7.7 und 7.8 sind die Gradienten der Funktionen
f (x, y) = x2 + y 2 , f (x, y) = x2 − y 2 und f (x, y) = exp(−x2 − y 2 ) angegeben.
2. f (r) = a · r = 3i=1 ai xi , wobei a ein konstanter Vektor ist. Dann ist
P
3
X
grad f ≡ ∇f = ei ai = a.
i=1
p
3. Sei φ(r) = |r| = x21 + x22 + x23 . Dann ist (mit r ≡ |r|)
3
X 1 r
grad r ≡ ∇r = ei 2xi = .
i=1
2|r| |r|
Man sollte sich das merken: Der Gradient des Betrags des Ortvektors eines
Teilchens ist der Einheitvektor r̂ = r/r, der radial (sternförmig) nach außen
zeigt.
p
4. Sei φ = φ(r), d.h. die Funktion φ hängt nur vom Betrag r = x21 + x22 + x23 des
Koordinatenvektors r ab. Unter Verwendung der Kettenregel in der Version
(7.2.15) erhalten wir
3
X dφ dφ r
∇φ(r) = ei ∂i r = . (7.4.9)
i=1
dr dr |r|
D.h. der Gradient eines skalaren Feldes, das nur vom Betrag des Ortsvektors
abhängt, zeigt – je nach Vorzeichen von dφ/dr – radial vom Ursprung weg
oder auf ihn hin. Das sollte man ebenfalls verinnerlichen!
Beachte: Die Operation grad (Vektorfeld) ist sinnlos, d.h. nicht definiert.
Beispiele für Gradientenfelder in der Physik: Gradientenfelder spielen z.B.

in der Mechanik eine zentrale Rolle. Inbesondere lassen sich manche (aber nicht alle)
Kraftfelder als Gradient eines skalaren Feldes darstellen.
F (x) = −∇V (x). (7.4.10)
Der Vektor x entspricht dem Ort eines Teilchens, auf das F (x) einwirkt. Wie wir
im Mechanik-Teil der Vorlesung sehen werden, gibt V (x) die potentielle Energie des
Teilchens in diesem Kraftfeld an. Die Bedeutung der Vorzeichenkonvention bespre-
chen wir unten bzw. ebenfalls im Mechanik-Teil.
Wenn V nicht explizit von der Zeit abhängt, bezeichnet man F als konservative
Kraft. Wenn V explizit von der Zeit abhängt, V = V (x, t), nennt man eine Kraft
der Form F = −∇V eine Potentialkraft.
Ein wichtiger Spezialfall sind konservative Zentralkräfte, deren Zentrum sich an ei-
nem Punkt x0 befindet. An jedem Punkt x im Raum zeigt der Vektorpfeil einer
solchen Kraft sternförmig entweder zum Punkt x0 hin oder von im weg. Wird das
Koordinatensystems so gewählt, dass x0 sein Ursprung ist, also x0 = 0, dann sind
diese Kräfte von der Form (7.4.9). Als Beispiele seien genannt:
1. Hooksche Federkraft: F H = −k(x − x0 ), k > 0.
k
VH (x) = (x − x0 )2 + const. ⇒ F H = −∇VH (x) = −k(x − x0 ) .
2
Wir können das Koordinatenssystem so wählen, dass x0 sein Ursprung ist.
Dann V = kr2 /2 + const.
2. Gravitationskraft eines Massenpunktes der Masse m2 auf einen Massenpunkt

der Masse m1 : Wir wählen das Koordinatenssystem KS so, dass sich m2 im
Ursprung von KS befindet. Der Abstand von m1 zum Ursprung sei r = |r|
und G bezeichne die Gravitationskonstante. Dann ist
m1 m2 m1 m2
F G,2→1 = −G 3 r = −G 2 r̂ , (7.4.11)
r r
wobei r̂ ≡ r/r. Diese Kraft kann folgendermaßen dargestellt werden:
m1 m2
VG (r) = −G + const. ⇒ F G,2→1 = −∇VG (r) .
r
Hinweise:
1) Die mathematische Form von F H und F G sind Naturgesetze, d.h. durch Mes-
sungen belegt. Diese Beispiele zeigen folgenden wichtigen Sachverhalt: Bei Kräften,
die als Gradient eines skalaren Feldes dargestellt werden können, ist die jeweilige
skalare Funktion nicht eindeutig, sondern durch die empirisch bestimmte Form von
F nur bis auf eine Konstante festgelegt.
2) Bei der Frage, ob ein Vektorfeld F tatsächlich als Gradient eines skalaren Fel-
des darstellbar ist, muss eine mathematische Feinheit beachtet werden, die wir in
Abschnitt 7.7.3 besprechen. Zur o.g. Gravitationskraft, siehe auch Seite 202.
Richtungsableitung:
Wir greifen das Thema “Steigung von f bezüglich einer bestimmten Richtung” wie-
der auf – siehe den Anfang dieses Abschnitts, Seite 170. Anhand von (7.4.5) sieht
man sofort, dass man die Steigung von f in Richtung ei durch skalare Multiplikation
von ∇f mit ei erhält:
∂f
= ei · ∇f. (7.4.12)
∂xi
Dabei benutzten wir, dass die ei eine ONB bilden, ei · ej = δij .
Die Steigung bezüglich einer beliebigen Richtung n erhält man durch die soge-
nannte Richtungsableitung, die wie folgt definiert ist:
∂f
≡ n · ∇f,
∂n (7.4.13)
n Einheitsvektor, |n| = 1.
Beachte: ∂f /∂n ist eine skalare Größe; deswegen wird in diesem Symbol das Vek-
torsymbol n nicht verwendet.
Geometrische Interpretation von ∇f :

Um die geoemtrische Bedeutung des Vektors ∇f zu klären, sei zunächst an folgendes
erinnert. Die Menge der Punkte, für die
f (x) = c, (7.4.14)
-x2-y2
grad(e ) grad(x2+y2) grad(x2-y2)
2 10 10
y
y
8 8
1.5
6 6
1
4 4
0.5
2 2
0 0 0
-2 -2
-0.5
-4 -4
-1
-6 -6
-1.5
-8 -8
-2 -10 -10
-2 -1.5 -1 -0.5 0 0.5 1 1.5 2 -10 -8 -6 -4 -2 0 2 4 6 8 10 -10 -8 -6 -4 -2 0 2 4 6 8 10
x x x
2
−y 2
(a) e−x (b) x2 + y 2 (c) x2 − y 2
Abbildung 7.9: Äquipotentiallinien und Gradientenfelder der Funktionen (= skalare

Felder) aus den Abb. 7.6, 7.7 und 7.8. Der Vektor ∇f (x) steht stets senkrecht zu
diesen Äquipotentiallinien und zeigt in Richtung des steilsten Anstiegs von f (x).
wobei c eine vorgegebene Konstante ist, definiert – wie bereits am Anfang dieses
Kapitels erwähnt wurde – eine Hyperfläche, die man in der Physik, insbesondere in
der Mechanik oft Äquipotentialfläche nennt7 . Dieser Begriff stammt aus der Mecha-
nik: Wenn f (x) die potentielle Energie eines Massenpunktes ist, dann ist die Fläche
f (x) = c die Menge aller Ortskoordinaten des Massenpunktes, für die seine poten-
tielle Energie den konstanten Wert c annimmt. Ein wichtiger Spezialfall ist die mit
einer am Ursprung zentrierten Zentralkraft assoziierten potentiellen Energie; sie ist
von der Form V = V (r). D.h. in diesem Fall sind die Äquipotentialflächen Kugeln
um den Ursprung. Ist die Zentralkraft bei x0 6= 0 zentriert, ist V = V (|x − x0 |),
d.h. die Äquipotentialflächen sind Kugeln um das Zentrum x0 .
Im Fall zweier Variablen definiert f (x1 , x2 ) = const. eine Kurve, eine sog. Äquipo-
tentiallinie.
Beispiele für Äquipotentiallinien:

1. Wir betrachten die Funktionen aus den Abbildungen 7.1 7.2 7.3
2 −y 2
(a) f (x, y) = e−x , Abbildung 7.1,
2 2
(b) f (x, y) = x + y , Abbildung 7.2,
(c) f (x, y) = x2 − y 2 , Abbildung 7.3.
In den Beispielen a) und b) sind die Äquipotentiallinien Kreise, im Beispiel c)
sind sie Hyperbeln, siehe Abbildung 7.9.
2. Sei φ(r) = a · r = 3i=1 ai xi . Dann definiert φ = const. eine Ebene im Raum.
P
Der Vektor ∇φ = a steht senkrecht auf dieser Ebene.
7
Bei einem Temperatur- oder Druckfeld, das die Temperatur bzw. den Druck an einem Raum-
punkt angibt, liefert T (x, y, z) = T0 bzw. p(x, y, z) = p0 natürlich die Isothermen bzw. Isobaren,
d.h. Flächen gleicher Temperatur bzw. gleichen Drucks im Raum.
Totales Differential:
Das totale Differential (7.2.12), das die infinitesimale Funktionsänderung bei infi-
nitesimalen Änderungen dxi aller Variablen xi angibt, kann mit ∇f geschrieben
werden als
n
X ∂f
df = dxi = (∇f ) · dx. (7.4.15)
i=1
∂x i
Wenn wir vom Punkt x auf einer Äquipotentialfläche von f zum Punkt x + dx,
der ebenfalls auf dieser Fläche liegt, fortschreiten, ändert sich der Wert von f
nicht. Demzufolge ist df = 0. Somit
x → x + dx auf d. Äquipotentialfläche ⇒ df = 0
⇒ (∇f ) · dx = 0
⇒ ∇f (x) ⊥ zur Fläche f (x)= const im Punkt x.
Diesem Ergebnis entnehmen wir die geometrische Bedeutung von ∇f (x).

Merke:
1) Die Richtung von ∇f (x) ist senkrecht zu den Flächen f (x) = c am jeweili-
gen Punkt x. Mit anderen Worten: Man erhält den Normalenvektor n einer (Hy-
per)Fläche an einem Punkt x0 durch Berechnung des Gradienten ∇f (x0 ) und an-
schließender Normierung dieses Vektors auf Eins.
2) Der Vektor ∇f (x) zeigt immer in eine Richtung, in der die Funktion f (x) zu-
nimmt. Das folgt aus der Definition (7.4.5) und aus der Bedeutung von ∂i f als
Tangentensteigung in Richtung ei ; siehe dazu die Beispiele in den Abb. 7.6, 7.7 und
7.8. In der Tat gibt die Richtung von ∇f (x0 ) die Richtung des stärksten Anstiegs8
der Funktion f (x) am Punkt x0 an. Das sieht man folgendermaßen: Wir bilden die
Richtungsableitung am Punkt x0 in Richtung eines beliebigen Einheitsvektors a,
|a| = 1, und benutzen die Schwarzsche Ungleichung (5.4.5) aus Kapitel 5:
|a · ∇f (x0 )| ≤ |a||∇f (x0 )| = |∇f (x0 )| .
Falls ∇f (x0 ) 6= 0 wird die Anstiegsstärke maximal, wenn man
∇f (x0 )
a=
|∇f (x0 )|
wählt. Falls ∇f (x0 ) = 0, ist f (x) in einer infinitesimalen Umgebung von x0 kon-
stant, d.h. f steigt bei x0 weder an noch ab.
3) Der Betrag |∇f (x0 )| gibt die Stärke des Anstiegs von f (x) senkrecht zu den
Äquipotentialflächen f (x) = c an. In Abbildung 7.9 ist das durch die Dichte der
Äquipotentiallinien visualisiert.
8
Der Begriff Gradient hat seinen Ursprung im lateinischen Wort gradiens = fortschreiten.
An dieser Stelle können wir auch den Grund für die Vorzeichenkonvention in
der Darstellung F = −∇V von konservativen oder Potentialkräften besprechen.
Die ,,von außen” geleistete mechanische Arbeit an einem Körper ist die Energie,
die man aufbringen muss, um den Körper in einem Kraftfeld F vom Punkt x0
nach x1 zu bringen, siehe Abschnitt 7.7. Beispiel: Man hebt einen Stein vom Erd-
boden auf und bringt in auf eine Höhe h. Wegen der Energieerhaltung führt die
von außen zugeführte Energie zu einer Erhöhung der potentiellen Energie V (x) des
Körpers. Stoppt man die Energiezufuhr, d.h. lässt man den Stein los, wird er durch
die Schwerkraft zum Erdboden hin beschleunigt, die potentielle Energie des Steins
nimmt ab. Die Schwerkraft wirkt offensichtlich in Richtung des stärksten Abfalls der
potentiellen Energie; deswegen F = −∇V . Warum V in der Tat der potentiellen
Energie eines Körpers in einem Kraftfeld des genannten Typs entspricht, besprechen
wir im Mechanik-Teil der Vorlesung.
Kompakte Darstellung der Taylor-Formel:

Mit Hilfe des Gradienten lassen sich die in Abschnitt 7.3 besprochenen Taylor-
Entwicklungen kompakter darstellen. Wir betrachten eine Funktion f = f (x), x =
(x1 , . . . , xn ) und entwickeln an der Stelle x0 . Dann können wir die obigen Taylor-
Formeln bis zur 2. Ordnung folgendermaßen angeben:
n
1 X
(xi − x0i )(xj − x0j )∂i ∂j f (x0 ) + O (∆xi )3 .

f (x) = f (x0 ) + (x − x0 ) · ∇f (x0 ) +
2! i,j=1
(7.4.16)
7.4.2 Divergenz
Man kann den Nabla-Operator (7.4.3) auch auf ein differenzierbares Vektorfeld A(x)
anwenden. Erfolgt die Anwendung in Form einer skalaren ,,Multiplikation”, erhält
man ein skalares Feld, das man die Divergenz von A(x) nennt.
Definition: Sei
3
X
A(x) = Ai (x)ei
i=1
ein stetig differenzierbares Vektorfeld, wobei {ei } eine kartesische ONB ist. Seine
Divergenz ist bezüglich dieser Basis definiert als
div A(x) ≡ ∇ · A(x) ≡ ∂1 A1 + ∂2 A2 + ∂3 A3 . (7.4.17)
Man erhält (7.4.17) formal durch Skalarproduktbildung der kartesischen Darstellung
von ∇ mit A.
Merke:
∇ · Vektorfeld = skalares Feld.
Sei φ(x) ein skalares Feld: div φ ist nicht definiert.
Beispiele:
1. Sei A = a ein konstantes Vektorfeld. Dann ist
3
X
div a ≡ ∇ · a = ∂i ai = 0.
i=1
2. Sei A = r. Dann ist

3
X n
X
div r ≡ ∇ · r = ∂i xi = 3 bzw. im Rn : div r = ∂i xi = n .
i=1 i=1
Rechenregeln:
1. ∇ · (A + B) = ∇ · A + ∇ · B.
2. ∇ · (cA) = c∇ · A, c ∈ C.
3. Sei A(x) ein Vektorfeld und φ(x) ein skalares Feld. Dann gilt
∇ · (φA) = φ∇ · A + A · ∇φ.
Mit den Symbolen div und grad lautet diese Rechenregel:
div (φA) = φ div A + A · grad φ.
Zur Herleitung dieser Formel verwendet man Definition (7.4.17) und die Pro-
duktregel ∂i (φAi ) = φ∂i Ai + Ai ∂i φ .
n
X n
X
∇ · (φA) = ∂i (φAi ) = (φ∂i Ai + Ai ∂i φ)
i=1 i=1
Xn
=φ ∂i Ai + A · ∇φ .
i=1
4. Oft benötigt man die Divergenz eines Gradientenfeldes ∇φ. Durch Bilden des
Skalar,,produkts” von ∇ und ∇φ erhalten wir:
∂2φ ∂2φ ∂2φ
∇ · ∇φ = + + ≡ ∆φ,
∂x21 ∂x22 ∂x23
wobei
∆ ≡ ∂12 + ∂22 + ∂32 (7.4.18)
der sogenannte Laplace-Operator in kartesischen Koordinaten ist. Mit den
Symbolen div und grad lautet dieses Ergebnis:
div grad φ = ∆φ. (7.4.19)

Die Identität (7.4.19) gilt natürlich nur für ein skalares Feld. Der Laplace-
Operator (7.4.18) kann auch auf ein Vektorfeld A angewendet werden. In einer
kartesischen Basis ist
∆A = e1 ∆A1 + e2 ∆A2 + e3 ∆A3 .
Bei einer Darstellung von A in einer ,,krummlinigen” Basis (siehe Abschnitt (7.5))
hat ∆A eine kompliziertere Form. Diese lernen Sie in der Vorlesung Theoretische
Physik 2: Elektrodynamik kennen.
Interpretation von div A:
Die Divergenz eines Vektorfeldes A(x) wird als lokale Quellenstärke von A(x) in-
terpretiert. Als Beispiel betrachten wir eine Flüssigkeit. Makroskopisch betrachtet
kann eine Flüssigkeit als Kontinuum von Teilchen (Molekülen) aufgefasst werden.
Der Stromdichtevektor der Flüssigkeit ist j(x, t) = n(x, t)v(x, t), wobei [n] = Zahl
d. Teilchen/Volumen und somit [j] = Zahl d. Teilchen/(Fläche×Zeit). Wir betrach-
ten ein kleines Volumen ∆V am Punkt x. Man kann sich fragen, ob pro Zeiteinheit
mehr Flüssigkeit aus diesem Volumen heraus- als hineinströmt. Im Limes ∆V → 0
ist die Antwort gegeben durch div j(x). (Eine Begründung dieser Aussage finden
Sie z.B. im Buch von S. Großmann.) Man nennt deshalb div j(x) manchmal das
Quellenfeld des Feldes j(x) – jedenfalls ist div j(x) ein Maß für eine Quelle (wenn
div j(x) > 0) oder eine Senke (wenn div j(x) < 0) von j(x) an der Stelle x. Eine
befriedigende Erklärung dieser Aussagen erhält man mit Hilfe des Gaußschen Inte-
gralsatzes, der in der HöMa3- und Theo-2 Vorlesung besprochen wird.
Ein weiteres Beispiel sind Magnetfelder – präzise, die magnetische Induktion B. Da
bisher keine magnetischen Ladungen gefunden wurden, gilt für beliebige B-Felder:
div B(x, t) = 0. (Das lernen Sie in den Vorlesungen zur Elektrodynamik.) D.h. die
magnetische Induktion B(x, t) ist immer quellenfrei.
7.4.3 Rotation
Sei A(x) ein stetig differenzierbares Vektorfeld. Mit Hilfe des Nabla-Operators ∇
und dem Vektorprodukt können wir A ein Vektorfeld zuordnen, die sogenannte
Rotation von A. Diese ist in einer kartesischen Basis definiert durch
3
X ∂
rot A ≡ ∇ × A ≡ ei ijk Ak
i,j,k=1
∂xj (7.4.20)
= (∂2 A3 − ∂3 A2 )e1 + (∂3 A1 − ∂1 A3 )e2 + (∂1 A2 − ∂2 A1 )e3 .
Merke:
rot × Vektorfeld = Vektorfeld.
rot (skalares Feld) ist nicht definiert.

Beispiele:
1. A = r:
3
X
rot r ≡ ∇ × r = ei ijk ∂j xk = 0 ,
|{z}
i,j,k=1
δjk
wobei verwendet wurde, dass ijj = 0.
2. A = ω × r, wobei ω ein im Raum konstanter Vektor sei:

3
X ∂
rot (ω × r) ≡ ∇ × (ω × r) = ei ijk (ω × r)k
i,j,k=1
∂xj
3 3 3
X ∂ X X
= ei ijk klm ωl xm = ei ijk klm ωl ∂j xm .
i,j,k=1
∂xj l,m=1 i,j,k,l,m=1
| {z }
δjm
Wir verwenden nun, dass ijk = kij und zudem die Relation (5.4.31) aus
Kapitel 5:
X3
kij klm = δil δjm − δim δjl .
k=1
Mit dieser Formel erhalten wir:

3
X 3
X
rot (ω × r) = ei (δil δjm − δim δjl )ωl δjm = ei 2ωi = 2ω , (7.4.21)
i,j,l,m=1 i=1
P P
wobei benutzt wurde, dass j,m δjm δjm = j δjj = 3.
Wer den Umgang mit dem -Symbol (noch) scheut, kann dieses Ergebnis auch
komponentenweise herleiten. Z.B. ist die Komponente von e1 :
(rot A)1 = ∂2 A3 − ∂3 A2 ,
wobei hier A3 = ω1 x2 − ω2 x1 und A2 = ω3 x1 − ω1 x3 .
Interpretation von rot A:

Die Rotation eines Vektorfeldes A kann als Maß für die lokale Wirbelstärke von A
interpretiert werden. Wir betrachten dazu als instruktives Beispiel das Geschwin-
digkeitsfeld v einer Flüssigkeit, das von der Form v(x) = ω × x sei. Hier ist x der
Ortsvektor eines Flüssigkeitsteilchens und ω sei ein konstanter Vektor in Richtung
e3 . (Der Einfachheit halber sei ω auch zeitunabhängig.) Der Geschwindigkeitsvek-
tor v an der Stelle x steht senkrecht auf der von ω und x aufgespannten Ebene; er
liegt immer in einer zu ω senkrechten Ebene. In der graphischen Darstellung von
v(x) in Abbildung 7.10 wurde ω als x3 -Achse des Koordinatensystems gewählt. Die
Abbildung zeigt, dass v(x) einen Wirbel beschreibt, dessen Drehachse die x3 -Achse
ist. Die Beträge der Geschwindigkeitspfeile wachsen linear mit dem Abstand von der
Abbildung 7.10: Das Vektorfeld A = ω × r, dargestellt in der x1 x2 -Ebene, wobei

ω ∝ e3 gewählt wurde. Das Bild zeigt auch die Drehrichtung eines sich in diesem
Strömungsfeld befindenden Korkens. (Aus dem Buch von Lang und Pucker.)
x3 -Achse an. Die Drehrichtung des Wirbels ist durch die Richtung von ω festgelegt.
In (7.4.21) zeigten wir, dass rot v = 2ω; d.h. die Rotation von v ist proportional
zum Drehvektor ω, der die Drehrichtung und die Stärke des Wirbels bestimmt.
Vektorfelder mit nichtverschwindender Rotation,
rot A 6= 0 ,
bezeichnet man als Wirbelfelder.
Hinweise:
1) Wenn v = ω ×x die Geschwindigkeit eines Teilchens ist, dann ist ω = |ω| = 2π/T
die Winkelgeschwindigkeit (= Kreisfrequenz) des Teilchens. Das sieht man folgender-
maßen. Es ist |v| = |ω × x| = ωr⊥ , wobei r⊥ = |x| cos θ, θ = ∠(ω, x). Andererseits
ist der bei einer Umdrehung um die Achse zurückgelegte Weg des Teilchens gleich
dem Kreisumfang 2πr⊥ . Somit ist der Betrag der Geschwindigkeit |v| = 2πr⊥ /T ,
wobei T die Umlaufzeit ist. Da die Winkelgeschwindigkeit durch ω = 2π/T definiert
ist, ist die obige Aussage gezeigt: Ein Teilchen mit der Geschwindigkeit v(x) = ω×x
bewegt sich auf einem Kreis ⊥ ω mit Radius r⊥ und hat die Winkelgeschwindigkeit
ω.
2) Wir betrachten das folgende zweidimensionale Vektorfeld in der x1 x2 -Ebene:
1
B= (e3 × r), r = xe1 + ye2 , r ∈ R2 \ {(0, 0)} , (7.4.22)
r2
wobei e3 ⊥ r. Das Feld B ist im Urprung singulär. Die Vektorpfeile dieses Feldes
zirkulieren um den Ursprung. (Die graphische Darstellung von B hat qualitativ die
in Fig. 7.10 gezeigte Form – allerdings ist hier |B| = 1/r.) Man findet mit Hilfe der
Formel (7.4.24) und dem Ergebnis (7.4.21), dass
rot B = 0 ∀r ∈ R2 \ {(0, 0)} . (7.4.23)
Im Ursprung wird rot B singulär. Wir kommen auf dieses Beispiel in Abschnitt 7.7.2
und in einer Übungsaufgabe zurück.
Rechenregeln:
1. ∇ × (A + B) = ∇ × A + ∇ × B.
2. ∇ × (cA) = c∇ × A, c ∈ C.
3. Seien A(x) und φ(x) ein differenzierbares Vektorfeld bzw. skalares Feld. Dann
gilt
∇ × (φA) = φ∇ × A + (∇φ) × A. (7.4.24)
Mit den Symbolen rot und grad lautet diese Formel:
rot (φA) = φ rot A + grad φ × A.
Zur Herleitung verwendet man die Definition (7.4.20) und die Produktregel
∂i (φAi ) = φ∂i A + Ai ∂i φ.
4. Sei φ(x) zweimal stetig differenzierbar in x ∈ Ω. Dann
rot (grad φ) ≡ ∇ × ∇φ = 0. (7.4.25)
Dies folgt durch Einsetzen von Ak = ∂k φ in die Definition (7.4.20) und der
Verwendung von ijk = −iki und ∂j ∂k φ = ∂k ∂j φ. Die gemischten partiel-
len Ableitungen sind vertauschbar, weil φ nach Voraussetzung zweimal stetig
differenzierbar ist (siehe den Satz von H.A. Schwarz). Man sagt, Gradienten-
felder sind wirbelfrei. Dieses Ergebnis verwenden wir im Abschnitt 7.7 und
im Mechanik-Teil der Vorlesung.
5. Wirbelfelder sind quellenfrei. Sei A(x) ein in x ∈ Ω zweimal stetig diffe-

renzierbares Vektorfeld. Dann
div (rot A) ≡ ∇ · (∇ × A) = 0 x ∈ Ω.
Beweis:
3
X X X
∇ · (∇ × A) = ∂i (∇ × A)i = ∂i ijk ∂j Ak = ijk ∂i ∂j Ak = 0;
i=1 i,j,k i,j,k
denn ∂i ∂j Ak = ∂j ∂i Ak , weil A nach Voraussetzung zweimal stetig differenzier-

bar ist, aber ijk = −jik .
Hinweise:
1) Man kann noch eine Reihe weiterer nützlicher Formeln vom obigen Typ für diffe-
renzierbare Vektorfelder A(x), B(x) herleiten, z.B. für grad (A · B), div (A × B),
rot (A × B), siehe z.B. das Buch von Bronstein et al. Wir benötigen diese Formeln
in dieser Vorlesung nicht.
2) In der Mechanik benötigen wir vor allem ∇φ. Die Operationen div , rot werden
Ihnen z.B. in der Vorlesung Theoretische Physik 2: Elektrodynamik ständig begeg-

nen.
3) Beachten Sie, dass wir grad , div , rot hier nur bezüglich einer kartesischen Ba-
sis darstellten. In der (theoretischen) Physik benötigt man die Darstellungen von
grad φ, div A, rot A, ∆φ, ∆A auch bezüglich krummliniger Koordinatenbasen, ins-
besondere bezüglich der Zylinder- und Polarkoordinatenbasis (siehe den nächsten
Abschnitt). Diese Darstellungen lernen Sie in den Vorlesungen zur Theoretischen
Physik ab dem 2. Semester kennen.
7.5 Polarkoordinaten und Zylinderkoordinaten

Nicht immer ist in der Physik die Verwendung eines kartesischen Koordinatensys-
tems zweckmäßig. Weisen physikalische Probleme beispielsweise eine Kugelsymme-
trie oder Zylindersymmetrie auf, so empfiehlt sich die Verwendung diesbezüglicher
Koordinatensysteme.
7.5.1 Ebene Polarkoordinaten

Wir betrachten zunächst zweidimensionale Probleme. Sei r = (x, y) der Ortsvektor
eines Teilchens. Anstelle kartesischer Koordinaten können wir auch ebene Polar-
koordinaten benutzen – siehe Abbildung 7.11. Diese Koordinaten verwendeten wir
bereits im Kapitel 3 über komplexe Zahlen.
p y
r = x2 + y 2 , φ = arctan , x = r cos φ ,
x ⇒ . (7.5.1)
0 ≤ r < ∞, 0 ≤ φ < 2π , y = r sin φ .
Am Usprung x = y = 0 ist φ unbestimmt. Wir können die Koordinaten von r

bezüglich einer kartesischen Basis {e1 , e2 } auch durch Polarkoordinaten ausdrücken:
r = xe1 + ye2 = (r cos φ)e1 + (r sin φ)e2 = r(r, φ). (7.5.2)
Koordinatenlinien:
• Alle Punkte in einer Ebene, deren r-Koordinate den Wert r0 hat, liegen auf
einem Kreis mit Radius r0 um den Ursprung 0, siehe Abbildung 7.11(b).
Dieser Kreis besitzt die Parameterdarstellung
r(r0 , φ) = r0 cos φ e1 + r0 sin φ e2 , 0 ≤ φ < 2π, (7.5.3)
wobei φ die Rolle des Kurvenparameters spielt. Die Kreise (7.5.3) nennt man
die φ-Koordinatenlinen, kurz, die φ-Linien.
• Alle Punkte in einer Ebene, deren φ-Koordinate den Wert φ0 hat, liegen auf
einem vom Ursprung 0 ausgehenden Strahl, der mit der positiven x-Achse den
Winkel φ0 einschließt, siehe Abbildung 7.11(b).
7.5 Polarkoordinaten und Zylinderkoordinaten 185
φ = const
y
r x
φ x
r = const
(a) Koordinaten. (b) Koordinatenlinien.

y
~eφ
~er
~r
x
(c) Basisvektoren.
Abbildung 7.11: Ebene Polarkoordinaten. Die Linien φ = const nennt man die r-
Linien; r = const sind die φ-Linien.
Die Parameterdarstellung dieses Strahls mit r als Kurvenparameter ist

r(r, φ0 ) = r cos φ0 e1 + r sin φ0 e2 , 0 ≤ r < ∞. (7.5.4)
Diese Strahlen nennt man die r-Linien.

Das (r, φ)-Koordinatennetz ist offensichtlich krummlinig. Deswegen sind ebene Po-
larkoordinaten, ebenso wie Zylinderkoordinaten und räumliche Polarkoordinaten
(siehe unten), Beispiele für krummlinige Koordinatensysteme. Allerdings schneiden
sich die Koordinatenlinien dieser Systeme an jedem Punkt unter einem rechten Win-
kel, siehe (7.5.6). Es handelt sich bei diesen Systemen um sog. orthogonale krumm-
linige Koordinatensysteme.
Tangentenvektoren:
Durch jeden Punkt der xy-Ebene – außer dem Ursprung 0 – gehen zwei der soeben
besprochenen Koordinatenlinien, d.h. Kurven (7.5.3), (7.5.4), die sich rechtwinklig
schneiden. Dies folgt aus der Orthogonalität der Tangentenvektoren an diese Ko-
ordinatenlinien im Punkt (r0 , φ0 ), die wir jetzt berechnen. (Zur Berechnung dieser
Vektoren siehe (5.5.22) in Kapitel 5.)

dr(r0 , φ) ∂r(r, φ)
Kurve (7.5.3) ⇒ Tangentenvektor = .
dφ φ=φ0 ∂φ r=r0
φ=φ0

dr(r, φ0 ) ∂r(r, φ)
Kurve (7.5.4) ⇒ Tangentenvektor = .
dr r=r0 ∂r r=r0
φ=φ0
Für einen beliebigen Punkt (r, φ) sind diese Tangentenvektoren gegeben durch
∂r(r, φ) (7.5.2)
= cos φ e1 + sin φ e2 ,
∂r
(7.5.5)
∂r(r, φ) (7.5.2)
= −r sin φ e1 + r cos φ e2 .
∂φ
Diese beiden Vektoren stehen offensichtlich senkrecht aufeinander. Wir dividieren
diese Vektoren noch durch ihre Beträge. Somit erhalten wir zu jedem Punkt (r, φ)
zwei zueinander orthogonale Einheitsvektoren er und eφ (siehe Abbildung 7.11(c)).
∂r
∂r
er ≡ ∂r = cos φ e1 + sin φ e2 ,
∂r
∂r (7.5.6)
∂φ
eφ ≡ ∂φ = − sin φ e1 + cos φ e2 .

∂r
Es ist er · eφ = 0.
Die Einheitsvektoren er , eφ bilden offensichtlich eine ONB im R2 , d.h. wir können
jedes Vektorfeld A(x) ∈ R2 auch nach er , eφ entwickeln:
A(x) = A1 (x, y)e1 + A2 (x, y)e2 = Ar (r, φ)er + Aφ (r, φ)eφ . (7.5.7)
Die Komponenten Ar (r, φ) und Aφ (r, φ) erhalten wir, indem wir in A1 , A2 die Koor-
dinaten x, y durch r, φ ausdrücken, siehe Gleichung (7.5.1), und dann (7.5.7) skalar
mit er und eφ multiplizieren. Es ist
Ar = A · er , Aφ = A · eφ . (7.5.8)
Ist das Vektorfeld A(x) in der Polarkoordinatenform (rechte Seite von (7.5.7) gege-
ben, dann erhält man seine Komponenten in einer kartesischen Basis durch
A1 = A · e1 , A2 = A · e2 , (7.5.9)
wobei in den Komponentenfunktionen Aρ , Aφ die Polarkoordinaten ρ, φ durch x, y

ausgedrückt werden müssen (siehe oben).
P2
Beispiel: Der Ortsvektor r = i=1 xi ei ist in der Basis er , eφ gegeben durch
r = rer .
Hinweise:
1) Im Gegensatz zu den kartesischen Basisvektoren e1 , e2 hängen er , eφ vom Ort,
d.h. von φ ab.
2) ,,Darstellung eines zweidimensionalen Vektorfeldes in der Polarkoordinatenbasis”
bezieht sich auf die rechte Seite von (7.5.7). Manchmal ist es zweckmäßig, A nach
einer kartesischen Basis zu entwickeln, aber anstelle der Koordinaten x, y die Polar-
koordinaten r, φ zu verwenden, also in den Feldkomponenten A1 , A2 auf der linken
Seite von (7.5.7) die Relationen x = r cos φ, y = r sin φ einzusetzen. Diese beiden
Darstellungen dürfen nicht verwechselt werden! Bei der Darstellung von A in der Po-
larkoordinatenbasis müssen bei der (partiellen) Differentiation von A nach einer der
Koordinaten auch die Basisvektoren er , eφ differenziert werden. Da hier er = er (φ),
eφ = eφ (φ), ist ∂ea /∂φ 6= 0. Wenn φ = φ(t), dann der /dt 6= 0, deφ /dt 6= 0, d.h. die
Richtung dieser Einheitsvektoren ändert sich mit der Zeit. In einer Übung leiten wir
die Darstellung der Geschwindigkeit und der Beschleunigung eines Teilchens in der
Polarkoordinatenbasis her.
7.5.2 Zylinderkoordinaten
Wir betrachten zunächst eine kartesische Basis in drei Dimensionen. Anstelle karte-
sischer Koordinaten verwenden wir Zylinderkoordinaten ρ, φ, z, definiert durch
p y
ρ= x2 + y 2 , φ = arctan , z = z,
x
0 ≤ ρ < ∞, 0 ≤ φ < 2π, −∞ < z < ∞, (7.5.10)
beziehungsweise
x = ρ cos φ, y = ρ sin φ, z = z,
siehe Abbildung 7.12. Auf der z-Achse ist φ unbestimmt, d.h. nicht wohldefiniert.
Für den Ortsvektor erhält man
r = xe1 + ye2 + ze3 = ρ cos φ e1 + ρ sin φ e2 + z e3 = r(ρ, φ, z). (7.5.11)
Das Zylinderkoordinatennetz erhält man folgendermaßen. Zunächst führt man Ko-
ordinatenflächen r(ρ0 , φ, z), r(ρ, φ0 , z) und r(ρ, φ, z0 ) ein, deren Gestalt aus der
Abbildung 7.12(b) ersichtlich ist.
ρ = ρ0 ↔ Zylindermantel um z-Achse,
φ = φ0 ↔ Halbebene ⊥ xy-Ebene mit z-Achse als Randlinie,
z = z0 ↔ Ebene parallel zur xy-Ebene.
Die Schnittkurve zweier Koordinatenflächen definiert eine Koordinatenlinie, siehe
Fig. 7.12. Die Koordinatenlinien sind analytisch durch r(ρ0 , φ0 , z), r(ρ, φ0 , z0 ) und
r(ρ0 , φ, z0 ) gegeben; man bezeichnet sie (in der angegebenen Reihenfolge) als z-, ρ-
und φ-Linien. Durch jeden Punkt r(ρ0 , φ0 , z0 ) im Raum laufen drei Koordinatenli-
nien, die sich paarweise senkrecht schneiden. Das folgt aus der Orthogonalität der
Tangentenvektoren, die wir jetzt bestimmen.
Wie in 7.5.1 können wir nun die Tangenteneinheitsvektoren an diese Koordina-
tenlinien im Punkt ρ, φ, z berechnen, siehe Abbildung 7.12(c). Wir erhalten
∂r
∂ρ
eρ ≡ = cos φ e1 + sin φ e2 ,
∂r
∂ρ
∂r
∂φ
eφ ≡ = − sin φ e1 + cos φ e2 , (7.5.12)
∂r
∂φ
∂r
∂z
ez ≡ ∂r = e3 .
∂z
Die Einheitsvektoren eρ , eφ , ez bilden eine ONB.

ea · eb = δab , a, b = ρ, φ, z. (7.5.13)
Wir können jedes Vektorfeld A(x) auch nach dieser Basis entwickeln.
3
X
A(x) = Ai (x, y, z)ei = Aρ (ρ, φ, z)eρ + Aφ (ρ, φ, z)eφ + Az (ρ, φ, z)ez , (7.5.14)
i=1
wobei
Aρ = A · eρ , Aφ = A · eφ , Az = A · ez . (7.5.15)
Ist A(x) in der Zylinderkoordinatenbasis gegeben, berechnet man seine Komponen-
ten in einer kartesischen Basis mit Relationen analog zu (7.5.9).
Beispiel: In der Zylinderkoordinatenbasis ist der Ortsvektor r = ρeρ + zez .
Bemerkung: Die Hinweise auf Seite 187 gelten analog. Hier ist eρ = eρ (φ), eφ =
eφ (φ), während ez ein konstanter Einheitsvektor ist.
z φ = φ0
z = z0
ρ = ρ0
P (ρ, φ, z) y
0
z
0 y
x
φ
ρ
x
(a) Koordinaten. (b) Koordinatenflächen und -linien.
z
~ez
~eρ
~eφ
~ez
~eφ
~eρ
0 y
x
(c) Basisvektoren.
Abbildung 7.12: Zylinderkoordinaten.

z φ = φ0
z
θ = θ0
P (ρ, θ, φ)
r = r0 θ0
r
θ y
0 y r0 0
φ0
φ
x
x
(a) Koordinaten. (b) Koordinatenflächen und -linien.
~er
~eφ
~er
~eφ ~eθ
~eθ
y
0
(c) Basisvektoren.
Abbildung 7.13: Räumliche Polarkoordinaten (Kugelkoordinaten).

7.5.3 Räumliche Polarkoordinaten (Kugelkoordinaten)

Diese sind definiert durch
√
p x2 +y 2
r = x2 + y 2 + z 2 , θ = arctan z
, φ = arctan xy ,
(7.5.16)
0 ≤ r < ∞, 0 ≤ θ ≤ π, 0 ≤ φ < 2π,
beziehungsweise
x = r sin θ cos φ, y = r sin θ sin φ, z = r cos θ , (7.5.17)
siehe Abbildung 7.13. Der Winkel θ ist der sogenannte Polarwinkel, φ heißt Azimut-
winkel. Auf der z-Achse ist φ unbestimmt, d.h. nicht wohldefiniert.
Mit (7.5.17) ist
r(r, θ, φ) = r sin θ cos φ e1 + r sin θ sin φ e2 + r cos θ e3 . (7.5.18)
Die Koordinatenflächen sind definiert durch
r = r0 , θ = θ0 , φ = φ0 ,
und die Koordinatenlinien ergeben sich als Schnittkurven zweier Koordinatenflächen

– siehe Abbildung 7.13(b). Sie sind analytisch durch r(r, θ0 , φ0 ), r(r0 , θ, φ0 ) und
r(r0 , θ0 , φ) gegeben; man bezeichnet sie (in der angegebenen Reihenfolge) als r-,
θ- und φ-Linien. Diese Linien schneiden sich in jedem Punkt unter einem rechten
Winkel – das folgt aus der Orthogonalität der Tangentenvektoren, die wir jetzt
berechnen.
Die Tangenteneinheitsvektoren an die drei Koordinatenlinien im Punkt r, θ, φ sind
∂r
∂r
er ≡ ∂r = (sin θ cos φ)e1 + (sin θ sin φ)e2 + cos θe3 ,
∂r
∂r
∂θ
eθ ≡ ∂r
= (cos θ cos φ)e1 + (cos θ sin φ)e2 − sin θe3 , (7.5.19)
∂θ
∂r
∂φ
eφ ≡ = − sin φe1 + cos φe2 .
∂r
∂φ
Die drei Tangenteneinheitsvektoren – siehe Abbildung 7.13(c) – bilden wieder eine

ONB, denn
ea · eb = δab , a, b = r, θ, φ. (7.5.20)
Wir können deshalb jedes dreidimensionale Vektorfeld A(x) auch nach dieser Basis
entwickeln.
3
X
A(x) = Ai (x, y, z)ei = Ar (r, θ, φ)er + Aθ (r, θ, φ)eθ + Aφ (r, θ, φ)eφ , (7.5.21)
i=1
wobei
Aρ = A · eρ , Aθ = A · eθ , Aφ = A · eφ . (7.5.22)
Ist A(x) in der Kugelkoordinatenbasis gegeben, berechnet man seine Komponenten
in einer kartesischen Basis mit Relationen analog zu (7.5.9).
Beispiel: In der Kugelkoordinatenbasis ist der Ortsvektor r = rer .
Bemerkung: Die Hinweise auf Seite 187 gelten analog. Hier ist er = er (θ, φ),
eθ = eθ (θ, φ) und eφ = eφ (φ).
7.6 Integration im Rn
Wir untersuchen nun Integrale über skalare Felder φ = φ(x1 , . . . , xn ) und Vektorfel-
der A = A(x1 , . . . , xn ). Konkret behandeln wir die Fälle n = 2, 3. (Im Fall n = 1
handelt es sich um Integrale über Funktionen einer reellen Variablen, die wir bereits
in Kapitel 2 besprachen.) Folgende Integrationsbereiche sind im R2 bzw. R3 von
Interesse – insbesondere bei Anwendungen in der Physik:
1. Eine Kurve in der Ebene oder im Raum.
2. Ein zusammenhängendes Gebiet Ω ⊆ Rn , z.B. eine Kreisscheibe oder ein

Rechteck in der Ebene oder eine Kugel, ein Zylinder oder Quader im Raum.
3. Eine zweidimensionale Fläche im R3 , z.B. eine Kugel- oder Zylinderoberfläche.
Wir behandeln diese Fälle im Folgenden.
7.7 Kurvenintegrale
Kurvenintegrale über Vektorfelder:
Zunächst betrachten wir sog. Kurvenintegrale über Vektorfelder. Als Beispiel für ein
solches Integral sei die (mechanische) Arbeit genannt, die eine Kraft F längs eines
Weges (= Kurve) C vom Punkt r A nach r B an einem Körper leistet. Wenn F längs
des betrachteten Weges ein konstanter Vektor und C eine Gerade zwischen r A und
r B ist, dann ist die
Arbeit = Kraft · Weg, d.h. W = F · (r B − r A ). (7.7.1)
Im Allgemeinen ist F = F (r) und C eine beliebige Bahnkurve. Somit

Z
(7.7.1) −→ W = F (r) · dr, (7.7.2)
C
wobei r A = r(tA ), r B = r(tB ) und t der Kurvenparameter ist. Das kann, muss aber
nicht die Zeit sein.
7.7 Kurvenintegrale 193
2 2 F~ (~ri+1 )
F~ (~r) C F~ (~ri )
~r(tB ) ∆~ri
~r(ti ) ~r(ti + ∆ti )
~r(tA )
1 1
(a) Beispiel für eine Kurve C und für ein Vektor- (b) Beispiel für eine mögliche Zerlegung.
feld F (r), r ∈ C.
Abbildung 7.14: Zum Kurvenintegral (7.7.3).
Hinweis: Wenn W > 0, dann leistet die Kraft Arbeit an dem Körper. Wenn W < 0,
muss Arbeit gegen die Kraft aufgewandt werden. Mit anderen Worten: die Arbeit,
die man von außen aufbringen muss, um einen Körper in einem Kraftfeld F von
r(tA ) nach r(tB ) zu bringen, ist (−W ). Der Fall W = 0 tritt insbesondere bei der
Bewegung eines Körpers auf einer Potentialfläche bzw. -linie einer konservativen
Kraft auf.
Das Integral in (7.7.2) ist ein sogenanntes Kurvenintegral über ein Vektorfeld.
Es ist – analog zu dem bestimmten Integral (2.4.14) bezüglich einer Variablen aus
Kapitel 2 – definiert als Limes einer Riemann-Summe. Dazu unterteilen wir C in
N + 1 Punkte:
r A = r 1 , r 2 , ..., r N +1 = r B ,
siehe Abbildung 7.14. Dann ist das obige Kurvenintegral über das Vektorfeld F (r)
entlang des Weges C von r A nach r B definiert durch
ZrB N
X
I≡ F (r) · dr ≡ lim F (r i ) · ∆r i , (7.7.3)
N →∞
r A ,C ∆r i →0 i=1
vorausgesetzt, dass der Limes für jede beliebige Zerlegung mit ∆ri → 0 und N → ∞
existiert.
Beachte: Das Kurvenintegral (7.7.3) ist ein Skalar9 .
7.7.1 Methoden zur Berechnung von Kurvenintegralen

Es gibt zwei Methoden zur Berechnung des Kurvenintegrals (7.7.3).
9
R
Man kann auch Kurvenintegrale der Form C
F × dr betrachten. Ein solches Integral ergibt
einen Vektor. Wir gehen hier darauf nicht ein.
1. Die Kurve C ist durch eine Parameterdarstellung r = r(t) gegeben. Dann ist
dr
F (r) · dr = F (r(t)) · dt.
dt
Einsetzen in (7.7.3) und Substitution der Integrationsgrenzen r(tA ), r(tB ) →
tA , tB – siehe die Substitutionsregel (2.4.19) in Kapitel 2 – ergibt
ZrB ZtB
I= F (r) · dr = F (r(t)) · ṙdt . (7.7.4)
r A ,C tA
Durch diese Formel wird das Kurvenintegral auf ein gewöhnliches Riemann-
Integral bezüglich des Kurvenparameters t zurückgeführt; der Integrand ist die
skalare Funktion F · ṙ.
Der Faktor F (r(t)) liefert die Werte des gegebenen Feldes entlang der Kur-
ve, der Faktor ṙ ist der nicht-normierte Tangentenvektor an die Kurve bei
r(t); er enthält die Information über C. (Wenn t die Zeit ist, dann ist ṙ die
Geschwindigkeit.) Ein Beispiel besprechen wir unten.
2. Die Kurve C ist nicht durch eine Parameterdarstellung gegeben, sondern durch
einen funktionalen Zusammenhang zwischen den Koordinaten x, y, z – siehe
das unten angegebene Beispiel. Wie können wir in diesem Fall das Kurvenin-
tegral (7.7.3) berechnen? Wir verwenden, dass
∆r i = ∆xi e1 + ∆yi e2 + ∆zi e3 ,
F = F1 e1 + F2 e2 + F3 e3
bezüglich einer kartesischen, d.h. t-unabhängigen ONB. Somit wird (7.7.3) zu
ZrB N
X
F (r) · dr = lim [F1 (r i )∆xi + F2 (r i )∆yi + F3 (r i )∆zi ] . (7.7.5)
N →∞
r A ,C i=1
Wir betrachten zunächt den ersten Summanden. Zu jedem Wert der Koordi-
nate x eines Punktes r = (x, y, z) ∈ C gehören lokal10 eindeutige Werte von y
und z, so dass wir y und z als Funktion von x auffassen können:
y = y(x) , z = z(x).
M.a.W.: Die x-Koordinate übernimmt im ersten Summanden von (7.7.5) die
Rolle des Kurvenparameters. Der erste Summand in (7.7.5) ist dann
N
X ZxB
lim F1 (r i )∆xi = F1 (x, y(x), z(x))dx. (7.7.6)
N →∞
i=1 xA
10
Notfalls muss man C in geeignete Stücke Ci zerlegen, so dass jeder Punkt auf Ci durch x und
die eindeutigen Zuordnungen y = y(x) und z = z(x) festgelegt ist.
Die rechte Seite ist ein gewöhnliches Integral bezüglich der Variablen x.
Analog verfährt man mit dem zweiten und dritten Summanden in (7.7.5). Im
zweiten Summanden betrachten wir x und z als Funktionen von y, im dritten x
und y als Funktionen von z. Dann erhalten wir für das Kurvenintegral (7.7.3)
bzw. (7.7.5):
ZrB
I= F (r) · dr
r A ,C
ZxB ZyB ZzB
= F1 (x, y(x), z(x))dx + F2 (x(y), y, z(y))dy + F3 (x(z), y(z), z)dz .
xA yA zA
(7.7.7)
Beispiel: Wir berechnen für das Vektorfeld

 2 
3x + 2y
A(r) =  −9yz  (7.7.8)
8xz 2
das Kurvenintegral längs der Geraden C1 von (0, 0, 0) nach (1, 1, 1).
Methode 1: Die Parameterdarstellung von C1 ist
   
t 1
dr  
r(t) =  t , 0≤t≤1 ⇒ = 1 .
dt
t 1
Somit 
  
3t2 + 2t 1
dr 
A(r(t)) · = −9t 2  ·  1  = 8t3 − 6t2 + 2t.
dt 3
8t 1
Das Kurvenintegral ist
Z tZ
B =1
(7.7.4) 1
I= A(r) · dr = (8t3 − 6t2 + 2t)dt = (2t4 − 2t3 + t2 )0 = 1.
C1 tA =0
Methode 2: Wir verwenden (7.7.7), wobei (xA , yA , zA ) = (0, 0, 0) und

(xB , yB , zB ) = (1, 1, 1).
ZxB ZyB ZzB
I= A1 dx + A2 dy + A3 dz
xA yA zA
ZxB ZyB ZzB
= (3x2 + 2y(x))dx + (−9yz(y))dy + (8x(z)z 2 )dz.
xA yA zA
Auf der Geraden C1 ist y = x, bzw. z = y, bzw. x = z. Wir setzen diese

Relationen in die Integrale ein und erhalten
Z1 Z1 Z1
2 2
I= (3x + 2x)dx + (−9y )dy + 8z 3 dz = 2 − 3 + 2 = 1.
0 0 0
Hinweis:
Verwechseln Sie das Kurvenintegal (7.7.3) über ein Vektorfeld nicht mit dem gewöhn-
lichen Integral (5.5.13) bzw. (5.5.15) über ein Vektorfeld aus Kapitel 5.
Kurvenintegrale über skalare Felder:

Sei φ = φ(r) eine Funktion mehrerer reeller Variablen. Wir betrachten eine Kurve
C im Definitionsgebiet von φ, die durch eine Parameterdarstellung r = r(t) gegeben
sei. Auf dieser Kurve sei φ(r) stetig. Das skalare Kurven- oder Wegintegral von φ
von r A = r(tA ) nach r B = r(tB ) längs der Kurve C ist erklärt durch
Z ZtB
φ ds ≡ φ(r(t)) |ṙ(t)| dt , (7.7.9)
C tA
wobei |ṙ(t)| der Betrag des Vektors ṙ(t) ist. Das Integral (7.7.9) ist ein Skalar11 .
Beispiele:
1) Setzt man φ = 1, ergibt (7.7.9) die Länge s der Kurve C zwischen r(tA ) und r(tB )
– die resultierende Formel und (5.5.19) aus Kapitel 5 sind identisch.
2) Ein inhomogener, sehr dünner Draht mit bekannter Massendichte µ(r) (hier [µ] =
Masse/Länge) werde durch ein Kurvenstück C, d.h. durch r = r(λ) beschrieben.
Man erhält die Masse M des Drahts durch Berechnung von
ZλB
M= µ(r(λ)) |ṙ(λ)| dλ ,
λA
wobei hier ṙ(λ) ≡ dr/dλ.
7.7.2 Eigenschaften von Kurvenintegralen

Im Folgenden betrachten wir das Kurvenintegal (7.7.3) eines Vektorfeldes, das ins-
besondere in der Newtonschen Mechanik eine wichtige Rolle spielt.
11
R
Man kann auch Kurvenintegrale der Form C
φ(r)dr betrachten. Solche Integrale sind Vektoren.
1. Wenn sich die Kurve C von r A nach r C zusammensetzt aus den Kurven C1 von
r A nach r B und C2 von r B nach r C , dann
ZrC ZrB ZrC

F (r) · dr = F (r) · dr + F (r) · dr. (7.7.10)
r A ,C r A ,C1 r B ,C2
2. Aus (7.7.10) folgt: Wenn eine Kurve C von r A nach r B rückwärts, d.h. von r B
nach r A durhlaufen wird, dann ist
ZrB ZrA
F (r) · dr = − F (r) · dr (7.7.11)
r A ,C r B ,C
3. Im Allgemeinen hängt das Kurvenintegral (7.7.3) für vorgegebenen Anfangs-

und Endpunkt r A , r B von der Form des Wegs C von r A nach r B ab.
Beispiel: Wir betrachten wieder das Vektorfeld A aus (7.7.8) und berechnen das
Kurvenintegral von r A = (0, 0, 0) → r B = (1, 1, 1) – aber diesmal nicht längs der
Geraden C1 , sondern längs des folgenden Parabelbogens C2 :


t
C2 : r(t) =  t2  , 0≤t≤1
4
t
 
1
dr  dr
⇒ = 2t  ⇒ A(r(t)) · = 5t2 − 18t7 + 32t12
dt 3 dt
4t
r
Z B Z1
dr 293
⇒ IC2 = A · dt = (5t2 − 18t7 + 32t12 )dt = 6 IC1 .
=
dt 156
r A ,C2 0
Abhängigkeit von der Form des Integrationsweges:
Frage: Wann ist das Kurvenintegral (7.7.3) für ein gegebenes Vektorfeld A(r) un-
abhängig von der Form des Weges C von r A nach r B ?
Antwort: Wenn das Vektorfeld A(r) ein Gradientenfeld ist, d.h. wenn ein skalares
Feld φ(r) existiert, so dass
A(r) = grad φ(r) ≡ ∇φ(r) . (7.7.12)

Beweis:
ZrB ZrB ZrB X3
(7.7.12) ∂φ
A · dr = (∇φ) · dr = dxi
i=1
∂x i
r A ,C r A ,C r A ,C
(7.7.13)
ZrB r B
(7.2.12)
= dφ = φ(r) = φ(r B ) − φ(r A ).

rA
r A ,C
Hinweis: Gl. (7.7.13) ist das Analogon zu folgendem wohlbekannten Ergebnis für
Funktionen einer Variablen: Wenn der Integrand die Ableitung einer Funktion f (x)
ist, dann ist f (x) + c die Stammfunktion, d.h.
ZxB ZxB
df xB
dx = df = f (x) = f (xB ) − f (xA ).

dx xA
xA xA
Wir definieren nun mit Hilfe des Kurvenintegrals (7.7.3) eine Funktion φC (r). Die
Koordinaten des Anfangspunktes r A = r 0 werden festhalten und die des Endpunktes
r B = r seien variabel:
C3
Zr ~r
φC (r) ≡ A(r 0 ) · dr 0 . C2 (7.7.14)
r 0 ,C
~r0
C1
Im Allgemeinen wird für ein gegebenes A(r) die Funktion φC (r) vom Weg C abhängen
– deswegen der Index C an φ. Wir bekommen für verschiedene Wege C i.A. verschie-
dene Funktionen φC . Wir zeigen nun die Umkehrung von (7.7.13):
Wenn (7.7.14) nur vom Anfangs- und Endpunkt r 0 und r, aber nicht vom Weg C
abhängt, dann ist A(r) als Gradientenfeld darstellbar.
Beweis: Wir analysieren die Differenz der beiden folgenden Integrale

r+∆r
Z Zr r+∆r
Z
0 0 (7.7.10)
φ(r + ∆r) − φ(r) = A · dr − A · dr = A · dr 0 . (7.7.15)
r0 r0 r
Der Index C an φ wurde weggelassen, da diese Funktion nach Voraussetzung weg-

unabhängig ist.
Rechte Seite von (7.7.15): Nach dem Mittelwertsatz der Integralrechnung gibt es
einen Punkt r 00 zwischen r und r + ∆r, so dass das Integral auf der rechten Seite
von 7.7.15 durch A(r 00 ) · ∆r gegeben ist.
Linke Seite von (7.7.15): Die Taylorentwicklung von φ(r + ∆r) um r ergibt
φ(r + ∆r) − φ(r) = (∇φ) · ∆r + O((∆r)2 ).
Setzen wir beide Ergebnisse in (7.7.15) ein und bilden den Limes ∆r → 0, dann
grad φ(r) = A(r),
was zu beweisen war.
In (7.7.13) zeigten wir die Umkehrung dieser Aussage, nämlich: Wenn A von der
Form A = ∇φ, dann ist das Kurvenintegral wegunabhängig.
Somit gilt der folgende wichtige
Satz 1: Kurvenintegrale über ein Vektorfeld A sind dann und nur dann unabhängig
von der Form des Weges C, wenn A von der Form A = ∇φ ist. Das skalare Feld
φ(r) ist durch A nur bis auf eine additive Konstante festgelegt; denn offensichtlich
liefern φ(r) und φ(r) + C dasselbe A(r) = ∇φ(r).
Ein Vektorfeld A(x), das von der Form A(x) = ∇φ(x) ist, nennt man ein konser-
vatives Feld. Man bezeichnet φ oft pauschal als das Potential von A.
Insbesondere nennt man eine Kraft F (x), die in der Form
F (x) = −∇φ(x) (7.7.16)
darstellbar ist, eine konservative Kraft. Dieser Begriff wurde bereits in Abschnitt 7.4.1
eingeführt.
Hinweise:
1) Die Vorzeichenkonvention wurde bereits in Abschnittt 7.4.1 erklärt.
2) Wenn φ explizit von der Zeit abhängt, dann nennt man, wie ebenfalls bereits in
Abschnitt 7.4.1 erwähnt wurde, F (x, t) = −∇φ(x, t) eine Potentialkraft.
3) Wenn das Vektorfeld A eine z.B. auf ein Teilchen wirkende Kraft F beschreibt,
d.h. [F ] = N, dann hat φ die Dimension einer Energie, [φ] = Nm. Die Funktion φ(x)
ist die potentielle Energie des Teilchens am Punkt x. Energien können nicht abso-
lut, sondern nur in Bezug auf eine Referenzenergie gemessen werden. Diese Tatsache
spiegelt sich hier in dem Sachverhalt wieder, dass φ durch eine gegebene Kraft nur
bis auf eine additive Konstante festgelegt wird.
Äquivalent zu Satz 1 ist der

Satz 2: Ein Vektorfeld A hat genau dann die Form A = ∇φ, wenn das Integral
von A über alle geschlossenen Kurven C Null ist.
I
A · dr = 0 ⇔ A = ∇φ. (7.7.17)
C
Die Kurve C muss natürlich im Definitionsgebiet von A liegen. H

Hinweis: Für Integrale über geschlossene Kurven benutzt man oft das Symbol C .
Beweis: Sei A = ∇φ.
I Zr2 Zr1
A · dr = A · dr + A · dr C2
C r 1 ,C1 r 2 ,C2
Zr2 Zr2 ~r2
(7.7.11)
= A · dr − A · dr C
r 1 ,C1 r 1 ,C2
Zr2 Zr2 ~r1
= dφ − dφ = 0. C1
r1 r1
Führen Sie den Beweis in umgekehrter Richtung selbst durch!
7.7.3 Hinreichendes Kriterium für ein Gradientenfeld

Es stellt sich die Frage, wie wir feststellen können, ob ein gegebenes Vektorfeld A(r)
ein Gradientenfeld, also von der Form A = ∇φ ist. In (7.4.25) auf Seite 183 zeigten
wir folgendes: Für eine in einem Gebiet zweimal stetig differenzierbare Funktion φ
ist
rot grad φ ≡ ∇ × ∇φ = 0. (7.7.18)
Daraus folgt:
Wenn A = ∇φ, dann rot A = 0. (7.7.19)
Gilt auch die Umkehrung, d.h.
wenn rot A = 0, dann A = ∇φ,

Rr
und somit (aufgrund der obigen Sätze 1 und 2) r12 A · dr wegunabhängig, bzw.
H
C
A · dr = 0? Ja, fast immer. Präzise formuliert gilt folgender Satz:
Wenn rot A = 0 in einem einfach zusammenhängenden Gebiet G ∈ R3 (bzw. G ∈
R2 ), dann existiert ein φ, so dass A = ∇φ. Aufgrund der obigen Sätze 1 und 2
sind somit Kurvenintegrale
H über A in diesem Gebiet unabhängig von der Form des
Weges, bzw. C A · dr = 0.
Ein einfach zusammenhängendes Gebiet G ist ein Gebiet, in dem sich jede geschlosse-
ne Kurve, die ganz in G liegt, auf einen Punkt in G zusammenziehen lässt. Beispiele
im R2 sind in Abbildung 7.15 gezeigt; Beispiele im R3 werden in der Legende dieser
Abbildung erläutert.
Aus Zeitgründen können wir den soeben zitierten Satz nicht beweisen. (Siehe
dazu die Vorlesung Höhere Mathematik III oder beispielsweise das Buch von Groß-
mann, S. 181ff). Wir machen uns aber anhand eines Beispiels im R2 klar, warum
(a) (b) (c) (d)
Abbildung 7.15: Beispiele für einfach zusammenhängende Gebiete (a,b) und nicht
einfach zusammenhängende Gebiete (c,d) im R2 . Beispiele im R3 : Wir denken uns
die gezeigten Gebiete aus der Zeichenebene heraus ins Dreidimensionale (3D) fortge-
setzt. Die so erzeugten 3D-Gebiete a,b sind ebenfalls einfach zusammenhängend. Aus
den Löchern in den 2D-Gebieten c,d werden in 3D beispielsweise Kugeln, Schläuche
oder krumme Würste. Wenn diese Gebilde ganz innerhalb des jeweiligen 3D-Gebiets
G liegen oder die Randfläche von G nur einmal berühren oder durchstoßen, dann ist
G einfach zusammenhängend; denn jede geschlossene Kurve in G kann dann immer
auf einen Punkt in G zusammengezogen werden. Falls diese Objekte die Randfläche
von G mindestens zweimal berühren oder durchstoßen, dann ist G nicht einfach
zusammenhängend.
die Eigenschaft einfach zusammenhängend wichtig ist. Wir zeigten in (7.4.23), dass
die Rotation des zweidimensionalen Vektorfeldes (7.4.22),

1 −y
B(x) = 2 (7.7.20)
x + y2 x
in der ,,punktierten Ebene” verschwindet:
rot B = 0 ∀r ∈ R2 \ {(0, 0)} .
Am Ursprung wird rot B singulär. Die punktierte Ebene R2 \ {(0, 0)} ist aber of-
fensichtlich nicht einfach zusammenhängend.
H Somit kann man aufgrund des obigen
Satzes nicht erwarten, dass C B · dr = 0, wenn C eine geschlossene Kurve ist, die
den Nullpunkt umschließt. Sei C o.B.d.A. der Kreis um den Nullpunkt mit Radius
R. In der Tat findet man, dass
I
B · dr = 2π ,
C
wenn C den Nullpunkt einmal umkreist. Wir zeigen das als Hausaufgabe. Zur Be-
rechnung des KreisintegralsR benutzt man bequemerweise ebene Polarkoordinaten.
r
Konsequenz: Das Integral r0 B(r 0 ) · dr 0 ist wegabhängig; denn wenn von r 0 → r
zum einen auf einem Weg oberhalb und zum anderen auf einem Weg unterhalb des
Ursprungs integriert wird, ist die Differenz der beiden Wegintegrale 2π. Demzufol-
ge kann man keine eindeutige Funktion φ bestimmen, so dass B = ∇φ(r) in der
punktierten Ebene.
Hinweise:
1) Wenn man (7.7.20) in einem einfach zusammenhängenden HGebiet G des R2 be-
trachtet, das den Ursprung nicht enthält, dann rot B = 0 und C B · dr = 0 für alle
geschlossenen Kurven in G. D.h. lokal lässt sich B durchaus als der Gradient eines
Potentials darstellen. Diese lokalen Potentiale lassen sich aber nicht widerspruchsfrei
zu einem Potential auf R2 \ {(0, 0)} zusammensetzen.
2) Das Analogon zu (7.7.20) im Raum ist

 
−y
1
B(x) = 2  x , x ∈ R3 \ {z-Achse} . (7.7.21)
x + y2
0
Zwar ist rot B = 0 in G = R3 \ {z-Achse}, aber dieses Gebiet H ist nicht einfach
zusammenhängend. Somit sollte es nicht verwundern, dass C B · dr 6= 0 für jede
geschlossene Kurve, die die z-Achse umschließt.
Beispiel aus der Physik: Gegeben sei ein (unendlich langer) dünner Metalldraht längs
der z-Achse, durch den ein konstanter Gleichstrom fließt. Dieser Gleichstrom erzeugt
ein statisches Magnetfeld, das bis auf eine Proportionalitätskonstante durch (7.7.21)
gegeben ist. Das lernen Sie in den Vorlesungen über Elektrodynamik.
3) Wir betrachten die von einem sich bei r 0 = 0 befindenden Massenpunkt ver-
ursachte Gravitationskraft, bzw. die von einer sich bei r 0 = 0 befindenden Punkt-
ladung verursachten Coulombkraft (auf einen anderen Massenpunkt bzw. Punktla-
dung) an der Stelle r im dreidimensionalen Raum. Beide Kräfte sind von der Form
γ r
F (r) = , r ∈ G = R3 \ {(0, 0, 0)} ,
r2 r
wobei r = |r|. Im Ursprung wird F singulär; in G Hist rot F = 0 – nachrechnen! Das
Gebiet G ist einfach
R r zusammenhängend! Somit ist C F · dr = 0 für jede geschlossene
0 0
Kurve in G, d.h. r0 F (r ) · dr ist wegunabhängig. Demzufolge ist F in G darstellbar
als F = −grad φ, wobei φ = γ/r. Die Gravitationskraft und Coulombkraft sind in
der Tat Gradientenfelder.
Fazit: Das folgende Kriterium ist hinreichend dafür, dass A ein Gradientenfeld
ist:

Wenn rot A = 0 in einem einfach
⇒ Es existiert ein φ(r) mit A = ∇φ.
zusammenhängenden Gebiet
Berechnung der Potentialfunktion:

Wenn das soeben genannte Kriterium für ein Vektorfeld A(r) erfüllt ist, kann man
die Potentialfunktion φ(r) aus A(r) folgendermaßen bestimmen:
Methode 1: Man löst das Differentialgleichungssystem
∂
φ = A1 (x, y, z) ,
∂x
∂
φ = A2 (x, y, z) , (7.7.22)
∂y
∂
φ = A3 (x, y, z)
∂z
durch Integration der Gleichungen12 , siehe das u.a. Beispiel.

Methode 2: Man berechnet das Kurvenintegral
Zr
φ(r) = A(r 0 ) · dr 0 . (7.7.23)
r0
Da dieses Integral wegen A = ∇φ wegunabhängig ist, wählt man zur Integration

bequemerweise einen Weg von r 0 nach r so, dass das Integral (7.7.23) auf möglichst
einfache Weise berechnet werden kann. Ist das Vektorfeld in einer kartesischen Basis
gegeben, kann man z.B. einen Polygonzug längs der Koordinatenachsen wählen:
C0 : r 0 = (x0 , y0 , z0 ) → (x, y0 , z0 ) → (x, y, z0 ) → (x, y, z).
Zur Berechnung von (7.7.23) längs eines solchen Weges kann man Methode 2 auf Sei-
te 194 benutzen. Die Funktion φ(r) ist, wie gesagt, durch A nur bis auf eine additive
Konstante festgelegt. Dies entspricht in (7.7.23) dem willkürlichen Anfangspunkt r 0 .
Durch Vorgabe von φ(r 0 ) ist φ(r) als Funktion eindeutig festgelegt.
Beispiele:
1. Das Vektorfeld (7.7.8) auf Seite 195

 
3x2 + 2y
A(r) =  −9yz 
8xz 2
R
ist kein Gradientenfeld, weil wir fanden, dass die Kurvenintegrale A · dr
wegabhängig sind. Wir überprüfen das noch einmal mit dem rot A Kriterium.
∇ × A = (∂x A3 − ∂z A2 )e1 + (∂z A1 − ∂x A3 )e2 + (∂x A2 − ∂y A1 )e3

= 9ye1 + 8z 2 e2 − 2e3 6= 0.
12
Es handelt sich hier um ein System von drei partiellen DGL 1. Ordnung für die gesuchte
Funktion φ(x, y, z), das man in der Regel recht einfach lösen kann.
2. Sei  
3x
A(r) =  −y 2  .
0
Dieses Feld ist offensichtlich in ganz R3 definiert und
rot A = 0 ∀r ∈ R3 .
Da der R3 einfach zusammenhängend ist, ist A darstellbar als A = ∇φ.

Bestimmung von φ(r): Wir benutzen die obige Methode 1 und lösen das Dif-
ferentialgleichungssystem (7.7.22):
∂x φ = 3x , (1)
∂y φ = −y 2 , (2)
∂z φ = 0 . (3)
Die Integration von (1) ergibt

Z
3
φ(x, y, z) = 3xdx = x2 + f (y, z) . (4)
2
Einsetzen in (2) und Integration liefert
∂y f (y, z) = −y 2
y3
Z
⇒ f (y, z) = − y 2 dy = − + g(z) . (5)
3
Einsetzen in (3) und Integration liefert
∂g(z)
= 0 ⇒ g(z) = const. (6)
∂z
Aus (4), (5) und (6) folgt schließlich
3 y3
φ(x, y, z) = x2 − + const.
2 3
Man kann φ(r) auch mit Methode 2, d.h. durch Berechnung des Integrals
(7.7.23) bestimmen – Hausaufgabe!
7.8 Zweidimensionale Integrale

Wir untersuchen zunächst Integrale der Form
ZZ
I= f (x, y) dx dy, (7.8.1)
F
7.8 Zweidimensionale Integrale 205
xi , yi
∆Fi
Abbildung 7.16: Koordinatennetz für ein zweidimensionales Integral.
wobei F ⊆ R2 ein Gebiet im R2 und f (x, y) eine integrierbare Funktion (siehe un-
ten) ist. Das Integral (7.8.1) ist ein Beispiel für ein zweidimensionales Integral, auch
Doppelintegral oder Flächenintegral genannt. Der Begriff Flächenintegral ist miss-
verständlich, denn
• nur wenn das Produkt der Integrationsvariablen x, y die Dimension einer Fläche
hat und f (x, y) = 1, dann liefert das Doppelintegral (7.8.1) die Fläche des zweidi-
mensionalen Gebiets F im geometrischen Sinn.
• Wenn f 6= 1, sollte man präziser von einem Integral über die ,,Fläche” F sprechen.
Die Dimension von I ist durch die Dimension von f und der Integrationsvariablen
bestimmt.
Zur Definition von (7.8.1): Man überzieht die Fläche F mit einem beliebigen
Koordinatennetz (das nicht kartesisch sein muss), siehe Abbildung 7.16. Das Gebiet
F wird dadurch auf beliebige Weise in N Teilflächenstücke ∆Fi zerlegt. Innerhalb
eines Teilflächenstücks wertet man die Funktion f (x, y) an einem beliebigen Punkt
(xi , yi ) ∈ ∆Fi aus und bildet die Riemann-Summe
N
X
f (xi , yi )∆Fi . (7.8.2)
i=1
Das Doppelintegral (7.8.1) ist definiert als der Limes der Riemann-Summe
ZZ N
X
f (x, y) dx dy = lim f (xi , yi )∆Fi , (7.8.3)
N →∞
F ∆Fi →0 i=1
falls dieser Limes für beliebige Zerlegungen existiert. Die Funktion f (x, y) heißt dann
integrierbar im Gebiet F – die Reihenfoge der Integration kann vertauscht werden.
Bei einer kartesischen Zerlegung ist ∆Fi = ∆xi ∆yi . Beachten Sie, dass mit ∆Fi → 0
y y
y = g2 (x)
d
F x = h1 (y) F
x = h2 (y)
c
y = g1 (x)
x x
a b
(a) (b)
Abbildung 7.17: Die Ränder derselben Fläche, verschieden parametrisiert.
gemeint ist, dass sowohl die Länge als auch die Breite des Flächenelements gegen
Null gehen muss: ∆xi → 0 und ∆yi → 0.
Mit der Riemann-Summe (7.8.3) kann man das Doppelintegral näherungsweise
(numerisch) berechnen. Man wählt N 1 und ∆Fi 1 (in adäquaten Einheiten)
und wertet die endliche Summe auf der linken Seite von (7.8.3) aus.
Wie kann man das Doppelintegral analytisch berechnen? Notwendigerweise muss
der Rand der Fläche F durch Funktionen y = y(x) oder x = x(y) in der xy-Ebene
analytisch darstellbar sein.
Die Abbildungen in 7.17 zeigen dasselbe Gebiet F , dessen Rand – der die Inte-
grationsgrenzen bestimmt – auf zwei verschiedene Weisen parametrisiert ist. Man
kann das Integral (7.8.1) für Gebiete dieses Typs demzufolge auf zweifache Weise
berechnen.
ZZ
I= f (x, y) dx dy
F
 
Zb gZ2 (x)
= f (x, y)dy  dx (7.8.4)

 

a g1 (x)
| {z }
≡f1 (x)
 
Zd hZ2 (y)
= f (x, y)dx  dy. (7.8.5)

 

c h1 (y)
| {z }
≡f2 (y)
Gleichung (7.8.4) entspricht der Abbildung 7.17(a). Hier integriert man zunächst
y
g1 (x)
g2 (x)
g3 (x)
g4 (x)
x
a b c d
Abbildung 7.18: Eine Fläche mit einem komplizierteren Rand als der in Abb. 7.17.
für festgehaltenes x über die Variable y, also längs der gestrichelten Linien parallel
zur y-Achse, von der unteren Grenze y1 = g1 (x) zur oberen Grenze y2 = g2 (x). Das
Ergebnis ist eine Funktion f1 (x), die man dann über die Variable x im Intervall
a ≤ x ≤ b integriert.
Alternativ kann I mit Gleichung (7.8.5) berechnet werden, d.h. es wird erst über
x und dann über y integriert – siehe Abbildung 7.17(b).
Es gibt natürlich auch Gebiete mit komplizierteren Rändern – dergestalt, dass
ein solcher Rand nicht zusammensetzbar ist aus einem jeweils durch eine Funktion
beschreibbaren oberen und unteren (bzw. linken und rechten) Randteil. Ein Beispiel
für ein solches Gebiet ist in Abbildung 7.18 gezeigt. Der linke Rand dieses Gebietes
kann nicht durch eine einzige Funktion beschrieben werden. Man muss in diesem
Fall das Doppelintegral I in eine Summe von Beiträgen zerlegen. Wir benutzen
(7.8.4) und beschreiben den linken Rand in den folgenden x-Intervallen durch die
Funktionen g1 - g4 :
c ≤ x ≤ d : y1 = g4 (x), y2 = g1 (x),
b ≤ x ≤ c : y1 = g4 (x), y2 = g3 (x),
a ≤ x ≤ c : y1 = g2 (x), y2 = g1 (x).
Dann
Zd Zc Zc
I= . . . dx + . . . dx + . . . dx .
c b a
Beispiel:
y y = x2
Integriere die Funktion y = 2x
f (x, y) = xy 2 (7.8.6) d=4
über die graue Fläche F . Die

Ränder von F sind
y = x2 und y = 2x
y √
bzw. x = 2 und x = + y .
x
c=0
a=0 b=2
Benutze die Formel (7.8.4):
 
Zb=2 Z2x
I=  xy 2 dy  dx
a=0 x2
| {z }
f1 (x)
y=2x
xy 3 8x4 x7
f1 (x) = = −
3 y=x2 3 3
Z2 4
x7

8x 32
⇒ I= − dx = .
3 3 5
0
Benutze alternativ die Formel (7.8.5):

 √ 
Zd=4 Z y
I= xy 2 dx  dy
 

c=0 y/2
| {z }
f2 (y)
√
2 2 x= y
xy y3 y4
f2 (y) = = −
2 x=y/2 2 8
Z4 3
y4

y 32
⇒ I= − dy = .
2 8 5
0
7.8.1 Variablentransformation, Jacobi-Determinante

Wie bei Integralen über eine Variable ist es bei zwei- und höherdimensionalen In-
tegralen oft zweckmäßig, neue Integrationsvariable einzuführen. Zum Beispiel em-
pfiehlt es sich bei Integration über eine Kreisfläche, anstelle von kartesischen Koor-
dinaten x, y ebene Polarkoordinaten ρ, φ zu benutzen:
p
x = ρ cos φ ρ = x2 + y 2 , 0 ≤ ρ < ∞,
−→ y (7.8.7)
y = ρ sin φ φ = arctan , 0 ≤ φ < 2π.
x
Allgemein: x, y → u, v:
x = x(u, v) u = u(x, y)
und Umkehrung (7.8.8)
y = y(u, v) v = v(x, y).
Der funktionale Zusammenhang (7.8.8) zwischen x, y und u, v muss zumindest lokal

(d.h. in geeigneten Gebieten F ⊂ R2 ) umkehrbar eindeutig sein. Wir geben unten
ein Kriterium an, mit dem man überprüfen kann, ob eine Variablentransformation
(7.8.8) umkehrbar ist.
Wie schreibt man das Integral (7.8.1) auf neue Variablen u = u(x, y) und v =
v(x, y) um? Wir suchen das mehrdimensionale Analogon der Substitutionsformel
(2.4.19) für bestimmte Integrale aus Kapitel 2, auf die wir noch einmal eingehen. Die
umkehrbare Variablentransformation (d.h. umkehrbare Funktion) u = u(x) bilde das
Intervall a ≤ x ≤ b auf das Intervall α ≤ u ≤ β ab; die Umkehrfunktion bezeichnen
wir mit x = x(u). Dann nimmt die Formel (2.4.19) folgende Form an:
Zb Zu(b) Zβ
dx dx
f (x)dx = f (x(u)) du = f (x(u)) du. (7.8.9)
du du
a u(a) α
Man beachte die Betragsstriche auf der rechten Seite, die aus folgendem Grund auf-
treten. Bei der im betrachteten Intervall umkehrbaren Transformation u = u(x) ist
entweder du/dx > 0 oder du/dx < 0. Wenn du/dx = 1/(dx/du) < 0, dann ist
u(a) = β und u(b) = α, wobei nach Vereinbarung β > α. Der Vorzeichenwechsel,
der beim Vertauschen der Integrationsgrenzen entsteht, wird durch die Ersetzung
dx/du → |dx/du| kompensiert.
Nun zur Variablentransformation u = u(x, y) und v = v(x, y). Wir betrachten

die Differenzen
∆u ≡ u(x + ∆x, y + ∆y) − u(x, y),
(7.8.10)
∆v ≡ v(x + ∆x, y + ∆y) − v(x, y),
wobei |∆x|, |∆y| 1. Die Taylorentwicklung (mit Hilfe von (7.3.2)) der rechten
Seite um x, y liefert
∂u(x, y) ∂u(x, y)
∆y + O (∆xi )2 ,

∆u = ∆x +
∂x ∂y
(7.8.11)
∂v(x, y) ∂v(x, y)
∆y + O (∆xi )2 .

∆v = ∆x +
∂x ∂y
Mit (7.8.11) kann man für jedes Zahlenpaar ∆x, ∆y eindeutig ein Zahlenpaar ∆u,
∆v ausrechnen. Für ∆x, ∆y → 0 erhalten wir

∆u ∂x u ∂y u ∆x
= · . (7.8.12)
∆v ∂x v ∂y v ∆y
| {z }
≡D(x,y)
Die Matrix D(x, y) heißt Funktionalmatrix der Transformation (7.8.8). Damit man
umgekehrt jedem ∆u, ∆v eindeutig ein ∆x, ∆y zuordnen kann, muss die inverse
Matrix D−1 existieren. Wie wir in Abschnitt 6.5.3 lernten, ist das der Fall, wenn die
Determinante det D 6= 0.
Dies ist das gesuchte Kriterium: Die Transformation (7.8.8) ist in der Umgebung
eines Punktes x, y genau dann umkehrbar eindeutig, wenn

∂x u ∂y u ∂(u, v)
det D(x, y) ≡ ≡ 6= 0. (7.8.13)
∂x v ∂y v ∂(x, y)
Die Determinante det D heißt Funktionaldeterminante oder Jacobi-Determinante

der Transformation (7.8.8). Die Jacobi-Determinante der Umkehrtransformation
x = x(u, v), y = y(u, v)
ist gemäß der Definition (7.8.13) gegeben durch

∂(x, y) ∂u x ∂v x
= . (7.8.14)
∂(u, v) ∂u y ∂v y
Wenn (7.8.13) von Null verschieden ist, kann vermutet werden, dass auch (7.8.14)
existiert. Tatsächlich gilt die wichtige Formel
∂(x, y) 1
= ∂(u,v)
. (7.8.15)
∂(u, v)
∂(x,y)
Beweis: Wir zeigen diese Formel für den allgemeinen Fall einer Transformation
von n Variablen. Sei xi = xi (u1 , u2 , ..., un ) und ui = ui (z1 , ..., zn ), i = 1, ..., n. Die
Kettenregel besagt, dass
n
∂xi X ∂xi ∂uk
= ⇔ Matrix D1 = D2 D3 .
∂zj ∂uk ∂zj
k=1 | {z }
|{z}
D1 D2 D3
Daraus folgt
det D1 = det D2 det D3 . (7.8.16)
Setze nun zi = xi . Dann ist D1 = δij die Einheitsmatrix, d.h. det D1 = 1. Damit
erhalten wir aus (7.8.16) die Formel (7.8.15).
y
v-Linien
∂~r(u, v)
dv
∂v
dF dy dF
∂~r(u, v)
dx du
∂u
x
u-Linien
(a) Kartesische Koordinaten x, y. (b) Allgemeine Koordinaten u, v.
Abbildung 7.19: Das Flächenelement dF in der xy- und der uv-Ebene. Zur Bezeich-
nung ,,u, v-Linien”, siehe Abschnitt 7.5.3.
Das Flächenelement dF :
In kartesischen Koordinaten x, y ist das zweidimensionale Flächenelement gegeben
durch dF = dxdy, siehe Abbildung 7.19(a). Wir führen nun eine Variablentransfor-
mation x, y 7→ u, v durch und berechnen dF in den neuen Koordinaten u, v. Diese
sind i.A. krummlinige Koordinaten. Man beachte, dass wir hier Flächen in der Ebene
R2 behandeln. (Den allgemeineren Fall von Flächen im R3 besprechen wir im nächs-
ten Abschnitt.) Die Punkte in der Ebene R2 , insbesondere die einer Teilfläche werden
analytisch beschrieben durch die Parameterform (wir benutzen hier der Einfachheit
halber eine kartesische Basis):
r(u, v) = x(u, v)e1 + y(u, v)e2 . (7.8.17)
Durch x, y 7→ u, v wird die xy-Ebene (≡ R2 ) auf die uv-Ebene (≡ R2 ) abgebildet.
Wir berechnen nun die Tangentenvektoren an die u- und v-Koordinatenlinie im
Punkt (u, v):
∂r ∂r
tu ≡ du , tv ≡ dv, (7.8.18)
∂u ∂v
siehe Abbildung 7.19(b). Beachte, dass es sich um nichtnormierte13 Vektoren han-
delt.
Das Flächenelement dF ist die Fläche des Parallelogramms, das von diesen Tangen-
tenvektoren aufgespannt wird. Diese Fläche ist (vgl. Abbildung 5.5, Seite 106)

∂r ∂r
dF = |tu × tv | =
× du dv. (7.8.19)
∂u ∂v
13
Die Differentiale du und dv in (7.8.18) sind notwendig. Als Beispiel wenden wir (7.8.18) auf
ein kartesisches Koordinatennetz an, d.h. r = xe1 + ye2 . Man erhält
∂r ∂r
dx = e1 dx , dy = e2 dy.
∂x ∂y
Einsetzen in (7.8.19) ergibt dF = dxdy, also das erwartete Ergebnis!
y y
√
y2 = R 2 − x2
b
R x a a x
0 0
b
√
y 1 = − R 2 − x2
(a) Kreisfläche. (b) 2. Fläche einer Ellipse.
Abbildung 7.20: Zwei Beispiele für Flächen im R2 .
Mit (7.8.17) erhält man für das Vektorprodukt

    
∂u x ∂v x 0
∂r ∂r 
× = ∂u y  ×  ∂v y  =  0 .
∂u ∂v
0 0 ∂u x ∂v y − ∂v x ∂u y
Somit ist
∂(x, y)
dF = |∂u x ∂v y − ∂v x ∂u y|du dv =
du dv. (7.8.20)
∂(u, v)
Mit diesem Ergebnis ist die Transformationsformel für zweidimensionale Integrale:
ZZ ZZ
∂(x, y)
f (x, y)dx dy = f (x(u, v), y(u, v)) du dv . (7.8.21)
∂(u, v)
F F0
Dabei ist F 0 das Bild des Gebiets F in der uv-Ebene.

Beachte: In (7.8.21) tritt der Betrag der Jacobi-Determinante auf. Wenn auf der
linken Seite – also beim Integral über F – die Integrationsgrenzen so sind, dass
die unteren Grenzen kleiner als die oberen sind, x1 ≤ x2 , y1 ≤ y2 , dann müssen
auch Integrationsgrenzen auf rechten Seite diese Bedingung erfüllen. Siehe dazu das
eindimensionale Analogon (7.8.9) und den Hinweis unten.
Beispiele:
1. Integriere die Funktion

f (x, y) = x2 y 2
über die Kreisfläche aus Abbildung 7.20(a).
(a) Man kann z.B. die Formel (7.8.4) benutzen:
ZR Zy2
 
I=  x2 y 2 dy  dx .
−R y1
Rechnen Sie das zu Hause aus!

(b) Alternativ bietet sich hier an, Polarkoordinaten
x = r cos φ , y = r sin φ
und die Transformationsformel (7.8.21) zu verwenden. Die Jacobi-Determinante

der Transformation ist

∂(x, y) ∂r x ∂φ x cos φ −r sin φ
= = = r cos2 φ + r sin2 φ = r ≥ 0.
∂(r, φ) ∂r y ∂φ y sin φ r cos φ
Somit ist das Flächenelement

∂(x, y)
dF = dr dφ = r dr dφ,
∂(r, φ)
Das Integral von f (x, y) = x2 y 2 über den Kreis aus Fig. 7.20(a) ist dann14
Z2π ZR Z2π
5 2 R6
I= r (cos φ sin φ) dr dφ = (cos φ sin φ)2 dφ
6
0 0 0
6
2π
R6 π

R φ sin(4φ)
= − = .
6 8 32
0 24
2. Wir berechnen nun den Flächeninhalt der in Abbildung 7.20(b) dargestellten

Ellipse. Diese Fläche besteht aus der Punktmenge
x2 y 2

2
F = (x, y) ∈ R : 2 + 2 ≤ 1 ,
a b
deren Rand durch
x2 y 2
+ 2 =1 (7.8.22)
a2 b
beschrieben wird. Zur Berechnung der Fläche der Ellipse müssen wir die Funk-
tion
f (x, y) = 1
14
Der Sachverhalt, dass x, y ↔ ρ, φ am Ursprung nicht definiert ist, d.h. die Jacobi-Determinante
∂(x, y)/∂(u, v) dort Null wird, ist für zweidimensionale Integrale unschädlich, siehe HöMa-
Vorlesung.
über die o.a. Punktmenge integrieren.

Es bietet sich die Variablentransformation
x, y → r, φ
mit
x = ar cos φ , y = br sin φ (7.8.23)
an. (Das sind sogenannte verallgemeinerte Polarkoordinaten.) Mit diesen Ko-
ordinaten lässt sich die Ellipsenfläche folgendermaßen beschreiben:
F = (r, φ) ∈ R2 : 0 ≤ φ ≤ 2π, 0 ≤ r ≤ 1 .

Zur Berechnung des Flächeninhalts benutzen wir (7.8.21). Die Jacobi-Determinante

der Transformation ist

∂(x, y) a cos φ −ar sin φ
= = abr ≥ 0.
∂(r, φ) b sin φ br cos φ
Somit ist der Flächeninhalt FI der Ellipse gegeben durch
ZZ Z2π Z1 Z2π
1
FI = dx dy = abr dr dφ = ab dφ = abπ .
2
F 0 0 0
Hinweis: Manchmal ist in der Literatur die Transformationsformel (7.8.21) ohne

die Betragsstriche an der Jacobi-Determinante angegeben. Wir machen uns an einem
Beispiel klar, wie diese Version der Transformationsformel anzuwenden ist.
Wir betrachten wieder das Beispiel (7.8.6) auf Seite 208:
f (x, y) = xy 2 , zu integrieren über die Fläche

mit den Rändern y = x2 und y = 2x, mit 0 ≤ x ≤ 2.
Um die Anwendung besagter Formel zu illustrieren, führen wir neue Variablen u, v

ein:
x = u, y = −v .
Das entspricht einer Spiegelung an der x-Achse. Die Jacobi-Determinante dieser
Transformation ist
∂(x, y) 1 0
= = −1.
∂(u, v) 0 −1
Die Gleichungen für den unteren und oberen Rand der Fläche, y = x2 und y = 2x,
lauten in den neuen Variablen: −v = u2 und −v = 2u, d.h.
y = x2 → v = −u2 ,
0 ≤ u ≤ 2. (7.8.24)
y = 2x → v = −2u ,
In diesem Intervall ist −u2 ≥ −2u. Somit beschreibt v = −u2 den oberen Rand der
Fläche, während der untere Rand durch v = −2u gegeben ist.
• Bei Anwendung der Transformationsformel (7.8.21) muss zum einen

∂(x, y)
∂(u, v) = +1

und zum anderen die unterhalb Gleichung (7.8.21) angegebene Vorschrift verwendet
werden. D.h. als untere Grenze des Integrals bezüglich v muss die Gleichung für den
unteren Rand, also v1 = −2u, verwendet werden. Mit Formel (7.8.21) erhält man
für f (x, y) = xy 2 = uv 2 :
Z−u2
uZ2 =2
 
32
I=  uv 2 (+1)dv  du = .
5
u1 =0 −2u
| {z }
7 4
− u3 + 8u3
• Die zu (7.8.21) analoge Formel, die die Jacobi-Determinante ohne Betragsstriche

enthält15 ,
ZZ ZZ
∂(x, y)
f (x, y)dx dy = f (x(u, v), y(u, v)) du dv, (7.8.25)
∂(u, v)
F F0
ist folgendermaßen anzuwenden: Auf der rechten Seite benutzt man als untere und
obere Integrationsgrenzen genau diejenigen, die sich aus der Transformation der
ursprünglichen unteren und oberen Grenzen ergeben. Für das obige Beispiel (Spie-
gelung) sind das die Gleichungen auf der rechten Seite von (7.8.24). Dann ist das
Integral gemäß Formel (7.8.25):
xZ2 =2
 2x  uZ2 =2
 −2u 
Z Z
32
I=  xy 2 dy  dx =  uv 2 (−1)dv  du = .
5
x1 =0 x2 u1 =0 −u2
7.8.2 Flächen im Raum, Flächenintegrale über Vektorfelder

Wir betrachten nun eine beliebige Fläche F im dreidimensionalen Raum R3 , siehe
Abbildung 7.21. Flächen im R3 , die wie Flächen in der xy-Ebene zweidimensionale
Gebiete sind, können auf verschiedene Weise mathematisch beschrieben werden.
Eine bequeme Darstellung ist die Parameterform
u1 ≤ u ≤ u2 ,
r(u, v) = x(u, v)e1 + y(u, v)e2 + z(u, v)e3 , (7.8.26)
v1 ≤ v ≤ v2 .
15
Das eindimensionale Analogon dieser Formel ist die mittlere Formel in (7.8.9).
v-Linie
dF~ u-Linie
~tv
·· ~tu
~r(u, v)
Abbildung 7.21: Eine Fläche im R3 .
Diese Form liefert den Ortsvektor eines jeden Punktes P ∈ F . Natürlich kann r(u, v),
je nach Zweckmäßigkeit, auch bezüglich einer krummlinigen Basis dargestellt wer-
den.
Man definiert nun an jedem Punkt r ∈ F ein vektorielles Flächenelement dF , in
dem auch die Lage der Fläche im R3 in der infinitesimalen Umgebung von r kodiert
ist. Man definiert den infinitesimalen Vektor

(7.8.19) ∂r ∂r
dF = n dF = n |tu × tv | = n × du dv , (7.8.27)
∂u ∂v
wobei n = n(r) der Einheitsvektor ist, der senkrecht zur der durch die Tangenten-
vektoren tu und tv aufgespannten Tangentialebene an F am Punkt r ist:
tu × tv
n=± . (7.8.28)
|tu × tv |
Die Vereinbarung ,,n ⊥ tu , tv ” legt n offensichtlich nur bis auf ein Vorzeichen fest16 .
An dieser Stelle vereinbaren wir, was man bei einer berandeten, orientierten17 Fläche
und bei einer geschlossenen Fläche unter ,,Ober- und Unterseite” bzw. ,,Außen- und
Innenseite” versteht.
16
Anders gesagt: Das Vorzeichen von tu × tv hängt von der gewählten Parametrisierung r(u, v)
ab.
17
Nicht alle berandeten Flächen haben zwei Seiten und sind orientierbar. Ein bekanntes Gegen-
beispiel ist das sog. Möbius-Band.
• Welche Seite einer geschlossenen Fläche, z.B. der Oberfläche eines Quaders oder
einer Kugel, die Außenseite ist, ist anschaulich klar. Bei einer geschlossenen Fläche
wird per Konvention das Vorzeichen auf der rechten Seite von (7.8.28) so gewählt,
dass dF = n dF nach außen, also nicht in das umschlossene Volumen hinein zeigt.
• Bei einer orientierbaren, berandeten Fläche soll n per Konvention immer nach
,,oben” zeigen. Die obere Seite einer solchen Fläche definiert man wie folgt: Wenn
der Rand der Fläche im mathematisch positiven, also im Gegenuhrzeigersinn durch-
laufen wird, ist ,,oben” durch die Rechtsschraubenregel (Daumen der rechten Hand)
definiert. Wenn die Parametrisierung r = r(u, v) so ist, dass für u → u + du,
v → v + dv die Änderung r → r 0 am Rand der Fläche im Gegenuhrzeigersinn er-
folgt, dann ist demzufolge n ∝ tu ×tv ; andernfalls muss das Minuszeichen in (7.8.28)
gewählt werden.
Der Vektor n = n(r) hat per Definition den Betrag |n| = 1, ändert aber bei
einer gekrümmten Fläche seine Richtung in Abhängigkeit von r ∈ F . Wenn die
Fläche in der xy-Ebene bzw. in einer dazu parallelen Ebene liegt, dann
n = ±e3 . (7.8.29)
Das Flächenelement (7.8.27) benötigt man beispielsweise zur Berechnung des

Durchflusses eines Vektorfeldes A(r) durch eine beliebige Fläche F im R3 , z.B.
eines Kraftfeldes oder eines elektrischen oder magnetischen Feldes. Dazu muss an
jedem Punkt r ∈ F die Richtung von A in Bezug auf die Fläche bzw. die Flächen-
normale n berücksichtigt werden; denn wenn das Fächenelement parallel zu A(r),
d.h. n(r) ⊥ A(r), verschwindet der Durchfluss durch dieses Element. Das ergibt ein
Flächenintegral des folgenden Typs:
ZZ
A(r) · dF . (7.8.30)
F
Das Ergebnis ist offensichtlich ein Skalar. Weitere Typen von Flächenintegralen sind
ZZ
A(r) × dF , (7.8.31)
F
ZZ
φ(r)dF . (7.8.32)
F
Die Integrale (7.8.31) und (7.8.32) liefern als Resultat jeweils einen Vektor.
Integrale des Typs (7.8.30) - (7.8.32) werden in der Regel erst in der Vorlesung
Theoretische Physik II: Elektrodynamik benötigt. Deswegen gehen wir hier nicht
weiter darauf ein.
7.9 Dreidimensionale Integrale

Wir betrachten hier dreidimensionale Integrale des Typs
ZZZ
I= f (x, y, z) dx dy dz, (7.9.1)
V
wobei V ⊆ R3 ein Gebiet im Raum ist. Die Funktion f (r) soll integrierbar in V
sein, wobei integrierbar analog zu (7.8.3) definiert ist. Für eine beliebige Zerlegung
von V in kleine Volumina ∆Vi muss der Limes
N
X
lim f (r i )∆Vi = I (7.9.2)
N →∞
∆Vi →0 i=1
existieren. Integrale der Form (7.9.1) nennt man gelegentlich auch Volumenintegrale,
wobei diese Namensgebung – wie die Bezeichnung Flächenintegral für (7.8.1) – miss-
verständlich ist. Wenn die Dimension [dxdydz] = (Länge)3 liefert (7.9.1) für f = 1
den Volumeninhalt von V im strikten geometrischen Sinn.
Integrale der Form (7.9.1) berechnet man völlig analog zu den Flächenintegralen
(7.8.1). Um (7.9.1) tatsächlich auf analytische Weise zu berechnen zu können, müssen
notwendigerweise für eine gegebene Funktion f (x, y, z) und gegebenes Gebiet V die
Randflächen von V analytisch darstellbar sein.
Generisches Beispiel: Die Randflächen eines dreidimensionalen Gebiets V seien

analytisch beschreibbar durch
x1 ≤ x ≤ x2 , y1 = y1 (x), y2 = y2 (x), z1 = z1 (x, y), z2 = z2 (x, y).
Analog zu (7.8.4) ist

   
ZZZ Zx2 yZ2 (x) z2Z(x,y)
f (x, y, z) dx dy dz = dx  dy  dz f (x, y, z)   . (7.9.3)

   
V x1 y1 (x) z1 (x,y)
Für integrierbare Funktionen f hängt das Integral nicht von der Reihenfolge der
Integrationen bezüglich x, y, z ab. Bei einem konkreten Problem wird die Reihenfolge
der Integration durch die Darstellung der Oberfläche von V diktiert.
Das Volumen V des Gebietes erhält man durch Integration der Funktion f (x, y, z) =
1, d.h. durch Aufsummation der Volumenelemente ∆Vi .
ZZZ
V = dx dy dz. (7.9.4)
V
7.9 Dreidimensionale Integrale 219
Beispiel: Wir integrieren f (r) = x2 + y 2 über den Quader
V = {0 ≤ x ≤ 1, − 1 ≤ y ≤ 2, − 2 ≤ z ≤ 0}.
 2  0  
ZZZ Z1 Z Z
I= f (x, y, z) dx dy dz = dx  dy  dz (x2 + y 2 )   = 8 .
V 0 −1 −2
Prüfen Sie nach, dass I in der Tat unabhängig von der Reihenfolge der Integrationen
ist.
Das Volumen dieses Quaders ist
Z1 Z2 Z0
V = dx dy dz = 6.
0 −1 −2
7.9.1 Variablentransformation, Jacobi-Determinante

Auch bei dreidimensionalen Integralen ist es oft zweckmäßig, neue Integrationsva-
riablen einzuführen. Sei
x, y, z ↔ u, v, w
in einem Gebiet V umkehrbar eindeutig:
x = x(u, v, w), u = u(x, y, z),

y = y(u, v, w), Umkehrung: v = v(x, y, z), (7.9.5)
z = z(u, v, w), w = w(x, y, z).
Demzufolge ist die Jacobi-Determinante

∂u x ∂v x ∂w x
∂(x, y, z)
6= 0 .
= ∂u y ∂v y ∂w y (7.9.6)
∂(u, v, w)
∂u z ∂v z ∂w z
Für die Determinante der Umkehrtransformation gilt (siehe die Formel (7.8.15), die
allgemein für n Variable bewiesen wurde):
∂(u, v, w) 1
= ∂(x,y,z)
. (7.9.7)
∂(x, y, z)
∂(u,v,w)
Analog zu (7.8.21) erhält man die Transformationsformel für Dreifach-Integrale:

ZZZ ZZZ
∂(x, y, z)
f (x, y, z) dx dy dz = f (u, v, w) du dv dw, (7.9.8)
∂(u, v, w)
V V0
wobei V 0 das Bild von V im (u, v, w)-Raum ist. Hinsichtlich der oberen und unteren
Integrationsgrenzen auf der rechten Seite von (7.9.8) ist die Bemerkung unterhalb
von (7.8.21) zu beachten. Oft ist folgende Merkregel hilfreich: Wähle die unteren
und oberen Integrationsgrenzen auf der rechten Seite von (7.9.8) so, dass auch das
Integral bezüglich der transformierten Variablen das Volumen V mit dem richtigen
Vorzeichen liefert:
ZZZ ZZZ
∂(x, y, z)
V = dx dy dz = ∂(u, v, w) du dv dw.
(7.9.9)
V V0
Analog zu (7.8.25) findet man in der Literatur auch für Dreifach-Integrale die Trans-
formationsformel (7.9.8) ohne Betragsstriche an der Jacobi-Determinanten. Bei An-
wendung dieser Formel werden die unteren und oberen Integrationsgrenzen analog
zum zweidimensionalen Fall auf Seite 215 bestimmt.
Beispiele:
1. Kartesische Koordinaten ↔ Zylinderkoordinaten: x, y, z ↔ ρ, φ, z,
x = ρ cos φ, y = ρ sin φ, z = z.
Die Jacobi-Determinante dieser Transformation ist

cos φ −ρ sin φ 0
∂(x, y, z)
= sin φ ρ cos φ 0 = ρ ≥ 0.
∂(ρ, φ, z)
0 0 1
Somit transformiert sich das Volumenelement
dx dy dz = ρ dρ dφ dz. (7.9.10)
(Wenn [x] = [y] = [z] = Länge, dann [dxdydz] = [ρdρdφdz] =(Länge)3 .)

2. Kartesische Koordinaten ↔ Kugelkoordinaten: x, y, z ↔ r, θ, φ,
x = r sin θ cos φ, y = r sin θ sin φ, z = r cos θ.
Die Jacobi-Determinante dieser Transformation ist

sin θ cos φ r cos θ cos φ −r sin θ sin φ
∂(x, y, z)
= sin θ sin φ r cos θ sin φ r sin θ cos φ
∂(r, θ, φ)
cos θ −r sin θ 0
= r2 cos2 θ sin θ + r2 sin3 θ = r2 sin θ ≥ 0.
Somit transformiert sich das Volumenelement
dx dy dz = r2 sin θ dr dθ dφ = r2 dr sin θ dθ dφ, (7.9.11)

| {z }
≡dΩ
wobei dΩ = sin θ dθ dφ das sogenannte Raumwinkelelement ist.

7.9 Dreidimensionale Integrale 221
Der Sachverhalt, dass die Transformationen 1) und 2) für Punkte auf der z-Achse
nicht umkehrbar sind, d.h. die obigen Jacobi-Determinanten dort Null werden, ist
für dreidimensionale Integrale unschädlich, siehe HöMa-Vorlesung.
Einfache Anwendungen dieser beiden Variablentransformationen sind:
1. Volumen eines Zylinders Z = {Kreis mit Radius R, Höhe h}:
ZZZ zZ0 +h Z2π ZR

(7.9.10)
VZ = dx dy dz = dz dφ ρ dρ = ρ2 hπ.
Z z0 0 0
2. Volumen einer Kugel mit Radius R:
ZZZ Z2π Zπ ZR
(7.9.11) 4
VK = dx dy dz = dφ sin θ dθ r2 dr = πR3 .
3
0
K
|0 {z }0
R1
−1 d cos θ
Weitere Anwendungen im Mechanik-Teil der Vorlesung.
Zum Schluss noch ein Hinweis zur Notation: Es ist unbequem, bei Mehr-
fachintegralen das Integralsymbol mehrfach hinzuschreiben; deswegen benutzt man
oft nur ein Integralzeichen – die Vielfachheit der jeweiligen Integration ist aus dem
Integrationsmaß, d.h. dem Linien-, Flächen- oder Volumenelement ersichtlich. Für
Flächen- und Volumenelemente in kartesischen Koordinaten sind die Abkürzungen
dx1 dx2 ≡ d2 x und dx1 dx2 dx3 ≡ d3 x
üblich. Somit
Z Z ZZ
2
d x≡ dx1 dx2 ≡ dx1 dx2 ,
Z Z ZZZ
3
d x≡ dx1 dx2 dx3 ≡ dx1 dx2 dx3 .

Einführung in Die Theoretische Physik

Hochgeladen von

Dokumentinformationen

Copyright

Verfügbare Formate

Dieses Dokument teilen

Dokument teilen oder einbetten

Freigabeoptionen

Stufen Sie dieses Dokument als nützlich ein?

Sind diese Inhalte unangemessen?

Copyright:

Verfügbare Formate

Einführung in Die Theoretische Physik

Hochgeladen von

Copyright:

Verfügbare Formate

Einführung in die Theoretische Physik

Teil I: Mathematische Methoden

Prof. W. Bernreuther1 , RWTH Aachen

WS 2009/2010 und SS 2011

Version 7. Juli 2011

Latex-Satz: Jan Busch

2 Funktionen einer reellen Variablen 10

4.2 Beispiele für lineare DGL 2. und höherer Ordnung . . . . . . . . . . . 81

6 Matrizen, Determinanten, Eigenwertproblem 121

7 Funktionen mehrerer reeller Variablen 149

1.1 Bemerkungen zur Vorlesung

In Kapitel 4, das Methoden zur Lösung einfacher Differentialgleichungen gewid-

1. Bei Physik-Anwendungen sollten Sie immer folgende elementare Regel beher-

2. Es gibt ja seit einiger Zeit leistungsfähige Computeralgebra-Programme, z.B.

Funktionen einer reellen Variablen

Wir besprechen in diesem Kapitel zunächst einige grundlegende Eigenschaften reel-

2.1 Reelle Funktionen

Man unterscheidet drei Darstellungsarten einer Funktion:

Weitere Begriffe bzw. Eigenschaften:

Eine Funktion ist ungerade, wenn f (−x) = −f (x).

Exponentialfunktionen und Logarithmen:

bezeichnet, siehe Abbildung 2.1(a). Für x ∈ Dsin ist −1 ≤ sin x ≤ 1. Deshalb

und ihr Wertebereich ist

in dem cos x streng monoton fallend ist. Die Umkehrfunktion ist

arccos x ≡ cos−1 (x) .

Ihr Definitionsbereich ist

3. y = tan x. Der Definitionsbereich dieser Funktion zerfällt in unendlich viele

Abbildung 2.2: Beispiele für bei x0 stetige und nichtstetige Funktionen.

Diese Ungleichung erhält man durch elementare geometrische Überlegungen. Somit

Beispiele für Funktionen mit Unstetigkeiten bzw. singulären Punkten:

f (x) = const ln |x| , x 6= 0 .

Die Funktion divergiert für x → 0.

Klassifizierung von Funktionen:

A.1) Algebraische Funktionen:

Allgemein ist eine algebraische Funktion y die Lösung einer algebraischen

P0 (x) + P1 (x)y + ... + Pn (x)y n = 0,

sin x, cos x, tan x, cot x und ihre Umkehrfunktionen.

A.2.2) Exponentialfunktionen und Logarithmus-Funktionen.

ex , bx , ln |x|, logb |x| .

Abbildung 2.3: Geometrische Bedeutung des Differenzen- und Differentialquotienten.

Mit elementaren Funktionen kann man natürlich auch zusammengesetzte ele-

sin x cos x cos x − sin x(− sin x) 1

In kompakter Schreibweise ist die Kettenregel:

(f (g(x)))0 = f 0 (g) g 0 (x).

d.h. y = tan g, g = z 1/2 , z = x2 + 1. Die Ableitung ist dann

Differentiation von Umkehrfunktionen:

2.2.2 Höhere Ableitungen

2.2.3 Lokale Extremwerte, stationäre Punkte

Im Mechanik-Teil dieser Vorlesung analysieren wir z.B. die potentielle Energie

2.3 Potenzreihen und Taylorentwicklung

2.3.1 Folgen und Reihen

Vorlesung Höhere Mathematik I besprochen.

und qSn von Sn subtrahiert:

S − qS = a − aq n+1 = a(1 − q n+1 ) .

Unendliche Folgen und Reihen:

Die Folge konvergiert (gegen die Zahl b), wenn

Die endlichen Summen n

wenn die Zahl S = lim Sn existiert, d.h. |S| < ∞ .

absolut konvergent für |q| < 1.

Um festzustellen, ob eine Potenzreihe in einem bestimmten Bereich von x konver-

konvergiert die Potenzreihe S(x) absolut4 . In den Endpunkten x = x0 − ρ und

Weitere Beispiele besprechen wir unten.

1. Zwei Potenzreihen darf man addieren, subtrahieren oder multiplizieren. Die

3. Eine Potenzreihe darf innerhalb ihres Konvergenzgebietes gliedweise differen-