Als pdf oder txt herunterladen
Als pdf oder txt herunterladen
Sie sind auf Seite 1von 221

Einführung in die Theoretische Physik

Teil I: Mathematische Methoden

Prof. W. Bernreuther1 , RWTH Aachen

WS 2009/2010 und SS 2011

Version 7. Juli 2011

Latex-Satz: Jan Busch

1
Kommentare, Druckfehlerhinweise, etc. bitte an die Email-Adresse
[email protected]
Inhaltsverzeichnis

1 Einleitung 5
1.1 Bemerkungen zur Vorlesung . . . . . . . . . . . . . . . . . . . . . . . 5
1.2 Literaturhinweise . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

2 Funktionen einer reellen Variablen 10


2.1 Reelle Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
2.2 Differentialrechnung . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
2.2.1 Rechenregeln . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
2.2.2 Höhere Ableitungen . . . . . . . . . . . . . . . . . . . . . . . . 25
2.2.3 Lokale Extremwerte, stationäre Punkte . . . . . . . . . . . . . 26
2.3 Potenzreihen und Taylorentwicklung . . . . . . . . . . . . . . . . . . 27
2.3.1 Folgen und Reihen . . . . . . . . . . . . . . . . . . . . . . . . 27
2.3.2 Potenzreihen . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
2.3.3 Taylorentwicklung um x0 = 0 . . . . . . . . . . . . . . . . . . 32
2.3.4 Taylorentwicklung um einen beliebigen Punkt x0 . . . . . . . . 35
2.3.5 Elementare transzendente Funktionen als Potenzreihen . . . . 36
2.3.6 Anwendungen . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
2.4 Integralrechnung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
2.4.1 Stammfunktion = unbestimmtes Integral . . . . . . . . . . . . 41
2.4.2 Bestimmtes Integral . . . . . . . . . . . . . . . . . . . . . . . 48

3 Komplexe Zahlen 57
3.1 Kartesische Darstellung . . . . . . . . . . . . . . . . . . . . . . . . . . 58
3.2 Darstellung in Polarkoordinaten . . . . . . . . . . . . . . . . . . . . . 59
3.3 Funktionen einer komplexen Variablen . . . . . . . . . . . . . . . . . 62
3.4 Anwendungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67

4 Gewöhnliche Differentialgleichungen 69
4.1 Beispiele für Differentialgleichungen 1. Ordnung . . . . . . . . . . . . 73
4.1.1 y 0 (x) = f (x) . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
4.1.2 y 0 (x) = H(x, y) . . . . . . . . . . . . . . . . . . . . . . . . . . 73
4.1.3 y 0 + a(x)y = 0 . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
4.1.4 y 0 + a(x)y = f (x) . . . . . . . . . . . . . . . . . . . . . . . . . 77
4.1.5 y 0 + ay = f (x) . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
INHALTSVERZEICHNIS 3

4.2 Beispiele für lineare DGL 2. und höherer Ordnung . . . . . . . . . . . 81


4.2.1 Drei allgemeine Aussagen . . . . . . . . . . . . . . . . . . . . 81
4.2.2 Lösung von y 00 + ay 0 + by = 0 . . . . . . . . . . . . . . . . . . 84
4.3 Beispiele aus der Physik . . . . . . . . . . . . . . . . . . . . . . . . . 87
4.3.1 1-dim. Federpendel im schwerelosen Raum . . . . . . . . . . . 87
4.3.2 1-dim. Federpendel im schwerelosen Raum mit Reibung . . . . 89
4.4 Allgemeine Hinweise . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
4.4.1 Anfangs- und Randbedingungen . . . . . . . . . . . . . . . . . 89
4.4.2 Zusammenfassung: lineare Differentialgleichungen . . . . . . . 91

5 Vektorrechnung 94
5.1 Skalare und Vektoren . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
5.2 Elementare Operationen, Vektorräume . . . . . . . . . . . . . . . . . 97
5.3 Bezugssysteme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100
5.4 Skalarprodukt, Vektorprodukt, Mehrfachprodukte von Vektoren . . . 103
5.4.1 Skalarprodukt zweier Vektoren . . . . . . . . . . . . . . . . . . 103
5.4.2 Vektorprodukt zweier Vektoren . . . . . . . . . . . . . . . . . 105
5.4.3 Mehrfachprodukte von Vektoren . . . . . . . . . . . . . . . . . 108
5.4.4 Definition und Eigenschaften des -Tensors . . . . . . . . . . . 109
5.5 Vektorwertige Funktionen, Raumkurven . . . . . . . . . . . . . . . . 110
5.5.1 Parametrisierung von Bahnkurven . . . . . . . . . . . . . . . . 111
5.5.2 Differentiation und Integration vektorwertiger Funktionen . . 113
5.5.3 Charakteristische Größen einer Kurve . . . . . . . . . . . . . . 115

6 Matrizen, Determinanten, Eigenwertproblem 121


6.1 Drehungen eines Koordinatensystems . . . . . . . . . . . . . . . . . . 121
6.1.1 Eigenschaften einer Drehmatrix . . . . . . . . . . . . . . . . . 124
6.2 Passive und aktive Transformationen . . . . . . . . . . . . . . . . . . 128
6.3 Skalare und Vektoren im euklidischen Raum . . . . . . . . . . . . . . 129
6.4 Rechenregeln für Matrizen . . . . . . . . . . . . . . . . . . . . . . . . 131
6.4.1 Spezielle Matrizen . . . . . . . . . . . . . . . . . . . . . . . . 132
6.4.2 Rechenregeln . . . . . . . . . . . . . . . . . . . . . . . . . . . 133
6.5 Determinanten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134
6.5.1 Einige Rechenregeln für Determinanten . . . . . . . . . . . . . 136
6.5.2 Entwicklungssatz . . . . . . . . . . . . . . . . . . . . . . . . . 136
6.5.3 Anwendungen . . . . . . . . . . . . . . . . . . . . . . . . . . . 137
6.6 Eigenwerte, Eigenvektoren, Diagonalisierung reell-symm. Matrizen . . 141
6.6.1 Berechnung der Eigenwerte . . . . . . . . . . . . . . . . . . . 142
6.6.2 Berechnung der Eigenvektoren . . . . . . . . . . . . . . . . . . 144
6.6.3 Diagonalisierung (Hauptachenstransformation) . . . . . . . . . 146
4 Einführung in die Theoretische Physik

7 Funktionen mehrerer reeller Variablen 149


7.1 Felder in der Physik . . . . . . . . . . . . . . . . . . . . . . . . . . . 149
7.1.1 Skalares Feld . . . . . . . . . . . . . . . . . . . . . . . . . . . 150
7.1.2 Vektorfeld . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151
7.2 Stetigkeit, partielle Ableitungen, totales Differential . . . . . . . . . . 152
7.2.1 Stetigkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 154
7.2.2 Partielle Ableitungen . . . . . . . . . . . . . . . . . . . . . . . 156
7.2.3 Totales Differential, Differenzierbarkeit . . . . . . . . . . . . . 157
7.2.4 Regeln für die partiellen Ableitungen . . . . . . . . . . . . . . 159
7.3 Taylorentwicklung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 163
7.3.1 Taylor-Formeln . . . . . . . . . . . . . . . . . . . . . . . . . . 163
7.3.2 Lokale Extremwerte, stationäre Punkte . . . . . . . . . . . . . 166
7.4 Gradient, Divergenz, Rotation . . . . . . . . . . . . . . . . . . . . . . 170
7.4.1 Gradient . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 170
7.4.2 Divergenz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 178
7.4.3 Rotation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 180
7.5 Polarkoordinaten und Zylinderkoordinaten . . . . . . . . . . . . . . . 184
7.5.1 Ebene Polarkoordinaten . . . . . . . . . . . . . . . . . . . . . 184
7.5.2 Zylinderkoordinaten . . . . . . . . . . . . . . . . . . . . . . . 187
7.5.3 Räumliche Polarkoordinaten (Kugelkoordinaten) . . . . . . . . 191
7.6 Integration im Rn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 192
7.7 Kurvenintegrale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 192
7.7.1 Methoden zur Berechnung von Kurvenintegralen . . . . . . . . 193
7.7.2 Eigenschaften von Kurvenintegralen . . . . . . . . . . . . . . . 196
7.7.3 Hinreichendes Kriterium für ein Gradientenfeld . . . . . . . . 200
7.8 Zweidimensionale Integrale . . . . . . . . . . . . . . . . . . . . . . . . 204
7.8.1 Variablentransformation, Jacobi-Determinante . . . . . . . . . 208
7.8.2 Flächen im Raum, Flächenintegrale über Vektorfelder . . . . . 215
7.9 Dreidimensionale Integrale . . . . . . . . . . . . . . . . . . . . . . . . 218
7.9.1 Variablentransformation, Jacobi-Determinante . . . . . . . . . 219
Kapitel 1

Einleitung

1.1 Bemerkungen zur Vorlesung


Der Zweck des ersten Teils der Vorlesung Einführung in die Theoretische Physik, der
den Inhalt dieses Skriptums umfasst, ist die Behandlung von mathematischen Me-
thoden, die für die Gebiete der Theoretischen und der Experimentalphysik benötigt
werden, die Sie in den beiden ersten Semestern des Bachelor-Studiums kennenlernen
werden. Das sind vor allem die Mechanik und in der Experimentalphysik auch Teile
der Wärmelehre und der Elektrodynamik.
Wir besprechen zunächst die Differential- und Integralrechnung für reelle Funktio-
nen, die von einer reellen Variablen abhängen, und insbesondere die in der Physik
ständig benutzte Methode der Taylor-Entwicklung einer Funktion.
Danach behandeln wir komplexe Zahlen und elementare algebraische Operationen
mit diesen Zahlen. Messgrößen in der Physik sind reell, d.h. nehmen reelle Zahlen-
werte an. Es ist aber oft nützlich, diese Größen zunächst durch komplexe Zahlen
bzw. komplexwertige Funktionen darzustellen.
Viele Grundgesetze der Physik sind nicht als algebraische Gleichungen, sondern als
Differentialgleichungen formulierbar – man denke z.B. an die Newtonsche Bewe-
gungsgleichung (siehe unten). Die Mechanik von Punktteilchen und starren Körpern
wird durch gewöhnliche Differentialgleichungen beherrscht, das sind Gleichungen, in
denen eine von einer reellen Variablen abhängige Funktion und ihre Ableitungen vor-
kommen. Einfache, wichtige Beispiele solcher Differentialgleichungen und Lösungs-
methoden besprechen wir in Kapitel 4.
Viele Observablen (Messgrößen) der Physik sind gerichtete Größen, sog. Vektoren.
Man denke an den Ort, die Geschwindigkeit und die Beschleunigung eines Teil-
chens/Körpers und an eine Kraft, die auf ein Teilchen bzw. einen ausgedehnten
Körper wirkt. Vektoren, elementare algebraische Operationen mit diesen Objekten,
und Vektoren, die von einer reellen Variablen abhängen, behandeln wir in Kapitel 5.
In Kapitel 6 lernen wir die mathematischen Objekte Matrix und Determinante ei-
ner Matrix kennen und besprechen, wie man mit diesen Objekten rechnet. Matrizen
und Determinanten benötigt man z.B. zur Lösung linearer Gleichungssysteme. Wir
6 Einführung in die Theoretische Physik

behandeln dann das sog. Eigenwertproblem für reelle symmetrische Matrizen. Diese
Problemstellung hat viele Anwendungen in der Physik (und der Mathematik). Sie
wird Ihnen z.B. in der Vorlesung Theoretische Physik I: Mechanik bei der Behand-
lung der Trägheitseigenschaften von starren Körpern wiederbegegnen.
Kapitel 7 befasst sich mit der Differential- und Integralrechnung von Funktionen
mehrerer Variablen. Viele Messgrößen der Physik hängen von mehreren Variablen
ab. Man denke etwa an die Gravitationskraft zwischen zwei punktförmigen Teilchen
(Massenpunkten), deren Stärke (und Richtung) von den Ortsvektoren der beiden
Teilchen abhängt – also von den 6 Ortskoordinaten, die die Positionen der beiden
Teilchen im Raum zu einem bestimmten Zeitpunkt angeben (siehe den Mechanik-
Teil der Vorlesung). Manche Kräfte sind nicht nur Funktionen der Ortskoordinaten
des Teilchens, auf das sie wirken, sondern hängen auch explizit vom Zeitpunkt ab,
zu dem sie wirken.
Wir werden in dieser Vorlesung die oben genannten mathematischen Objekte einfüh-
ren und vor allem Rechenoperationen üben. Auf strenge Beweise wird weitgehend
verzichtet. Diese Beweise werden in den Vorlesungen über Höhere Mathematik gelie-
fert. (In diesen Vorlesungen lernen Sie natürlich auch noch Begriffe und mathema-
tische Methoden kennen, die hier nicht besprochen werden.) Sie sollten die HöMa-
und diese Vorlesung nicht als redundante Veranstaltungen ansehen. In den HöMa-
Vorlesungen wird die genannte Mathematik in der Regel allgemeiner, abstrakter
und strenger behandelt. Der Stoff wird, salopp gesprochen, aus einem etwas ande-
ren Blickwinkel behandelt – das führt in der Regel zu einem tieferen Verständnis.

Die Physik befasst sich mit der Erforschung der Gesetzmäßigkeiten der unbe-
lebten Natur (die Biophysik auch mit der Untersuchung von Teilen der belebten
Natur). Gegenstand der Untersuchungen sind physikalische Systeme, das sind
Teile der Natur, die real vorhanden oder durch Experimente realisierbar sind. Die
Theoretische Physik befasst sich mit der Untersuchung bzw. Beschreibung solcher
physikalischer Systeme mit mathematischen Methoden. Dazu wird ein System oder
Prozess modelliert. In den einfachsten Fällen sind solche Modelle Idealbilder der Rea-
litiät. Grundlage dieser Untersuchungen bzw. dieser Modellbildung sind einheitliche
Gesetze, sog. Naturgesetze. Natürlich ist es das oberste Ziel jeder Naturwissenschaft,
bisher unbekannte Naturgesetze zu entdecken. Die Grundgesetze der Mechanik sind
allerdings seit langem bekannt.
In der Mechanik wird die Wirkung von Kräften (in der modernen Physik spricht
man allgemeiner von Wechselwirkungen) auf Körper, insbesondere auf deren Bewe-
gung untersucht. Gegenstand der theoretischen Mechanik ist die Berechnung, d.h.
die Vorhersage dieser Kraftwirkung, insbesondere die Berechnung der Bahnen von
Körpern mit Hilfe von Bewegungsgleichungen.
Wir behandeln im Rahmen dieses Mathematik-Teils der Vorlesung nur einfache An-
wendungen aus der Mechanik und verwenden nur Konzepte, die Sie bereits aus der
Schulphysik kennen sollten. Eine umfassende Begriffsbildung liefert der Mechanik-
Teil dieser Vorlesung. Wir idealisieren Körper durch Massenpunkte, soll heissen, man
1.1 Bemerkungen zur Vorlesung 7

denkt sich die gesamte Masse eines (kleinen) Körpers auf einen Punkt im Raum
konzentriert. Wir bezeichnen dies auch pauschal als ein Teilchen. Aus dem Physik-
Unterricht in der Schule sollten Sie wissen, dass die Bewegung eines Teilchens im
Raum festgelegt ist, wenn wir seine Bahn, d.h. seinen Ort als Funktion der Zeit
kennen. Daraus erhält man durch Differentiation nach der Zeit die Geschwindigkeit
und die Beschleunigung des Teilchens:

dr dv d2 r
Ort r = r(t) ⇒ Geschwindigkeit v = ⇒ Beschleunigung a = = 2 .
dt dt dt
Ort, Geschwindigkeit und Beschleunigung sind Vektoren (siehe Kapitel 5). Diese
werden oft durch einen Pfeil über dem jeweiligen Symbol gekennzeichnet, z. B. −

r.
In diesem Skript kennzeichnen wir Vektoren in der Regel durch Fettbuchstaben.
Aus dem Schulunterricht sollten Sie auch noch wissen, dass das grundlegende Bewe-
gungsgesetz der Mechanik die Newtonsche Bewegungsgleichung ist: Die Masse eines
Teilchens mal seiner Beschleunigung ist gleich der auf das Teilchen einwirkenden
Kraft. Benutzt man, dass die Beschleunigung die 2. Ableitung des Ortsvektors nach
der Zeit ist, ist dieses Gesetz gegeben durch

d2 r
m =F, (1.1.1)
dt2
wobei m die Masse des Teilchens und F die auf das Teilchen einwirkende Kraft
ist. Die die Bewegung verursachenden Kräfte können wir für unsere Zwecke als be-
kannt voraussetzen; sie werden bzw. wurden in der Regel experimentell bestimmt.
Die Gl. 1.1.1 ist eine Differentialgleichung (2. Ordnung)– tatsächlich handelt es sich
um 3 Differentialgleichungen für die 3 Koordinaten des Ortsvektors. Die Lösung
dieser Differentialgleichung werden wir für einfache Kraftgesetze in Kapitel 4 lösen.
Beispiele für Kräfte, die wir im Rahmen dieses Mathematik-Teils der Vorlesung be-
nutzen, sind:

• Die Gravatitationskraft der Erde F Erde auf ein Objekt der Masse m, das nicht
zu weit von der Erdoberfläche entfernt ist. In diesem Fall ist diese Kraft in sehr
guter Näherung ortsunabhängig und gegeben durch
m
F Erde = mg = −mgez , g = 9, 81 , (1.1.2)
s2
wobei g die sog. Erdbeschleunigung und ez ein von der Erdoberfläche senkrecht nach
oben zeigender Einheitsvektor ist.
• Die Hookesche Federkraft

F H = −k(r − r 0 ) , (1.1.3)
wobei die Federkonstante k die Stärke der jeweiligen Rückstellkraft charakterisiert
und r 0 die Ruhelage des am Ende der Feder befindlichen Massenpunktes ist.
8 Einführung in die Theoretische Physik

• Reibungskräfte, die proportional zur Geschwindigkeit bzw. zum Quadrat der Ge-
schwindigkeit eines Körpers sind, siehe Kapitel 4.
• Die Kraft, die ein elektrisches Feld E auf ein Teilchen der Ladung q ausübt, ist

F E = qE . (1.1.4)

In Kapitel 4, das Methoden zur Lösung einfacher Differentialgleichungen gewid-


met ist, werden zunächst der Einfachkeit halber Bewegungen in einer Raumdimen-
sion, z B. in x-Richtung betrachtet. Dann sind der Ort, die Geschwindigkeit und die
Beschleunigung eines Teilchens gegeben durch

dx dv d2 x
x = x(t) , v= , a= = 2 ,
dt dt dt
und die Newtonsche Bewegungsgleichung lautet

d2 x
m =F. (1.1.5)
dt2

Hinweise:

1. Bei Physik-Anwendungen sollten Sie immer folgende elementare Regel beher-


zigen: Überprüfen Sie die physikalische Dimension der in einer (Differenti-
al)gleichung vorkommenden Größen und die Dimension der Lösung der Glei-
chung. So können Sie oft grobe Fehler feststellen bzw. vermeiden. Wir kenn-
zeichnen die Dimension einer physikalischen Größe A mit [A]. In der Mechanik
verwendet man als Einheitensystem das MKS-System (Meter, Kilogramm, Se-
kunde). So sind die Dimensionen bzw. Einheiten der obigen Größen:
m m
[x] = Länge, Einheit = m , [v] = , [a] = 2 ,
s s
kg m
[m] = Masse, Einheit = kg , [F ] = 2 = N (Newton) .
s
Im Mathematik-Teil dieser Vorlesung, d.h. in diesem Skript werden wir aller-
dings die auftretenden Größen in der Regel als dimensionslos ansehen.

2. Es gibt ja seit einiger Zeit leistungsfähige Computeralgebra-Programme, z.B.


Mathematica, Maple oder Matlab, die per Knopfdruck Funktionen differenzie-
ren und integrieren, Funktionsgraphen zeichnen, die Determinante einer Ma-
trix berechnen, etc. Wenn Sie wirklich von dieser Vorlesung profitieren wollen,
sollten Sie aber die Hausaufgaben nicht mit Hilfe eines solchen Programms
lösen, sondern alles per Hand rechnen und zeichnen.
1.2 Literaturhinweise 9

1.2 Literaturhinweise
Mathematische Methoden:
Lehrbücher, die große Teile der mathematischen Methoden dieser Vorlesung und
etliches mehr behandeln, sind:
S. Großmann: Mathematischer Einführungskurs für die Physik, Teubner Verlag (2009).
C.B. Lang und N. Pucker: Mathematische Methoden in der Physik, Spektrum Aka-
demischer Verlag (2005).
Als Nachschlagewerk zu empfehlen: I. N. Bronstein u. a.: Taschenbuch der Mathe-
matik, Verlag Harri Deutsch (2008).

Newtonsche Mechanik:
Zum Vorlesungsteil Newtonsche Mechanik wird es ein Skriptum geben, das im L2P
als pdf file zur Verfügung gestellt werden wird.
Für Anfänger geeignete Lehrbücher sind:
W. Nolting: Grundkurs Theoretische Physik 1: Klassische Mechanik, Springer Ver-
lag (2006).
W. Greiner u.a.: Klassische Mechanik I, Verlag Harri Deutsch (2008).
S. Brandt, H. D. Dahmen: Mechanik. Eine Einführung in Experiment und Theorie,
Springer-Verlag (2004).
T. Fließbach, Mechanik, Spektrum Akademischer Verlag (2009). Dieses Buch setzt
die o.g. mathematischen Methoden im Wesentlichen voraus und behandelt die New-
tonsche Mechanik nur sehr knapp. Es ist für die Vorlesung Theoretische Physik I,
Mechanik geeignet.
Kapitel 2

Funktionen einer reellen Variablen

Wir besprechen in diesem Kapitel zunächst einige grundlegende Eigenschaften reel-


ler Funktionen einer reellen Variablen und dann die Differentiation und Integration
solcher Funktionen. Vieles davon dürfte Ihnen aus der Schule bekannt sein. Neu
für Sie ist vermutlich die Taylor-Entwicklung von Funktionen, eine enorm wichtige
Näherungsmethode.
Viele Messgrößen der Physik hängen von einer anderen Meßgröße ab. So Sind Ort,
Geschwindigkeit und Beschleunigung eines Teilchens Funktionen der Zeit, der At-
mosphärendruck ist bei konstanter Temperatur eine Funktion des Abstandes von
der Erdoberfläche, etc. Wie bereits in der Einleitung betont wurde, sind Mess-
größen dimensionsbehaftet. Wir ignorieren das aber in diesem Kapitel, d.h. alle
(un)abhängigen Variablen und weitere auftretende Parameter werden, wenn nicht
anders erwähnt, als dimensionslos betrachtet.

2.1 Reelle Funktionen


Eine reelle Funktion f einer reellen Variablen x ist eine Vorschrift, die einer reellen
Zahl x auf eindeutige Weise eine reelle Zahl y = f (x) zuordnet:
x 7→ y = f (x).
Es ist x ∈ Df ⊆ R der Definitionsbereich Df und y ∈ Wf ⊆ R der Wertebereich W
der Funktion, wobei R die Menge der reellen Zahlen bezeichnet.

Man unterscheidet drei Darstellungsarten einer Funktion:


1. Explizite Darstellung: y = f (x). Beispiel: y = x4 − sin2 x.
2. Implizite Darstellung: F (x, y) = 0. Beispiel: x2 + xy 5 − 7 = 0.
3. Parameterdarstellung: x = g(t), y = h(t). Beispiel:
x = a cos t,
y = a sin t, −π ≤ t ≤ π.
2.1 Reelle Funktionen 11

Weitere Begriffe bzw. Eigenschaften:


Eine Funktion ist gerade, wenn f (−x) = f (x).
Beispiele: f (x) = a cos x,
f (x) = bx2 .

Eine Funktion ist ungerade, wenn f (−x) = −f (x).


Beispiele: f (x) = a sin x,
f (x) = bx3 .
Eine Funktion ist monoton steigend bzw. fallend, wenn
x1 > x 2 ⇒ f (x1 ) ≥ f (x2 ) bzw. f (x1 ) ≤ f (x2 ) . (2.1.1)
Eine Funktion ist streng monoton steigend bzw. fallend, wenn
x1 > x 2 ⇒ f (x1 ) > f (x2 ) bzw. f (x1 ) < f (x2 ) . (2.1.2)
Eine Funktion f ist periodisch mit der Periode p ∈ R, wenn
f (x + p) = f (x) ∀x, x + p ∈ Df , (2.1.3)
Beispiele: f (x) = sin x und cos x haben die Periode p = 2π. Es ist
sin(x + 2π) = sin x , cos(x + 2π) = cos x ∀x ∈ R .

Umkehrfunktion:
Wenn eine Funktion f (x) einem bestimmten Gebiet x ∈ D streng monoton steigend
oder fallend ist, d.h. wenn eine der Bedingungen (2.1.2) erfüllt ist, dann ist sie in
diesem Gebiet umkehrbar. Die Umkehrfunktion von f bezeichnet man in der Regel
mit f −1 , d.h. x = f −1 (y). Diese Funktion ist durch Vorschrift
f −1 (f (x)) = x (2.1.4)
definiert. Graphisch erhält man die Umkehrfunktion f −1 durch Spiegelung des Gra-
phen von f an der Geraden y = x.
Vorsicht: Die Notation kann zu Missverständnissen führen; f −1 (y) ist nicht
[f (y)]−1 = f (y)
1
.

Beispiel: Die Umkehrfunktion von y = x2 (x ≥ 0) ist y = x und nicht y = x12 .
Sei f (x) : D 7→ WD streng monoton. Der Definitionsbereich der Umkehrfunktion
f −1 (x) ist WD , ihr Wertebereich ist D.
Wenn eine Funktion nicht in ihrem gesamten Definitionsbereich streng monoton ist,
sondern nur in verschiedenen Teilgebieten, kann man sie separat umkehren. Das lie-
fert aber in diesen Teilgebieten verschiedene Umkehrfunktionen.
Beispiel: Die Funktion y = x2 ist in ganz R definiert, aber nur in den Teilgebie-
ten x ≥ 0 und x ≤ 0 streng monoton. Im Gebiet x ≥ 0 nennen wir die Funktion
f1 = f , im Gebiet x ≤ 0 ist durch f die Funktion f2 = √ f definiert. Die Umkehr-
2 −1
funktion von f1 (x) = x im Gebiet x ≥ 0 ist f1 (x) √ = x. Die Umkehrfunktion
von f2 (x) = x2√im Gebiet x ≤ 0 ist f2−1 (x) = − x (wobei hier x ≥ 0); denn
f2−1 (f2 (x)) = − x2 = −|x|.
12 Einführung in die Theoretische Physik

Exponentialfunktionen und Logarithmen:


Die Exponentialfunktion zur Basis e sollten Sie aus der Schule kennen. Ihre Defini-
tion ist  x n
exp(x) = lim 1 + . (2.1.5)
n→∞ n
Man kann zeigen (siehe HöMaI-Vorlesung), dass sie identisch ist mit ex , wobei
 n
1
e = lim 1 + = 2, 71828...
n→∞ n
Es gelten die üblichen Rechenregeln für Potenzen:
1
e0 = 1 , ex ey = ex+y , e−x =
.
ex
Die Exponentialfunktion ist auf ganz R definiert; ihr Wertebreich ist 0 < y < ∞.
Die Logarithmusfunktion ln x (Logarithmus naturalis)
y = ln x , x>0
ist die Umkehrfunktion von ex im Gebiet x > 0. Es gilt
eln x = x ∀x > 0 und ln(ex ) = x ∀x ∈ R . (2.1.6)
Beachten Sie, dass ln x positiv, null, negativ für x > 1, x = 1, 0 < x < 1 ist. Der
Logarithmus aus einer negativen Zahl macht im Rahmen der Mathematik der reellen
Zahlen und Funktionen keinen Sinn (siehe das Kapitel über komplexe Zahlen). Oft
begegnet man aber folgender Funktion, die in der reellen Analysis auch für negative
Zahlen definiert ist:
f (x) = ln |x| , x 6= 0 .
Für x → 0 geht f (x) → −∞. Das folgt aus 2.1.6.
Allgemeine Potenzfunktion: Für eine beliebige positive reelle Zahl a ist diese
Funktion definiert durch
y = ax ≡ ex ln a , a > 0, x ∈ R. (2.1.7)
Sie ist wie ex auf ganz R definiert; ihr Wertebereich ist 0 < y < ∞. Es ist nicht
schwer zu zeigen, dass folgende Rechenregeln gelten:
(ax )y = axy , ax ay = ax+y .
Für x > 0 ist die Umkehrfunktion von (2.1.7) die Logarithmusfunktion zu einer
beliebigen Basis a ∈ R, a > 0:
ln x
y = loga x = , x > 0.
ln a
Analog zu oben ist die Funktion loga |x| für alle x 6= 0 definiert. Man überzeuge sich
davon, dass folgende Rechenregeln gelten – hier bezeichnet log den Logarithmus zu
einer beliebigen Basis a > 0, insbesondere ln = loge :
 
r x
log(x ) = r log x , log(xy) = log x + log y, log = log x − log y .
y
2.1 Reelle Funktionen 13

Trigonometrische Funktionen:
Die trigonometischen Funktionen
sin x cos x
sin x , cos x , tan x = , cot x =
cos x sin x
sind die wichtigsten Beispiele für periodische Funktionen. Die Funktionen sin x und
cos x sind auf der ganzen reellen Achse definiert; die Funktionen tan x und cot x wer-
den bei den Nullstellen von cos x bzw. sin x unendlich, d.h. ihr Definitionsbereich
ist R abzüglich dieser Nullstellen. Da es sich bei den trigonometrischen Funktionen
um periodische Funktionen handelt, sind sie nicht in ihren ganzen Definitionsbe-
reichen umkehrbar – ihre Umkehrfunktionen, die sog. inversen trigonometrischen
Funktionen oder Arkusfunktionen sind mehrdeutig. Will man eine eindeutige Um-
kehrfunktion erhalten, muss man den Definitionsbereich der jeweiligen trigonome-
trischen Funktion auf ein Gebiet beschränken, in dem sie streng monoton steigend
oder fallend ist. Man nennt das ein Monotonieintervall. Dies ist am Beispiel von
sin x in Abbildung 2.1(a) dargestellt.
1. y = sin x. Diese Funktion ist in ganz R definiert und ist periodisch mit Periode
2π, also nicht im ihrem ganzen Definitionsbereich umkehrbar. Will man eine
eindeutige Umkehrfunktion erhalten, muss man den Definitionsbereich der je-
weiligen trigonometrischen Funktion auf ein Gebiet beschränken, in dem sin x
streng monoton steigend oder fallend ist. Man wählt das Monotonieintervall
n π πo
Dsin = x − ≤ x ≤ ,

2 2
in dem sin x streng monoton steigend ist. Die zu diesem Intervall des sin x
gehörende Umkehrfunktion wird mit

arcsin x ≡ sin−1 x

bezeichnet, siehe Abbildung 2.1(a). Für x ∈ Dsin ist −1 ≤ sin x ≤ 1. Deshalb


ist der Definitionsbereich von y = arcsin x:

Darcsin = {x |−1 ≤ x ≤ 1}

und ihr Wertebereich ist


π π
− ≤ arcsin x ≤ .
2 2
Merke: arcsin x ist die dimensionslose Länge eines Bogens am Einheitskreis,
d.h. der Winkel, dessen Sinus den Wert x hat, siehe Abbildung 2.1(b)

2. y = cos x ist in ganz R definiert und ist periodisch mit Periode 2π. Zur Um-
kehrung beschränkt man sich auf das Monotonieintervall

Dcos = {x |0 ≤ x ≤ π } ,
14 Einführung in die Theoretische Physik

in dem cos x streng monoton fallend ist. Die Umkehrfunktion ist

arccos x ≡ cos−1 (x) .

Ihr Definitionsbereich ist


−1 ≤ x ≤ 1,
und ihr Wertebereich
0 ≤ arccos x ≤ π.

3. y = tan x. Der Definitionsbereich dieser Funktion zerfällt in unendlich viele


offene Intervalle1  π π 
− + nπ , + nπ , n ∈ Z .
2 2
Die Funktion tan x ist periodisch mit der Periode π. In jedem dieser Intervalle
ist tan x streng monoton steigend. Zur Umkehrung wählt man das Monoto-
nieintervall n π πo
Dtan = x − < x < ,

2 2
Die Umkehrfunktion ist
arctan x ≡ tan−1 (x).
Ihr Definitionsbereich ist
−∞ < x < ∞,
und ihr Wertebereich
π π
− < arctan x < .
2 2
4. y = cot x. Der Definitionsbereich dieser Funktion zerfällt in unendlich viele
offene Intervalle
(nπ , (n + 1)π) , n ∈ Z .
Die Funktion cot x ist periodisch mit der Periode π. In jedem dieser Intervalle
ist cot x streng monoton fallend. Zur Umkehrung wählt man das Monotonie-
intervall
Dtan = {x |0 < x < π } ,
Die Umkehrfunktion ist
y = arccot x.
Ihr Definitionsbereich ist
−∞ < x < ∞,
und ihr Wertebereich
0 < arccot x < π.
1
Die Menge der ganzen Zahlen bezeichnet man mit Z = {0, ±1, ±2, ±3, . . .}, die Menge der
natürlichen Zahlen mit N = {1, 2, 3, . . .}. Außerdem benutzt man das Symbol N0 = {0, 1, 2, 3, . . .}.
2.1 Reelle Funktionen 15

Hinweise:
1) Machen Sie sich mit diesen Funktionen vertraut, z.B. anhand des Buches von
Bronstein et al. Zeichnen Sie diese Funktionen!
2) Die Umkehrfunktionen der trigonometrischen Funktionen nennt man wie gesagt
auch Arkusfunktionen. Die zu den oben gewählten Monotonieintervallen gehörenden
Arkusfunktionen sind die sog. Hauptwerte dieser Funktionen. Wenn man zur Um-
kehrung einer trignonometrischen Funktion ein anderes Monotonieintervall wählt,
verschiebt sich der Wert der zugehörigen Arkusfunktion um eine Konstante; siehe
z.B. das Buch von Bronstein et al.

Stetigkeit:
Die Funktion f (x) sei in einem offenen Intervall (a, b) definiert und es sei x0 ∈
(a, b). Die Funktion heißt stetig an der Stelle x0 , wenn zu jedem beliebig kleinen
 > 0 stets eine passende Zahl δ() > 0 angegeben werden kann, so dass |f (x) −
f (x0 )| <  für alle x, die |x − x0 | < δ() erfüllen. Diese Definition ist mit folgender
Definition äquivalent: Wenn für jede Zahlenfolge {xn }∞ n=0 , die gegen x0 konvergiert,
die jeweiligen Funktionswerte f (xn ) gegen f (x0 ) konvergieren, dann heißt f in x0
stetig. (Beweis der Äquivalenz in der HöMaI-Vorlesung.) Man schreibt
lim f (x) = f (x0 ) .
x→x0

Man spricht von linksseitiger bzw. rechtsseitiger Stetigkeit, wenn der Grenzwert der
Funktion für von links bzw. von rechts gegen x0 konvergierende Zahlenfolgen exis-
tiert. Demnach ist eine bei x0 stetige Funktion beidseitig stetig.
Salopp gesprochen ist eine Funktion f bei x0 stetig, wenn ihr Graph bei x0 keinen
Sprung hat oder wenn f (x0 ) 6= ±∞. Die Funktionen in Abbildung 2.2a,b sind bei x0
stetig, während die Funktion in Abbildung 2.2c bei x0 unstetig ist – diese Funktion
ist bei x0 nicht definiert. Man kann diese Funktion bei x0 zwar links- oder rechtsei-
tig stetig ergänzen, indem man ihr den linksseitigen oder rechtsseitigen Grenzwert
zuweist,
lim f (x) = y0 , lim f (x) = y00 .
x%x0 x&x0

Da y0 6= y00 kann man ihr nicht beide Werte zuweisen, sonst wäre f nicht eindeutig.

Zwei Grenzwerte:
In Abschnitt 2.2 benötigen wir die beiden folgenden Grenzwerte:
sin x
lim = 1, (2.1.8)
x→0 x
ex − 1
lim = 1. (2.1.9)
x→0 x
Zum Beweis von (2.1.8) benutzt man die Ungleichung
π
| sin x| ≤ |x| ≤ | tan x| für |x| < .
2
16 Einführung in die Theoretische Physik

π
2


2

-π π
2 2
(a)
x

1
π
φ= 2
x

0 φ=
arcsin x

φ = − π2

−1
(b) φ = arcsin x ist ein Bogen
am Einheitskreis.

Abbildung 2.1: (a) Die Funktion sin x ist im Intervall − π2 ≤ x ≤ π2 streng monoton
steigend (durchgezogene rote Kurve). Die Umkehrfunktion in diesem Bereich ist
arcsin x, das ist nur die durchgezogene blaue Kurve! Der Definitionsbereich dieser
Funktion ist −1 ≤ x ≤ 1 und ihr Wertebereich ist − π2 ≤ arcsin x ≤ π2 .
2.1 Reelle Funktionen 17

x0 x0 x0
(a) Stetig bei x0 . (b) Stetig bei x0 . (Aber dort (c) Unstetig bei x0 .
nicht differenzierbar.)

Abbildung 2.2: Beispiele für bei x0 stetige und nichtstetige Funktionen.

Diese Ungleichung erhält man durch elementare geometrische Überlegungen. Somit


ist
x sin x π
cos x = ≤1 für 0 < |x| < .
tan x x 2
Da cos x → 1 für x → 0, folgt aus dieser Ungleichung der Grenzwert (2.1.8).
Zum Beweis von (2.1.9) benutzt man die Ungleichung

1 ex − 1 1
≤ ≤ für 0 < |x| < 1 . (2.1.10)
1 + |x| x 1 − |x|

Den linken Teil dieser Ungleichung beweist man folgendermaßen: Für x > 0 und
n > 1 ist  x 1  x n
1+x= 1+ < 1+ < ex , (2.1.11)
1 n
wobei die binomische Formel (2.2.3) und die Definition (2.1.5) der Exponentialfunk-
tion verwendet wurde. Dieselbe Ungleichung gilt für 0 > x > −1 (nachprüfen).
Somit ist
ex − 1 1
≥1≥ für x > 0 .
x 1+x
Für 0 > x > −1 erhält man mit der Ungleichung (2.1.11):

1 ex − 1 1 1
ex < ⇒ ≥ = .
1−x x 1−x 1 + |x|

Damit ist die linke Seite von (2.1.10) bewiesen. Die rechte Seite dieser Ungleichung
beweist man analog (Hausaufgabe). Den Grenzwert (2.1.9) erhält man im Limes
x → 0 auf der linken und rechten Seite von (2.1.10).

Beispiele für Funktionen mit Unstetigkeiten bzw. singulären Punkten:


Ein Beispiel für eine unstetige Stelle einer Funktion ist die bereits oben diskutierte
Funktion aus Abbildung 2.2c. Diese Funktion hat bei x0 einen Sprung, ist aber in
18 Einführung in die Theoretische Physik

der Umgebung von x0 beschränkt. Der am häufigsten auftretende Typ einer Unste-
tigkeitsstelle einer Funktion sind Punkte x0 , an denen die Funktion unendlich wird,
d.h. divergiert. Viele uns interessierende Funktionen besitzen solche sog. singulären
Punkte2 x0 . Man unterscheidet verschiedene Typen von Singularitäten. Wir führen
hier keine Klassifizierung durch, sondern geben nur einige Beispiele.
a) Pole: Wir betrachten als Beispiele
1 1 1 1
f (x) = , g(x) = 2
= , h(x) = .
1−x 1−x (1 + x)(1 − x) (1 − x)2
Die Funktion f divergiert bei x = 1. Wenn x → 1 von links, dann f → ∞; wenn
x → 1 von rechts, dann f → −∞. Man sagt, f hat einen einfachen Pol bei x = 1.
Somit hat g(x) jeweils einen einfachen Pol bei x = 1 und bei x = −1. Die Funktion
h(x) hat einen Doppelpol bei x = 1. Man sagt, eine Funktion f (x) hat bei x0 einen
n-fachen Pol (n ∈ N), wenn sie sich für x → x0 verhält wie
const
f (x) → .
(x − x0 )n
b) Wurzelsingularitäten: Beispiel:
const
f (x) = √ , x > 0.
x
Die Funktion divergiert für x → 0.
c) Logarithmische Singularitäten: Beispiel:

f (x) = const ln |x| , x 6= 0 .

Die Funktion divergiert für x → 0.


Funktionen mit einer singulären Stelle x0 des Typs a, b oder c divergieren verschieden
stark bei x0 . So divergiert eine Funktion mit einer Wurzelsingulärität offensichtlich
schwächer als 1/(x − x0 ) und der Logarithmus divergiert schwächer als jede Potenz
von x. Beispiele:
x
lim √ = 0 , lim xr ln x = 0, r > 0.
x&0 x x&0

Der erste Grenzwert ist offensichtlich; den zweiten Grenzwert zeigt man mit der
L’Hospitalschen Regel, siehe Abschnitt 2.3.6.

Klassifizierung von Funktionen:


Traditionell unterscheidet man in der mathematischen Physik (und in anderen Ge-
bieten) zwischen sog. elementaren Funktionen und sog. höheren transzendenten Funk-
tionen bzw. speziellen Funktionen.
2
Oft bezeichnet man jeden Punkt x0 , an dem eine Funktion f (x) unstetig ist, als singulären
Punkt.
2.1 Reelle Funktionen 19

A) Elementare Funktionen:
Dazu gehören die algebraischen Funktionen und die elementaren transzenden-
ten Funktionen.

A.1) Algebraische Funktionen:


A.1.1) Polynome.

y = P (x) = a0 + a1 x + ... + an xn , aj ∈ R , n ∈ N.

Die höchste Potenz n bezeichnet man als den Grad des Polynoms.
A.1.2) Gebrochen rationale Funktionen.
a0 + a1 x + ... + an xn P (x)
y= n
= .
b0 + b1 x + ... + bn x Q(x)
A.1.3) Nichtrationale Funktionen. Diese enthalten Wurzeln. Beispiele:

y = x7/8 ,
q √
y = (x2 + 5) x .

Allgemein ist eine algebraische Funktion y die Lösung einer algebraischen


Gleichung der Form

P0 (x) + P1 (x)y + ... + Pn (x)y n = 0,

wobei n ∈ N und die Pi (x) Polynome sind. Die Indizes i bezeichnen hier
nicht den Grad von Pi .
A.2) Elementare transzendente Funktionen:
A.2.1) Trigonometrische Funktionen.

sin x, cos x, tan x, cot x und ihre Umkehrfunktionen.

A.2.2) Exponentialfunktionen und Logarithmus-Funktionen.

ex , bx , ln |x|, logb |x| .

A.2.3) Hyperbelfunktionen.
ex − e−x ex + e−x
sinh x = , cosh x = ,
2 2
sinh x cosh x
tanh x = , coth x = ,
cosh x sinh x
und ihre Umkehrfunktionen
arsinhx ≡ sinh−1 x , arcoshx ≡ sinh−1 x ,
artanhx ≡ tanh−1 x , arcothx ≡ coth−1 x .
20 Einführung in die Theoretische Physik

y y

f (x) f (x)

f (x2 ) Sekante
Tangente

f (x1 )

x x
x1 x2 x0
(a) Sekante durch (x1 , f (x1 )) und (x2 , f (x2 ). (b) Tangente an f bei x0 .

Abbildung 2.3: Geometrische Bedeutung des Differenzen- und Differentialquotienten.

Mit elementaren Funktionen kann man natürlich auch zusammengesetzte ele-


mentare Funktionen basteln. Seien f = f (y) und y = g(x) elementare Funk-
tionen, dann ist f (g(x)) ebenfalls eine elementare Funktion.
B) Höhere transzendente Funktionen (sog. spezielle Funktionen):
Dazu gehören z.B. die Gamma-Funktion (siehe unten), die elliptischen Integral-
Funktionen, die Bessel-Funktionen und die hypergeometrischen Funktionen.
Etliche dieser Funktionen werden Sie in den Vorlesungen Theoretische Physik
II, III, IV kennenlernen.

2.2 Differentialrechnung
Wir betrachten eine stetige Funktion y = f (x).
Differenzenquotient: Ein Differenzenquotient von f ist ein Verhältnis der Form
∆f (x) f (x1 ) − f (x2 )
≡ . (2.2.1)
∆x x1 − x2
Geometrische Bedeutung: Der Differenzenquotient ist die Steigung der Sekante, die
die Punkte (x1 , f (x1 )) und (x2 , f (x2 )) verbindet, siehe Abbildung 2.3(a).
Differentialquotient: Wir setzen x2 = x0 und x1 = x0 + h, wobei h ∈ R beliebig.
Wir halten x0 fest und lassen h → 0 gehen. Die Funktion f heißt an der Stel-
le x0 differenzierbar, wenn der folgende Limes (der Differentialquotient)
sowohl für positive als auch negative h → 0 existiert:

df (x) f (x0 + h) − f (x0 )
≡ lim . (2.2.2)
dx x=x0 h→0
h
Geometrische Bedeutung: Der Differentialquotient ist die Steigung der Tangente an
den Graphen von f bei x0 , siehe Abbildung 2.3(b).
2.2 Differentialrechnung 21

Notation:
dy df
y0 ≡ ≡ f 0 (x) ≡ .
dx dx
Man nennt den Differentialquotienten auch die (erste) Ableitung von f .

Beispiele:

y = axn ⇒ y0 = naxn−1 , n ∈ N,
y = sin x ⇒ y0 = cos x,
y = cos x ⇒ y0 = − sin x,
y = ex ⇒ y0 = ex .

Zur Herleitung der Ableitungen dieser elementaren Funktionen benutzt man in der
Definition (2.2.2) des Differentialquotienten folgendes: i) Bei der Ableitung von xn
verwendet man die binomische Formel3
n  
n
X n
(x0 + h) = xn−k
0 hk . (2.2.3)
k
k=0

ii) Bei der Ableitung von sin x benutzt man, dass sin(x0 + h) − sin x0 = 2 cos(x0 +
h/2) sin(h/2) und zudem, dass sin(h/2)/(h/2) → 1 für h → 0, siehe (2.1.8). iii) Zur
Berechnung der Ableitung von cos x verwendet man, dass cos(x0 + h) − cos x0 =
−2 sin(x0 + h/2) sin(h/2) und wiederum, dass sin(h/2)/(h/2) → 1 für h → 0. iv)
Bei der Ableitung von ex verwendet man, dass (eh −1)/h → 1 für h → 0, siehe (2.1.9).

Hinweis: Die Stetigkeit von f (x) bei x0 ist keine hinreichende Voraussetzung für ihre
Differenzierbarkeit bei x0 . Ein Beispiel dafür ist die in Abbildung 2.2(b) dargestellte
Funktion, die bei x0 stetig ist. Wenn man den Limes der Differenzenquotienten
mit h → 0, h < 0 bildet, erhält man offensichtlich für den Differentialquotienten
(2.2.2) eine negative Zahl, während der Limes der Differenzenquotienten mit h → 0,
h > 0 eine positive Zahl liefert. Man kann im Sinne dieses Beispiels die links- und
rechtsseitige Ableitung von f an einer Stelle x0 definieren. Eine Funktion f ist dann
bei x0 differenzierbar, wenn die links- und rechtsseitige Ableitung existiert und beide
gleich sind.
Eine stetige Funktion
p muss nicht unbedingt einseitig differenzierbar sein. Beispiel:
die Funktion y = |x| ist insbesondere bei x0 = 0 stetig, aber es existieren keine
einseitigen Ableitungen an dieser Stelle (siehe Übungen).
3
Der Binomialkoeffizient
 
n n!
≡ , 0 ≤ k ≤ n.
k k!(n − k)!

Per Definition ist i) der Koeffizient null für k > n und ii) 0! = 1.
22 Einführung in die Theoretische Physik

2.2.1 Rechenregeln

Man will bei der Differentiation komplizierter Funktionen natürlich nicht jedesmal
auf die Definition (2.2.2) zurückgreifen. Dazu benutzt man folgende Rechenregeln:

(f ± g)0 = f 0 ± g 0 , (2.2.4)
(f · g)0 = f 0 g + f g 0 (Produktregel), (2.2.5)
 0
1 g0
=− 2 (2.2.6)
g g
 0
f f 0g − f g0
= (Quotientenregel). (2.2.7)
g g2

Der Beweis der ersten Regel ist trivial. Zum Beweis der anderen Regeln siehe die
HöMaI-Vorlesung. Weitere wichtige Rechenregeln besprechen wir gleich.
Beispiele für die Anwendung der Quotientenregel:

sin x cos x cos x − sin x(− sin x) 1


y = tan x = ⇒ y0 = 2
= ,
cos x cos x cos2 x

cos x 1
y = cot x = ⇒ y0 = − 2 .
sin x sin x

Kettenregel: Sei y = f (z) und z = g(x) und somit y = f (g(z)). (Man nennt das
eine zusammengesetzte Funktion.) Dann ist

d df (g) dg
f (g(x)) = (Kettenregel). (2.2.8)
dx dg dx

In kompakter Schreibweise ist die Kettenregel:

(f (g(x)))0 = f 0 (g) g 0 (x).


2.2 Differentialrechnung 23

Beispiele:

1. √ 
y = tan x2 + 1 ,

d.h. y = tan g, g = z 1/2 , z = x2 + 1. Die Ableitung ist dann

dy dy dg dz
=
dx dg dz dx
1 1 −1/2
= z 2x
cos2 g 2
1 x
= √ √ .
cos2 2 2
x +1 x +1

2. Allgemeine Exponentialfunktion

y = bx = ex ln b b ∈ R, b > 0.

Daher
dy
= ex ln b ln b = bx ln b.
dx

Differentiation von Umkehrfunktionen:


Sei y = f (x) differenzierbar und umkehrbar in einem bestimmten Gebiet x ∈ D. Ihre
Ableitung ist dxdy
= f 0 (x). Die Umkehrfunktion bezeichnen wir hier mit x = f˜(y),
anstelle von f −1 , um Missverständnisse zu vermeiden. Gemäß der Definition (2.1.4)
der Umkehrfunktion ist
x = f˜(f (x)).
Die Ableitung dieser Gleichung nach x ergibt unter Benutzung der Kettenregel:

d ˜ d df (x)
1= f (f (x)) = f˜(y)
dx dy dx
df˜(y) 1
⇒ = . (2.2.9)
dy df (x)/dx

Dies ist die sog. Umkehrfunktionsregel. Die Formel (2.2.9) ist wie folgt zu verstehen.
In (2.2.9) ist die Umkehrfunktion f˜ als Funktion der Variablen y dargestellt. Auf der
rechten Seite muss man nach der Berechnung der Ableitung df (x)/dx die Ersetzung
x = f˜(y) durchführen. Will man zur üblichen Konvention zurückkehren und f˜ als
Funktion von x darstellen, dann vertausche man y ↔ x in (2.2.9) und erhält

df˜(x) 1
= , (2.2.10)
dx df (y)/dy
24 Einführung in die Theoretische Physik

wobei man auf der rechten Seite nach der Berechnung der Ableitung df /dy die Er-
setzung y = f˜(x) vornehmen muss.

Hinweis: Mit den Ableitungen von exp x, sin x, cos x, den Regeln (2.2.4) – (2.2.7),
der Kettenregel (2.2.8) und der Umkehrfunktionsregel (2.2.9) bzw. (2.2.10) kann
man alle (zusammengesetzten) elementaren Funktionen differenzieren. Nichtelemen-
tare Funktionen, die durch Potenzreihen – siehe Abschnitt 2.3 – dargestellt werden
können, kann man damit ebenfalls differenzieren. Die Ableitung
R x einer nichtelemen-
taren Funktion F (x), die in Form eines Integrals F (x) = a dtf (t) darstellbar ist
–siehe etwa das Beispiel (2.4.25) –, ist dF(x)/dx =f(x). Das wird in (2.4.20) gezeigt.
Eine andere Ableitungsregel für Funktionen, die durch ein Integral definiert sind, ist
(2.4.24) unten.

Beispiele:
1. y = ln x ist die Umkehrfunktion von x = ey mit der Ableitung dx/dy = ey .
Mit (2.2.10) erhalten wir (0 ≡ d/dx):
1 1 1
(ln x)0 = y
= ln x = .
e e x
2.
y = ln |x|,
d.h. y = ln x für x > 0 und y = ln(−x) für x < 0. Unter Benutzung des soeben
erzielten Ergebnisses erhalten wir
dy 1
= .
dx x
Für x < 0 wurde zudem die Kettenregel benutzt:
d 1 1
ln(−x) = (−1) = .
dx (−x) x

3.
y = xr = er ln x , r ∈ R.
Unter Benutzung der Kettenregel erhält man
r
(xr )0 = (r ln x)0 er ln x = xr = rxr−1 .
x
4. y = arcsin x ist die Umkehrfunktion von x = sin y. Mit (2.2.10) ergibt sich:
1 1 1
(arcsin x)0 = d sin y
= =p
dy
cos y 1 − sin2 y
1
=√ , |x| < 1 .
1 − x2
2.2 Differentialrechnung 25

5. y = arccos x ist die Umkehrfunktion von x = cos y. Mit (2.2.10) erhält man:
1 1 1
(arccos x)0 = d cos y
= = −p
dy
− sin y 1 − cos2 y
1
= −√ , |x| < 1 .
1 − x2

Differential:
df
Man kann die Ableitung einer Funktion, dx = f 0 (x), als Differentialquotient ernst
nehmen. Multiplikation mit der infinitesimalen Größe dx ergibt:

df = f 0 (x)dx . (2.2.11)

Man bezeichnet df als das Differential von f an der Stelle x. Gl. (2.2.11) besagt,
dass sich die Funktion vom Wert f (x) zum Wert f (x) + df (x) infinitesmal ändert,
wenn man die Variable von x nach x + dx infinitesmal ändert.
Beispiel: y = xr ⇒ dy = rxr−1 dx.

2.2.2 Höhere Ableitungen


Sei f (x) eine differenzierbare Funktion und die Ableitung sei ebenfalls differenzier-
bar. Die 2. Ableitung von f erhält man, indem man die Ableitung – also den Diffe-
rentialquotienten (2.2.2) – der 1. Ableitung bildet. Notation:
d2 f (x)
 
d df (x)
≡ .
dx2 dx dx
Höhere Ableitungen sind rekursiv definiert. Die n-te Ableitung von f (x) erhält man
aus der (n − 1)-ten Ableitung:
dn f (x) d dn−1 f (x)
 
= n = 1, 2, 3, ...
dxn dx dxn−1
Wir nehmen hier natürlich an, dass diese Ableitungen existieren.
Man verwendet oft die Strich-Notation
d2 f dn f (x)
f 00 ≡ , . . . , f (n)
≡ .
dx2 dxn
In der Mechanik bestimmen wir typischerweise Bahnen von Körpern, d.h. wir
berechnen Koordinaten als Funktion der Zeit, z.B. x = x(t). Es interessieren uns
dx(t) d2 x(t)
die Geschwindigkeit und die Beschleunigung .
dt dt2
Zur Abkürzung verwendet man oft die Punkt-Notation
dx d2 x
ẋ(t) ≡ , ẍ(t) ≡ .
dt dt2
26 Einführung in die Theoretische Physik

2.2.3 Lokale Extremwerte, stationäre Punkte


Sie kennen aus der Schule die Begriffe lokales Minimum und Maximum und Wen-
depunkt einer Funktion f (x). Wir betrachten eine (nicht notwendigerweise stetige)
Funktion f (x) in einer lokalen Umgebung Gx0 = {|x − x0 | < a} eines Punktes x0 .
Definition: Wenn es eine Umgebung Gx0 gibt, so dass
f (x0 ) ≤ f (x) ∀x ∈ Gx0 , dann heißt f (x0 ) lokales Minimum von f .
f (x0 ) ≥ f (x) ∀x ∈ Gx0 , dann heißt f (x0 ) lokales Maximum von f .
Ein lokales Minimum oder Maximum einer Funktion bezeichnet man auch als lokalen
Extremwert von f . Gemäß der obigen Definition muss es sich nicht notwendigerweise
um einen isolierten Punkt handeln – es kann auch ein Kontinuum von Minima oder
Maxima vorliegen.
Es sei f (x) in Df differenzierbar. Definition:
Wenn f 0 (x0 ) = 0 für x0 ∈ Df , dann heißt x0 stationärer Punkt von f .
Hinweise:
1. Bei einem stationären Punkt liegt nicht notwendigerweise ein lokales Mini-
mum oder Maximum von f . Beispiel: Die Funktion y = x3 hat bei x0 = 0
einen stationären Punkt, wird aber dort weder lokal minimal noch maximal.
In diesem Beispiel liegt bei x0 ein Wendepunkt (siehe das u.a. Kriterium).
2. Eine Funktion kann auch eine Kontinuum von stationären Punkten haben.
Beispiel: eine Gerade parallel zur x-Achse, f (x) = const. Nach der obigen
Definition sind alle x stationäre Punkte. Es handelt sich weder um Minima
oder Maxima noch um Wendepunkte.
Wenn die Funktion f zweimal stetig differenzierbar ist – d.h. f und ihre Ableitung
f 0 sind stetig und differenzierbar und f 00 ist stetig –, dann erhält man folgende
Aussagen, die Sie aus der Schule kennen:
Wenn f 0 (x0 ) = 0 und f 00 (x0 ) > 0 ⇒ lokales Minimum bei x0 .
Wenn f 0 (x0 ) = 0 und f 00 (x0 ) < 0 ⇒ lokales Maximum bei x0 .
Wenn f 0 (x0 ) = 0 und f 00 (x0 ) = 0 ⇒ lokales Min., Max. oder stat. Punkt bei x0 .
Das Kriterium f 00 (x0 ) > 0 (f 00 (x0 ) < 0) ist hinreichend, aber nicht notwendig für ein
lokales Minimum (Maximum). Wenn f 00 (x0 ) = 0, muss man weitere Untersuchungen
vornehmen, um den Typ des stationären Punktes festzulegen. Man kann sich dazu
verschiedener Methoden bedienen:
1. Zeichnen Sie (immer) die Funktion in der Umgebung eines stationären Punktes
– dann sehen Sie sofort, worum es sich bei f (x0 ) handelt. Die Definition eines
lokalen Minimums bzw. Maximums ist oben angegeben. Wenn die Funktion in
einer Umgebung Gx0 monoton steigt oder fällt, liegt bei x0 ein Wendepunkt
vor.
2.3 Potenzreihen und Taylorentwicklung 27

2. Vergleich der Vorzeichen der 1. Ableitung: Sei x ∈ Gx0 . Wenn f 0 (x) > 0 für
x < x0 und f 0 (x) < 0 für x > x0 (d.h. Steigung erst positiv, dann negativ),
dann liegt bei x0 ein Minimum vor. Wenn f 0 (x) < 0 für x < x0 und f 0 (x) > 0
für x > x0 , dann handelt es sich um ein Maximum. Wenn f 0 (x) in einer
Umgebung von x0 sein Vorzeichen nicht ändert, d.h. f in dieser Umgebung
monoton steigt oder fällt, dann handelt es sich um einen Wendepunkt.

3. Methode der höheren Ableitungen: Wenn die dritte und höhere Ableitungen
von f existieren, kann man anhand ihres Verhaltens ebenfalls den Typ des
stationären Punktes bestimmen. Z.B. wenn f 00 (x0 ) = 0 und f 000 (x0 ) 6= 0, dann
liegt bei x0 ein Wendepunkt (siehe z.B. das Buch von Bronstein et al.).

Beispiele:
1) f (x) = x4 . Die Funktion hat offensichtlich bei x0 = 0 ein (globales) Minimum.
Da f 00 (0) = 0, muss man sich einer der o.g. Methoden bedienen, um das formal zu
zeigen. Z.B. folgt die Aussage f (0) = Minimum aus dem Wechsel des Vorzeichens
von f 0 (x) = 4x3 von Minus nach Plus beim Wechsel von x < 0 nach x > 0.
2) f (x) = x5 . Bei x0 = 0 liegt ein Wendepunkt vor; denn i) f 0 (0) = f 00 (0) = 0 und
ii) f 0 (x) = 5x4 wechselt sein Vorzeichen beim Übergang von x < 0 nach x > 0 nicht.

Im Mechanik-Teil dieser Vorlesung analysieren wir z.B. die potentielle Energie


V (x) eines Teilchens in einem Kraftfeld – im einfachsten Fall für eine Bewegung
in einer Raumdimension – als Funktion der Ortskoordinate x und bestimmen die
stationären Punkte x0 von V . Wenn es sich bei V (x0 ) um ein lokales Minimum han-
delt, dann befindet sich das Teilchen am Ort x0 in einer stabilen Gleichgewichtslage.
Ist V (x0 ) ein lokales Maximum oder ein Wendepunkt, ist die Gleichgewichtslage x0
instabil.

2.3 Potenzreihen und Taylorentwicklung


Oft will man (in der Physik) komplizierte Funktionen f (x), die bei x0 hinreichend oft
stetig differenzierbar sind und sich in der Nähe dieses Punktes ,,anständig” verhal-
ten (stetig, beschränkt), in der Umgebung dieses Punktes näherungsweise darstellen.
Dies liefert die Taylorentwicklung. Sie ermöglicht es, f (x) in der Umgebung von x0
durch ein Polynom n-ten Grades zu approximieren. Wenn f (x) beliebig oft diffe-
renzierbar ist, kann man diese Funktion – in der Regel nur in einem bestimmten
Gebiet |x − x0 | < a – durch eine unendliche Reihe, eine sog. Potenzreihe darstel-
len. Andererseits kann eine Funktion auch durch Vorgabe einer Potenzreihe definiert
werden.

2.3.1 Folgen und Reihen


Zunächst einige Begriffe zu und Ergebnisse für reelle Zahlenfolgen und Reihen. Ei-
niges davon sollten Sie aus der Schule kennen. Details werden ausführlich in der
28 Einführung in die Theoretische Physik

Vorlesung Höhere Mathematik I besprochen.


Endliche Zahlenfolge:
Das ist eine Folge von N + 1 (reellen) Zahlen

b 0 , b 1 , . . . , b i , . . . , bN .

Dass wir hier den Zählindex i mit i = 0 beginnen lassen, ist eine Konvention. Die
Summe (= endliche Reihe) dieser Folge ist die (reelle) Zahl
N
X
SN = b 0 + b 1 + . . . + b N = bi ,
i=0
P
wobei hier das Summenzeichen verwendet wurde.
Ein bekanntes Beispiel ist die geometrische Folge (auch geometrische Progression
genannt):
b0 = a, b1 = aq, b2 = aq 2 , . . . , bn = aq n .
Die Summe dieser n + 1 Glieder ist
a(1 − q n+1 )
Sn = a + aq + aq 2 + . . . + aq n = . (2.3.1)
1−q
Man erhält dieses Ergebnis, indem man zunächst Sn mit q multipliziert,

qSn = aq + aq 2 + aq 3 + . . . + aq n+1

und qSn von Sn subtrahiert:

S − qS = a − aq n+1 = a(1 − q n+1 ) .


| n {z n}
Sn (1−q)

Unendliche Folgen und Reihen:


Wir betrachten eine unendliche Zahlenfolge

b0 , b 1 , . . . , b i , . . . ≡ {bi }∞
i=0 .

Die Folge konvergiert (gegen die Zahl b), wenn

b = lim bi existiert.
i→∞

Die endlichen Summen n


X
Sn = bi
i=0

nennt man Partialsummen. Die mit der Folge assoziierte unendliche Reihe ist formal
gegeben durch
X∞
S≡ bi .
i=0
2.3 Potenzreihen und Taylorentwicklung 29

Die unendliche Reihe existiert, wenn die Folge der Partialsummen konvergiert, d.h.

wenn die Zahl S = lim Sn existiert, d.h. |S| < ∞ .


n→∞

Eine offensichtlich notwendige, aber nicht hinreichende Bedingung dafür, dass der
Grenzwert S existiert ist, dass die Folge der bi gegen Null konvergiert:

lim bi = 0 .
i→∞

Beispiele:
1) Für die geometrische Reihe {bi = aq i }∞
i=0 sind die Partialsummen Sn durch (2.3.1)
gegeben. Die Partialsummen konvergieren, wenn |q| < 1:
a
|q| < 1 ⇒ S = lim Sn = . (2.3.2)
n→∞ 1−q
Die geometrischen Reihe konvergiert somit für |q| < 1.
2) Wir betrachten die sog. harmonische Reihe und die sog. alternierende harmonische
Reihe: ∞ ∞
X 1 X (−1)k+1 1 1 1
und = 1 − + − ... (2.3.3)
k=1
k k=1
k 2 3 4
Die mit diesen Reihen assoziierten Folgen sind Nullfolgen; denn in beiden Fällen
ist limk→∞ bk = 0. Allerdings konvergiert nur die alternierende harmonische Reihe;
die harmonische Reihe ist divergent. Die Divergenz dieser Reihe kann man mit ele-
mentaren Mitteln zeigen. Die Konvergenz der alternierenden harmonischen Reihe
kann man z.B. mit dem Leibniz-Kriterium für alternierende Reihen beweisen – siehe
HöMa-Vorlesung. Wir werden unten auf diese Reihen zurückkommen.
Rechenregeln für konvergente Reihen: Bei einer konvergenten Reihe mit dem
Wert S darf man jedes Glied mit einer Zahl a ∈ R multiplizieren; die neue Reihe
ist wieder konvergent und hat den Wert aS. Zwei konvergente Reihen darf man
gliedweise addieren und subtrahieren. Man darf in einer konvergenten Reihe auch
beliebig viele Klammern setzen, ohne den Grenzwert der Reihe zu verändern.
Nun zum Begriff der absoluten Konvergenz einer Reihe. Wir betrachten

X ∞
X
bk (R1) und |bk | . (R2)
k=1 k=1

Die Glieder in (R1) können verschiedene Vorzeichen haben. Wenn die Reihe (R2)
konvergiert, dann konvergiert offensichtlich auch die Reihe (R1). Man sagt, die Rei-
he (R1) konvergiert absolut. Wenn Reihe (R2) divergiert, ist zunächst nicht klar, ob
(R1) auch divergiert oder konvergiert. Falls (R1) konvergiert, bezeichnet man sie als
bedingt konvergent. Ein Beispiel dafür sind die beiden Reihen in (2.3.3). Die kon-
vergente alternierende harmonische Reihe entspricht (R1), die harmonische Reihe
(R2). Wie erwähnt, divergiert diese Reihe; deswegen ist die alternierende harmo-
nische Reihe bedingt konvergent. Im Gegensatz dazu ist die geometrische Reihe
30 Einführung in die Theoretische Physik

absolut konvergent für |q| < 1.


Bei einer absolut konvergenten Reihe darf man die Glieder der Reihe, also ihre Sum-
manden beliebig umordnen, ohne dass man den Wert der Reihe ändert. Das ist bei
bedingt konvergenten Reihen i.A. nicht der Fall.
Es gibt eine Reihe von Kriterien, mit denen man feststellen kann, ob eine un-
endliche Reihe konvergiert. Wir erwähnen hier nur zwei dieser Kriterien:
Quotientenkriterium: Falls der Grenzwert n → ∞ des Verhältnisses |bn+1 /bn |
existiert, dann gilt:


bn+1
ρ < 1 ⇒ Reihe ist absolut konvergent,

Sei ρ = lim . Falls ρ = 1 ⇒ keine Aussage mit diesem K. möglich,
n→∞ bn 
ρ > 1 ⇒ Reihe ist divergent.

(2.3.4)
1
Wurzelkriterium: Falls der Grenzwert n → ∞ der n-ten Wurzel |bn | existiert,
n

dann gilt:

1
ρ < 1 ⇒ Reihe ist absolut konvergent,

Sei ρ = lim |bn | n . Falls ρ = 1 ⇒ keine Aussage mit diesem K. möglich,
n→∞ 
ρ > 1 ⇒ Reihe ist divergent.

(2.3.5)

2.3.2 Potenzreihen
Die Glieder der obigen Reihen und ihre Werte sind Konstanten – aber man kann
auch Reihen betrachten, deren Glieder Funktionen einer Variablen sind. Der ein-
fachste und am häufigsten auftretende Fall einer solchen Funktionenreihe ist der
einer Potenzreihe. Das ist eine unendliche Reihe der Form

X ∞
X
n
an x oder S(x) = an (x − x0 )n , an , x0 , x ∈ R.
n=0 n=0

Die Zahlen an sind die Koeffizienten der Potenzreihe, x0 ist der Entwicklungspunkt
(siehe unten) und x bezeichnet eine reelle Variable. Die erste Reihe ist offensichtlich
ein Spezialfall (x0 = 0) der zweiten Reihe. Eine Potenzreihe ist – falls sie konvergiert
– eine Funktion S(x) der Variablen x. Solche Reihen können auf verschiedene Wei-
se verwendet werden. Man kann einerseits eine bekannte Funktion innerhalb eines
bestimmten Gebietes durch eine Potenzreihe darstellen. Das werden wir unten an-
hand etlicher wichtiger Beispiele tun. Man kann andererseits eine Potenzreihe durch
Vorgabe von Koeffizienten an auch zur Definition neuer Funktionen benutzen. Vie-
le nichtelementare Funktionen können auf diese Weise definiert werden. Wir gehen
darauf hier nicht ein.
Falls eine Potenzreihe nur endlich viele Glieder hat, d.h. wenn an = 0 ∀n > N , dann
handelt es sich offensichtlich um ein Polynom PN (x) vom Grad N .
2.3 Potenzreihen und Taylorentwicklung 31

Um festzustellen, ob eine Potenzreihe in einem bestimmten Bereich von x konver-


giert, kann man die entsprechenden Kriterien für unendliche Reihen benutzen –
insbesondere das o.g. Quotienten- oder Wurzelkriterium. Mit diesen Kriterien kann
der Konvergenzradius ρ der jeweiligen Reihe bestimmt werden. Wir betrachten i.F.
Potenzreihen mit ρ 6= 0. Im Gebiet

|x − x0 | < ρ

konvergiert die Potenzreihe S(x) absolut4 . In den Endpunkten x = x0 − ρ und


x = x0 + ρ kann die Reihe entweder konvergent oder divergent sein.

Beispiel: Wir betrachten die oben besprochene geometrische Reihe und setzen
q = x und a = 1. Die Partialsumme SN der Reihe ist
N
2 N
X 1 − xN +1
SN (x) = 1 + x + x + ... + x = xn = .
n=0
1−x

N →∞
Für |x| < 1 ⇒ xN +1 −−−→ 0, d.h.
1
S(x) = lim SN (x) = .
N →∞ 1−x
Fazit: Man kann die Funktion 1/(1 − x) für |x| < 1 durch folgende Potenzreihe
darstellen: ∞
1 X
= xn für |x| < 1.
1 − x n=0
Für |x| < 1 konvergiert diese Reihe absolut. Anhand der linken Seite dieser Gleichung
sehen wir, dass die Reihe auch bei x = −1 konvergiert, aber bei x = 1 divergiert.
Was hat man durch diese Darstellung gewonnen? Man kann die Funktion 1/(1 − x)
z.B. in der Umgebung von x0 = 0 näherungsweise durch eine endliche Summe, d.h.
ein Polynom darstellen, mit dem es sich in der Regel einfacher rechnen lässt. Je
mehr Glieder man berücksichtigt, desto genauer wird die Approximation.

1
1+x
1 + x + x2
..
.

Weitere Beispiele besprechen wir unten.

Ohne Beweis listen wir noch einige Aussagen auf, die für das Rechnen mit Po-
tenzeihen wichtig sind (Beweis siehe HöMa-Vorlesung):
4
Bei Funktionenreihen kommt noch der Begriff der gleichmäßigen Konvergenz der Reihe ins
Spiel. Wir gehen hier nicht darauf ein.
32 Einführung in die Theoretische Physik

1. Zwei Potenzreihen darf man addieren, subtrahieren oder multiplizieren. Die


resultierende Potenzreihe konvergiert zumindest im Durchschnitt der Konver-
genzgebiete der beiden Ausgangsreihen.

2. Man kann auch den Quotienten zweier Potenzreihen bilden. Die Nennerreihe
darf aber entweder keine Nullstelle am Entwicklungspunkt x0 haben, d.h. es
muss a0 6= 0 sein, oder die Nullstelle n-ter Ordnung der Nennerreihe bei x0 wird
durch eine Nullstelle mindestens n-ter Ordnung der Zählerreihe aufgehoben.

3. Eine Potenzreihe darf innerhalb ihres Konvergenzgebietes gliedweise differen-


ziert oder integriert5 werden:
∞ ∞
d X X d
an (x − x0 )n = an (x − x0 )n .
dx n=0 n=0
dx
Z ∞
X ∞
X Z
n
dx an (x − x0 ) = an dx (x − x0 )n .
n=0 n=0

Vorsicht: Am Rand des Konvergenzgebiets konvergieren die rechten Seiten die-


ser Gleichungen nicht unbedingt gegen die Ableitung bzw. das Integral der
Funktion, die durch die Potenzreihe auf der linken Seite dargestellt wird.

2.3.3 Taylorentwicklung um x0 = 0
In vielen Anwendungen stellt sich folgendes Problem: Gegeben ist eine Funktion
f (x), die sich in der Umgebung eines Punktes x0 ,,anständig” verhält. Man möchte
diese Funktion bei x0 in eine Potenzreihe entwickeln.
Wir wollen zunächst eine Formel für den Fall x0 = 0 herleiten. Die Funktion f sei an
dieser Stelle unendlich oft differenzierbar. Die allgemeine Form der gesuchten Reihe
ist ∞
X
f (x) = an xn = a0 + a1 x + a2 x2 + ... (2.3.6)
n=0

Frage: Wie erhalten wir die Koeffizienten an aus f (x)?


Wir nehmen an, dass die Reihe in einem Gebiet um x0 = 0 konvergiert. Dann dürfen
wir sie gliedweise differenzieren (siehe oben).
1. x0 = 0 in (2.3.6) einsetzen liefert a0 = f (0).

2. Differenziere die linke und rechte Seite von (2.3.6):



X
0
f (x) = nan xn−1 = a1 + 2a2 x + 3a3 x2 + ...
n=1

x0 = 0 einsetzen liefert a1 = f 0 (0).


5
siehe nächstes Kapitel
2.3 Potenzreihen und Taylorentwicklung 33

3. Zweifache Differentiation von (2.3.6):



X
f 00 (x) = n(n − 1)an xn−2 = 2a2 + 3 · 2a3 x + ...
n=2

Man erhält a2 = f 00 (0)/2.

4. Dreifache Differentiation von (2.3.6):



X
000
f (x) = n(n − 1)(n − 2)an xn−3 = 3! a3 + 4! a4 x + ...
n=3

Man erhält a3 = f 000 (0)/3!.

5. n-fache Differentiation von (2.3.6):

f (n) (x) = n! an + (n + 1)! an+1 x + ...

Man erhält
1 (n)
an = f (0). (2.3.7)
n!

Mit (2.3.7) erhalten wir aus (2.3.6) die Potenzreihenentwicklung einer Funktion f (x)
an der Stelle x0 = 0. Das ist die sog. Taylor-Reihe der Funktion bei x0 = 0:


X f (n) (0)
f (x) = xn . (2.3.8)
n=0
n!

Beispiel: Taylorentwicklung von f (x) = ex um x0 = 0.

dn x
e = ex → f (n) (0) = 1 ∀n.
dxn
Somit

x
X xn
e = . (2.3.9)
n=0
n!

Hinweis: Diese Potenzreihe konvergiert für alle x ∈ R, siehe HöMa I-Vorlesung..


Die Abbildung 2.4 zeigt, dass man die Exponentialfunktion in der Umgebung von
x0 = 0 bereits durch die ersten paar Summanden aus (2.3.9) gut approximieren
kann.
34 Einführung in die Theoretische Physik

Exponentialfunktion, y=ex
8
y

ex

7 1

1+x
6 2
1+x+x
2
2 3
5 1+x+ +x
x
2 6
2 3 4
1+x+ +x + x
x
2 6 24
4

0
-2 -1.5 -1 -0.5 0 0.5 1 1.5 2
x

Abbildung 2.4: Die Funktion y = ex und Taylor-Approximationen um x0 = 0.


Abgebildet sind ex und die Taylor-Polynome von der nullten bis zur vierten Ordnung.
2.3 Potenzreihen und Taylorentwicklung 35

Allgemein: Approximiert man eine Funktion f (x) bei x0 = 0 durch die ersten N
Glieder ihrer Potenzreihe, dann schreibt man oft
N N
X f (n) (0) X f (n) (0)
f (x) = xn + O(xN +1 ) ≈ xn . (2.3.10)
n! n!
|n=0 {z } n=0

Näherungsformel für f (x)

O(xN +1 ) ist eine symbolische Schreibweise für das, was in der unendlichen Reihe weg-
gelassen wurde. Das Symbol zeigt an, dass der nichtberücksichtigte Term mindestens
von der Größenordnung = Ordnung xN +1 ist. Für dieses sogenannte Restglied gibt
es Abschätzungsformeln, in denen die (N + 1)-te Ableitung von f auftritt, siehe
HöMaI-Vorlesung.

2.3.4 Taylorentwicklung um einen beliebigen Punkt x0


Wir wollen nun eine (unendlich oft differenzierbare) Funktion f (x) an einem beliebi-
gen Punkt x0 durch eine Potenzreihe darstellen. Die allgemeine Form einer solchen
Reihe ist ∞
X
f (x) = bn (x − x0 )n bn ∈ R. (2.3.11)
n=0

Wir nehmen wieder an, dass der Konvergenzradius dieser Reihe verschieden von Null
ist. Dann dürfen wir die Reihe im Konvergenzgebiet gliedweise differenzieren.
1. x = x0 einsetzen ergibt b0 = f (x0 ).

2. Differenzieren von (2.3.11) führt auf



X
0
f (x) = bn n(x − x0 )n−1 .
n=1

x = x0 einsetzen ergibt b1 = f 0 (x0 ).

3. Die n-fache Differentiation ergibt

f (n) (x) = n! bn + (n + 1)! bn+1 (x − x0 ) + ...

Einsetzen von x = x0 liefert


1 (n)
bn = f (x0 ). (2.3.12)
n!

Somit erhalten wir die Taylor-Reihe bei x0 :



X f (n) (x0 )
f (x) = (x − x0 )n . (2.3.13)
n=0
n!
36 Einführung in die Theoretische Physik

Setzen wir x − x0 = h, d.h. x = x0 + h, erhalten wir die zu (2.3.13) äquivalente Form


der Taylor-Reihe:

X f (n) (x0 )
f (x0 + h) = hn . (2.3.14)
n=0
n!

Beispiel: Entwickle f (x) = ln x um x0 = 1, verwende dazu die Formel (2.3.13).

f (1) = 0
1
f 0 (x) = ⇒ f 0 (1) = 1
x
1
f 00 (x) = − ⇒ f 00 (1) = −1
x2
1
f 000 (x) = (−1)(−2) ⇒ f 000 (1) = 2
x3
..
.

Somit ist

1 1
ln x = 0 + (x − 1) − (x − 1)2 + (x − 1)3 + O (x − 1)4 .

2 3

Weitere Beispiele in den Übungen.

2.3.5 Elementare transzendente Funktionen als Potenzrei-


hen
Wir leiten für einige dieser Funktionen, die häufig in der Physik vorkommen, ihre
Potenzreihendarstellung um x0 = 0 her.

• Für f (x) = ex haben wir das bereits in (2.3.9) getan; das Ergebnis war


x
X xn
e = .
n=0
n!

• f (x) = ln x. Da ln 0 = −∞, existiert für diese Funktion keine Entwicklung um


x0 = 0. Wir betrachten ln x in der Umgebung von x = 1. Anstelle von ln x
betrachten wir
f (x) = ln(1 + x)
2.3 Potenzreihen und Taylorentwicklung 37

und entwickeln diese Funktion um x0 = 0. Wir verwenden die Formel (2.3.8).

f (0) = ln 1 = 0
1
f 0 (x) = ⇒ f 0 (0) = 1
1+x
1
f 00 (x) = (−1) ⇒ f 00 (0) = −1
(1 + x)2
1
f 000 (x) = (−1)(−2) ⇒ f 000 (0) = 2
(1 + x)3
..
.
1
f (n) (x) = (−1)n−1 (n − 1)! ⇒ f (n) (0) = (−1)n−1 (n − 1)! .
(1 + x)n

Einsetzen in (2.3.8) ergibt



X xn x2 x3
ln(1 + x) = (−1)n−1 =x− + + O(x4 ). (2.3.15)
n=1
n 2 3

Hinweis: Diese Potenzreihe konvergiert absolut für −1 < x < 1, siehe HöMaI-
Vorlesung. Die Reihe konvergiert bei x = 1; dort entspricht sie der alternie-
renden harmonischen Reihe in (2.3.3). Die Reihe divergiert bei x = −1; dort
entspricht sie der harmonischen Reihe in (2.3.3). Anhand von (2.3.15) sieht
man, dass der Wert der alternierenden harmonischen Reihe S = ln 2 ist.

Hyperbolische Funktionen
Für cosh x und sinh x erhalten wir die Potenzreihenentwicklung um x0 = 0 mit Hilfe
der Potenzreihendarstellung (2.3.9) von ex .
"∞ ∞
# ∞
ex + e−x (2.3.9) 1 X xn X (−x)n 1X xn
cosh x = = = + = [1 + (−1)n ]
2 2 n=0 n! n=0 n! 2 n=0 n!

X x2n
= .
n=0
(2n)!
(2.3.16)
Analog findet man

ex − e−x X x2n+1
sinh x = = . (2.3.17)
2 n=0
(2n + 1)!
Hinweis: Diese beiden Potenzreihen konvergieren absolut für alle x ∈ R.

Bemerkung: Für tanh x und coth x haben die Koeffizienten der Glieder ihrer
Potenzreihe eine kompliziertere Form, aber man kann die ersten Terme der entspre-
chenden Reihen problemlos berechnen, siehe Übungen.
38 Einführung in die Theoretische Physik

Trigonometrische Funktionen
Wir entwickeln f (x) = sin x um x0 = 0.

f (0) = 0
0
f (x) = cos x ⇒ f 0 (0) = 1
f 00 (x) = − sin x ⇒ f 00 (0) = 0
f 000 (x) = − cos x ⇒ f 000 (0) = −1
f (4) (x) = sin x ⇒ f (4) (0) = 0
..
.

Die geradzahligen Ableitungen bei x0 = 0 sind 0, die ungeradzahligen sind abwech-


selnd +1 und −1. Einsetzen in die Formel (2.3.8) ergibt

X x2n+1 x3 x5
sin x = (−1)n =x− + + O(x7 ). (2.3.18)
n=0
(2n + 1)! 3! 5!

Für cos x finden wir analog:



X x2n x2 x4
cos x = (−1)n =1− + + O(x6 ). (2.3.19)
n=0
(2n)! 2! 4!

Hinweise:

1. Die beiden Potenzreihen konvergieren absolut für alle x ∈ R.

2. Die Koeffizienten in der Potenzreihenentwicklung von tan x und cot x haben


eine kompliziertere Form, aber man kann sie ebenfalls problemlos berechnen.

3. Wir benutzten hier bei der Herleitung der Potenzreihendarstellung insbeson-


dere der Funktionen ex , sin x, und cos x die Ableitungen dieser Funktionen.
Diese Ableitungen berechneten wir mit Hilfe der beiden Grenzwerte (2.1.8),
(2.1.9). Wir wiesen darauf hin, dass man mit diesen Ableitungen und dem
Differentialquotienten von xn die Ableitungen aller (elementaren) Funktionen
bestimmen kann.
In vielen Mathematikbüchern und -Vorlesungen wird der Aufbau der Differen-
tialrechung von Funktionen einer Variablen anders durchgeführt. Es wird – vor
Einführung des PDifferentialquotienten einer Funktion – gezeigt, dass ex gleich
der Potenzeihe ∞ n
n=0 x /n! ist, bzw. sin x, cos x gleich den rechten Seiten von
(2.3.18), (2.3.19). (Für diese Herleitungen benötigt man mehr als eine Zeile!)
Mit Hilfe dieser Potenzreihen erhält man rasch die Grenzwerte (2.1.8), (2.1.9)
und mit deren Hilfe die Ableitungen von ex , sin x, und cos x.
2.3 Potenzreihen und Taylorentwicklung 39

2.3.6 Anwendungen
Taylor-Approximation:
Die Entwicklung von Funktionen in Potenzreihen ist in der (theoretischen) Physik
gang und gäbe. In vielen Anwendungen braucht man aber nicht die exakte Darstel-
lung der Funktion als unendliche Reihe, sondern nur eine näherungsweise Darstellung
als endliche Reihe (= Polynom) bis zu einer bestimmten Ordnung. Man spricht dann
von von einer Taylor-Approximation. Bei der Taylor-Approximation einer Funktion
zur N -ten Ordnung in der Umgebung eines Punktes x0 muss die Funktion bei x0
nur N -fach differenzierbar sein. Aus Formel (2.3.13) erhalten wir
N N
X f (n) (x0 )  X f (n) (x0 )
f (x) = (x − x0 )n + O (x − x0 )N +1 ≈ (x − x0 )n . (2.3.20)
n! n!
|n=0 {z } n=0

Näherungsformel für f (x)

Für das Restglied gibt es wie gesagt Abschätzungsformeln, in denen die (N + 1)-te
Ableitung von f auftritt, siehe HöMaI-Vorlesung.

Hinweise:
1. Die Approximation der Funktion f (x) durch das Polynom N -ter Ordnung
auf der rechten Seite von (2.3.20) macht i.A. nur für x-Werte Sinn, für die
|x − x0 | < 1 gilt. Dann ist der weggelassene Term, der von der Größenordnung
(x − x0 )N +1 ist, in der Regel hinreichend klein.
2. In Anwendungen in der Physik ist x in der Regel dimensionsbehaftet, d.h. die
Aussage ,,x bzw. (x−x0 ) klein” oder ,,x bzw. (x−x0 ) groß” muss sich auf einen
Vergleich mit einer für das jeweilige physikalische Problem charakteristischen
Größe beziehen, die dieselbe physikalische Dimension wie x hat.
Beispiel: Sei
r
V (x) =
(a + x)2
die potentielle Energie eines Teilchens mit der Koordinate x. Es ist [x] =
[a] =Länge und [r]=Energie×Länge2 . Wir wollen V (x) für ,,kleine” x durch
Taylorapproximation bis zur 1. Ordnung nähern – präzise, für |x|  |a|, d.h.
|x/a|  1. Stures Anwenden der Taylorformel für x0 = 0, d.h. (2.3.8) bzw.
(2.3.10) bis zur 1. Ordnung ergibt
r 2r
V (x) = 2
− 3 x + O(x2 ) .
a a
Die Abschätzung des vernachlässigten Restgliedes durch die dimensionsbe-
haftete Größe x2 macht wenig Sinn. Geschickter ist es, eine dimensionslose
Variable z = x/a einzuführen. Damit erhalten wir
r r
⇒ V (z) = 2 1 − 2rz + O(z 2 ) .

V (z) = 2 2
a (1 + z) a
40 Einführung in die Theoretische Physik

3. Will man eine Funktion, die aus Produkten von Funktionen besteht, bis zu
einer bestimmten Ordnung entwickeln, ist es in der Regel am geschicktesten,
die Taylorentwicklung der Produkte zu verwenden, und diese konsistent bis
zur gewünschten Ordnung auszumultiplizieren.
Beispiel: Bestimme die Taylor-Approximation der Funktion ex sin x bis zur
Ordnung x3 bei x0 = 0.

x2 x3 x3
  
x 4 5
e sin x = 1 + x + + + O(x ) x − + O(x )
2! 3! 3!
3x2 x3
=x+ − + O(x4 ) .
2 6

4. Analog kann man vorgehen, wenn man eine Funktion der Form f (x)/g(x)
entwickeln will.

L’Hospitalsche Regel:
Diese Regel ist sehr nützlich, wenn man Funktionen der Form f (x)/g(x) an einer
Stelle x0 auswerten will, an der sowohl der Zähler als auch der Nenner beide null
oder beide unendlich werden – man erhält dann 0/0 bzw. ∞/∞. Bei Produkten
f (x)g(x) kann eine unbestimmte Form 0 · ∞ auftreten. In vielen dieser Fälle kann
der Grenzwert x → x0 mit der sog. L’Hospitalschen Regel durchgeführt werden. Sie
besagt, dass

f (x) f 0 (x)
lim = lim 0 , wenn f (x0 ) = g(x0 ) = 0 . (2.3.21)
x→x0 g(x) x→x0 g (x)

Man differenziert somit zunächst die Funktionen im Zähler und Nenner und bildet
erst dann den Grenzwert. Wenn der Ausdruck auf der rechten Seite von (2.3.21) wie-
der eine unbestimmte Form 0/0 bzw. ∞/∞ liefert, wendet man die Regel nochmal
an – und zwar so lange, bis man entweder einen wohldefinierten Limes erhält oder
feststellt, dass der Grenzwert divergiert.
Man kann (2.3.21) einfach beweisen, indem man die Taylor-Formel (2.3.13) für die
Funktionen f (x) und g(x) benutzt. Wir wollen das hier nicht tun. Stattdessen be-
trachten wir einige Beispiele:

ex − 1 sin x
f1 (x) = , f2 (x) = , f3 (x) = xr ln x , r > 0 .
x x
Wir wollen f1 bei x = 0 auswerten. Wir hatten bereits in (2.1.9) – ohne Verwendung
von dex /dx = ex – gezeigt, dass f1 (0) = 1. Mit Hilfe von (2.3.21) können wir uns im
Nachhinein davon überzeugen. Es ist (ex − 1)0 /(x)0 = ex , also f1 (0) = 1.
In (2.1.8) hatten wir gezeigt, dass f2 (0) = 1. Bei der Herleitung von d sin x/dx =
cos x hatten wir benutzt, Auch hiervon können wir uns im Nachhinein mit (2.3.21)
überzeugen.
2.4 Integralrechnung 41

Die Auswertung von f3 bei x = 0 ergibt die unbestimmte Form 0·∞. Zur Anwendung
von (2.3.21) schreiben wir f3 = f /g, wobei f = ln x und g = x−r . Dann

f (x) x−1 xr r>0


lim = lim = lim = 0.
x→0 g(x) x→0 −rx−r−1 x→0 −r

Dies zeigt, dass der Logarithmus ln x für x → 0 schwächer divergiert als jede negative
Potenz x−r .

2.4 Integralrechnung
Nun zur Integralrechnung mit Funktionen, die von einer Variablen abhängen. Die
Grundbegriffe und elementaren Rechenregeln sollten Sie bereits aus der Schule ken-
nen. Das unbestimmte Integral einer Funktion ist die Umkehrung ihrer Differentia-
tion. Das bestimmte Integral einer Funktion weist der Funktion eine reelle Zahl (ggf.
komplexe Zahl) zu. In Anwendungen in der Physik hängt die physikalische Bedeu-
tung dieser Zahl (Fläche, Geschwindigkeit, Ort, Arbeit, etc.) von der physikalischen
Bedeutung der Funktion und der Variablen ab, über die integriert wird.

2.4.1 Stammfunktion = unbestimmtes Integral

Gegeben sei die Ableitung f einer Funktion y:

d
y 0 = f (x) 0
≡ . (2.4.1)
dx

Gesucht ist die Lösung dieser Gleichung6 . Mit anderen Worten, wir suchen eine
Funktion y(x) = F (x), so dass

F 0 (x) = f (x).

Diese Funktion nennt man Stammfunktion oder unbestimmtes Integral von f (x). Es
ist klar, dass F nur bis auf eine additive Konstante c festgelegt ist. Wenn F (x) eine
Stammfunktion von f (x) ist, dann ist auch F (x) + c eine Stammfunktion.

6
Hinweis: Die Gleichung (2.4.1) ist der einfachste Typ einer Differentialgleichung 1. Ordnung
– siehe Kapitel 4.
42 Einführung in die Theoretische Physik

Beispiele:
Funktion f (x) Stammfunktion (SF) F (x)
1
xn , n 6= −1 xn+1 + c
n+1
1
sin(ax), a 6= 0 − cos(ax) + c
a
1
cos(ax), a = 6 0 sin(ax) + c
a
1 ax
eax , a 6= 0 e +c
a
1
ln |x| + c
x
1
arctan x + c
1 + x2

Notation: Für die Stammfunktion = unbestimmtes Integral F (x) einer Funktion


f (x) sind folgende Bezeichnungen gebräuchlich:
Z
F (x) = f (x)dx ≡ SF [f (x)] .

Die Notation SF [f (x)] wird z.B. im Skript von Prof. Meden verwendet. Wir be-
nutzen sie
R in diesem Abschnitt ebenfalls, verwenden dann aber das häufig benutzte
Symbol f (x)dx. Bei diesem Symbol steht x für die Variable, von der die Stamm-
funktion abhängt. Das Symbol sollte Sie in Bezug auf Definition des bestimmten
Integrals (siehe unten) nicht verwirren – dort steht die Variable hinter dem Integral-
zeichen für diejenige, die ,,ausintegriert” wird.

Rechenregeln zur Bestimmung von Stammfunktionen:


1. Ist F SF von f und G SF von g, dann gilt für konstante a, b:
aF (x) + bG(x) ist SF von af (x) + bg(x). (2.4.2)

Beispiel:
1 1
f (x) = sin2 x = − cos(2x)
2 2
1 1
⇒ F (x) = x − sin(2x) + c.
2 4
2. Partielle Integration:
Aus der Produktregel der Differentiation,
(f (x)g(x))0 = f 0 (x)g(x) + f (x)g 0 (x) ,
2.4 Integralrechnung 43

erhalten wir sofort, dass

SF [f 0 g + f g 0 ] = f (x)g(x)

oder

SF [f g 0 ] = f (x)g(x) − SF [f 0 g]

In der üblichen Schreibweise lautet diese Formel: (2.4.3)

Z Z
0
f (x)g (x) dx = f (x)g(x) − f 0 (x)g(x) dx.

Beispiel: Bestimme die SF von y = x sin x. Zur Anwendung von (2.4.3) stellen
wir y in der Form y = f g 0 dar, wobei

f = x, g 0 = sin x ⇒ g = − cos x + c.

Dann ist

SF [x sin x] = −x cos x + c − (−1)SF [1 · cos x] = −x cos x + sin x + c.

3. Substitutionsmethode:
Sei F (x) eine SF von f (x) und g(x) eine differenzierbare Funktion. Wir erin-
nern uns an die Kettenregel der Differentiation, Gl. (2.2.8):

dF (g(x)) dF dg
= = f (g(x))g 0 (x).
dx dg |{z}
dx
|{z}
f g0

Somit ist

SF [f (g(x))g 0 (x)] = F (g(x))

Das ist die sog. Substitutionsregel. In der üblichen Schreib-


weise formuliert man diese Regel wie folgt: Die zu integrie- (2.4.4)
rende Funktion sei f (x) und es sei x = g(t).
⇒ dx = g 0 (t)dt (0 ≡ dtd ), und es gilt

Z Z
f (x) dx = f (g(t))g 0 (t) dt.
44 Einführung in die Theoretische Physik

Beispiel: Gesucht ist die SF von y = x sin x2 . Wir verwenden die obere Formel
in (2.4.4). Wir setzen

f (g) = sin g wobei g(x) = x2 , ⇒ g 0 = 2x,

und somit
1
x sin x2 = g 0 (x) sin g(x).
2
Die Stammfunktion von f (g) ist

F (g) = − cos g + c.

Damit erhalten wir, dass


 1 (2.4.4) 1
SF x sin x2 = SF [g 0 sin g] = − cos x2 + c.

2 2

Da capo: Wir verwenden nun die untere Formel in (2.4.4). Setze x2 = t, d.h.
√ √ 1
x= t, g(t) = t ⇒ g 0 (t) = t−1/2 .
2
Somit
Z Z √ Z
1 1 1
2
x sin x dx = t sin t t−1/2 dt = sin t dt = − cos t + c
2 2 2
1
= − cos x2 + c.
2

Integration gebrochen rationaler Funktionen:


Wir besprechen nun eine Methode zur Bestimmung der Stammfunktion einer ge-
brochen rationalen Funktion. Eine solche Funktion ist, wie oben erwähnt, von der
Form
P (x)
f (x) = , (2.4.5)
Q(x)
wobei P (x) ein Polynom vom Grad m und Q(x) ein Polynom vom Grad n ist.
Vorbemerkung 1: Wenn m ≥ n, dann kann f (x) immer auf die Form
p2 (x)
f (x) = p1 (x) + (2.4.6)
Q(x)
gebracht werden, wobei p1 (x) ein Polynom vom Grad m − n und p2 (x) ein Polynom
mit einem Grad kleiner als der von Q(x) ist. Die Form (2.4.6) erhält man durch
Division von P (x) durch Q(x). Wir überzeugen uns davon anhand eines Beispiels in
den Übungen.
Wir nehmen deshalb im Folgenden an, dass

Grad von P (x) < Grad von Q(x).


2.4 Integralrechnung 45

Vorbemerkung 2: Der Grad des Polynoms Q sei n und Q ist o.B.d.A. von der Form

Q(x) = b0 + b1 x + . . . + xn , bj ∈ R ,

siehe die Bemerkung in der Fußnote7 . Wir verwenden im Folgenden die Aussage, dass
ein reelles Polynom Q(x) vom Grad n maximal n reelle Nullstellen, d.h. maximal
n reelle Lösungen der Gleichung Q(x) = 0 hat. Es kann sich a) um n einfache
Nullstellen handeln; b) es können auch mehrfache Nullstellen auftreten, wobei eine
i-fache Nullstelle i-fach gezählt wird; c) es kann auch sein, dass die Zahl der reellen
Nullstellen kleiner als n ist. Welcher der drei Fälle realisiert ist, hängt von den
Werten der reellen Zahlen bj ab. Wir kommen darauf im Kapitel 3 über komplexe
Zahlen zurück.

Methode der Partialbruchzerlegung:


Fall a) Die Nullstellen ai des Nenners Q(x) seien reell und einfach. Dann hat Q die
folgende Produktdarstellung:

Q(x) = (x − a1 )(x − a2 ) · · · (x − an ) , ai 6= aj , ai ∈ R .

Die sog. Partialbruchzerlegung von (2.4.5) hat die Form

P (x) A1 A2 An
= + + ... + . (2.4.7)
Q(x) x − a1 x − a2 x − an
Die Koeffizienten A1 , ..., An erhält man, indem man die rechte Seite auf den Haupt-
nenner bringt und die Koeffizienten der Potenzen von x in den Zählern der Quoti-
enten auf der linken und rechten Seite der Gleichung vergleicht.
Beispiel:
2x + 3 2x + 3 A1 A2 A3
= = + + . (2.4.8)
x3 2
+ x − 2x x(x − 1)(x + 2) x x−1 x+2
Rechte Seite auf den Hauptnenner bringen:
A1 (x − 1)(x + 2) + A2 x(x + 2) + A3 x(x − 1) ! 2x + 3
= .
x(x − 1)(x + 2) x(x − 1)(x + 2)
Der Koeffizientenvergleich der Potenzen von x der Zähler auf der rechten und linken
Seite der Gleichung ergibt


x 2 : A1 + A2 + A3 = 0 
3 5 1
x : A1 + 2A2 − A3 = 2 ⇒ A1 = − , A 2 = , A 3 = − .
2 3 6
x0 : −2A1 = 3

7
Im Allgemeinen ist Q(x) = cn xn + ... Durch Ausklammern der Konstanten cn in Q, d.h.
P (x)
f (x) = cn Q(x)/cn
können wir o.B.d.A. von Q(x) = xn + ... ausgehen.
46 Einführung in die Theoretische Physik

Das unbestimmte Integral (die Stammfunktion) von (2.4.8),


Z
2x + 3
F (x) = dx ,
x + x2 − 2x
3

erhält man durch Integration der rechten Seite von (2.4.8) unter Verwendung von
Z
A
dx = A ln |x − a| + c.
x−a
Fall b) Q(x) hat n reelle Nullstellen, einige davon seien mehrfache Nullstellen.
Anhand eines Beispiels sei erläutert, wie man in diesem Fall die Partialbruchzerle-
gung vornehmen muss.
Beispiel:
x3 + 1 A1 A2 A3 A4
3
= + + 2
+ . (2.4.9)
x(x − 1) x x − 1 (x − 1) (x − 1)3
Der Koeffizientenvergleich der Potenzen von x ergibt
A1 = −1, A2 = 2, A3 = 1, A4 = 2.
Das unbestimmte Integral von (2.4.9) ist somit
x3 + 1
 
−1
Z Z
2 1 2
dx = dx + + +
x(x − 1)3 x x − 1 (x − 1)2 (x − 1)3
1 1
= − ln |x| + 2 ln |x − 1| − − + c.
x − 1 (x − 1)2
Fall c) Das Polynom Q hat die Produktdarstellung:
Q(x) = (x − a1 )k1 · · · (x − ar )kr (x2 + p1 x + q1 )l1 · · · (x2 + ps x + qs )ls ,
| {z }
sollen keine reellen Nullstellen haben

wobei k1 + . . . + kr + 2l1 + . . . + 2ls = n. In diesem Fall erhält man die Partialbruch-


zerlegung von f (x), Gl. (2.4.5), folgendermaßen: Für jeden Faktor (x − a)k ist die
Summe von Brüchen
A1 A2 Ak
+ 2
+ ... +
x − a (x − a) (x − a)k
anzusetzen. Für jeden Faktor (x2 + px + q)l ist die Summe von Brüchen
B1 x + C1 Bl x + Cl
2
+ ... + 2
x + px + q (x + px + q)l
anzusetzen.
Nun zur Berechnung der Stammfunktionen dieser Brüche. Für l = 1 erhält man:
!

Z
Bx + C B 2C pB 2x + p
dx = ln |x2 + px + q| + p arctan p + const.
x2 + px + q 2 4q − p2 4q − p2
(2.4.10)
2.4 Integralrechnung 47

wobei 4q − p2 > 0. Wir beweisen diese Formel in den Übungen, Blatt 3.


Für l > 1, d.h. zur Berechnung des unbestimmten Integrals
Z
Bx + C
dx , l = 2, 3, ...
(x + px + q)l
2

verwendet man folgenden Trick: Wir differenzieren das folgende Integral, dessen
Integrand vom Parameter q abhängt, nach diesem Parameter:
Z Z  
d Bx + C d Bx + C
dx = dx
dq (x2 + px + q)l−1 dq (x2 + px + q)l−1
Z
Bx + C
= −(l − 1) dx.
(x2 + px + q)l
Somit ist
Z Z
Bx + C 1 d Bx + C
2 l
dx = dx. (2.4.11)
(x + px + q) (1 − l) dq (x2 + px + q)l−1
Durch sukzessive Anwendung dieser Formel können wir uns bis l − 1 = 1 “herunter-
hangeln” und dann die Formel (2.4.10) anwenden.
Beispiel:
Z Z
Bx + C (2.4.11) d Bx + C
2 2
dx = −1 2
dx . (2.4.12)
(x + px + q) dq x + px + q
Das Integral auf der rechten Seite ist durch (2.4.10) gegeben. Wir müssen (2.4.10)
nur noch nach −d/dq differenzieren, um das unbestimmte Integral auf der rechten
Seite von (2.4.12) zu erhalten.

Weitere Methoden:
Es gibt eine Reihe weiterer Methoden, d.h. Substitutionen = Variablentransforma-
tionen zur Berechnung unbestimmter Integrale. Hier seien nur zwei Beispiele ge-
nannt.
• Integrale der Form
Z
P (u, v)
R(sin x, cos x)dx , wobei R(u, v) = ,
Q(u, v)
lassen sich mit der Variablentransformation (sog. Halbwinkelmethode)
x
t = tan
2
auf ein Integral einer rationalen Funktion zurückführen.
• Integrale der Form Z √
R(x, x2 + a2 )dx
48 Einführung in die Theoretische Physik

lassen sich mit


x = a sinh t oder x = a tan t
bearbeiten. Beispiele dazu und weitere Transformationsformeln findet man etwa bei
I.N. Bronstein et al., Taschenbuch der Mathematik.
Es gibt auch eine Reihe ausführlicher Handbücher, in denen das teilweise mehrere
Jahrhunderte alte Wissen über Integrale gesammelt ist; z. B.
I.S. Gradshteyn und I.M. Ryzhik, Table of Integrals, Series, and Products, Academic
Press (inzwischen in der 7. Auflage, 2007).
Die Computeralgebra-Programme Mathematica und Maple ,,kennen” die bekannten
Stammfunktionen ebenfalls. Allerdings sollten Sie diesen Programmen bei der Inte-
gration komplizierter Funktionen nie blind vertrauen.
,,Das Differenzieren ist ein Handwerk – aber das Integrieren eine Kunst.” Dieser
Spruch bringt pointiert eine Erfahrung zum Ausdruck, die Sie vermutlich ebenfalls
schon gemacht haben bzw. noch machen werden. Während man mit den Regeln aus
Abschnitt 2.2.1 – und (2.4.20), (2.4.21) und (2.4.24) unten – jede in analytischer
Form vorliegende Funktion ,,nach Schema F” differenzieren kann, erfordert die Be-
stimmung des Integrals einer komplizierten Funktion eine oder mehrere mehr oder
weniger raffinierte Transformationen. In vielen Fällen gelingt es nicht, das Integral
einer Funktion in analytischer Form durch elementare Funktionen auszudrücken –
obwohl das Integral existiert. Solche Integrale waren oft Anlass zur Definition neuer,
nichtelementarer Funktionen; siehe Abschnitt 2.4.2.

2.4.2 Bestimmtes Integral


Das sog. bestimmte Integral einer Funktion f (x) zwischen den Grenzen a ≤ x ≤ b
ist eine Zahl, oder anders gesagt eine Vorschrift, die der Funktion eine Zahl zuweist.
Da wir hier reelle Funktionen betrachten, die von einer reellen Variablen abhängen,
ist diese Zahl reell. Die geometrische Interpretation eines bestimmten Integrals ist
die einer Fläche (siehe jedoch den Hinweis unten). Das bestimmte Integral
Zb
f (x)dx = Fläche zwischen f (x) und x-Achse von a bis b, (2.4.13)
a

siehe Abbildung 2.5. Sie kennen das aus der Schule.


Das bestimmte Integral ist durch eine Grenzprozedur definiert. Man wählt zunächst
eine endliche Zahl (N + 1) von Stützstellen xn , n = 0, ..., N der Funktion zwischen
den Grenzen a und b:
a = x 0 < x 1 < x 2 < . . . < xn < . . . < xN = b .
Der Abstand ∆xn = xn − xn−1 kann beliebig gewählt werden; wir wählen hier als
Beispiel äquidistante Intervalle
(b − a)
∆x = .
N
2.4 Integralrechnung 49

f(x) = 20 x2 e-x
f(x)

10

0
0 1 2 3 4 5
x

Abbildung 2.5: Beispiel für die Berechnung eines bestimmten Integrals. Die Funktion
f (x) = 20x2 e−x wurde im Intervall 1 ≤ x ≤ 4 in N +1 äquidistante Stützstellen x0 =
1, . . . , xN = 4 eingeteilt
PN (hier N = 25). Die Summe der Flächen der abgebildeten
Rechtecksäulen ist n=1 f (a + n∆x)∆x, wobei ∆x = (b − a)/N .
50 Einführung in die Theoretische Physik

Im Inneren oder auch am Rand eines jeden Elementarintervalls [xn−1 , xn ] wählt man
einen beliebigen Punkt zn , berechnet die Rechtecksfläche f (zn )∆xn und addiert die
N Flächen. Wir wählen hier die rechten Stützpunkte der jeweiligen Rechtecke, siehe
das Beispiel in Abbildung 2.5.

zn = a + n∆x , n = 1, ..., N.

Das bestimmte Integral, das man auch das Riemann-Integral nennt, ist definiert
durch den Grenzwert N → ∞ und folglich ∆xn → 0 bzw. ∆x → 0:

Zb N
X
f (x)dx = lim f (a + n∆x)∆x . (2.4.14)
N →∞
a n=1

Bemerkungen:
1) Das bestimmte Integral existiert, wenn der Grenzwert eine endliche Zahl ergibt,
die unabhängig von der Wahl der Stützstellen ist.
2) Damit der Grenzwert existiert, muss f (x) im Intervall [a, b] nicht stetig sein. Für
in [a, b] unstetige aber beschränkte Funtionen existiert (2.4.14) ebenfalls. Das be-
stimmte Integral existiert sogar, wenn f in [a, b] einen oder mehrere singuläre Punkte
besitzt, an denen f ,,hinreichend schwach divergiert”, siehe das Beispiel unterhalb
Gl. (2.4.15). Präzisere Aussagen dazu erhalten Sie in der HöMaII-Vorlesung.
3) Das Bilden der Riemann-Summe, d.h. die Berechnung der endlichen Summe
P N
0 f (zn )∆xn ist ein praktisches Verfahren zur näherungsweisen Berechnung eines
bestimmten Integrals. Im Gaußschen Näherungsverfahren (und seinen diversen Va-
rianten) zur numerischen Berechnung eines bestimmten Integrals wird die Stützstel-
lenwahl dahingehend optimiert, dass man für eine bestimmte Klasse von Funktionen
einen möglichst guten Näherungswert für das bestimmte Integral bei nicht zu vielen
Stützstellenauswertungen erhält.

Sei F (x) eine Stammfunktion von f (x), d.h. es ist F 0 (x) = f (x). Dann gilt der
Hauptsatz der Differential- und Integralrechnung:

Zb
f (x)dx = F (b) − F (a) . (2.4.15)
a

Beispiele: √ √
1) Die Stammfunktion von f (x) = 1/ x ist F (x) = 2 x + c. Somit ist

Z1 √ √
1
dx √ = 2( 1 − 0) = 2 .
x
0

Obwohl f (x) bei x = 0 divergent ist, existiert das bestimmte Integral.


2.4 Integralrechnung 51

2) Es sei 0 < a < b und f (x) = 1/x.

Zb
1
dx = ln b − ln a
x
a

Hier existiert das bestimmte Integral für a → 0 nicht.

Hinweis:
Das bestimmte Integral (2.4.13) bzw. (2.4.15) ist nur dann eine Fläche im Sinne
ihrer eigentlichen geometrischen Bedeutung, wenn z.B. x und f (x) die Dimension
einer Länge haben, [x] = [dx] = [f ] = Länge bzw. [F ] =Fläche. In Anwendungen,
z.B. in der Physik, haben x und f oft andere Bedeutungen. Z.B. kann x für die
Zeit und f (x) für die Beschleunigung eines Körpers als Funktion der Zeit stehen.
(Wir verwenden dann in der Regel die Variable t und a(t).) Dann ist das bestimmte
Integral, d.h. die rechte Seite von (2.4.15) die Differenz der Geschwindigkeiten des
Körpers zu den Zeiten b und a.
Ein anderes Beispiel ist die Arbeit, die eine auf einen Körper einwirkende Kraft an
dem Körper verichtet. Die Kraft wirke in x-Richtung und beschleunige den Körper
von x = a nach x = b. Hier ist [x] = [dx] = Länge, [f ] = Kraft und das bestimmte
Integral bzw. F haben die Dimension einer Energie, [F ] = Energie = Arbeit. Das
bestimmte Integral (2.4.15) ergibt dann die Differenz der Energien des Körpers an
den Punkten b und a.

Elementare Regeln:

1. Beispiel: Sei f (x) von der Form wie in der Skizze dargestellt.
Es ist
f
Zb
f (x) = Fläche ⊕ −Fläche .
a

D.h. der Beitrag zu einem be- a x
stimmten Integral, bei dem b
f (x) < 0 ist, hat ein negatives
Vorzeichen.

2. Intervalladdition: Es gilt

Zb Zc Zc
f (x)dx + f (x)dx = f (x)dx. (2.4.16)
a b a
52 Einführung in die Theoretische Physik

3. Aus (2.4.16) folgt, dass


Zb Za
f (x)dx = − f (x)dx. (2.4.17)
a b

Diese Regeln folgen aus der Linearität des (bestimmten) Integrals.

Weitere Rechenregeln für bestimmte Integrale:


Die Rechenregeln zur Bestimmung von Stammfunktionen gelten natürlich auch für
bestimmte Integrale, insbesondere die Regeln, die in Abschnitt 2.4.1 besprochen
wurden.

Partielle Integration:
Zb Zb
0
b
f (x)g(x)dx = f (x)g(x) a − f (x)g 0 (x)dx . (2.4.18)
| {z }
a f (b)g(b)−f (a)g(a) a

Substitutionsregel:
Oft kann die Variable x einer Funktion f (x) als Funktion x = g(t) einer anderen
Variablen betrachtet werden. Die Funktion g sei im Integrationsgebiet umkehrbar,
die Umkehrfunktion ist t = g̃(x). Dann gilt:

Zb Zg̃(b)
f (x)dx = f (g(t))g 0 (t)dt . (2.4.19)
a g̃(a)

Beispiel:
Zb
2
I= xe−cx dx.
0
2
Substitution t = −cx . Dann
dt 1
= −2cx ⇒ xdx = − dt .
dx 2c
Transformation der Integrationsgrenzen:
x=0 → t(0) = 0,
x=b → t(b) = −cb2 .
Somit
Z 2
−cb  
1 t 1 t −cb2 1 −cb2 1
I=− dt e = − e 0 = − e − − .
2c 2c 2c 2c
0
2.4 Integralrechnung 53

Variable Integrationsgrenzen, Differentiation nach den Grenzen:


Wir können in einem bestimmten Integral die obere oder untere Grenze als variabel
auffassen und so mit dem bestimmten Integral eine Funktion einer Variablen defi-
nieren; insbesondere dann, wenn die Stammfunktion F von f nicht in analytischer
Form angegeben werden kann. Zum Beispiel sei die obere Grenze b variabel; wir
nennen b = x. Die untere Grenze a sei fest. Dann definiert
Zx
f (x0 )dx0 = F (x) − F (a)
a

die Funktion F (x). Es ist klar, dass die Integrationsvariable und die variable (obere)
Grenze verschieden voneinander sind; d.h. man muss verschiedene Symbole benut-
zen.
Die Differentiation nach der oberen Grenze ergibt
Zx
d dF (x) d
f (x0 )dx0 = − F (a) = f (x). (2.4.20)
dx | dx |dx {z }
a
{z }
Per Def. f (x) =0, da
a=const.

Analog ist
Zb
d d dF (x)
f (x0 )dx0 = F (b) − = −f (x). (2.4.21)
dx dx dx
x

Für viele Funktionen f (x) kennt man die analytische Form der Stammfunktion
nicht. Man kann, wie gesagt, über ein Integral der Form
Zx
I(x) = dx0 f (x0 ) (2.4.22)
x0

eine Funktion I(x) definieren, von der man dann eben nur ihre Integraldarstellung
analytisch kennt. Eine andere Möglichkeit zur Definition einer Funktion J(x) ist
Zb
J(x) = dt f (t, x) . (2.4.23)
a

Differentiation unter dem Integralzeichen:


Wenn eine Funktion J(x) in der Form (2.4.23) gegeben ist, erhält man ihre Ableitung
folgendermaßen:
Zb Zb
dJ(x) d ∂f (t, x)
= dt f (t, x) = dt , (2.4.24)
dx dx ∂x
a a
54 Einführung in die Theoretische Physik

wobei hier ∂f (t, x)/∂x die sog. partielle Ableitung der Funktion f (t, x) zweier Va-
riablen nach x ist. Diese partielle Ableitung bildet man wie die oben besprochene
gewöhnliche Ableitung von Funktionen einer Variablen; die Variable t wird dabei
festgehalten, d.h. als Konstante betrachtet. Voraussetzung für die Anwendung von
(2.4.24) ist, dass f in einem zweidimensionalen Gebiet partiell nach x differenzier-
bar ist und diese Ableitung dort stetig ist. Wir behandeln partielle Ableitungen von
Funktionen mehrerer Variablen im Detail in Kapitel 7; siehe auch das Beispiel 3)
unten.

Beispiele:
1) Beispiel zu (2.4.22): Die aus der Statistik bekannte Gaußsche Fehlerfunktion

Zx
2 2
erf (x) ≡ √ e−t dt , (2.4.25)
π
0

siehe die Vorlesung Datenverarbeitung. Obwohl die Stammfunktion der ,,Gauß-Glocke”


2
e−t (eine völlig harmlose elementare Funktion) existiert, kann man die Stamm-
funktion nicht in analytischer Form durch elementare Funktionen ausdrücken. Mit
2 √
(2.4.20) erhalten wir, dass d erf (x)/dx = 2e−x / π.
2) Beispiel zu (2.4.23): Die Gamma-Funktion Γ(x) ist die Verallgemeinerung der
Fakultät n! ≡ 1 · 2 · · · n auf reelle Zahlen x. Eine Integraldarstellung dieser Funktion
für positive reelle Zahlen ist

Z∞
Γ(x) = tx−1 e−t dt , x > 0. (2.4.26)
0

Wir untersuchen diese Funktion in einer Übung etwas näher. Die Ableitung dΓ(x)/dx
berechnet man mit (2.4.24).
3) Beispiel zu (2.4.24): Wir betrachten das Integral

Z1
t
J(x) = dt arctan .
x
0

Für x > 0 können wir J nach x mit (2.4.24) differenzieren:

Z1 Z1
x2
 
dJ(x) ∂ t t 1
= dt arctan =− dt 2 = ln .
dx ∂x x t + x2 2 1 + x2
0 0

Dieses Beispiel ist relativ trivial insofern, als das Integral J(x) auch in analytischer
Form berechenbar ist (tun Sie das zu Hause).
2.4 Integralrechnung 55

Uneigentliche Integrale:
Die beiden Haupttypen der sog. uneigentlichen Integrale sind

A) Integrale, bei denen eine oder beide Integrationsgrenzen im Unendlichen liegen.


Im Sinne dieses Begriffes ist die Integraldarstellung (2.4.26) der Gamma-Funktion
ein uneigentliches Integral. Man erhält ein solches Integral z.B. dadurch, dass man
eine der Integrationsgrenzen – oder beide – eines bestimmten Integrals gegen ∞
bzw. −∞ schickt:
Zb Zb
z.B.
f (x) dx −→ lim f (x) dx .
b→∞
a a

Analog definiert man uneigentliche Integrale auf der Halbachse (−∞, b] oder der
ganzen reellen Zahlengeraden (−∞, ∞). Wir wollen hier nicht darauf eingehen, un-
ter welchen Voraussetzungen ein solches Integral existiert, siehe dazu z.B. das Buch
von Bronstein et al. Notwendigerweise muss f (x) → 0 für x → ±∞. Wir begnügen
uns mit einigen Beispielen:

Z∞ Zb
dx dx
1) = lim = lim ln b = ∞ ,
x b→∞ x b→∞
1 1

d.h. dieses uneigentliche Integral existiert nicht.

Z∞ Zb  
dx dx 1
2) = lim = lim − + 1 = 1 .
x2 b→∞ x2 b→∞ b
1 1
Z∞
2 √ √
3) e−x dx = π lim erf (y) = π.
y→∞
−∞

Dieses Ergebnis leiten wir in einer Übung zu Kapitel 7.8 her.

B) Integrale unstetiger Funktionen: Der Definitionsbereich der Funktion f (x) sei


ein halboffenenes Intervall [a, b); im Punkt b sei der Grenzwert lim f (x) = ∞. Man
x→b
definiert das uneigentliche Integral

Zb Zb−
f (x) dx = lim+ f (x) dx . (2.4.27)
→0
a a

Die Exsitenz (d.h. Endlichkeit) des Grenzwertes hängt von der Schwäche bzw. Stärke
der Singularität von von f (b − ) für  → 0+ ab.
Analog: Sei f (x) im halboffenen Intervall (a, b] definiert und divergiere für x → a.
56 Einführung in die Theoretische Physik

Dann
Zb Zb
f (x) dx = lim+ f (x) dx . (2.4.28)
→0
a a+

Beispiel: Die Funktion f (x) = 1/ x ist bei x = 0 singulär. Es ist

Zb Zb √ √
dx dx √
√ = lim √ = lim (2 b − 2 ) = 2 b .
x →0+ x →0+
0 

Für das Integral der Funktion f (x) = x−r , r > 0 mit denselben Integrationsgrenzen
findet man, dass dieses uneigentliche Integral für für r < 1 existiert, während es für
r ≥ 1 unendlich wird.
Kapitel 3

Komplexe Zahlen

Sie wissen aus der Schule, dass viele quadratische Gleichungen – oder algebraische
Gleichungen höheren Grades – keine reellen Lösungen haben. Beispiele:

x2 + 1 = 0 oder x2 + px + q = 0, wenn p2 − 4q < 0.

Dies war der Anlass zur Erweiterung der reellen Zahlen auf die Menge der komplexen
Zahlen:
R ⊂ C.
Menge der reellen Zahlen Menge der komplexen Zahlen
Man führt die sog. imaginäre Einheit i ein, die definiert ist durch

imaginäre Einheit: i2 ≡ −1 .

Somit ist die Lösung von z 2 + 1 = 0 gegeben durch z = ±i. Aus i2 ≡ −1 folgt

i3 = i2 i = −i
i4 = i2 i2 = (−1)(−1) = +1
i5 = i4 i = i
etc.

Eine beliebige komplexe Zahl z ∈ C ist darstellbar als

z = x + iy, wobei x, y ∈ R . (3.0.1)

Man bezeichnet

x = Re z als den Realteil von z,


y = Im z als den Imaginärteil von z.
2

Hinweis: Aus√ i = −1 folgert man naiv, dass i = ± √−1. Vereinbarungsgemäß setzt
man i = + −1, aber Vorsicht: Die Wurzelfunktion z muss für eine komplexe Zahl
erst definiert werden; siehe Abschnitt 3.3 am Ende dieses Kapitels.
58 Einführung in die Theoretische Physik

Im z Im z
z1 + z2
b z = a + ib z1
b1

a Re z
b2 z2
Re z
a1 a2
(a) Komplexe Ebene. (b) Addition zweier komplexer Zahlen z1 , z2 .

Abbildung 3.1: Kartesische Darstellung von komplexen Zahlen.

3.1 Kartesische Darstellung


Man bezeichnet (3.0.1) als die kartesische Darstellung einer komplexen Zahl z. Der
Grund ist die geometrische Interpretation dieser Gleichung. Während reelle Zahlen
als Punkte auf einer Geraden darstellbar sind, lassen sich komplexe Zahlen durch
Punkte in einer Ebene, der Gaußschen Zahlenebene veranschaulichen, siehe Abbil-
dung 3.1(a). Wählt man ein kartesisches Koordinatensystem (zwei zueinander senk-
rechte Achsen), so sind x = Re z, y = Im z die Projektionen von z auf die reelle
bzw. imaginäre Achse.

Addition/Subtraktion:

z1 ± z2 = (a1 + ib1 ) ± (a2 + ib2 ) = a1 ± a2 + i(b1 ± b2 ), (3.1.1)


bzw., wenn wir eine komplexe Zahl z durch das Zahlenpaar z = (a, b) darstellen:

z1 ± z2 = (a1 , b1 ) ± (a2 , b2 ) = (a1 ± a2 , b1 ± b2 ). (3.1.2)

Stellen wir die Addition/Subtraktion zweier komplexer Zahlen in der Zahlenebene


dar, so sehen wir, dass die Addition/Subtraktion von komplexen Zahlen, wie in
Abbildung 3.1(b) gezeigt, der Addition/Subtraktion zweier Vektoren entspricht –
siehe Kapitel 5.

Multiplikation:

z1 z2 = (a1 + ib1 )(a2 + ib2 ) = a1 a2 + ib1 a2 + ia2 b1 + i2 b1 b2


(3.1.3)
= (a1 a2 − b1 b2 ) + i(a1 b2 + a2 b1 ).
3.2 Darstellung in Polarkoordinaten 59

Definition der komplexen Konjugation:


Die zu z = a + ib konjugierte komplexe Zahl z ∗ ist definiert durch1
z ∗ ≡ a − ib. (3.1.4)
D.h. zwei zueinander konjugiert komplexe Zahlen haben identische Realteile und
ihre Imaginärteile unterscheiden sich nur durch ein Vorzeichen.
Ihr Produkt
zz ∗ = (a + ib)(a − ib) = a2 + b2
ist eine reelle Zahl ≥ 0.
Es gilt
(z1 + z2 )∗ = z1∗ + z2∗ , (z1 z2 )∗ = z1∗ z2∗ .
Nachprüfen!

Division:
Den Quotienten z1 /z2 berechnet man, indem man mit dem komplex konjugierten
des Nenners erweitert.
  
z1 a1 + ib1 a1 + ib1 a2 − ib2 a1 a2 + b1 b2 a2 b1 − a1 b2
= = = 2 2
+i 2 . (3.1.5)
z2 a2 + ib2 a2 + ib2 a2 − ib2 a2 + b2 a2 + b22

Hinweis:
Beachten Sie folgendes: Seien z1 , z2 zwei komplexe Zahlen. Dann ist im Allgemeinen
Re(z1 z2 ) 6= Re z1 Re z2 , Im(z1 z2 ) 6= Im z1 Im z2 ; (3.1.6)
denn
Re(z1 z2 ) = Re z1 Re z2 − Im z1 Im z2 , Im(z1 z2 ) = Re z1 Im z2 + Im z1 Re z2 ,
wie man sofort an Gl. (3.1.3) ablesen kann. Nur wenn eine der beiden Zahlen reell
ist, z.B. z1 = a ∈ R, z2 = z ∈ C, dann
Re(az) = aRe z , Im(az) = aIm z .
Diese elementaren Resultate sollten Sie verinnerlichen – wir benötigen sie beispiels-
weise in Kapitel 4.2.

3.2 Darstellung in Polarkoordinaten


Oft ist es bequemer, mit komplexen Zahlen in der sog. Polarkoordinatendarstellung
zu rechnen. Das gilt vor allem für die Multiplikation und Division.
1
Hinweis: Anstelle von z ∗ ist auch die Notation z̄ verbreitet.
z = a + ib ⇒ z̄ ≡ z ∗ = a − ib.
60 Einführung in die Theoretische Physik

b z
ρ
z
b
ρ
φ φ
a a

− arctan(b/a)

φ φ
a a

ρ
ρ
b b
z z

Abbildung 3.2: Polarkoordinatendarstellung komplexer Zahlen, die in den vier ver-


schiedenen Quadranten der Zahlenebene liegen.
3.2 Darstellung in Polarkoordinaten 61

Eine komplexe Zahl z kann festgelegt werden durch ihren Absolutbetrag



ρ ≡ |z| = a2 + b2 (3.2.1)
und den Winkel zwischen der Geraden durch die Punkte 0 und z und der positiven
Achse +Re z, siehe Abbildung 3.2. Diesen Winkel nennt man die Phase oder das
Argument von z:
φ = arg (z) . (3.2.2)
Das ist die Polarkoordinatendarstellung eines Punktes in einer Ebene.
Der Zusammenhang zwischen a, b und ρ, φ ist gegeben durch
a = ρ cos φ b = ρ sin φ. (3.2.3)
Den Abbildungen 3.2 ist außerdem zu entnehmen, dass

    0 für a > 0, b > 0,
b 
π für a < 0, b > 0,
φ = arctan + (3.2.4)
a 
 π für a < 0, b < 0,
2π für a > 0, b < 0,

wobei man auf die Addition von 2π in der letzten Zeile verzichten kann, weil cos(φ +
2π) = cos φ und sin(φ + 2π) = sin φ.
Beachte: Das Argument φ einer komplexen Zahl ist nur bis auf ganzzahlige Vielfa-
che von 2π festgelegt, wie aus (3.2.3) ersichtlich ist.
Mit a = ρ cos φ und b = ρ sin φ erhalten wir die Darstellung von z in Polarkoor-
dinaten:
z = a + ib = ρ cos φ + iρ sin φ = ρeiφ . (3.2.5)
Die letzte Gleichung, die sog. Euler-Formel
eix = cos x + i sin x (3.2.6)
müssen wir noch beweisen. Dazu benutzen wir die Potenzreihenentwicklungen der
Exponentialfunktion, Gl. (2.3.9), des Sinus, Gl. (2.3.18), und des Kosinus, Gl. (2.3.19).
∞ ∞ ∞
X (ix)n X (ix)2n X (ix)2n+1
eix = = +
n=0
n! n=0
(2n)! n=0
(2n + 1)!
∞ ∞
X xn n
X x2n+1
= (−1) +i (−1)n
n=0
(2n)! n=0
(2n + 1)!
= cos x + i sin x.
Aus (3.2.6) folgt, dass die Exponentialfunktion einer rein imaginären Variablen
z = iφ eine periodische Funktion mit Periode 2π ist:
ei(φ+2πk) = eiφ , k = 0, ±1, ±2, ... (3.2.7)
Daraus folgt, dass jede Zahl z unendlich viele Exponentialdarstellungen besitzt:

z = ρei(φ+2πk) , k = 0, ±1, ±2, ... (3.2.8)


62 Einführung in die Theoretische Physik

Multiplikation:
Nun nochmal zur Multiplikation und Division zweier komplexer Zahlen, die in der
Darstellung (3.2.5) besonders einfach durchgeführt werden können.

z1 z2 = ρ1 eiφ1 ρ2 eiφ2 = ρ1 ρ2 ei(φ1 +φ2 ) . (3.2.9)

Komplexe Konjugation:
(3.2.5)
z = eiφ ⇒ z ∗ = e−iφ (3.2.10)
Geometrisch entspricht die komplexe Konjugation von z der Spiegelung von z an
der reellen Achse. D.h.

z ∗ = ρ cos(−φ) + iρ sin(−φ) = ρ cos φ − iρ sin φ .

Absolutbetrag:
1/2
|z| = (zz ∗ )1/2 = ρeiφ ρe−iφ = ρ. (3.2.11)

Division:
z1 ρ1 eiφ1 ρ1 i(φ1 −φ2 )
= iφ
= e . (3.2.12)
z2 ρ2 e 2 ρ2
Als Erweiterung der Euler-Formel (3.2.6) erhält man die Formel von Moivre
für die n-te Potenz einer komplexem Zahl:

z n = ρn einφ = ρn (cos(nφ) + i sin(nφ)) . (3.2.13)

3.3 Funktionen einer komplexen Variablen


Wie für reelle Zahlen kann man auch Funktionen von komplexen Zahlen z betrach-
ten. Der Funktionswert ist im Allgemeinen wieder eine komplexe Zahl.
Beispiel:
f (z) = ez = ex+iy = ex eiy = ex cos y + iex sin y.
Weitere Beispiele besprechen wir unten. Das mathematische Gebiet, in dem komple-
xe Funktionen, ihre Differentiation und Integration untersucht werden, heißt Funk-
tionentheorie. Einen Einblick in diesen Zweig der Mathematik erhalten Sie in der
Vorlesung Höhere Mathematik IV.
Wir erwähnen hier ein grundlegendes Ergebnis, den sogenannten Fundamental-
satz der Algebra (der von C.F. Gauß bewiesen wurde). Jedes Polynom N -ten Grades

PN (x) = a0 + a1 z + a2 z 2 + ... + aN z N , (3.3.1)

wobei die ai im Allgemeinen komplexe Koeffizienten sind, hat in der komplexen


Ebene genau N Nullstellen zi , d.h. PN (zi ) = 0, wobei n-fache Nullstellen n-mal
3.3 Funktionen einer komplexen Variablen 63

k=2 k=1

π
k=3 3 k=0
1

k=4 k=5

Abbildung 3.3: Die sechs komplexen Wurzeln der Gleichung z 6 = 1.

gezählt werden.
Beispiel: Die reelle Gleichung x6 − 1 hat 2 relle Nullstellen x1,2 = ±1. Die komplexe
Gleichung z 6 − 1 = 0 hat 4 weitere komplexe Nullstellen.
Zum Auffinden dieser Lösungen benutzen wir die Exponentialdarstellung, z = ρeiφ .

z 6 = 1 ⇒ (z 6 )∗ = (z ∗ )6 = 1
!
⇒ (zz ∗ )6 = ρ12 = 1
⇒ ρ = 1, da ρ ≥ 0.

Somit sind die gesuchten Nullstellen von der Form z = eiφ . Es muss gelten:
!
z 6 = ei6φ = 1 = ei2πk k ∈ Z, vgl. (3.2.8)
⇒ 6φ = 2πk
π
⇒ φ= k k = 0, ±1, ±2, ...
3
Wir erhalten somit die 6 Nullstellen

z0 = 1, z1 = eiπ/3 , z2 = ei2π/3 , ..., z5 = ei5π/3 ,

siehe Abbildung 3.3. Die Lösungen für k = 1 und k = 5 bzw. k = 2 und k = 4 sind
komplex konjugiert zueinander. Für k = 6 ergibt sich dieselbe Lösung wie für k = 0,
die Lösung für k = 7 ist identisch mit der Lösung für k = 1, die Lösung für k = −1
ist identisch mit der für k = 5, etc.
Wir benutzten die Aussage des Fundamentalsatzes der Algebra bereits in Kapi-
tel 2.4, und zwar für den Fall, dass die Koeffizienten ai des Polynoms (3.3.1) reell
64 Einführung in die Theoretische Physik

sind. In diesem Fall ist die Zahl nr der reellen Nullstellen xj des Polynoms PN (x)
kleiner oder gleich N . Wenn nr < N , dann sind die verbleibenden Nullstellen paar-
weise konjugiert komplex zueinander – d.h. deren Anzahl (N − nr ) ist eine gerade
Zahl.

Potenzfunktionen und Wurzelfunktionen: Wir betrachten die Potenzfunk-


tion w = z n , n ∈ N etwas näher. Der Definitionsbereich dieser Funktion ist die
Menge der komplexen Zahlen; die Funktionswerte sind wieder komplexe Zahlen. In
der Polarkoordinatendarstellung ist diese Funktion

w = z n = |z|n einφ , wobei φ = argz .

Anhand dieser Darstellung sieht man folgendes: Wenn z = |z| exp(iφ) die Menge der
komplexen Zahlen z 6= 0 durchläuft, 0 < |z| < ∞, 0 ≤ φ < 2π, dann überdeckt die
Funktion w = z n die komplexe Zahlenebene n-mal2 . Jeweils n verschiedene z-Werte
zk ,
2π 2π
zk = ρeiφk , φk = φ + k , k = 0, . . . , n − 1 , 0 ≤ φ <
n n
n
liefern
√ denselben Funktionswert w = z . Das bedeutet, dass die Umkehrfunktion
z = w für n > 1 mehrdeutig ist.
n

Für die Funktion w = z 2 stellt sich das wie folgt dar. Wir variieren z in der kom-
plexen Ebene längs eines Kreises mit festem Radius um den Nullpunkt, d.h. festem
|z|. Die Phase von z wird in mathematisch positiver Richtung = Gegenuhrzeiger-
richtung geändert, siehe Abbildung 3.4. Der Bildpunkt w = z 2 variiert ebenfalls auf
einem Kreis mit Radius |z|2 um den Nullpunkt, aber doppelt so schnell. Mit anderen
Worten: wenn durch Variation von z die komplexe Ebene einmal überdeckt wird,
wird durch w = z 2 die Bildebene
√ zweimal überdeckt.
Für die Umkehrfunktion z = w bedeutet dies:

w = ρeiφ , z= ρeiφ/2 . (3.3.2)

Bei einer kompletten Umkreisung des Nullpunktes in der w-Ebene sind wir wieder
beim selben w, aber z nimmt einen anderen Wert an:
√ √
w = ρei(φ+2π) = ρeiφ , aber z = ρei(φ+2π)/2 = − ρeiφ/2 .

Bei einer zweifachen kompletten Umkreisung des Nullpunktes in der w-Ebene erhal-
ten wir allerdings wieder denselben Wert von z wie in (3.3.2):
√ √
w = ρei(φ+4π) = ρeiφ , z= ρei(φ+4π)/2 = + ρeiφ/2 .

Um hier eine Umkehrfunktion zu definieren, die eindeutig in die ganze komple-


xe z-Ebene C abbildet, wird eine auf B. Riemann zurückgehende Konstruktion
2
Mit anderen Worten: Bereits bei Beschränkung auf das n-te Segment |z| ≥ 0, 0 ≤ φ < 2π/n,
überdeckt w = z n ganz C.
3.3 Funktionen einer komplexen Variablen 65

Abbildung 3.4: Umlauf auf einen Kreis um den Nullpunkt in der z-Ebene in mathe-
matisch positiver Richtung.

durchgeführt, die wir uns anhand dieses Beispiels klarmachen. Man schneidet die
beiden übereinander liegend gedachten w-Ebenen längs der negativen rellen Ach-
se auf und denkt sich die beiden ,,Ufer” des Schnittes im oberen Blatt mit den
beiden Ufern des Schnittes im unteren Blatt gemäß Abbildung 3.5 verklebt.
√ Die
3
so konstruierte Fläche heisst Riemannsche Fläche der Funktion z = w. Wir
nennen diese Fläche hier R2 . Das Aufschneiden der Ebenen längs der negativen
reellen Achse ist eine (allgemein übliche) Konvention – man könnte den Schnitt
auch längs einer beliebigen anderen Geraden von Null nach Unendlich legen. Die
komplexen Zahlen w mit −π < φ ≤ π liegen auf dem unteren Blatt von R2 ;
dann wandert man in das obere Blatt von R2 , das den komplexen Zahlen w mit
π < φ ≤ 3π entspricht. Bei √ φ = 3π geht es wieder in das untere Blatt, etc. Was
machen die Bildpunkte z = w ? Wir betrachten Zahlen w auf dem Einheitskreis
|w| = 1. Im ersten Blatt startet man konventionsgemäß mit Zahlen w = exp(iφ) mit
φ > −π. (Für das nicht im ersten Blatt liegende φ = −π, d.h. w = exp(−iπ) = −1
wäre z = exp(−iπ/2) = −i.) Am Ende der Umkreisung des ersten Blattes ist
w = exp(iπ) = −1 und somit z = exp(iπ/2) = i. Am Ende der Umkreisung des
√ Blattes ist w = exp(i3π) = −1 und z = exp(−i3π/2) = −i. Somit definiert
zweiten
z = w eine eindeutige Abbildung von R2 7→ C.

Wie man anhand dieses


√ Beispiels erahnen kann, hat die Riemannsche Fläche der
n-ten Wurzel,
√ z = n
w, n Blätter. Die dreiblättrige Riemannsche Fläche der Funk-
tion z = w ist in Abbildung 3.6 dargestellt.
3

Transzendente Funktionen: Hier nur der Vollständigkeit halber ein paar kurze
Bemerkungen zu den Umkehrfunktionen der komplexen Exponentialfunktion und
der trigonometrischen Funktionen.
Die komplexe Exponentialfunktion

w = ez = ex eiy
3
Der Nullpunkt ist ein sog. Verzweigungspunkt dieser Funktion. (Der andere ist z = ∞.) Man
√ anderen Punktes w 6= 0 bei dieser Funktion
kann sich überlegen, dass die Umkreisung irgend eines
zu keinen Mehrdeutigkeiten führt. Bei der Funktion w − w0 ist w0 der Verzweigungspunkt.
66 Einführung in die Theoretische Physik


Abbildung 3.5: Die zweiblättrige Riemannsche Fläche der Funktion z = w.


Abbildung 3.6: Die dreiblättrige Riemannsche Fläche der Funktion z = 3
w.
3.4 Anwendungen 67

bildet unendlich viele verschiedene z, nämlich


z = x + iy mit y = y0 + 2kπ , k = 0, ±1, ±2, ...
auf das gleiche w ab, vgl. (3.2.7). Deswegen ist die Umkehrfunktion
z = Ln w
mehrdeutig. (Man beachte die Großschreibung des Symbols.) Mit w = ρ exp(iφ) =
ρ exp[i(φ + 2kπ)] erhält man
Ln w = ln ρ + i(φ + 2kπ) , k = 0, ±1, ±2, ...
Man beschränkt sich üblicherweise auf den sog. Hauptwert ln w von Ln w:
ln w = ln ρ + iφ , −π < φ ≤ π . (3.3.3)
Die Funktion Ln w bzw. ln w ist für alle komplexen Zahlen w 6= 0 definiert.
Die Riemannsche Fläche Rln von Ln w hat unendlich viele Blätter. Die Funktion
Ln w definiert eine eindeutige Abbildung von Rln 7→ C.
Die Umkehrfunktionen der komplexen Funktionen sin z, sin z, tan z, cot z sind eben-
falls unendlich vieldeutig. Das sollte aufgrund der Diskussion der entsprechenden
reellen Funktionen in Kapitel 2 nicht verwundern. Wir gehen hier nicht weiter da-
rauf ein.

Hinweis: Für unsere Zwecke benötigen wir das Konzept der Riemannschen Fläche
nicht. Wenn wir den Logarithmus oder insbesondere die Wurzel einer komplexen Zahl
z berechnen müssen, legen wir das Argument der Variablen z durch
− π < arg z ≤ π (3.3.4)
fest4 . Somit wird ln z gemäß (3.3.3) berechnet. Wollen wir die Wurzel aus einer
negativen reellen Zahl z = −a, a > 0 ziehen, wird diese Zahl demzufolge durch
a exp(iπ)
√ dargestellt
√ – aber nicht√durch a exp(−iπ) oder durch
√ a exp(i3π) etc. Somit
ist −a = a exp(iπ/2) = +i a. Die Funktion w = z bildet für Werte z mit
der in (3.3.4) gewählten Festlegung die komplexe Zahlenebene C auf die rechte
Halbebene {w| − π/2 < argw ≤ π/2} ab.

3.4 Anwendungen
Von den vielfältigen mathematischen Anwendungen komplexer Zahlen seien hier nur
zwei einfache, für uns relevante Beispiele erwähnt. Man kann die trigonometrischen
Additionstheoreme
sin(x ± y) = sin x cos y ± cos x sin y , cos(x ± y) = cos x cos y ∓ sin x sin y ,
4
Beachten Sie, dass es bei der Festlegung von argz nur darum geht, keine ganzzahligen Vielfachen
von 2π zuzulassen. Man könnte argz beispielsweise auch durch π/2 ≤ argz < 5π/2 festlegen.
68 Einführung in die Theoretische Physik

wobei x, y reell oder komplex sein können, schnell mit Hilfe der Darstellungen
1 ix 1 ix
e + e−ix e − e−ix ,
 
cos x = sin x = (3.4.1)
2 2i
die man aus der Euler-Formel erhält, beweisen. Wir machen das in einer Übung.
Wozu braucht man komplexe Zahlen und/oder komplexe Funktionen in der Phy-
sik? Wie Sie wissen, sind die Messwerte physikalischer Observablen durch reelle
Zahlen gegeben. In vielen Gebieten der (theoretischen) Physik ist es allerdings be-
quem und nützlich, bestimmte Messgrößen zunächst durch komplexe Zahlen bzw.
durch komplexwertige Funktionen darzustellen und damit zu rechnen. So beschreibt
man beispielsweise in der Elektrodynamik zeitabhängige elektromagnetische Felder,
die sich als Lösungen der zeitabhängigen Maxwell-Gleichungen im Vakuum oder in
linearen Medien ergeben, vorzugsweise durch komplexwertige Funktionen. In der
Quantentheorie ergibt sich die Aufenthaltswahrscheinlichkeitsdichte |ψ|2 eines Teil-
chens an einem Ort zu einer bestimmten Zeit aus einer i.A. komplexwertigen ,,Wel-
lenfunktion” ψ. (Auch in der theoretischen Hydro- und Aerodynamik, die nicht Teil
des Bachelor-Curriculums sind, findet man Anwendungen der Theorie der komple-
xen Funktionen.) Im Rahmen der Mechanik benutzen wir komplexe Zahlen bzw.
Funktionen vornehmlich bei der Lösung linearer Schwingungsdifferentialgleichungen
– siehe nächstes Kapitel. Wir benötigen im Wesentlichen nur die elementaren alge-
braischen Operationen mit komplexen √ Zahlen, die Euler- und Moivre-Formeln, die
z
Exponentialfunktion e , die Wurzel z und den Zusammenhang (3.4.1) zwischen
dem Sinus und Kosinus und exp(±ix) für reelle x.
Kapitel 4

Gewöhnliche
Differentialgleichungen

Differentialgleichungen (DGL) spielen in der Physik eine überragende Rolle. Viele


Gesetze der Physik, insbesondere die Bewegungsgesetze (Dynamik) sind als Diffe-
rentialgleichungen formulierbar. Man unterscheidet

Gewöhnliche Differentialgleichungen: Sei y = y(x) eine Funktion einer reellen


Variablen x. Eine gewöhnliche DGL n-ter Ordnung ist eine Gleichung, in der
y(x) und die Ableitungen dieser Funktion bis zur n-ten Ordnung y (n) vorkom-
men:
F (x, y, y 0 , ..., y (n) ) = 0, (4.0.1)
wobei F einen funktionalen Zusammenhang zwischen der unabhängigen Va-
riablen x und der Funktion y und ihren Ableitungen bezeichnet. Die DGL, die
uns hier interessieren, sind sog. explizite DGL n-ter Ordnung. Diese sind von
der Form
y (n) = F (x, y, y 0 , ..., y (n−1) ) . (4.0.2)

Partielle Differentialgleichungen: Hier betrachtet man eine Funktion y, die von


mehreren reellen Variablen abhängt, y = y(x1 , ..., xn ). Eine partielle DGL n-
ter Ordnung ist eine Gleichung, in der y und ihre partiellen Ableitungen (siehe
Kapitel 7) bis zur n-ten Ordnung vorkommen. In dieser Vorlesung benötigen
wir nur gewöhnliche DGL. Einige für die Physik wichtige partielle DGL wer-
den in den Vorlesungen über Theoretische Physik ab dem 3. Semester bespro-
chen. Prominente Beispiele sind die Maxwell-Gleichungen, die Laplace- und
Poisson-Gleichung, die Wellengleichung (Theoretische Physik II: Elektrodyna-
mik), die Schrödinger-Gleichung (Theoretische Physik III: Quantenmechanik)
und die Wärmeleitungsgleichung bzw. Diffusionsgleichung (Theoretische Physk
IV: Statistische Physik).

Im Folgenden behandeln wir nur gewöhnliche DGL, vor allem gewöhnliche DGL
1. und 2. Ordnung. Die Dynamik von Punktteilchen und starren Körpern wird
70 Einführung in die Theoretische Physik

durch die Newtonschen Bewegungsgleichungen bzw. den Lagrange- und Hamilton-


Gleichungen, die Sie in der Vorlesung Theoretische Physik I kennenlernen werden,
beherrscht. Dies sind – in der Regel mehrere – gewöhnliche DGL 2. Ordnung, wobei
die Zeit t die Rolle der unabhängigen Variablen übernimmt, von der die Bahnkoor-
dinaten des/der betrachteten Objekts/Objekte abhängen.

Einige Beispiele aus der Physik:


a) Eine typische Aufgabe der theoretischen Mechanik ist die Berechnung von Bah-
nen als Funktion der Zeit mit Hilfe des Newtonschen Bewegungsgesetzes. Hier
ist die Zeit t die unabhängige Variable, und die Bahnkoordinaten x(t), y(t), z(t)
sind Funktionen von t. Man verwendet üblicherweise die Notation
dx
ẋ(t) = x-Komponente der Geschwindigkeit,
dt
d2 x
ẍ(t) = 2 x-Komponente der Beschleunigung,
dt
und analog für die Zeitableitungen der Bahnkoordinaten y(t) und z(t).
Das Newtonsche Gesetz lautet in einer Raumdimension 1 :
mẍ = F (x, ẋ, ẍ, t), (4.0.3)
wobei m die Masse des Objektes ist, auf das die Kraft2 F wirkt. Die Kraft kann
im Allgemeinen von x, ẋ, ẍ und auch explizit von t abhängen. (Abhängigkei-
ten von höheren Zeitableitungen treten in der Regel nicht auf.) Die Gleichung
(4.0.3) ist eine DGL 2. Ordnung. Die Kräfte, die wir im Mechanik-Teil der Vor-
lesung betrachten, sind entweder konstant oder hängen von Ort und/oder der
Geschwindigkeit des Teilchens, aber nicht von seiner Beschleunigung ẍ ab.

Spezialfall: Teilchen, das im Schwerefeld


der Erde senkrecht fällt.

F = mg,
g = 9, 81 m/s2 Erdbeschleunigung,
m
dx
v(t) = Geschwindigkeit.
dt x
g

1
In drei Raumdimensionen erhalten wir für x(t), y(t) und z(t) drei Differentialgleichungen, die
im Allgemeinen – je nach funktionaler Abhängigkeit der Komponenten des Kraftvektors F von den
Bahnkoordinaten und/oder ihren Ableitungen – gekoppelt sind. In diesem einführenden Kapitel
in die Thematik behandeln wir keine DGL-Systeme, sondern nur eindimensionale Bewegungen.
2
Die Kraft ist ein Vektor, d.h. hat in drei Raumdimensionen drei Komponenten - siehe nächstes
Kapitel. In diesem Kapitel behandeln wir, wie gesagt, als physikalische Beispiele der Einfachheit
halber nur eindimensionale Bewegungen.
KAPITEL 4. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 71

Da in diesem Beispiel die Kraft nicht von x abhängt, können wir (4.0.3) durch
die Ersetzung ẋ = v in eine DGL 1. Ordnung bezüglich v(t) umwandeln:
mẍ = mv̇ = mg
⇒ v̇ = g.
Diese DGL 1. Ordnung für v löst man durch Integration, d.h. Bestimmung der
Stammfunktion. Das Ergebnis ist
v(t) = gt + C,
wobei C eine beliebige reelle Konstante ist.
An diesem simplen Beispiel sehen wir folgenden Sachverhalt: Eine gewöhnliche
DGL 1. Ordnung des Typs (4.0.2) hat in der Regel eine Schar von Lösungen (d.h.
unendlich viele Lösungen), die durch eine beliebige Konstante C parametrisiert
ist. Um eine Vorhersage machen zu können, muss die Lösung eindeutig sein. Dies
erreichen wir dadurch, dass wir v zu einer bestimmten Zeit vorgeben, d.h. kennen
müssen. Sei also v(t0 ) = v0 gegeben. Dann ist die Lösung für v(t) eindeutig.

v(t) = gt + C
⇒ v0 = gt0 + C
v(t0 ) = v0
⇒C = v0 − gt0 .
Um die Bahn x(t) zu berechnen, müssen wir den Ausdruck für v(t) integrieren,
was man sofort machen kann. Wir sehen, dass dabei wieder eine willkürliche
Integrationskonstante C 0 auftritt. Diese wird festgelegt, indem wir uns den Ort
des Teilchens zu einer bestimmten Zeit vorgeben, x(t0 ) = x0 .
Fazit: Dieses einfache Beispiel illustriert folgenden wichtigen, recht allgemeinen
Sachverhalt: Viele – aber nicht alle – gewöhnlichen DGL n-ter Ordnung des Typs
(4.0.2) besitzen eine Schar von Lösungen = allgemeine Lösung. Diese hängt von
n willkürlichen Integrationskonstanten ab. Diese Konstanten werden festgelegt
durch Vorgabe von n Anfangs- oder Randbedingungen an die Funktion bzw.
ihrer Ableitungen; siehe unten.
238
b) Radioaktiver Zerfall: Wir betrachten ein radioaktives Material, z.B. Uran U,
das instabil ist:
238
92 U −→ 234 90 Th + 4
2 He .
|{z}
sog. α-Teilchen

Es sei N (t) die Anzahl der zur Zeit t noch nicht zerfallener Atomkerne. Das Zer-
fallsgesetz ergibt sich aus folgenden Sachverhalten: Während eines Zeitintervalls
dt finden im statistischen Mittel dN Kernzerfälle statt. Diese mittlere Änderung
ist proportional zur Zahl N (t) der zur Zeit t noch vorhandener Kerne und zum
Zeitintervall dt. Die Zahl N (t) nimmt mit der Zeit ab; d.h. dN/dt ist negativ.
Somit ist das Zerfallsgesetz:
d
N (t) = −λN (t) , λ > 0, (4.0.4)
dt
72 Einführung in die Theoretische Physik

wobei λ die Zerfallskonstante bzw. Zerfallsrate pro zur Zeit t noch vorhandener
Kerne N (t) ist; [λ] = 1/Zeit. Gl. (4.0.4) ist eine lineare DGL 1. Ordnung. Die
allgemeine Lösung von (4.0.4) erhält man entweder durch Erraten,
N (t) = Ce−λt , C beliebige Konstante, (4.0.5)
oder mit Hilfe einer systematischen Lösungsmethode, der sog. Trennung der Va-
riablen, siehe unten.
Durch Vorgabe einer Anfangsbedingung N (t = 0) = N0 wird C fixiert. Einsetzen
in (4.0.5) ergibt
N (t) = N0 e−λt . (4.0.6)
Die Beispiele a) und b) sind Beispiele für lineare DGL.

Zurück zur Mathematik. Im Folgenden bezeichnen wir die unabhängige Varia-


ble wieder mit x und die gesuchte Funktion mit y = y(x). Man unterscheidet
• Nichtlineare DGL n-ter Ordnung:
F (x, y, y 0 , ..., y (n) ) = 0. (4.0.7)
Hier treten y und/oder die Ableitungen von y nichtlinear auf, z.B.
p
y2, y 0 , etc.
3
Beispiel: y 00 + a(x)(y 0 )4 + b(x)y 2 = 0.
• Lineare DGL n-ter Ordnung: Diese sind von der Form
a0 (x)y(x) + a1 (x)y 0 (x) + ... + an (x)y (n) (x) = f (x). (4.0.8)
Wenn f (x) 6= 0 ist, heißt die DGL inhomogen. Falls f (x) = 0 heisst die DGL
homogen. Falls die ai , i = 0, . . . , n konstant sind, handelt es sich um eine
lineare inhomogene DGL mit konstanten Koeffizienten.
In der Physik treten vor allem (nicht)lineare DGL 1. und 2. Ordnung auf.

Existenz einer Lösung:


Bei einer DGL stellt sich zunächst die Frage, ob bzw. unter welchen Vorausset-
zungen eine Lösung existiert, und falls ja, vieviele Lösungen es gibt. Diese essen-
tiellen Fragen, mit der sich die Mathematiker befassen, lassen sich für DGL der
Form (4.0.1) bzw. (4.0.2) nicht völlig allgemein, sondern nur fallweise bzw. nur für
bestimmte DGL-Klassen beantworten. Wir argumentieren hier pragmatisch bzw.
empirisch. Die DGL, die uns interessieren, entsprechen Naturgesetzen, insbesonde-
re dem Newtonschen Bewegungsgesetz mit in der Natur auftretenden Kräften. Die
Naturbeobachtung zeigt uns, dass Lösungen dieser DGL existieren3 .
3
Diese lapidare Feststellung soll aber nicht den Eindruck erwecken, dass die Ausssagen zur
Existenz und Eindeutigkeit von Lösungen einer DGL für die Physik irrelevant sind. Wir können
hier nur nicht darauf eingehen.
4.1 Beispiele für Differentialgleichungen 1. Ordnung 73

Lösungsmethoden:
Um eine DGL zu lösen, muss man sie auf irgendeine Weise ,,integrieren”. Wir wissen
bereits aus Kapitel 2, dass man ein Integral oft nicht in analytischer Form angeben
kann, obwohl man weiss, das es existiert. Genauso verhält es sich bei vielen DGL.
Manchmal helfen Transformationen der unabhängigen Variablen und/oder der ge-
suchten Funktion, um die DGL in eine analytisch lösbare Form zu bringen. Man
kann in jedem Fall (wenn man sich über die Existenz einer Lösung im Klaren ist)
numerische Verfahren anwenden, auf die wir hier nicht eingehen können. Diese Ver-
fahren sind aber in der Praxis (extrem) wichtig – Sie sollten sich im Laufe Ihres
Studiums einen Einblick in diese Methoden gönnen.
Für alle linearen DGL n-ter Ordnung mit konstanten Koeffizienten und für etliche
Typen nichtlinearer DGL 1. Ordnung lassen sich glücklicherweise allgemeine ana-
lytische Lösungsverfahren angeben. Wir besprechen im Folgenden nur einige dieser
Methoden, die wir zur Lösung einfacher Probleme der Mechanik brauchen.

4.1 Beispiele für Differentialgleichungen 1. Ord-


nung
4.1.1 DGL des Typs y 0 (x) = f (x)
Der einfachste DGL-Typ hat die Form

y 0 (x) = f (x). (4.1.1)

Die allgemeine Lösung ist natürlich die Menge der Stammfunktionen von f (x).
Zx
y(x) = f (x0 )dx0 = F (x) −F (a) = F (x) + C. (4.1.2)
| {z }
a C

Die untere Integrationsgrenze a bzw. äquivalent dazu die Konstante C ist beliebig.
Eine eindeutige Lösung erhält man durch Vorgabe eines Anfangswertes y(x0 ) = y0 .
Einsetzen in (4.1.2) ergibt
C = y0 − F (x0 ). (4.1.3)
Wir wissen bereits, dass sich für komplizierte Funktionen f (x) die analytische Form
der Stammfunktion möglicherweise nicht angeben lässt. Man kann aber in jedem
Fall das Integral in (4.1.2) numerisch auswerten.

4.1.2 DGL des Typs y 0 (x) = H(x, y)


Wir betrachten Differentialgleichungen 1. Ordnung des Typs

y 0 (x) = H(x, y) . (4.1.4)


74 Einführung in die Theoretische Physik

Für beliebige H(x, y) gibt es keine allgemeine analytische Lösungsmethode. Wenn


jedoch H von der Form
H(x, y) = f (x) g(y) (4.1.5)
ist, und somit
dy
= f (x) g(y) , (4.1.6)
dx
dann kann man diese DGL durch sog. Separation der Variablen lösen. Multipli-
ziere (4.1.6) mit (1/g(y)) dx. Man erhält
1
dy = f (x)dx. (4.1.7)
g(y)
Wir integrieren beide Seiten:
Zy Zx
1
0
dy 0 = f (x0 )dx0 , (4.1.8)
g(y )
y0 x0

wobei wir hier schon die Anfangsbedingung y(x0 ) = y0 verwendet haben.


Wir überprüfen, ob wir diese Anfangsbedingung korrekt in (4.1.8) eingebaut haben.
Dazu setzen wir im rechten Integral die obere Grenze gleich der unteren, x = x0 .
Dann verschwindet die rechte Seite. Im linken Integral muss wegen der gewählten
Anfangsbedingung y = y0 gesetzt werden. D.h. auch die linke Seite ist gleich null.
Nun zur weiteren Auswertung von (4.1.8). Die Stammfunktion von 1/g(y) sei G(y).
Wir nehmen an, dass wir sie in analytischer Form kennen. Die Stammfunktion von
f (x) sei F (x). Damit lässt sich (4.1.8) schreiben als

G(y) − G(y0 ) = F (x) − F (x0 )


⇒ G(y) = F (x) − F (x0 ) + G(y0 ). (4.1.9)

Mit Hilfe der Umkehrfunktion G̃ von G können wir diese algebraische Gleichung
nach y auflösen und erhalten die gesuchte Lösung von (4.1.4):

y = G̃ (F (x) − F (x0 ) + G(y0 )) . (4.1.10)

Hinweise:
(i) Diese Lösung ist eindeutig, weil wir in (4.1.8) die Anfangsbedingung schon
einsetzten. Hätten wir das nicht getan, d.h., hätten wir in (4.1.8) unbestimmte
Integrale verwendet, dann würde Gl. (4.1.9) ersetzt werden durch

G(y) + c1 = F (x) + c2 ⇒ G(y) = F (x) + c2 − c1 .


| {z }
C

Die freie Konstante C wird durch die gewählte Anfangsbedingung y(x0 ) = y0


festgelegt, d.h. C = G(y0 ) − F (x0 ).
4.1 Beispiele für Differentialgleichungen 1. Ordnung 75

(ii) Man kann die Umkehrfunktion G̃ von G nicht immer berechnen. Die gesuchte
Lösung y ist dann implizit durch die algebraische Gleichung (4.1.9) gegeben.

(iii) Beachte, dass DGL 1. Ordnung des Typs (4.1.6) sowohl linear als auch nicht-
linear sein können.

Beispiel: Eindimensionale Bewegung eines großen Objekts (Tennisball, Fußball)


der Masse m in Luft.

FL

Der Luftwiderstand führt zu einer Reibungskraft FL . Das empirische Gesetz für FL


ist im Fall großer Objekte mit Geschwindigkeit v das sog. Newtonsche Reibungsge-
setz:
FL = −av 2 a > 0.
Wir vernachlässigen in diesem Beispiel die Schwerkraft. Die Newtonsche Bewegungs-
gleichung lautet dann
mẍ = FL .
Da FL nur von v abhängt, können wir diese DGL 2. Ordnung in x unter Verwendung
von ẍ = v̇ umschreiben:
dv
m = −av 2 . (4.1.11)
dt
Dies ist eine nichtlineare, homogene DGL 1. Ordnung für v, die man durch Trennung
der Variablen löst. Aus (4.1.11) folgt

dv
m = −a dt
vZ2 Z
1
⇒ m dv = −a dt
v2
m
⇒ − + c1 = −at + c2
v
m
⇒ = at + c1 − c2 .
v | {z }
c

Die allgemeine Lösung ist also


m
v(t) = . (4.1.12)
at + c
Die Konstante c wird festgelegt durch Angabe der Geschwindigkeit zu einem be-
stimmten Zeitpunkt, z.B. zur Zeit t0 = 0. Die Anfangsbedingung sei v(0) = v0 .
76 Einführung in die Theoretische Physik

Einsetzen in In (4.1.12) ergibt c = m/v0 . Somit erhalten wir für die Geschwindigkeit
des Objekts
v0 m
v(t) = τ≡ , (4.1.13)
1 + t/τ av0
wobei τ ein das Problem charakterisierender Parameter ist; [τ ] = Zeit. Wie erwartet
wird das Objekt immer langsamer; für t  τ geht v(t) → 0.

4.1.3 DGL des Typs y 0 + a(x)y = 0


Bei DGL der Form
y 0 + a(x)y = 0 , mit y(x0 ) = y0 (4.1.14)
handelt es sich um lineare, homogene DGL 1. Ordnung mit nichtkonstanten Koeffi-
zienten (weil a = a(x)). Das ist ein Spezialfall der Gleichung (4.1.6). Die Lösungs-
methode ist wieder Separation der Variablen.
dy 1
= −a(x)y · dx

dx y
dy
⇒ = −a(x) dx
y
Z Zx
dy
⇒ = − a(x0 ) dx0
y
x0
Zx
⇒ ln |y| + c = − a(x0 ) dx0
x0
 
Zx
e−c exp −
⇒ |y| = |{z} a(x0 ) dx0  .
c̃>0 x0

Unterscheide
 
Zx
y > 0 ⇒ |y| = y ⇒ y = c̃ exp − a(x0 ) dx0  ,
x0
 
Zx
y < 0 ⇒ |y| = −y ⇒ y = −c̃ exp − a(x0 ) dx0  .
x0

Fazit: Die allgemeine Lösung von (4.1.14) ist vor Implementierung der Anfangs-
bedingung:  x 
Z
y(x) = C exp − a(x0 ) dx0  , (4.1.15)
x0
4.1 Beispiele für Differentialgleichungen 1. Ordnung 77

mit beliebiger, reeller Konstanten C. Die Berücksichtigung der Anfangsbedingung


y(x0 ) = y0 ergibt

y(x0 ) = Ce−0 = C
⇒ C = y0 .

4.1.4 DGL des Typs y 0 + a(x)y = f (x)


Bei
y 0 + a(x)y = f (x) , mit y(x0 ) = y0 (4.1.16)
handelt es sich um eine lineare, inhomogene DGL 1. Ordnung.
Lösungsmethode: Man findet die Lösung von (4.1.16) durch die sogenannte Varia-
tion der Konstanten. Damit ist folgender Ansatz gemeint: Die allgemeine Lösung
der mit (4.1.16) assoziierten homogenen DGL y 0 + a(x) y = 0 ist (4.1.15), wobei
C = const. Wir ersetzen nun C durch eine unbekannte Funktion C(x), d.h. wir
machen den Ansatz  x 
Z
y(x) = C(x) exp − a(x0 ) dx0  . (4.1.17)
x0

Die Differentiation nach x ergibt


 x   x 
Z Z
y 0 (x) = C 0 (x) exp − a(x0 ) dx0  −C(x)a(x) exp − a(x0 ) dx0  . (4.1.18)
x0 x0
| {z }
−a(x)y

Setzt man Gleichungen (4.1.17) und (4.1.18) in (4.1.16) ein, erhält man
 x   x 
Z Z
C 0 (x) exp − a(x0 ) dx0  − a(x)y + a(x)y = f (x) · exp + a(x0 ) dx0 


x0 x0
(4.1.19)
 
Zx
dC
⇒ = f (x) exp + a(x0 ) dx0  . (4.1.20)
dx
x0

Das ist eine Differentialgleichung für die gesuchte Funktion C(x), die durch Integrie-
ren – d.h. durch Bestimmung der Stammfunktion der rechten Seite – gelöst werden
kann. Für C(x) erhalten wir
Zx R x00
00 + a(x0 ) dx0
C(x) = f (x )e x0
dx00 + C0 , (4.1.21)
x0
78 Einführung in die Theoretische Physik

wobei C0 eine Integrationskonstante ist. Wir setzen C(x) in (4.1.17) ein und benut-
zen, dass
Zx0 Zx Zx
− a(x ) dx − a(x ) dx = − a(x0 ) dx0 .
0 0 0 0

x00 x0 x00

Somit erhalten wir als allgemeine Lösung von (4.1.16):


Zx Rx
a(x0 )dx0
Rx
a(x0 )dx0 −
y(x) = f (x00 )e− x00 dx00 + C0 e x0 (4.1.22)
| {z }
x0 Das ist die allgemeine Lösung
| {z } der homogenen DGL y 0 +
Das ist eine spezielle Lösung a(x)y = 0
(wenn C0 = 0) der inhomoge-
nen DGL (4.1.16)

Dieser Sachverhalt gilt allgemein für lineare DGL, siehe unten und Abschnitt 4.4.2.
Aus der allgemeinen Lösung (4.1.22) der inhomogenen (!) DGL (4.1.16) müssen wir
noch diejenige Lösung bestimmen, welche die Anfangsbedingung y(x0 ) = y0 erfüllt.
Einsetzen in (4.1.22) ergibt
y0 = 0 + C0 · 1 ⇒ C0 = y0 . (4.1.23)

Satz: Das in (4.1.22) dargestellte Ergebnis lässt sich in folgendem Satz zusammen-
fassen. Die allgemeine Lösung y einer inhomogenen, linearen DGL n-ter Ordnung
ist die Summe aus der allgemeinen Lösung yhom der zugehörigen homogenen DGL
und einer speziellen Lösung ys der inhomogenen DGL
y(x) = yhom (x) + ys (x). (4.1.24)
Der Beweis wird in der Vorlesung HöMa II geliefert. Wir überzeugen uns hier nur
davon, wie sich diese Aussage im Falle der DGL (4.1.16) darstellt. Dazu setzen wir
(4.1.24) in (4.1.16) ein:
0
yhom + ys0 + ayhom + ays = f
0
⇒ yhom + ayhom + ys0 + ays = f .
| {z } | {z }
= 0 per Definition von löst diese DGL per Defi-
yhom nition von ys

4.1.5 DGL des Typs y 0 + ay = f (x), a = const.


Bei der DGL
y 0 + ay = f (x) a = const. (4.1.25)
mit Anfangsbedingung y(x0 ) = y0 handelt es sich um eine lineare, inhomogene DGL
1. Ordnung mit konstanten Koeffizienten. Das ist ein Spezialfall der DGL (4.1.16).
In diesem Fall können wir das Integral in den in der allgemeinen Lösung (4.1.22)
auftretenden Exponentialfaktoren sofort ausführen:
Rx
a dx0
Rx
adx0 00 00 −
e− x00 = e−ax+ax = eax e−ax und e x0
= e−ax+ax0 = eax0 e−ax . (4.1.26)
4.1 Beispiele für Differentialgleichungen 1. Ordnung 79

Einsetzen von (4.1.26) in (4.1.22) ergibt die allgemeine Lösung der DGL (4.1.25):

Zx
−ax 00
y(x) = e f (x00 )eax dx00 + C0 eax0 e−ax . (4.1.27)
x0

Die Lösung, welche die Anfangsbedingung y(x0 ) = y0 erfüllt, ergibt sich wieder mit
C0 = y0 .

Beispiel aus der Physik: Senkrechte Bewegung


eines kleinen Teilchens mit konstanter4 Masse m
unter dem Einfluss der Schwerkraft Fg der Erde
und dem Luftwiderstand, d.h. der Reibungskraft
FR . Die Newtonsche Bewegungsgleichung lautet m

mẍ = Fg + FR , (4.1.28)
bv
wobei Fg = mg mit g = 9, 81 m/s2 (Erdbeschleuni- mg
gung). Für kleine Teilchen ist die mit der Luftrei- x
bung assoziierte Kraft gegeben durch das Stokes-
sche Reibungsgesetz FR = −bv, b > 0.
Da die rechte Seite von (4.1.28) nur von der Geschwindigkeit v(t), aber nicht von
x(t) abhängt, verwenden wir den gleichen ,,Trick” wie in Gleichung (4.1.11): Wir
benutzen auf der linken Seite von (4.1.28), dass ẍ = v̇, d.h.

mv̇ = mg − bv. (4.1.29)

Somit haben wir aus der DGL 2. Ordnung in der Ortsvariablen eine DGL 1. Ordnung
in der Geschwindigkeit gemacht. Aus (4.1.29) folgt:

1
v̇ + v = g, (4.1.30)
τ

wobei τ ≡ m/b, [τ ] = Zeit. Die DGL (4.1.30) ist von der Form (4.1.25), mit a = 1/τ
und f (x) = g = const.
Nun zur Lösung dieser DGL:

1. Die allgemeine Lösung von (4.1.30) ist gegeben durch (4.1.22), wobei (4.1.26)
benutzt werden kann. Die Berücksichtigung der Anfangsbedingung v(t0 = 0) =
v0 ergibt, dass C0 = v0 . Somit ist die gesuchte Lösung von (4.1.29) gegeben
4
Die Abbildung sollte nicht missverstanden werden. Ein Wassertröpfchen, das in feuchter Luft
fällt, sammelt durch Kondensation von Wasserdampf Masse auf; d.h. seine Masse nimmt im Laufe
der Zeit zu. Bewegungsgleichungen für den Fall zeitabhängiger Massen behandeln wir im Mechanik-
Teil der Vorlesung.
80 Einführung in die Theoretische Physik

durch
 
Zt Zt
1
v(t) = v0 e−t/τ + g exp − dt0  dt00
τ
0 00
| {z t }
00 00
exp(− τt + tτ )=e−t/τ e+t /τ

Zt
00
⇒ v(t) = v0 e−t/τ + ge −t/τ
et /τ dt00
|0 {z }
00 t
τ |
et /τ =τ et/τ −τ
0

⇒ v(t) = v0 e−t/τ + gτ 1 − e−t/τ .



(4.1.31)

2. Man muss die Formel (4.1.22) für die allgemeine Lösung nicht auswendig ken-
nen. Merken sollte man sich aber die Schritte und Methoden zur Lösung ei-
ner inhomogenen linearen DGL 1. Ordnung. i) Bestimmung der allgemeinen
Lösung yhom der assoziierten homogenen DGL. ii) Bestimmung einer Lösung
ys (x) der inhomogenen DGL durch Variation der Konstanten. iii) Implemen-
tierung der Anfangsbedingung y(x0 ) = y0 in die allgemeine Lösung y(x) =
yhom (x) + ys (x) der inhomogenen DGL.
Zu i): Die zu (4.1.30) gehörende homogene DGL ist
1
v̇ + v = 0 .
τ
Diese DGL löst man durch Trennung der Variablen.
1 1
dv = − dt ⇒ v(t) = Ce−t/τ .
v τ
Zu ii): Ansatz zur Suche einer Lösung der inhomogenen DGL (4.1.29). Wir er-
setzen die Integrationskonstante C durch C(t) und machen den Lösungsansatz
v(t) = C(t) exp(−t/τ ). Diesen setzen wir in (4.1.29) ein. Wir erhalten
1 1
Ċe−t/τ − Ce−t/τ + Ce−t/τ = g ,
τ τ
und somit

Ċe−t/τ = g ⇒ Ċ = ge+t/τ ⇒ C(t) = gτ e+t/τ + C0

Wir sehen, dass wir wie im allgemeineren Fall (4.1.21) nicht nur eine Lösung,
sondern eine Lösungsschar erhalten. Somit ist die allgemeine Lösung von (4.1.29):

v(t) = C(t)e−t/τ = gτ + C0 e−t/τ .

Man sieht, dass diese Lösung die Struktur (4.1.24) hat; ys = gτ ist eine spe-
zielle Lösung der inhomogenen DGL und C0 e−t/τ die allgemeine Lösung der
4.2 Beispiele für lineare DGL 2. und höherer Ordnung 81

homogenen DGL.
Zu iii): Festlegung der Integrationskonstanten durch die Anfangsbedingung
v(t0 = 0) = v0 :

v0 = v(0) = gτ + C0 ⇒ C0 = v0 − gτ .

Die so fixierte, eindeutige Lösung von (4.1.29) stimmt natürlich mit der obigen
Lösung (4.1.31) überein.
Bahn und Diskussion der Lösung:
• Die Bahn x(t) des Teilchens erhält man sofort durch Integration der Geschwindig-
keit (4.1.31). Die dabei auftretende Integrationskonstante wird durch Vorgabe eines
Anfangswertes x(t0 = 0) = x0 festgelegt.
• Für Zeiten t  τ geht e−t/τ → 0 und somit
t→∞ mg
v(t) −−−→ vfinal := gτ = konstante Geschwindigkeit.
b
D.h. die Gravitationskraft, die beschleunigt, und die bremsende Luftreibungskraft
linear in v kompensieren sich für Zeiten t  τ nahezu.

4.2 Beispiele für lineare DGL 2. und höherer Ord-


nung
Wir betrachten hier in einigem Detail nur DGL n-ter Ordnung der Form

y (n) + an−1 y (n−1) + ... + a0 y = 0 , wobei a0 , ..., an−1 Konstanten , (4.2.1)

bzw. den Spezialfall einer DGL 2. Ordnung:

y 00 + ay 0 + by = 0, a, b reelle Konstanten. (4.2.2)

Das sind lineare, homogene DGL n-ter bzw. 2. Ordnung mit konstanten Koeffizi-
enten. Beachte, dass wir Differentialgleichungen dieses Typs immer auf die Form
(4.2.1) bzw. (4.2.2) bringen können (durch Division der jeweiligen Gleichung durch
den Koeffizienten von y 00 , falls dieser verschieden von 1 ist).

4.2.1 Drei allgemeine Aussagen


I. Superpositionsprinzip:
Sind y1 (x) und y2 (x) verschiedene Lösungen von (4.2.1), so ist auch

y = A1 y 1 + A2 y 2 , A1 , A2 Konstanten (4.2.3)

eine Lösung von (4.2.1).


82 Einführung in die Theoretische Physik

Beweis für die DGL 2. Ordnung: Wir setzen (4.2.3) in (4.2.2) ein:

A1 y100 + A2 y200 + a(A1 y10 + A2 y20 ) + b(A1 y1 + A2 y2 ) = 0


⇒ A1 (y100 + ay10 + by1 ) +A2 (y200 + ay20 + by2 ) = 0 .
| {z } | {z }
0 nach Voraussetzung 0 nach Voraussetzung

Hinweise:

1. Mit ,,verschiedene Lösungen” sind sog. linear unabhängige Lösungen gemeint,


das sind Lösungen, für die y2 (x) 6= Ay1 (x), A = const. Für y2 = Ay1 wäre die
Aussage trivial.

2. Das Superpositionsprinzip gilt nicht nur für DGL der Form (4.2.2), sondern
für alle linearen, homogenen DGL n-ter Ordnung, wobei die Koeffizienten auch
Funktionen von x sein können.

an (x)y (n) + an−1 (x)y (n−1) + ... + a0 (x)y = 0. (4.2.4)

D.h. die Überlagerung (Superposition) von Lösungen einer linearen, homo-


genen DGL (4.2.4) ist wieder eine Lösung dieser DGL. Dieses simple, aber
grundlegende Ergebnis ist von enormer Bedeutung in der Physik.

3. Für nichtlineare DGL gilt dieses Prinzip nicht.

II. Lösungsmethode:
Zum Lösen einer linearen, homogenen DGL n-ter Ordnung mit konstanten Koeffi-
zienten, also der DGL (4.2.1), gibt es eine Standardmethode, nämlich den Ansatz

y(x) = C eλx , wobei C, λ beliebige Konstanten. (4.2.5)

Differenziere y n-mal:
y (n) = Cλn eλx .
Setze dies in (4.2.1) ein und teile durch C. Man erhält

λn + an−1 λn−1 + ... + a1 λ + a0 = 0. (4.2.6)

Die linke Seite dieser algebraischen Gleichung ist ein Polynom n-ten Grades in λ.
Man nennt es das charakteristische Polynom der DGL (4.2.1). Nach dem Fundamen-
talsatz der Algebra aus Kapitel 3 hat dieses Polynom n Nullstellen λi , die – selbst
wenn die aj alle reell sind – auch komplex sein können.

• Wenn die Lösungen λi von (4.2.6) alle verschieden voneinander sind,

λi 6= λj ∀i, j = 1, ..., n,
4.2 Beispiele für lineare DGL 2. und höherer Ordnung 83

dann sind die n Lösungen von (4.2.1)


yi (x) = Ci eλi x (4.2.7)
linear unabhängig – d.h. keine der Lösungen yi ist ein konstantes Vielfaches
einer anderen, yi (x) 6= Ayj (x). Wegen des Superpositionsprinzips erhalten wir
somit in diesem Fall, dass die allgemeine Lösung der DGL (4.2.1) gegeben ist
durch die Linearkombination
n
X
y(x) = Ci eλi x . (4.2.8)
i=1

Die allgemeine Lösung hängt von n beliebigen Konstanten C ab. Eine eindeu-
tige Lösung erhält man durch Festlegung der Konstanten. Bei physikalischen
Anwendungen bestimmt die jeweilige physikalische Situation nicht nur nur die
Form der DGL, sondern auch wie diese Konstanten festgelegt werden. Eine
typische Problemstellung ist das sogenannte Anfangswertproblem: Man sucht
eine Lösung der DGL (4.2.1), die den n Anfangsbedingungen
y(x0 ) = y0 , y 0 (x0 ) = y1 , ..., y (n−1) (x0 ) = yn−1 (4.2.9)
genügt. Einsetzen der n Anfangswerte (4.2.9) in die allgemeine Lösung (4.2.8)
bzw. in deren Ableitungen ergibt ein lineares Gleichungssystem, d.h. n Glei-
chungen für die gesuchten Ci , die dadurch festgelegt sind.
• Das charakteristische Polynom (4.2.6) kann mehrfache Nullstellen haben. In
diesem Fall sind die entsprechenden Lösungen (4.2.7) nicht mehr linear un-
abhängig. Tritt zum Beispiel eine zweifache Nullstelle auf, λ1 = λ2 , dann ist
eλ1 x = eλ2 x .
Wie man in diesem Fall n linear unabhängige Lösungen konstruiert, besprechen
wir im nächsten Abschnitt am Beispiel der DGL 2. Ordnung, Gl. (4.2.2).

III. Reelle Lösungen im Fall reeller Koeffizienten aj :


Einige oder alle Nullstellen λj des charakteristischen Polynoms (4.2.8) können kom-
plex sein. Dann sind die zugehörigen Lösungen
yj (x) = Cj eλj x = Cj e(Re λj )x ei(Im λj )x (4.2.10)
komplex, d.h. komplexwertige Funktionen der reellen Variablen x. (Zur Erinnerung:
i ist die imaginäre Einheit.) Bei Anwendungen in der Physik sind die Koeffizienten
aj in der Regel reell. Wir sind letztendes nur an reellen Lösungen der DGL interes-
siert, weil physikalische Größen durch reelle Zahlen bzw. Funktionen charakterisiert
werden. Da die DGL (4.2.1) linear ist, ist – falls die aj alle reell sind – auch der
Realteil von yj (x),
yj,phys (x) = Re yj (x), (4.2.11)
84 Einführung in die Theoretische Physik

eine Lösung dieser DGL. Wir zeigen dieses grundlegende Ergebnis anhand der DGL
2. Ordnung, Gl. (4.2.2), wobei wie gesagt a, b reell sein müssen. Es sei

y(x) = Re y + iIm y

eine komplexwertige Lösung dieser DGL. Einsetzen ergibt

0 = y 00 + ay 0 + by = (Re y 00 + aRe y 0 + bRe y) +i (Im y 00 + aIm y 0 + bIm y) .


| {z } | {z }
reell reell

Die rechte Seite dieser Gleichung ist eine komplexe Zahl bzw. eine komplexwertige
Funktion. Sie kann nur verschwinden, wenn sowohl ihr Realteil als auch ihr Ima-
ginärteil verschwinden5 , d.h. wenn die beiden Klammern separat null sind. Dieses
Argument kann sofort auf die DGL n-ter Ordnung, Gl. (4.2.1) übertragen werden.
Außerdem sollte klar sein, dass die obige Aussage auch für homogene lineare DGL
mit reellen Koeffizientenfunktionen aj (x) (j = 0, . . . , n − 1) gilt.

4.2.2 Lösung von y 00 + ay 0 + by = 0


Nun zur allgemeinen Lösung des Spezialfalls (4.2.2), d.h. der homogenen DGL 2.
Ordnung mit konstanten Koeffizienten:

y 00 + ay 0 + by = 0 a, b relle Konstante, (4.2.12)

wobei wie bereits oben betont wurde, wir letztendes nur an der allgemeinen reellen
Lösung dieser DGL interessiert sind.
Setzt man den Ansatz (4.2.5)
y(x) = C eλx
in (4.2.12) ein, erhält man das charakteristische Polynom bzw. die charakteristische
Gleichung 2. Grades,
λ2 + aλ + b = 0 , (4.2.13)
mit den zwei Lösungen
a  a2 1/2
λ1,2 = − ± −b . (4.2.14)
2 4
| {z }
≡d Diskriminante

Drei Fälle sind zu unterscheiden:


1. Falls d > 0, dann sind λ1,2 zwei reelle Nullstellen des charakteristischen Poly-
noms. Die beiden linear unabhängigen Lösungen von (4.2.12)

y1 = C1 eλ1 x , y2 = C2 eλ2 x
5
Beachte: wenn a und/oder b komplex sind, dann sind die Terme oberhalb der beiden Klammern
i.A. nicht reell, d.h. entsprechen nicht dem Real- und Imaginärteil des Ausdrucks auf der rechten
Seite der Gleichung; siehe (3.1.6) in Kapitel 3.
4.2 Beispiele für lineare DGL 2. und höherer Ordnung 85

wachsen oder fallen in diesem Fall exponentiell mit x. Die allgemeine Lösung
von (4.2.12) ist gegeben durch
y(x) = C1 eλ1 x + C2 eλ2 x , (4.2.15)
wobei C1 , C2 zwei beliebige reelle Konstante sind (weil wir nur an reellen
Lösungen interessiert sind). Diese beiden Konstanten werden durch Vorgabe
von zwei Anfangsbedingungen festgelegt:
y(x0 ) = y0 , y 0 (x0 ) = y1 .
Zur Implementierung dieser Anfangsbedingungen müssen wir (4.2.15) noch
differenzieren: y 0 = C1 λ1 eλ1 x + C2 λ2 eλ2 x . Einsetzen der Anfangsbedingungen
in y und y 0 ergibt
C1 eλ1 x0 + C2 eλ2 x0 = y0 , C1 λ1 eλ1 x0 + C2 λ2 eλ2 x0 = y1 .
Dieses lineare, inhomogene algebraische Gleichungssystem (zwei Gleichungen,
zwei Unbekannte) lässt sich problemlos nach C1 und C2 auflösen.
2. Falls d < 0, dann
s   r
a a2 a a2
λ1,2 =− ± (−1) b − =− ±i b− .
2 4 2 | {z 4 }
≡ω>0

Die beiden Nullstellen6 sind somit zueinander konjugiert komplex:


a
λ1,2 = − ± iω , λ1 = λ∗2 .
2
Diese beiden Nullstellen liefern zwei linear unabhängige Lösungen von (4.2.12)
der Form (4.2.7), und die allgemeine Lösung ist – siehe (4.2.8):
a
y = C1 eλ1 x + C2 eλ2 x = e− 2 x C1 eiωx + C2 e−iωx ,

(4.2.16)
| {z }
≡u

wobei C1 und C2 beliebige, i.A. komplexe Konstanten sind. Mit der Euler-
Formel aus Kapitel 3 ist
u(x) = C1 (cos ωx + i sin ωx) + C2 (cos ωx − i sin ωx)
= (C1 + C2 ) cos ωx + (iC1 − iC2 ) sin ωx.
Mit der Umbenennung
A1 := C1 + C2
beliebig komplex
A2 := iC1 − iC2
6

Wir benutzten hier die in Kapitel
√ 3.3 besprochene Definition der der Wurzel z einer komple-

xen Zahl. Demzufolge ist −1 = eiπ = eiπ/2 = +i.
86 Einführung in die Theoretische Physik

erhalten wir
u(x) = A1 cos ωx + A2 sin ωx,
und die allgemeine Lösung von (4.2.12) hat die Form
a
y(x) = e− 2 x u(x). (4.2.17)
Im Allgemeinen sind A1 , A2 komplexe Konstanten, d.h. y(x) ist eine komple-
xe Funktion der reellen Variablen x. Da die DGL (4.2.12) linear ist und a, b
reell sein sollen, ist wie bereits oben gezeigt der Realteil von y(x) ebenfalls
eine Lösung von (4.2.12) – und das ist die allgemeine reelle, d.h. physikalisch
relevante Lösung von (4.2.12) im Falle von d < 0:
a
yphys (x) = Re y(x) = e− 2 x (a1 cos ωx + a2 sin ωx), (4.2.18)
wobei a1 = Re A1 , a2 = Re A2 zwei beliebige reelle Konstanten sind. Die
Anfangsbedingung an y und y 0 wird analog zur Vorgehensweise in 1) imple-
mentiert.
3. Falls d = 0, dann hat das charakteristische Polynom (4.2.13) die doppelte
Nullstelle
a
λ1 = λ2 = − .
2
Das liefert nur eine Lösung von (4.2.12):
a
y1 (x) = C e− 2 x . (4.2.19)
Wie erhalten wir in diesem Fall eine zweite, linear unabhängige Lösung? Man
benutzt die Methode Variation der Konstanten. Wir machen den Ansatz
a
y(x) = C(x) e− 2 x . (4.2.20)
Dann ist
a a a
y 0 = C 0 e− 2 x − C e− 2 x
2
a a a a a a2 a
y 00 = C 00 e− 2 x − C 0 e− 2 x − C 0 e− 2 x + C e− 2 x .
2 2 4
Wir setzen y und diese Ableitungen in die DGL (4.2.12) ein und erinnern uns
daran, dass wir den Fall d = 0, d.h. b = a2 /4 diskutieren. Das ergibt
a a a2 − a x a a2 a a2 a
C 00 e− 2 x − aC 0 e− 2 x + Ce 2 + aC 0 e− 2 x − Ce− 2 x + Ce− 2 x = 0.
4 2 4
Die Terme proportional zu C 0 und zu C kürzen sich weg und wir verbleiben
mit der folgenden, einfach zu lösenden DGL 2. Ordnung:
C 00 (x) = 0 .
⇒ C 0 (x) = A1 ,
⇒ C(x) = A1 x + A2 . (4.2.21)
4.3 Beispiele aus der Physik 87

FH

0
Masse m FH

Ruhelage Auslenkung

Abbildung 4.1: Federpendel in einer Raumdimension im schwerelosen Raum.

Setzen wir (4.2.21) in (4.2.20) ein, erhalten wir als Lösung von (4.2.12):
a
y(x) = (A1 x + A2 ) e− 2 x .
Der zweite Term und die Lösung (4.2.19) sind linear abhängig, während der
erste Term und (4.2.19) linear unabhängig sind. Somit ist die allgemeine reelle
Lösung von (4.2.12) im Falle d = 0:
a a
y(x) = (A1 x e− 2 x + A2 e− 2 x ) A1 , A2 reell. (4.2.22)

Die Anfangsbedingung an y und y 0 wird analog zur Vorgehensweise in 1) implemen-


tiert.

4.3 Beispiele aus der Physik


Wir betrachten nun zwei elementare, aber wichtige Beispiele aus der Mechanik. In
diesen Beispielen wird die Bewegung eines Objekts durch eine lineare, homogene
DGL 2. Ordnung mit konstanten Koeffizienten beschrieben.

4.3.1 Eindimensionales Federpendel im schwerelosen Raum


Wir betrachten die eindimensionale Schwingung eines ,,Massenpunktes” m, der an
einer Feder hängt – siehe Fig. 4.1. Die Schwingungsamplitude x(t) ist durch die
Newtonsche Bewegungsgleichung bestimmt,
mẍ = F , (4.3.1)
wobei F die auf den Massenpunkt wirkende Gesamtkraft bezeichnet. Die Feder be-
finde sich irgendwo im schwerlosen Raum – somit wirkt auf die Masse m keine
88 Einführung in die Theoretische Physik

Gravitationskraft, sondern nur die rücktreibende Kraft der Feder. Wenn die Feder
nicht überdehnt wird, gilt das Hookessche Gesetz:
FH = −k(x − x0 ), x0 = 0 , (4.3.2)
wobei k > 0 und sich die Ruhelage des Pendels o.B.d.A. bei x0 = 0 befinden soll.
Gl. (4.3.2) in (4.3.1) eingesetzt ergibt
mẍ + kx = 0 ,
⇒ ẍ + ω 2 x = 0 , (4.3.3)
wobei ω 2 ≡ k/m > 0. Man findet die Lösung dieser linearen DGL 2. Ordnung mit
Hilfe des Standard-Ansatzes (4.2.5):
x(t) = C eλt
⇒ λ2 + ω 2 = 0
⇒ λ1,2 = ±iω.
Die allgemeine Lösung von (4.3.3) ist somit
x(t) = C1 eiωt + C2 e−iωt . (4.3.4)
Die physikalisch relevante Lösung ist gegeben durch den Realteil von x(t) – siehe
Gl. (4.2.18).
xphys (t) = Re x(t) = a1 cos ωt + a2 sin ωt. (4.3.5)
Die reellen Konstanten a1 , a2 werden festgelegt durch Berücksichtigung der Anfangs-
bedingungen. Wir geben uns den Ort und die Geschwindigkeit des Massenpunktes
zu einer bestimmten Zeit t0 vor:
x(t0 ) = x0 , ẋ(t0 ) = v0 .
Einsetzen in (4.3.5) bzw. in die 1. Zeitableitung liefert zwei Gleichungen für a1 und
a2 .
Die DGL (4.3.3) ist das einfachste Beispiel einer Schwingungsdifferentialgleichung
– sie beschreibt eine eine freie, ungedämpfte Schwingung mit der Kreisfrequenz ω
in einer Raumdimension. Die Amplitude der Schwingung als Funktion der Zeit ist
gegeben durch die Lösung (4.3.5), wobei a1,2 wie gesagt durch die jeweilige Anfangs-
bedingung festgelegt sind. Man bezeichnet ein System, das der Bewegungsgleichung
(4.3.3) genügt, als eindimensionalen ungedämpften harmonischen Oszillator. Dieses
simple mechanische Beispiel dient als Modell für viele ungedämpfte eindimensionale
Schwingungen in der Physik.

Beachte: Die Differentialgleichung


ẍ − rx = 0 , r>0
beschreibt einen völlig anderen Vorgang, nämlich exponentiell mit der Zeit anstei-
gende bzw. fallende Amplituden.
4.4 Allgemeine Hinweise 89

4.3.2 Eindimensionales Federpendel im schwerelosen Raum


mit Reibung
Das Pendel befinde sich in einem mit Flüssigkeit oder Gas gefüllten Behälter. Die
von diesem Medium auf den Massenpunkt ausgeübte Reibungskraft sei proportional
zu v (siehe oben).
FR = −κẋ , κ > 0. (4.3.6)
Somit ist die Newtonsche Bewegungsgleichung

mẍ = FH + FR
= −kx − κẋ ,

d.h.
κ k
ẍ + ẋ + x = 0. (4.3.7)
m m
Dies ist die DGL einer eindimensionalen Schwingung mit einem Dämpfungsterm.
Die allgemeine Lösung fanden wir bereits im Abschnitt 4.2.2. Wie dort müssen wir
drei Fälle unterscheiden:
κ2 k κ2 k κ2 k
1) 2
> , 2) 2
< , 3) 2
= .
4m m 4m m 4m m
Diese Fälle beschreiben drei verschiedene physikalische Vorgänge, nämlich (1) dem
sog. überdämpften Fall, (2) den Fall einer gedämpften Schwingung und (3) den sog.
aperiodischen Grenzfall. Wir werden sie im Detail in den Übungen behandeln und
nochmal im Mechanik-Teil der Vorlesung darauf eingehen. Dort besprechen wir auch
den Fall, dass auf den Oszillator noch eine zusätzliche äußere Kraft einwirkt. Das
führt zu einer inhomogenen DGL 2. Ordnung. In diesem Fall müssen wir zusätzlich
zur allgemeinen Lösung der assoziierten homogenen DGL noch eine spezielle Lösung
der inhomogenen DGL finden.

4.4 Allgemeine Hinweise


Zum Schluss dieses Kapitels fassen hier noch einmal einige allgemeine Aussagen über
gewöhnliche DGL zusammen, ohne dafür Beweise zu geben. (Diese werden in der
Vorlesung HöMa II bzw. in Spezialvorlesungen über DGL geliefert.)

4.4.1 Anfangs- und Randbedingungen


Wir sahen, dass die jeweilige allgemeine Lösung der von uns behandelten DGL-
Typen 1. Ordnung von einer beliebigen Konstanten C, und die der oben bespro-
chenen DGL 2. Ordnung von zwei beliebigen Konstanten C1 , C2 abhängt. Viele
(nicht)lineare DGL n-ter Ordnung der Form

y (n) (x) = F x, y(x), y 0 (x), ..., y (n−1) (x)



(4.4.1)
90 Einführung in die Theoretische Physik

besitzen ebenfalls eine Schar von Lösungen. Wir nehmen an, dass diese Lösungen
existieren. Das ist unter relativ milden Anforderungen an F der Fall. Diese allge-
meine Lösung hängt von n beliebigen Konstanten C1 , ..., Cn ab:
y = y(x, C1 , ..., Cn ). (4.4.2)
Die allgemeine Lösungsschar (4.4.2) ist wenig aussagekräftig. In Anwendungen (in
der Physik, Chemie, Biologie, den Ingenieurwissenschaften, usw.) ist das Ziel, eine
eindeutige Lösung zu bestimmen – nur diese ermöglicht eine Vorhersage. Dazu muss
man Anfangs- oder Randbedingungen vorgeben, die die gesuchte Lösung erfüllen
soll. Diese Bedingungen werden vom jeweiligen Problem, in unserem Kontext von
der Physik diktiert!

Anfangswertproblem:
Unter relativ allgemeinen Voraussetzungen an die Eigenschaften der DGL (4.4.1)
erhält man eine eindeutige Lösung dieser DGL durch Vorgabe der n Anfangswerte:
y(x0 ) = y0 ,
y 0 (x0 ) = y1 ,
.. (4.4.3)
.
y (n−1) (x0 ) = yn .
Einsetzen dieser Anfangswerte in die allgemeine Lösung (4.4.2) bzw. deren Ablei-
tungen ergibt n algebraische Gleichungen für die Konstanten C1 , ..., Cn , die zu lösen
sind. Die Suche nach einer eindeutigen Lösung von (4.4.1), welche den Anfangsbe-
dingungen (4.4.3) genügt, nennt man ein Anfangswertproblem 7 .

Randwertproblem:
Hier sucht man eine eine eindeutige Lösung von (4.4.1) durch Vorgabe von n Be-
dingungen an y und/oder ihren Ableitungen an den Rändern x = a und x = b
des Lösungsintervalls a ≤ x ≤ b. Ein Beispiel dafür ist die Temperaturverteilung
längs eines eindimensionalen Stabes der Länge L, der sich in einem Medium befin-
det, dessen Temperatur TM sei. Die beiden Enden des Stabes sollen auf konstanter
Temperatur T1 bzw. T2 mit T1 6= T2 gehalten werden. Nach einer gewissen Zeit stellt
sich ein stationärer Zustand ein, d.h. die Temperaturverteilung T hängt nur von der
Ortsvariablen x, aber nicht mehr von der Zeit ab. Zu lösen ist dann das folgende
Randwertproblem:
T 00 (x) = a2 (T (x) − TM ) mit T (0) = T1 , T (L) = T2 6= T1 .
7
Nicht jedes Anfangswertproblem hat eine eindeutige Lösung. Ein Gegenbeispiel ist

y 0 (x) = y mit y(0) = 0 , wobei 0 ≤ x < ∞ .
Sowohl y(x) = 0 als auch die Schar yλ (x) = 0 für 0 ≤ x ≤ λ, yλ (x) = (x − λ)2 /4 für λ < x < ∞
lösen dieses Anfangswertproblem.
4.4 Allgemeine Hinweise 91

Auf die physikalische Herleitung dieser DGL gehen wir hier nicht ein. Dieses Beispiel
soll nur zeigen, dass in der Physik auch Randwertprobleme mit gewöhnlichen DGL
eine Rolle spielen.
Das wohl berühmteste Beispiel für ein Randwertproblem ist die DGL einer schwin-
genden Saite, die an ihren Enden x = a und x = b fixiert ist. (Es handelt sich dabei
aber um eine partielle DGL.) Mit diesem Problem schlugen sich Großmeister von
Pythagoras bis hin zu Euler, J. und D. Bernoulli, d’Alembert und Lagrange herum.
Eine Saite ist ein elastischer, nicht-starrer Körper – man behandelt solche Objekte
in der Kontinuumsmechanik.
Randwertaufgaben sind nicht immer lösbar. Es gibt auch einfache Beispiele dafür,
dass eine Randwertaufgabe zwar eine Lösung besitzt, die Lösung aber nicht eindeutig
ist. Da wir uns im Mechanik-Teil dieser Vorlesung nur mit Anfangswertproblemen
für Massenpunkte bzw. in der Vorlesung Theoretische Physik I für starre Körper
befassen, gehen wir darauf nicht ein.

4.4.2 Zusammenfassung: lineare Differentialgleichungen


Hier fassen wir noch einmal einige wichtige, bereits oben erläuterte Aussagen über
DGL des Typs
an (x)y (n) + an−1 (x)y (n−1) + ... + a0 (x)y = f (x) (4.4.4)
zusammen.
• Die allgemeine Lösung einer linearen, inhomogenen DGL n-ter Ordnung ist
die Summe aus der allgemeinen Lösung der assoziierten homogenen DGL und
einer speziellen Lösung der inhomogenen DGL,
y(x) = yhom (x) + ys (x).
Im Falle einer DGL 1. Ordnung haben wir uns davon schon überzeugt – siehe
oben. Inhomogene, lineare DGL 2. Ordnung werden wir im Mechanik-Teil der
Vorlesung lösen. Beachten Sie, dass die Anfangswerte (bzw. die Randwerte)
nicht yhom , sondern der allgemeinen Lösung y der inhomogenen Gleichung
aufgeprägt werden müssen!
• Für lineare, homogene DGL n-ter Ordnung, d.h. f (x) = 0 in (4.4.4), gilt das
Superpositionsprinzip: Jede Überlagerung von linear unabhängigen Lösungen
der DGL ist wieder eine Lösung. Die allgemeine Lösung der DGL erhält man
durch Überlagerung der n linear unabhängigen Lösungen mit freien Koeffizien-
ten Ci . Die Anfangsbedingungen selektieren dann aus dieser Lösungsschar eine
eindeutige Lösung; die Koeffizienten Ci ergeben sich als Lösung eines linearen
inhomogenen algebraischen Gleichungssystems8 .
8
Wie man ein lineares inhomogenes algebraisches Gleichungssystem – n Gleichungen, n Unbe-
kannte – löst, besprechen wir in Kapitel 6. Im Mechanik-Teil der Vorlesung behandeln wir nur DGL
(4.4.4) von höchstens 2. Ordnung – das resultierende Gleichungssystem kann man mit elementaren
Methoden lösen.
92 Einführung in die Theoretische Physik

• Lineare, homogene DGL n-ter Ordnung mit konstanten Koeffizienten,

y (n) + an−1 y (n−1) + ... + a0 y = 0 , a0 , a1 , ...an−1 Konstanten , (4.4.5)

löst man mit dem Ansatz


y = C eλx . (4.4.6)
Nach Einsetzen von (4.4.6) in die DGL (4.4.5) erhält man das charakteristische
Polynom bzw. die charakteristische Gleichung der DGL:

λn + an−1 λn−1 + ... + a0 = 0. (4.4.7)

Diese hat n Lösungen λi , von denen einige oder alle komplex sein können.
* Falls alle λi einfache Nullstellen des charakteristischen Polynoms sind,
erhält man die n linear unabhängigen Lösungen

yi = Ci eλi x , i = 1, . . . , n .

* Bei mehrfachen Nullstellen des charakteristischen Polynoms ist die Be-


stimmung der unabhängigen Lösungen etwas komplizierter, siehe das obi-
ge Beispiel.
* Im Falle einer komplexen Nullstelle λj ist die zugehörige Lösung (4.4.6) ei-
ne komplexwertige Funktion yj . Falls die Koeffizienten al der DGL (4.4.5)
alle reell sind, erhält man eine reelle Lösung dieser DGL wie oben gezeigt
durch Bilden des Realteils von yj .

Abschließender Hinweis: Systeme gewöhnlicher DGL


Im Mechanik-Teil der Vorlesung befassen wir uns vor allem mit der Lösung der New-
tonschen Bewegungsgleichung für Probleme nicht nur in einer, sondern natürlich
auch in zwei bzw. drei Raumdimensionen. In diesen Fällen müssen wir ein im All-
gemeinen gekoppeltes System von zwei bzw. drei gewöhnlichen DGL lösen. In drei
Raumdimensionen hat dieses System die Form
mẍ1 =F1 (xi , ẋi , t) ,
mẍ2 =F2 (xi , ẋi , t) , (4.4.8)
mẍ3 =F3 (xi , ẋi , t) ,

wobei die Komponenten Fi der (bekannten) Kraft, je nach Problem, von den Orts-
und/oder Geschwindigkeitskomponenten eines Objekts (der Masse m) und ggf. auch
explizit von der Zeit t abhängen.
Man muss versuchen, dieses System durch geeignete Manipulationen zu entkoppeln,
d.h. in DGL überzuführen, die jeweils nur noch von einer der drei unbekannten
Funktionen xi (t) und ihren Ableitungen abhängen. Wir werden bei den Problemen,
die wir im Mechanik-Teil der Vorlesung behandeln, durch geeignete Addition, Sub-
traktion, etc. der Gleichungen die resultierenden entkoppelten DGL lösen. Durch
4.4 Allgemeine Hinweise 93

Vorgabe von 3 × 2 = 6 Anfangsbedingungen xi (t0 ) und ẋi (t0 ), i = 1, 2, 3, wird dann


die Lösung des jeweiligen Problems eindeutig festgelegt.
Wenn die Kraftkomponenten Fi linear von den xi und ẋi abhängen, handelt es
sich bei (4.4.8) um ein lineares System von drei gewöhnlichen DGL 2. Ordnung.
Wenn in (4.4.8) keine Koeffizientenfunktionen aj (xi ), sondern nur konstante Koef-
fizienten aj auftreten, kann man unter Zuhilfenahme von Methoden der Linearen
Algebra Formeln für die allgemeine Lösung von (4.4.8) herleiten. Wir werden in die-
ser Vorlesung nicht darauf eingehen (abgesehen von einem kurzen Hinweis am Ende
von Kapitel 6); wir benötigen diese Formeln i.F. auch nicht.
Sie sollten sich aber Folgendes merken: Auch für ein System von linearen inhomo-
genen DGL (wobei die Koeffizienten nicht konstant sein müssen) gilt:

Die allgemeine Lösung des inhomogenen Systems =


allgemeine Lösung des homogenen Systems
+ eine spezielle Lösung des inhomogenen Systems.

Auch hier ist wieder zu beachten, dass die Anfangswerte (bzw. die Randwerte) nicht
der allgemeinen Lösung des homogenen Systems, sondern der allgemeinen Lösung
des inhomogenen Systems aufgeprägt werden müssen!
Kapitel 5

Vektorrechnung

Meßgrößen (Observable) der Physik können hinsichtlich ihrer vollständigen Fest-


legung in verschiedene Klassen eingeteilt werden. Zur Festlegung der Masse eines
Körpers oder der Temperatur eines physikalischen Systems genügt eine Zahl (bezo-
gen auf ein gewähltes Maßsystem); man nennt eine solche Observable einen Skalar.
Zur Festlegung der Geschwindigkeit eines Körpers oder einer Kraft bedarf es ne-
ben der Angabe der Stärke, d.h. des Betrags der jeweiligen Meßgröße noch einer
Richtungsangabe. Eine solche Observable nennt man einen Vektor. (Es gibt auch
Meßgrößen, zu deren Festlegung die Angabe einer Zahl und einer Richtung nicht
ausreicht; das sind sog. Tensoren 2. oder höherer Stufe. Wir gehen aber auf solche
Observablen nur am Rande in Kapitel 6 ein.)

Wir besprechen zunächst die in der nichtrelativistischen Physik üblichen, an-


schaulichen Definitionen eines Skalars und eines Vektors, geben einige Beispiele,
behandeln dann elementare algebraische Operationen mit Vektoren und die Darstel-
lung eines Vektors durch seine Komponenten bezüglich eines Koordinatensystems.
Danach besprechen wir, auf welche Weise man Vektoren miteinander multiplizieren
kann. Vieles davon werden Sie bereits aus der Schule kennen. Zum Schluss dieses
Kapitels behandeln wir vektorwertige Funktionen einer reellen Variablen; insbeson-
dere wie man solche Funktionen differenziert und integriert. Die für uns wichtigsten
vektorwertigen Funktionen sind der Ortsvektor eines Massenpunktes, der die Bahn
des Massenpunktes im Raum beschreibt, seine Geschwindigkeit und seine Beschleu-
nigung. Diese Vektoren betrachtet man in der Regel als Funktionen der Zeit.

Im Laufe dieser Vorlesung und in der Vorlesung Theoretische Physik I wird präzi-
siert, wie die Begriffe Skalar und Vektor in der nichtrelativistischen und in der rela-
tivistischen Physik definiert und benutzt werden. Die folgenden Beispiele beziehen
sich auf die nichtrelativistische Physik, insbesondere auf die nichtrelativistische Me-
chanik.
5.1 Skalare und Vektoren 95

5.1 Skalare und Vektoren


Im Folgenden benutzen wir elementare Konzepte der euklidischen Geometrie, wie
Gerade, Parallele, Winkel, usw.

Skalare
Anschauliche Definition: Ein Skalar ist eine Größe, die durch Angabe einer
einzigen Zahl – bezogen auf die jeweilige Maßeinheit der physikalischen Größe –
gekennzeichnet ist. Diese Zahl darf nicht von Bezugssystem1 abhängen, in dem man
die Größe misst.

Beispiele:
• Zahl der Atome in einem Stück Materie,

• Masse m eines Körpers,

• Temperatur T eines physikalischen Systems,

• Zeit t bzw. Zeitdauer eines Vorgangs,

• Abstand zweier Körper2 .

Vektoren:
Anschauliche Definition: Ein Vektor ist – in der nichtrelativistischen Physik –
eine Größe, die gekennzeichnet ist durch eine nichtnegative Zahl – das ist der Betrag
der Größe in der jeweiligen Maßeinheit – und durch eine Richtung 3 im Raum.

Beispiele aus der nichtrelativistischen Physik:


• Geschwindigkeit,

• Beschleunigung,

• Kraft,

• elektrische Feldstärke,
1
Ein Bezugssystem ist ein Koordinatensystem versehen mit Uhren, in dem physikalische Pro-
zesse untersucht werden. Von grundlegender Bedeutung sind sog. Inertialsysteme – siehe den
Mechanik-Teil der Vorlesung. In diesen Systemen nehmen die Grundgesetze der Physik eine einfa-
che Form an.
2
Die Zeit und der räumliche Abstand zweier Punkte sind nur in der nichtrelativistischen Physik
skalare Größen – nicht aber in der relativistischen Physik.
3
In der Regel beziehen wir uns auf den dreidimensionalen Raum, in dem sich das physikalische
Geschehen abspielt. Der Begriff des Vektors lässt sich aber problemlos auf einen n-dimensionalen
Raum (n = 1, 2, 3, 4, ...) verallgemeinern bzw. noch abstrakter fassen (siehe unten).
96 Einführung in die Theoretische Physik

• magnetische Feldstärke.

Vektoren stellt man graphisch durch Pfeile dar, z.B. durch die gerichtete gerad-
linige Verbindung zwischen zwei Punkten.

Q1
~a
P1 −−−→
a = P1 Q 1
−−−→
P2 b = P2 Q 2
~b Q2

Die Länge eines Pfeils entspricht dem Betrag des Vektors.

Notation: Um Vektoren nicht mit skalaren Größen zu verwechseln, benutzt man in


der Physik-Literatur in der Regel die Pfeilnotation −

a oder, wie in diesem Skriptum,
Fettbuchstaben: Vektor a mit Betrag |a| ≡ a.
Beispiele:

• Geschwindigkeit v mit Betrag |v|, z. B. |v| = 100 m/s,

• Kraft F mit Betrag |F |, z. B. |F | = 7, 1 N,

• Elektrische Feldstärke E mit Betrag |E|, z. B. |E| = 12 V/m.

Freie und gebundene Vektoren: Die obige Definition besagt, dass ein Vektor
−−→
P Q nicht davon abhängt, wo der Punkt P , von dem der Vektor ausgeht, im Raum
liegt. Die geometrische Interpretation eines Vektors4 ist die einer Parallelverschie-
bung, der jeden Punkt P im Raum in eine feste Richtung um eine feste Strecke
−−−→ −−−→
verschiebt. Zwei Vektoren, d.h. zwei Verschiebepfeile P1 Q1 , P2 Q2 sind gleich, wenn
sie gleichsinnig parallel sind und die gleiche Länge, d.h. den gleichen Betrag haben.
In der Physik- und Ingenieur-Literatur bezeichnet man Bezugspunkt-unabhängige
Vektoren als freie Vektoren. Als Beispiel sei die Geschwindigkeit genannt. Wenn ein
Pkw in Aachen und ein anderer in Köln jeweils mit 100 km/h strikt nach Westen
fahren, ordnen wir beiden Fahrzeugen den gleichen Geschwindigkeitsvektor v zu.
Analog gilt das z.B. auch für die Beschleunigung oder für eine von Ort unabhängige
Kraft. Die Operationen mit Vektoren, die im nächsten Abschnitt besprochen werden,
gelten für freie Vektoren.
Im Gegenssatz dazu ist ein sog. gebundener Vektor, wie z.B. der Ortsvektor eines
Massenpunktes, an einen Bezugspunkt gebunden, von dem er ausgeht. Wir kommen
in Abschnitt 5.3 auf den Ortsvektor zurück.
4
Wir reden hier von konstanten, nicht von ortsabhängigen Vektoren.
5.2 Elementare Operationen, Vektorräume 97

~b ~a

~a + ~b
~a + ~b
~a ~b

Abbildung 5.1: Die Addition zweier Vektoren a und b ist kommutativ.

5.2 Elementare Operationen, Vektorräume


Addition von Vektoren:
Die Addition zweier Vektoren ist in Abbildung 5.1 dargestellt. Offensichtlich gilt:
a1) Die Addition ist kommutativ: a + b = b + a.

a2) Die Addition ist assoziativ: (a + b) + c = a + (b + c).

a3) Es gibt einen Nullvektor 0, d.h. |0| = 0, Angriffs- und Zielpunkt fallen beim
Nullvektor zusammen. Es gilt a + 0 = a.

a4) Zu jedem Vektor a gibt es einen Vektor −a (mit gleicher Länge wie a, aber
entgegengesetzter Richtung), so dass a − a = 0.

Multiplikation eines Vektors a mit einer reellen Zahl λ ∈ R


Offensichtlich gilt wegen der obigen Regeln zur Vektoraddition folgendes:
ist ein Vektor mit gleicher Richtung wie a,
a+a
aber doppelter Länge,

ist ein Vektor mit gleicher Richtung wie a,


a
| +a+
{z ... + a} aber n-facher Länge.
n-mal

Das legt folgende Definition nahe: Multipliziert man einen Vektor a mit einer reellen
Zahl λ, so ist das Ergebnis der Vektor λa. Dieser Vektor hat die gleiche Richtung
wie a (er ist parallel zu a), wenn λ > 0, bzw. die zu a entgegengesetzte Richtung
(er ist antiparallel zu a), wenn λ < 0. Für seine Länge (Betrag) gilt:

|λa| = |λ||a|.

Aus dieser Definition ergeben sich sofort folgende Regeln für die Multiplikation von
Vektoren mit reellen Zahlen λ, α ∈ R:
98 Einführung in die Theoretische Physik

m1) 1 · a = a.

m2) α(λa) = (αλ)a.

m3) λ(a + b) = λa + λb.

m4) (α + λ)a = αa + λa.

Die Menge der Vektoren in drei Raumdimensionen, für die die Additionsregeln
a1) – a4) und die Multiplikationsregeln m1) – m4) mit reellen Zahlen gelten, bil-
den einen sogenannten Vektorraum; präziser, einen dreidimensionalen Vektorraum
V3 über dem sogenannten Körper der reellen Zahlen R. Die Dimension eines Vek-
torraums wird unten im Abschnitt über lineare Unabhängigkeit definiert.
In der Physik ist es nützlich, Vektoren auch in ein, zwei oder allgemein in d Raumdi-
mensionen zu betrachten. Diese Vektoren bilden einen d-dimensionalen Vektorraum
Vd .
Notation: Vd = Rd = R × R × . . . × R.
Diese Notation bringt zum Ausdruck, dass die Menge der Verschiebepfeile im d-
dimensionalen ,,Anschauungsraum” isomorph5 zum ,,d-fachen Produkt der reellen
Zahlenmenge” ist. Das wird in Abschnitt 5.3 erläutert.

Hinweise:

1. In der Mathematik wird der Begriff eines Vektors bzw. eines Vektorraums ab-
strakter gefasst. Man bezeichnet eine Menge V von Objekten, in der die Additi-
onsregeln a1) – a4) und die Multiplikationsregeln m1) – m4) gelten (mit reellen
Zahlen, oder mit komplexen Zahlen, oder allgemeiner mit Objekten aus einem
Körper K), als Vektorraum. So bildet z.B. die Menge {f (x)} der auf dem In-
tervall [a, b] integrierbaren reellen Funktionen einen (unendlich-dimensionalen)
Vektorraum. Die Addition f + g zweier Vektoren f und g und die Multipli-
kation mit reellen Zahlen α, β ist durch αf (x) + βg(x) definiert. Vektorräume
dieser Art werden Ihnen auch in den Vorlesungen über Theoretische Physik in
den höheren Semestern begegnen.

2. Wenden wir die Multiplikationsregeln m1)– m4) auf die oben eingeführten
Begriffe Skalar und Vektor an, so besagen diese Regeln, dass

Skalar · Vektor → Vektor.

In der Physik werden Vektoren – die im Allgemeinen dimensionsbehaftet sind –


nicht nur mit dimensionslosen Zahlen, sondern auch mit dimensionsbehafteten
Skalaren multipliziert. Das Ergebnis ist zwar wieder ein Vektor, hat aber eine
5
Isomorph bedeutet strukturgleich. Zwei Räume bezeichnet man als isomorph, wenn man ihre
Elemente umkehrbar eindeutig aufeinander abbilden kann und die Rechenregeln in beiden Räumen
übereinstimmen.
5.2 Elementare Operationen, Vektorräume 99

andere physikalische Dimension.


Beispiel:
m a = F.
↑ ↑ ↑
Masse Beschleunigung Kraft
Skalar Vektor Vektor

3. Die Additionsgesetze a1) – a4) machen natürlich nur für Vektoren mit dersel-
ben physikalischen Dimension Sinn.

Lineare Unabhängigkeit
Wir betrachten den Vektorraum Vd = Rd . Eine Anzahl von n Vektoren g 1 , ..., g n
heißt linear unabhängig, wenn die Gleichung
λ1 g 1 + λ2 g 2 + ... + λn g n = 0
nur dann gilt, wenn alle Koeffizienten λi = 0 sind. Falls es mindestens eine reelle
Zahl λj 6= 0 gibt, so dass diese Gleichung gilt, heissen die Vektoren g 1 , ..., g n linear
abhängig.

Beispiele:
1. V1 = R. Hier gibt es nur einen linear unabhängigen Vektor, wir nennen ihn g.
Alle anderen Vektoren sind Vielfache von g:
b = λg λ ∈ R.
M.a.W.: In V1 = R sind zwei oder mehr Vektoren immer linear abhängig.
2. V2 = R2 . Hier gibt es maximal zwei linear unabhängige Vektoren.
~g1
Beispiel: ~g 2

Jeder weitere Vektor in der Ebene kann als Linearkombination von g 1 und g 2
dargestellt werden:
b = λ1 g 1 + λ2 g 2 .
M.a.W.: In V2 = R2 sind drei oder mehr Vektoren immer linear abhängig.
3. Vd = Rd . Hier gibt es maximal d linear unabhängige Vektoren.

Definition: Als Basis in Vd = Rd bezeichnet man einen Satz g 1 , g 2 , ..., g d


von d linear unabhängigen Vektoren. Die Dimension d eines Vektorraums ist
gleich der Maximalzahl der linear unabhängigen Vektoren. Jeder Vektor b ∈ Vd
kann als Linearkombination der d Basisvektoren dargestellt werden:
b = b1 g 1 + b2 g 2 + ... + bd g d , bi ∈ R. (5.2.1)
100 Einführung in die Theoretische Physik

5.3 Bezugssysteme
Die Gleichung (5.2.1) besagt, dass jeder Vektor b ∈ V = Rn eindeutig durch den
Satz von Zahlen
b1 , ..., bd ←→ b (5.3.1)

bezüglich der gewählten Basis g 1 , ..., g d festgelegt ist. Die Zahlen (5.3.1) heißen Kom-
ponenten oder Koordinaten des Vektors b bezüglich der Basis {g i }. Der Einfachheit
halber wählt man in der Regel sogenannte Orthonormalbasen. Das sind d Einheits-
vektoren, die alle senkrecht6 aufeinander stehen:

e1 , e2 , ..., ed
(5.3.2)
mit |ei | = 1 ∀i = 1, ..., n und ei ⊥ ej ∀i 6= j.

Im Folgenden betrachten wir den dreidimensionalen Raum V = R3 , gelegentlich


auch den zweidimensionalen Raum R2 . Eine Orthonormalbasis (ONB)

{e1 , e2 , e3 } , (5.3.3)

also eine Basis mit der Eigenschaft (5.3.2), definiert ein sog. kartesisches Koordi-
natensystem im R3 .

1. Man wählt einen beliebigen Punkt O im Raum, bei dem die Pfeile e1 , e2 , e3
der Länge Eins beginnen. Den Punkt O nennt man Nullpunkt oder Koordi-
natenursprung. Die Winkel ∠(ei , ej ) sind jeweils 90◦ . Die Verlängerung der
Pfeile ergeben die Koordinatenachsen, die mit Maßzahlen versehen werden.

2. Für die ONB (5.3.3) sind zwei Orientierungen möglich, siehe Abbildung 5.2.
Rechts- und linkshändige ONB können nicht durch Drehungen ineinander
übergeführt werden.
∧ ∧ ∧
e1 = positive x- e2 = positive y- e3 = positive z-
Achse Achse Achse
∧ ∧ ∧
rechtshändig ori- = Daumen der = Zeigefinger der = Mittelfinger der
entiertes System rechten Hand rechten Hand rechten Hand
∧ ∧ ∧
linkshändig orien- = Daumen der lin- = Zeigefinger der = Mittelfinger der
tiertes System ken Hand linken Hand linken Hand
Wir wählen in der Regel ein rechtshändig orientiertes System = Rechtssystem.
6
Man muss im Allgemeinen zunächst im jeweiligen Vektorraum das Skalarprodukt zweier Vek-
toren definieren. Mit einem Skalarprodukt kann man festlegen, was Orthogonalität zweier Vektoren
bedeuten soll. Im euklidischen Rd können wir allerdings auf geometrische Weise zueinander senk-
rechte Vektoren konstruieren.
5.3 Bezugssysteme 101

z z

y
y

~e3 ~e3
~e2 ~e2
~e1 x x ~e1

(a) Rechtshändig orientiertes Koordi- (b) Linkshändig orientiertes Koordi-


natensystem. natensystem.

Abbildung 5.2: Die beiden möglichen Orientierungen einer 3-dim. Orthonormal-


basis. Rechts- und linkshändige ONB können nicht durch Drehungen ineinander
übergeführt werden.

Hinweis: Bei der Konstruktion eines Bezugssystems, insbesondere eines kartesi-


schen Systems, bleiben offensichtlich folgende Eigenschaften unbestimmt, d.h. sind
frei wählbar: i) Die Lage des Ursprungs im Raum und ii) die Lage des orthogo-
nalen ,,Dreibeins” e1 , e2 , e3 im Raum. Es bedürfte eines weiteren Bezugssystems,
um diese Eigenschaften festzulegen. Dieses Bezugssystem hätte aber wiederum die
genannten Freiheiten. Mit anderen Worten, ein Koordinatensystem ist frei in Bezug
auf i) Verschiebungen (Translationen) und ii) Drehungen im Raum.

Koordinatendarstellung von Vektoren:


Jeder Vektor a im Raum hat bezüglich einer vorgegebenen ONB (5.3.3) die eindeu-
tige Zerlegung
a = a1 e1 + a2 e2 + a3 e3 , (5.3.4)
Algebraisch sollte diese Gleichung aufgrund von (5.2.1) klar sein. Geometrisch in-
terpretiert bedeutet (5.3.4) folgendes. Wenn a ein freier Vektor, also frei im Raum
parallel-verschiebbar ist, kann man seinen Anfangspunkt in den Ursprung O des
Koordinatensystems legen, siehe Abbildung 5.3. Wenn a ein Ortsvektor ist, ist O
per Definition sein Anfangspunkt.
Deshalb bietet sich die folgende Darstellung von a an:
 
a1
a =  a2  ≡ a . (5.3.5)
a3
Dies ist Darstellung von a in kartesischen Koordinaten. Sie kennen sie vermutlich
aus der Schule.
102 Einführung in die Theoretische Physik

~a

a3
a1
x a2
y

Abbildung 5.3: Bezüglich einer vorgegebenen ONB (5.3.3) hat ein Vektor die ein-
deutige Zerlegung (5.3.4).

Auf diese Weise werden die obigen geometrischen Überlegungen auf algebraische
Betrachtungen und somit auf das Rechnen mit reellen Zahlen zurückgeführt. Die
Rechenregeln a1) – a4) und m1) – m4) lassen sich sofort auf (5.3.5) übertragen.
Seien a, b ∈ V3 = R3 und α, β ∈ R, dann
       
c1 a1 b1 αa1 + βb1
c = αa + βb ⇔  c2  = α  a2  + β  b2  =  αa2 + βb2  . (5.3.6)
c3 a3 b3 αa3 + βb3

Völlig analog stellt man Vektoren aus Vd = Rd dar und rechnet mit ihnen. Das
Symbol Rd sollte nun klar sein. Es bezeichnet die Menge der d-komponentigen reellen
Spaltenvektoren.

Schreibweise: Einige Bemerkungen zur Notation in (5.3.5). Man sollte verinnerli-


chen, dass Vektoren basisunabhängige Objekte sind – dieser Sachverhalt wird durch
das Symbol a zum Ausdruck gebracht. Das Symbol a bzw. das dreikomponentige
Objekt in der Mitte von (5.3.5) zeigt an, dass es sich um die Darstellung von a
bezüglich einer Basis handelt. Um Platz zu sparen, schreibt man den dreikompo-
nentigen Spaltenvektor gelegentlich auch als Zeilenvektor (a1 , a2 , a3 ).
Genaugenommen sollte man immer durch entsprechende Symbole zwischen einem
Vektor und seiner Darstellung bezüglich einer Basis unterscheiden; wir werden das
auch im Folgenden oft, aber nicht immer tun. In der Regel wird in der Literatur für
beide Fälle nur das Symbol a bzw. −→
a benutzt, um die Notation nicht zu überladen
– man erkennt aus dem Kontext, welcher Fall gemeint ist.
Die Grundgesetze der Physik, z.B. das Newtonsche Bewegungsgesetz, gelten in-
nerhalb einer Klasse von Bezugssystemen, den sogenannten Inertialsystemen, un-
abhängig von der Wahl des speziellen Systems (siehe den obigen Hinweis). Deswegen
5.4 Skalarprodukt, Vektorprodukt, Mehrfachprodukte von Vektoren 103

formuliert man diese Grundgesetze in der Regel basisunabhängig – d.h. mit Vekto-
ren unabhängig von ihrer Koordinatendarstellung bezüglich einer bestimmten Basis.
Zum Beispiel lautet das Newtonsche Bewegungsgesetz in Bezugssystem-unabhängi-
ger Vektordarstellung:
d2
m 2 x(t) = F . (5.3.7)
dt
Dieses Gesetz gilt in jedem Inertialsystem (dies wird im Mechanik-Teil behandelt).
Für konkrete Rechnungen ist es aber meistens notwendig, ein geeignetes Koordina-
tensystem (KS) zu wählen. Wählt man ein kartesisches KS mit der ONB (5.3.2),
dann ist
3
X X3
x(t) = xi (t)ei , F = Fi ei ,
i=1 i=1

und die Bewegungsgleichung (5.3.7) nimmt bezüglich des gewählten KS die Form

d2
m x(t) = F
dt2
an.

5.4 Skalarprodukt, Vektorprodukt, Mehrfachpro-


dukte von Vektoren
In diesem Abschnitt behandeln wir, auf welche Weise man Vektoren miteinander
multiplizieren kann. Das unten eingeführte Skalarprodukt zweier Vektoren ist so
definiert, dass die Längen- und Winkelmessung der euklidischen Geometrie auf al-
gebraische Rechenoperationen im R3 bzw. Rd übertragen werden. Auch das u.a.
Vektorprodukt hat eine geometrische Bedeutung.
Wir besprechen die basisunabhängigen Definitionen der jeweiligen Produkte und
ihre Darstellung durch die Vektorkomponenten bezüglich der rechtshändigen ONB
{e1 , e2 , e3 } aus Abbildung 5.2(a).

5.4.1 Skalarprodukt zweier Vektoren a, b


Das Skalarprodukt zweier Vektoren a, b – auch inneres Produkt genannt – ordnet
den beiden Vektoren eine reelle Zahl zu. Seine basisunabhängige Definition ist:

~b
φab a · b = |a| |b| cos φab , (5.4.1)
~a
wobei 0 ≤ φab ≤ π der Winkel zwischen den Vektoren a und b ist. Weil cos φab =
cos(2π − φab ), spielt es keine Rolle, welchen der beiden Winkel zwischen a und b
104 Einführung in die Theoretische Physik

man nimmt.
Wenn der in der Abbildung gezeigte Winkel
φab spitz ⇒ a · b > 0,
φab stumpf ⇒ a · b < 0,
π
φab = d.h. a ⊥ b ⇒ a · b = 0.
2
Beispiel aus der Physik: Die mechanische Arbeit A, die an einem Körper bei Bewe-
gung um eine kleine Strecke ∆r = r 2 −r 1 gegen eine Kraft F bzw. unter Einwirkung
einer Kraft verrichtet werden muss, ist A = F · ∆r.
Das Skalarprodukt ist
kommutativ a · b = b · a (5.4.2)
und
distributiv (a + b) · c = a · c + b · c. (5.4.3)
Die Eigenschaft (5.4.2) ist offensichtlich. Den Beweis der Eigenschaft (5.4.3) finden
Sie z.B. im zitierten Buch von S. Großmann.
Da φab = 0 zur Folge hat, dass a · a = |a||a| cos 0 = |a||a|, kann man die Länge
eines Vektors a mit Hilfe des Skalarproduktes ausdrücken.

|a| = a · a. (5.4.4)
Das Skalarprodukt erfüllt die Schwarzsche Ungleichung
|a · b| ≤ |a||b| , (5.4.5)
die sich in einer Vielzahl von Anwendungen als nützlich erweist. Diese Ungleichung
folgt sofort aus der Definition (5.4.1) und | cos φab | ≤ 1.

Komponentendarstellung des Skalarprodukts


Nun zu unserer ONB {e1 , e2 , e3 } mit der Eigenschaft (5.3.2). Diese Eigenschaften
implizieren, dass
e1 · e1 = e2 · e2 = e3 · e3 = 1
(5.4.6)
und ei · ej = 0 für i 6= j.
Gleichung (5.4.6) lässt sich kompakt mit Hilfe des sogenannten Kronecker-Symbols
δij ausdrücken, das wie folgt definiert ist:
(
1 für i = j
δij ≡ ei · ej = (5.4.7)
0 für i 6= j.

Aus (5.4.6) folgt, dass das Skalarprodukt zweier Vektoren a und b durch ihre Kom-
ponenten bezüglich dieser Basis gegeben ist durch
a · b = (a1 e1 + a2 e2 + a3 e3 ) · (b1 e1 + b2 e2 + b3 e3 )
(5.4.7) (5.4.8)
= a1 b1 + a2 b2 + a3 b3 .
5.4 Skalarprodukt, Vektorprodukt, Mehrfachprodukte von Vektoren 105

~b
φ̃ab
~a

nicht dieser Winkel


für das Vektorprodukt

Abbildung 5.4: Der Winkel φ̃ab in der Definition (5.4.10) ist der kleinere der beiden
Winkel zwischen a und b.

In der Komponentendarstellung von a und b schreibt man


   
a1 b1
 a2  ·  b2  = a1 b1 + a2 b2 + a3 b3 .
a3 b3

Die Länge, also der Betrag eines Vektors a folgt aus (5.4.8):
√ q
a ≡ |a| = a · a = a21 + a22 + a23 . (5.4.9)

Dieses Ergebnis erhält man auch aus Abbildung 5.3 durch zweimalige Anwendung
des Satzes von Pythagoras.
Hinweis: Man nennt den Vektorraum Rd versehen mit dem Skalarprodukt (5.4.1)
einen d-dimensionalen euklidischen Raum. Der Grund für diese Namensgebung
sollte klar sein – in diesem Raum werden die Regeln der euklidische Geometrie auf
algebraische Rechenoperationen zurückgeführt.

5.4.2 Vektorprodukt zweier Vektoren a, b


Das Vektorprodukt a × b – auch äußeres Produkt genannt – ordnet den beiden
Vektoren a und b einen Vektor zu, der folgendermaßen definiert ist:

a × b = n|a||b| sin φ̃ab ,


wobei n ein Einheitsvektor ist, |n| = 1, mit n ⊥ a und n ⊥ b.
Die Richtung von n muss so gewählt werden, dass a, b, n in dieser
Reihenfolge rechtshändig orientiert sind – siehe Abbildung 5.2(a). (5.4.10)
Der Winkel φ̃ab bezeichnet den kleineren der beiden Win-
kel7 zwischen a und b. Somit 0 ≤ φ̃ab ≤ π, d.h. sin φ̃ab ≥ 0, siehe
Abbildung 5.4.

Merkregel: Wenn der Daumen der rechten Hand in Richtung von a zeigt und der
Zeigefinger der rechten Hand, den Handrücken verlängernd ausgestreckt, in Richtung
von b zeigt, dann zeigt der senkrecht dazu von der Handinnenfläche weg ausgestreck-
te Mittelfinger der rechten Hand in Richtung von n, also in die Richtung von a × b.
106 Einführung in die Theoretische Physik

~b

|~b| sin φ̃ab

φ̃ab
~a

Abbildung 5.5: Das von a und b aufgespannte Parallelogramm hat die Fläche F =
ab sin φ̃ab = |a × b|.

Aus der Definition (5.4.10) folgt, dass das Vektorprodukt zweier paralleler oder
antiparalleler Vektoren null ist.

a (anti)parallel zu b ⇔ a × b = 0. (5.4.11)

Parallele oder antiparallele Vektoren bezeichnet man als kollineare Vektoren.

Weitere Eigenschaften:

a×b=− b×a (5.4.12)


(λ1 a) × (λ2 b) = λ1 λ2 a × b λ1 , λ2 ∈ R. (5.4.13)

Die Relationen (5.4.12) und (5.4.13) folgen unmittelbar aus der Definition (5.4.10).
Gl. (5.4.12) besagt, dass das Vektorprodukt nicht kommutativ ist – wegen des
Minuszeichens in (5.4.12) bezeichnet man das Vektorprodukt als antikommutativ.
Das Vektorprodukt ist jedoch distributiv; denn es gilt

a × (b + c) = a × b + a × c. (5.4.14)

Diese Relation kann man z.B. mit der Komponentendarstellung (5.4.18) des Vektor-
produkts herleiten.

Geometrische Bedeutung des Vektorprodukts:


Aus Abbildung 5.5 geht hervor, dass der Betrag des Vektorprodukts gleich der Fläche
des von a und b aufgespannten Parallelogramms ist.

|a × b| = |a| |b| sin φ̃ab . (5.4.15)

Komponentendarstellung des Vektorprodukts:


Dazu benötigen wir zunächst die Vektorprodukte der Basisvektoren. Aus der Defi-
nition (5.3.2) der rechtshändigen Basis {e1 , e2 , e3 } und der Definition des Vektor-
5.4 Skalarprodukt, Vektorprodukt, Mehrfachprodukte von Vektoren 107

1 1

3 2 3 2

(1, 2, 3); (2, 3, 1); (3, 1, 2) (1, 3, 2); (3, 2, 1); (2, 1, 3)
(a) Zyklische Vertauschungen (b) Antizyklische Vertau-
von (1, 2, 3). schungen von (1, 2, 3).

Abbildung 5.6: (Anti-)zyklische Vertauschungen.

produkts (5.4.10) folgt, dass


e1 × e1 = e2 × e2 = e3 × e3 = 0,
e1 × e2 = −e2 × e1 = e3 ,
(5.4.16)
e2 × e3 = −e3 × e2 = e1 ,
e3 × e1 = −e1 × e3 = e2 .

Die Relationen (5.4.16) können folgendermaßen zusammengefasst werden:


ei × ej = ek ,
wobei (i, j, k) = (1, 2, 3) oder eine zyklische Vertauschung dieser (5.4.17)
drei Zahlen ist, siehe Abbildung 5.6.
Mit Hilfe von (5.4.16) bzw. (5.4.17) können wir das Vektorprodukt zweier Vektoren
in der Komponentendarstellung berechnen:
a × b = (a1 e1 + a2 e2 + a3 e3 ) × (b1 e1 + b2 e2 + b3 e3 )
= (a1 b2 − a2 b1 )(e1 × e2 ) + (a1 b3 − a3 b1 )(e1 × e3 ) + (a2 b3 − a3 b2 )(e2 × e3 )
= (a2 b3 − a3 b2 )e1 + (a3 b1 − a1 b3 )e2 + (a1 b2 − a2 b1 )e3 .
(5.4.18)

Anwendungen in der Physik:


In der Mechanik wird das Vektorprodukt beispielsweise zur Definition der Mess-
größen Drehimpuls und Drehmoment benötigt. Auf ein Teilchen der Masse m wirke
am Ort r eine Kraft F . Der Impuls des Teilchens ist p = mv, wobei v die Geschwin-
digkeit des Teilchens ist. Dann sind der Drehimpuls L des Teilchens und das auf das
Teilchen wirkende Drehmoment N gegeben durch8

L = r × p, N =r×F .
8
Für den Drehimpuls eines Körpers gilt die Bewegungsgleichung dL/dt = N , die aus der New-
tonschen Bewegungsgleichung folgt – siehe den Mechanik-Teil der Vorlesung.
108 Einführung in die Theoretische Physik

~c
Volumen
F ·h
h = ~n · ~c

~b

~n k ~a × ~b F = |~a × ~b|
φ̃ab
~a

Abbildung 5.7: Spatprodukt V (a, b, c) ≡ (a × b) · c. |V | = |a × b| n · c = F · h ist


das Volumen des Parallelepipeds.

Der Drehimpuls und das Drehmoment sind wie der Ortsvektor vom Bezugspunkt O
des Koordinatensystems – aber nicht von der Orientierung seiner Achsen – abhängig,
sind also weitere Beispiele für gebundene Vektoren.

5.4.3 Mehrfachprodukte von Vektoren


Seien a, b, c drei Vektoren.
1. (a · b)c ist ein Vektor in Richtung ±c. Beachte, dass
(a · b)c 6= a(b · c) ;
denn die rechte Seite ist ein Vektor in Richtung ±a.
2. Spatprodukt: Dies ist eine Zahl – d.h. ein Skalar – definiert durch
V (a, b, c) ≡ (a × b) · c. (5.4.19)

Geometrische Bedeutung des Spatprodukts: Sein Betrag |V | ist das Volumen


des durch a, b, c aufgespannten Körpers; das ist ein sogenanntes Parallelepi-
ped, siehe Abbildung 5.7.
Eigenschaften des Spatproduktes:
(a × b) · c = c · (a × b) (5.4.20)
(a × b) · c = 0 ⇔ a, b, c liegen in einer Ebene (5.4.21)
(a × b) · c = (c × a) · b = (b × c) · a. (5.4.22)
Die Relation (5.4.20) folgt aus der Kommutativität des Skalarprodukts. Gl. (5.4.21)
folgt aus der Definition des Vektor- und des Skalarprodukts. Gl. (5.4.22) be-
weisen wir in einer Übungsaufgabe; am bequemsten mit Hilfe des in (5.4.26)
definierten -Symbols.
5.4 Skalarprodukt, Vektorprodukt, Mehrfachprodukte von Vektoren 109

3. Dreifaches Vektorprodukt a × (b × c). Dies ist ein Vektor, und zwar gilt

a × (b × c) = b(a · c) − c(a · b). (5.4.23)

Merkregel: “bac minus cab”. Die Relation (5.4.23) beweisen wir auf Sei-
te 110. Beachten Sie, dass hier das Assoziativgesetz nicht gilt!

(a × b) × c 6= a × (b × c). (5.4.24)

Der Vektor in (5.4.23) liegt in der von b und c aufgespannten Ebene, während
(5.4.23)
(a × b) × c = −c × (a × b) = −a(c · b) + b(c · a) (5.4.25)

ein Vektor in der von a und b aufgespannten Ebene ist.

5.4.4 Definition und Eigenschaften des -Tensors


Die Eigenschaft (5.4.17) der rechtshändigen ONB {e1 , e2 , e3 } können wir auch fol-
gendermaßen darstellen: Wir definieren das Spatprodukt

 +1 wenn i, j, k = 1, 2, 3 und zyklisch,

ijk ≡ ei · (ej × ek ) = −1 wenn i, j, k = 2, 1, 3 und zyklisch, (5.4.26)

 0 sonst.

Das Symbol ijk heißt total antisymmetrischer -Tensor9 , oder total antisymmetri-
sches -Symbol oder Levi-Civita-Symbol. Es handelt sich um ein Objekt bestehend
aus 3 · 3 · 3 = 27 Zahlen. Aus der Definition folgt, dass
123 = 312 = 231 = +1,
(5.4.27)
213 = 321 = 132 = −1,
und dass der Wert des Symbols null ist, wenn mindestens zwei Indizes gleich sind:

iik = iji = ijj = 0. (5.4.28)

Gl. (5.4.27) und (5.4.28) besagen, dass

ijk = kij = jki , (5.4.29)

und dass ijk antisymmetrisch unter Vertauschung zweier benachbarter Indizes ist:

ijk = −jik , ijk = −ikj , etc. (5.4.30)

Es gilt folgende für Anwendungen wichtige Formel:


3
X
kij klm = δil δjm − δim δjl . (5.4.31)
k=1

9
In Kapitel 6 wird erklärt, warum man dieses Objekt als Tensor bezeichnet.
110 Einführung in die Theoretische Physik

Man beweist diese Formel z.B. durch explizites Einsetzen der Werte des -Symbols
und Verwendung seiner Antisymmetrieeigenschaften.
Anwendungen:
1) Zunächst stellen wir fest, dass wir die Relationen (5.4.16) mit dem -Symbol
folgendermaßen kompakt darstellen können:

ei × ej = ijk ek , i, j, k = 1, 2, 3 . (5.4.32)

2) Als nächstes betrachten wir das Vektorprodukt b × c, das mit (5.4.32) die Form
3
X 3
X
b×c= bi cj ei × ej = ijk bi cj ek (5.4.33)
i,j=1 i,j,k=1

annimmt.
3) Mit (5.4.33), (5.4.32) und (5.4.31) beweisen wir nun die Relation (5.4.23).
3
! 3
!
X X
a × (b × c) = al el × ijk bi cj ek
l=1 i,j,k=1
3 3
X (5.4.31) X
= al bi cj ijk lkm em = − al bi cj em (δil δjm − δim δjl )
|{z}
i,j,k,l,m=1 −lmk i,j,l,m=1
3
X
=− (ai bi cj ej − aj cj bi ei ) = b(a · c) − c(a · b) .
i,j

Natürlich kann man diese Relation auch auf Fußgängerart herleiten, soll heißen durch
zweimalige Anwendung von (5.4.18) unter Verwendung von (5.4.16).

5.5 Vektorwertige Funktionen, Raumkurven


Die Bahn eines Massenpunktes beschreibt man analytisch durch seinen Ortsvek-
tor r. In der Physik interessieren wir uns typischerweise dafür, wie ein Massen-
punkt/Körper seine Bahn im Laufe der Zeit t durchläuft. Dies wird durch die Kennt-
nis des Ortsvektors als Funktion der Zeit geliefert, r = r(t). In geometrischer Termi-
nologie handelt es sich dabei um eine Kurve im Raum. M.a.W: Eine Raumkurve ist
analytisch beschreibbar durch eine vektorwertige Funktion einer reellen Variablen.

Definition: Eine vektorwertige Funktion einer reellen Variablen t im d-dimensionalen


Raum ist eine Abbildung

t∈I⊂R 7→ d-dimensionaler Vektor f (t) ∈ W ⊂ Rd .

Hinweise:
5.5 Vektorwertige Funktionen, Raumkurven 111

x2

~r(t)

x1
0

Abbildung 5.8: Eine Bahnkurve ist eine vektorwertige Funktion r(t).

1. Der Parameter t in der obigen Definition muss nicht die Zeit sein; je nach
Zweckmäßigkeit kann eine Koordinate, ein Winkel, die Bogenlänge, usw. zur
Parametrisierung einer vektorwertigen Funktion benutzt werden – siehe unten.
2. Der Ortsvektor r = r(t) beschreibt analytisch die Bahnkurve eines Teilchens
im Ortsraum. Natürlich kann jede vektorwertige Funktion geometrisch als Kur-
ve in einem abstrakten Raum interpretiert werden. So beschreibt z.B. die Ge-
schwindigkeit v = v(t) eines Massenpunktes eine Kurve im ,,Geschwindigkeits-
raum”, eine nicht vom Ort abhängige Kraft F = F (t) eine Kurve im ,,Raum
der Kraftvektoren”, usw.

5.5.1 Parametrisierung von Bahnkurven


Im Folgenden sei f (t) = r(t) der Ortsvektor in drei Raumdimensionen10 . Die folgen-
den Überlegungen gelten analog für jede vektorwertige Funktion in d Dimensionen.
Wir wählen im R3 (allgemein im Rd ) ein kartesisches Koordinatensystem, d.h.
einen beliebigen, aber festen Koordinatenursprung O und eine kartesische ONB
{e1 , e2 , e3 }. Wie bereits betont wurde, steht dieses kartesische Dreibein beliebig aber
fest im Raum, d.h. die Einheitsvektoren ei sind nicht vom Parameter t abhängig11
Die Bahnkurve, Abbildung 5.8, d.h. die Änderung des Ortes P eines Teilchens bei
Änderung des Parameters t (typischerweise t = Zeit) ist durch den Ortsvektor r(t)
bestimmt.
r(t) = x1 (t)e1 + x2 (t)e2 + x3 (t)e3 , (5.5.1)
bzw. in Komponentendarstellung12 :
r(t) = (x1 (t), x2 (t), x3 (t)). (5.5.2)
10
Die Abbildungen dieses Abschnittes wurden der Einfachheit halber in zwei Dimensionen ge-
zeichnet.
11
In Kapitel 7 und im Mechanik-Teil der Vorlessung betrachten wir auch ortsabhängige ONB,
nämlich die Polarkoordinaten- und Zylinderkoordinatenbasen. Da der Ort eines Teilchens i.A. von
der Zeit abhängt, sind die Basisvektoren dieser ONB i.A. t-abhängig.
12
Die kartesischen Koordinanten eines Ortsvektors bezeichnen wir oft auch mit x, y, z.
112 Einführung in die Theoretische Physik

x2

~r
R
φ x1

Abbildung 5.9: Kreisbahn in der x1 x2 -Ebene.

Gleichung (5.5.1) bzw. (5.5.2) beschreibt die Trajektorie (= Bahn = Raumkurve)


des Teilchens.
Bahnkurve: {r(t), ta ≤ t ≤ te }. (5.5.3)
Gleichung (5.5.1) bzw. (5.5.2) bezeichnet man als Parameterdarstellung einer Raum-
kurve; die unabhängige Variable t heißt Parameter. Das Kerngeschäft der Theore-
tischen Mechanik ist die Berechnung der durch Kräfte verursachte Bahn eines Teil-
chens als Funktion der Zeit t, z.B. mit Hilfe der Newtonschen Bewegungsgleichung.
Das ist das Grundproblem der Dynamik von Massenpunkten. Zur analytischen Be-
schreibung der Form einer Raumkurve (das ist Teil der Kinematik von Massen-
punkten), mit der wir uns hier befassen, kann man aber auch andere Parameter
verwenden – insbesondere muss man dazu keine Bewegungsgleichung lösen.

Beispiel: Kreisbahn in der x1 x2 -Ebene, Abbildung 5.9.


1. Parametrisierung durch den Winkel φ.
r(φ) = (R cos φ, R sin φ, 0) 0 ≤ φ ≤ 2π.

2. Parametrisierung durch die Koordinate x1 .


q
r(x1 ) = (x1 , ± R2 − x21 , 0) − R ≤ x1 ≤ R,

wobei das Pluszeichen für die obere, das Minuszeichen für die untere Halbebene
gilt.
3. Parametrisierung durch die Koordinate x2 .
q
r(x2 ) = (± R2 − x22 , x2 , 0) − R ≤ x2 ≤ R,

wobei eine Bemerkung analog zu 2) zu beachten ist.


5.5 Vektorwertige Funktionen, Raumkurven 113

5.5.2 Differentiation und Integration vektorwertiger Funk-


tionen
Wir betrachten hier stetige vektorwertige Funktionen, wobei der Hinweis genügen
soll, dass eine stetige Funktion r(t) einer kontinuierlichen Kurve, d.h. einer Kurve
ohne Sprünge entspricht.

Differentiation:
Eine vektorwertige Funktion r(t) ist differenzierbar, wenn der Limes

d dr(t) r(t + ∆t) − r(t)


r(t) ≡ = lim . (5.5.4)
dt dt ∆t→0 ∆t

unabhängig von der Folge ∆t → 0. Die Ableitung dr(t)/dt ist wieder eine vektor-
wertige Funktion. In der Darstellung (5.5.1) durch t-unabhängige Basisvektoren ist
r(t) stetig und differenzierbar, wenn alle Komponenten xi (t) in (5.5.1) stetig und
differenzierbar sind. In dieser Komponetendarstellung ist die 1. Ableitung

dr(t) dx1 (t) dx2 (t) dx3 (t)


= e1 + e2 + e3 . (5.5.5)
dt dt dt dt
Man überzeugt sich mit Hilfe der Differentiationsregeln für gewöhnliche Funktionen
f (t), dass folgende Differentiationsregeln für Vektorfunktionen a(t), b(t) gelten:

d  da db
a(t) + b(t) = + , (5.5.6)
dt dt  dt  
d  da db
a(t) · b(t) = ·b+a· , (5.5.7)
dt dt dt
   
d  da db
a(t) × b(t) = ×b+a× , (5.5.8)
dt dt dt
d  df da
f (t)a(t) = a + f , (5.5.9)
dt dt dt
d  da df
a f (t) = . (5.5.10)
dt df dt

Die Regeln (5.5.7), (5.5.8) und (5.5.9) sind Produktregeln, (5.5.10) ist die Kettenre-
gel.

Höhere Ableitungen: Wie bei gewöhnlichen Funktionen sind höhere Ableitun-


gen von Vektorfunktionen rekursiv definiert.

dn d dn−1
 
r(t) = r(t) . (5.5.11)
dtn dt dtn−1
114 Einführung in die Theoretische Physik

Beispiel: Wenn r(t) der Ortsvektor eines Teilchens und die Variable t die Zeit ist,
dann sind
dr(t) d2 r(t)
v(t) ≡ ≡ ṙ(t) und a(t) ≡ ≡ r̈(t) (5.5.12)
dt dt2
die Geschwindigkeit und die Beschleunigung des Teilchens zur Zeit t.

Integration:
Nun zur Integration vektorwertiger Funktionen f (t). Wir entwickeln f (t) nach einer
t-unabhängigen Basis:
f (t) = f1 (t)e1 + f2 (t)e2 + f3 (t)e3 .
Definition: Das (unbestimmte oder bestimmte) Riemann-Integral über eine vek-
torwertige Funktion f (t) ist derjenige Vektor, dessen Komponenten die jeweiligen
Integrale über die Komponentenfunktionen sind. Das unbestimmte Integral ist
Z Z Z Z
f (t) dt = e1 f1 (t) dt + e2 f2 (t) dt + e3 f3 (t) dt . (5.5.13)

Seien Fi (t) Stammfunktionen der Funktionen fi (t), dann


Z
f (t) dt = (F1 (t) + c1 )e1 + (F2 (t) + c2 )e2 + (F3 (t) + c3 )e3 . (5.5.14)

Man erhält somit drei voneinander unabhängige Integrationskonstante ci .


Das bestimmte Integral ist
Zt2
f (t) dt = F1 (t)|tt21 e1 + F2 (t)|tt21 e2 + F3 (t)|tt21 e3 . (5.5.15)
t1

Beispiel:
Von einem Teilchen sei seine Beschleunigung a = a(t) als Funktion der Zeit t be-
kannt, und außerdem seine Geschwindigkeit v(0) und sein Ort r(0) zur Zeit t = 0.
Man berechne seine Geschwindigkeit und seine Bahn als Funktionen der Zeit.
Da a(t) = dv(t)/dt, ist
Zt
v(t) = a(t0 )dt0 + v(0) .
0
Die Addition von v(0) auf der rechten Seite sorgt dafür, dass die Geschwindigkeit
bei t = 0 den vorgegebenen vektoriellen Wert annimmt. Da v = dr/dt, erhält man
die Bahn durch Berechnung des Integrals
Zt
r(t) = v(t0 )dt0 + r(0) .
0

Die Länge s(t) der zur Zeit t zurückgelegten Bahn berechnet man mit der Formel
(5.5.19) unten.
5.5 Vektorwertige Funktionen, Raumkurven 115

x2
ta = t0
t1

t2
~r(ta )

t = tN

~r(t)
x1

Abbildung 5.10: Bahnkurve angenähert durch Polygonzug.

5.5.3 Charakteristische Größen einer Kurve


Wir betrachten glatte Kurven und besprechen einige Größen, die eine solche Kurve
charakterisieren. ,,Glatt” heißt, dass die Kurve und ihre 1. Ableitung stetig sind.

Bogenlänge:
Die Bogenlänge s ist die Länge der Raumkurve, die, ausgehend von einem (willkürlich
gewählten) Anfangspunkt Pa , entlang der Kurve gemessen wird. Man wählt eine dis-
∧ ∧
krete Anzahl von Punkten Pn = r(tn ) auf der Kurve, beginnend bei Pa = r(ta ) und

endend bei PN = r(tN ) – siehe Abbildung 5.10. Wir setzen

t − ta
∆t = > 0,
N (5.5.16)
tn = ta + n∆t , n = 0, 1, 2, ..., N.

Die geradlinige Verbindung der Punkte ergibt einen Polygonzug der Länge
N
X −1
LN (ta , t) = |r(tn+1 ) − r(tn )|
n=0
N −1 (5.5.17)
X r(tn+1 ) − r(tn )
= ∆t.
n=0
∆t

Im Limes N → ∞, d.h. ∆t → 0, erhalten wir die Bogenlänge

s(t) = lim LN (ta , t). (5.5.18)


N →∞
∆t→0
116 Einführung in die Theoretische Physik

In diesem Limes geht der Differenzenquotient aus (5.5.17) über in die Ableitung

r(tn+1 ) − r(tn ) ∆t→0 dr
−−−→
∆t dt t=tn

und aus der Summe in (5.5.17) wird ein Riemann-Integral – siehe (2.4.14):
Zt Zt q
dr(t0 ) 0

s(t) = dt = ẋ21 + ẋ22 + ẋ23 dt0 . (5.5.19)
dt0
ta ta

Mit dieser Formel wird die Bogenlänge berechnet.


Die differentielle Änderung der Bogenlänge ist positiv, wie die Differentiation
von (5.5.19) nach t zeigt:
ds(t) dr(t)
= > 0. (5.5.20)
dt dt
Somit ist s(t) eine streng monoton wachsende Funktion und demzufolge umkehrbar,
also eindeutig nach t auflösbar:
s = s(t) ⇒ t = t(s).
Durch Einsetzen in r(t) erhalten wir die Parametrisierung einer Raumkurve durch
die Bogenlänge:
r(t) → r(t(s)) = r(s) . (5.5.21)

Beispiel: Wir betrachten eine ebene Kreisbewegung, siehe das Beispiel auf Sei-
te 112. Die Bewegung soll mit konstanter Winkelgeschwindigkeit erfolgen, d.h. der
Winkel φ in der Parametrisierung 1) auf Seite 112 ist φ = ωt, wobei die Kreisfrequenz
ω konstant ist.
r(t) = (R cos ωt, R sin ωt, 0)
dr
⇒ = (−Rω sin ωt, Rω cos ωt, 0)
dt
dr
⇒ = Rω
dt
Zt
⇒ s(t) = Rωdt0 = Rωt (setze ta = 0)
0
s
⇒ t(s) =

Damit ist die Parametrisierung dieser Kreisbewegung durch die Bogenlänge gegeben
durch  s s 
r(s) = R cos , R sin ,0 .
R R
Nach einem Umlauf muss s/R = 2π sein. Das entspricht der Bogenlänge s = 2πR,
also dem Umfang des Kreises.
5.5 Vektorwertige Funktionen, Raumkurven 117

x2 d~r
dt

∆~r

~r(t)

~r(t + ∆t)

x1

Abbildung 5.11: Der Vektor dr/dt ist parallel zur Tangente im Kurvenpunkt r(t).

Tangenteneinheitsvektor, Bahnkrümmung:
Nun zur geometrischen Bedeutung des Vektors dr/dt. Wir betrachten den Differenz-
vektor – siehe Abbildung 5.11:
∆r = r(t + ∆t) − r(t).
Division durch den Skalar ∆t ergibt den Vektor
∆r ∆t→0 dr
−−−→ .
∆t dt

Der Vektor dr/dt ist parallel zur Tangente im Kurvenpunkt P = r(t). Die Division
dieses Vektors durch seinen Betrag ergibt den Tangenteneinheitsvektor t.
dr/dt
t≡ , |t| = 1. (5.5.22)
|dr/dt|
Wir parametriseren nun r durch die Bogenlänge, r = r(s). Verwendet man das
Resultat (5.5.20) in der Formel (5.5.22), erhält man
dr/dt dr dt dr
t≡ = = . (5.5.23)
ds/dt dt ds ds
Diese Formel liefert den Tangenteneinheitsvektor t als Funktion von s, t = t(s).
Der Vektor t hat per Definition den Betrag 1; er kann aber seine Richtung mit
t bzw. mit s ändern. Diese Richtungsänderung ist ein Maß für die Krümmung der
Bahn. Man definiert deshalb

dt(s)
Krümmung: κ ≡ ,
ds (5.5.24)
−1
Krümmungsradius: ρ ≡ κ .
Wenn die Bahn eine Gerade ist, dann ist κ = 0 und der Krümmungsradius ρ = ∞.
118 Einführung in die Theoretische Physik

Normaleneinheitsvektor:
Nach der obigen Definition von t ist
t(s) · t(s) = 1.
Die Differentiation dieser Gleichung ergibt
dt dt dt
·t+t· =0 ⇒ t· = 0.
ds ds ds
Demzufolge ist der Vektor
dt
N≡ ⊥ t.
ds
Der sog. Normaleneinheitsvektor, auch Hauptnormale oder Krümmungsvektor gen-
nannt (vgl. (5.5.24)) genannt, ist der normierte Vektor N :
dt(s)/ds (5.5.24) 1 dt
n≡ = = n(s). (5.5.25)
|dt/ds| κ ds
Man definiert einen dritten Vektor, die sogenannte Binormale b(s), durch
b ≡ t × n. (5.5.26)
Offensichtlich ist b ⊥ t und b ⊥ n und
π
|b| = |t × n| = |t| |n| sin = 1. (5.5.27)
|{z} |{z} | {z2}
1 1
1

Die drei Einheitsvektoren t(s), n(s), b(s) bilden ein rechtshändiges ONS, das mit
einem Massenpunkt auf seiner Bahnkurve r(s) mitwandert und i.A. ständig seine
Richtung ändert. Man nennt dieses ONS das begleitende Dreibein.

Hinweise:
1. Bei einer ebenen Bewegung ist b ein konstanter Einheitvektor, der immer senk-
recht auf der Bahnebene steht.
2. Ein Maß für eine nichtebene Bewegung ist die sog. Torsion. Die Differentiation
von b nach der Bogenlänge liefert unter Verwendung von db/ds ⊥ b (siehe z.B.
das Lehrbuch von Lang und Pucker, Kapitel 7):
db
= −τ n .
ds
Diese Formel definiert die Torsion oder Windung τ an einen Kurvenpunkt P ,
dem der Wert s entspricht. Sie charakterisiert in der unmittelbaren Umgebung
von P die Abweichung der Kurve von einer ebenen Kurve. Ein Beispiel für eine
Kurve mit τ 6= 0 ist die in einer Übungsaufgabe behandelte Schraubenlinie
(Helix).
3. Bei einer Geraden verschwinden sowohl die Krümmung als auch die Torsion.
5.5 Vektorwertige Funktionen, Raumkurven 119

Anwendung: Geschwindigkeit und Beschleunigung eines Massenpunktes. Die Bahn


eines Massenpunktes ist gegeben durch seinen Ortsvektor r = r(t), t sei die Zeit.
Die Geschwindigkeit v(t) ist stets tangential zur Bahnkurve r(t), denn

dr dr ds (5.5.23) ds
v(t) = = = t. (5.5.28)
dt ds dt dt
Gleichung (5.5.20) besagt, dass ds/dt der Betrag der Geschwindigkeit ist:

ds
v(t) ≡ |v(t)| = . (5.5.29)
dt
Nochmaliges Differenzieren von (5.5.28) nach t ergibt die Beschleunigung a(t):

d2 r dt dt ds
a(t) = 2
= v̇t + v = v̇t + v . (5.5.30)
dt dt ds dt
Unter Verwendung von (5.5.25), (5.5.24) und (5.5.29) erhält man

d2 r v2
a(t) = = v̇t + n. (5.5.31)
dt2 ρ
Man nennt die Komponente längs t die Tangentialbeschleunigung

at ≡ v̇ ,

und die Komponente längs n die Normal- oder Zentripetalbeschleunigung

v2
an ≡ ,
ρ
siehe Abbildung 5.12.

Hinweis: Die Formeln (5.5.29) und (5.5.31) liefern per se natürlich keine Vorher-
sage der Beträge v(t) und v̇(t) der Geschwindigkeit und der Beschleunigung eines
Teilchens, das sich unter dem Einfluß einer Kraft bewegt. Um durch Rechnung her-
auszufinden, ob das Teilchen eine Tangential- und/oder eine Normalbeschleunigung
erfährt, muss man zunächst die Newtonsche Bewegungsgleichung

mr̈(t) = F

lösen, d.h. die Bahn r = r(t) für vorgegebene Anfangsbedingungen r(t0 ) = r 0 und
ṙ(t0 ) = v 0 bestimmen. Dies besprechen wir im Mechanik-Teil der Vorlesung.
120 Einführung in die Theoretische Physik

x2

~b
~t
·
~n v2
ρ

~b
v̇ ·
~n ~t

v2
v̇ ρ
x1

Abbildung 5.12: Tangential- und Normalbeschleunigung v̇ und v 2 /ρ.


Kapitel 6

Matrizen, Determinanten,
Eigenwertproblem

Den Begriffen Matrix und Determinante einer Matrix begegnet man in der Mathe-
matikausbildung in der Regel zum ersten Mal bei der Lösung linearer algebraischer
Gleichungssysteme. Ein solches System lässt sich mit Hilfe einer Matrix in kompak-
ter Form darstellen. Die Determinante dieser Matrix liefert ein Kriterium dafür, ob
das Gleichungssystem lösbar ist.
Wir führen hier Matrizen in einem anderen Kontext ein. Drehungen von Koor-
dinatenystemen im Raum werden durch einen bestimmten Typ von Matrizen be-
schrieben. Dies bietet uns die Möglichkeit zu präzisieren, wie die Begriffe Skalar und
Vektor in der nichtrelativistischen Physik verwendet werden. Danach besprechen
wir die Eigenschaften bestimmter Matrix-Typen und behandeln die Lösung linearer
Gleichungssysteme. Zum Schluss dieses Kapitels behandeln wir das sog. Eigenwert-
problem. Diese Problemstellung tritt in vielen Gebieten der Mathematik und Physik
auf.

6.1 Drehungen eines Koordinatensystems


Euklidischer Raum:
In diesem Abschnitt werden wir die Begriffe Skalar und Vektor prägnanter fassen,
und zwar in Bezug auf das Verhalten dieser Größen unter Koordinatentransforma-
tionen im euklidischen Raum. Wie bereits in Kapitel 5 erwähnt wurde, wird als
dreidimensionaler (allgemeiner, als d-dimensionaler) euklidischer Raum der Vektor-
raum R3 bezeichnet, in dem das Skalarprodukt zweier Vektoren a und b durch

a · b = |a| |b| cos φab . (6.1.1)

definiert ist. Mit diesem Skalarprodukt werden die Regeln der euklidischen Geome-
trie auf algebraische Rechenoperationen im R3 zurückgeführt. Insbesondere erhält
man
122 Einführung in die Theoretische Physik

• a·b=0 ⇔ a ⊥ b,
• der Abstand zwischen zwei Punkten mit Koordinaten (x1 , x2 , x3 ) und (y1 , y2 , y3 )
bezüglich einer ONB ist gegeben durch
p p
d = |x − y| = (x − y) · (x − y) = (x1 − y1 )2 + (x2 − y2 )2 + (x3 − y3 )2 ,

• die Summe der Winkel eines Dreiecks ist immer 180◦ .


Der euklidische Raum ist der adäquate mathematische Raum zur Beschreibung der
Phänomene der nichtrelativistischen Physik. In diesem Kontext muss noch betont
werden, dass in der nichtrelativistischen Physik die Zeit als universeller Parameter,
d.h. als skalare Größe aufgefasst wird. Die Annahme, dass synchronisierte Uhren
die gleiche Zeit bzw. die gleiche Zeitdifferenz für zwei Ereignisse anzeigen, erweist
sich als tragbar, solange die Uhren sich relativ zueinander mit einer Geschwindigkeit
bewegen, die klein gegenüber der Lichtgeschwindigkeit ist. Demzufolge ist beispiels-
weise die Geschwindigkeit v = dr/dt ein Vektor; denn wenn die Zeitdifferenz dt als
Skalar aufzufassen ist, ist der Quotient des Differenzvektors dr und dt wieder ein
Vektor.
Gelegentlich benutzt man das Symbol E3 (allgemein Ed ) für den dreidimensionalen
euklidischen Raum, um herauszustellen, dass der R3 mit dem Skalarprodukt (6.1.1)
versehen wurde.

Drehungen von kartesischen Koordinatensystemen:


In der Physik ist es oft zweckmäßig, ein und denselben Vorgang von verschiedenen
Koordinatensystemen aus zu beschreiben. Ein wichtiger Spezialfall ist der, dass die
beiden Systeme denselben Ursprung haben, aber gegeneinander verdreht sind. Wir
betrachten deshalb zwei Koordinatensysteme K und K 0 mit gemeinsamen Nullpunkt
O, aber voneinander verschiedenen kartesischen ONB {e1 , e2 , e3 } und {e01 , e02 , e03 }.
Ein gegebener Vektor x (Ortsvektor, Geschwindigkeit, etc.) ist dann bezüglich der
Basis von K oder von K 0 darstellbar.
Der Einfachheit halber besprechen wir zunächst den Fall zweier Raumdimensio-
nen, siehe Abbildung 6.1.
x = x1 e1 + x2 e2 = x01 e01 + x02 e02 . (6.1.2)
Unser Ziel ist, den Zusammenhang zwischen den Koordinaten x0i (i = 1, 2) und
xj (j = 1, 2) zu finden. Zunächst bestimmen wir, wie die x0i aus den xj berechnet
werden. Dazu entwickeln wir die Basisvektoren e0i nach den Basisvektoren ej :
e01 = a11 e1 + a12 e2 ,
(6.1.3)
e02 = a21 e1 + a22 e2 .
Durch skalare Multiplikation (d.h. Bilden des Skalarprodukts) der zwei Vektorglei-
chungen in (6.1.3) mit e1 bzw. mit e2 erhalten wir unter Benutzung von ei · ej = δij :
aij = e0i · ej = |e0i | |ej | cos φij = cos φij , i, j = 1, 2. (6.1.4)
6.1 Drehungen eines Koordinatensystems 123

20

x2 ~x

10

φ21
x01
x02
φ22
= φ12
φ
φ11 = φ 1
0 x1

Abbildung 6.1: Drehung eines kartesischen Koordinatensystems in zwei Raumdimen-


sionen.

Wir multiplizieren nun Gl. (6.1.2) skalar mit e01 und benutzen (6.1.4):

x1 e1 · e01 +x2 e2 · e01 = x01 . (6.1.5)


| {z } | {z }
a11 a12

Skalare Multiplikation von (6.1.2) mit e02 ergibt

x1 e1 · e02 +x2 e2 · e02 = x02 . (6.1.6)


| {z } | {z }
a21 a22

Die Gleichungen (6.1.5) und (6.1.6) enthalten das gewünschte Ergebnis:


x01 = a11 x1 + a12 x2 ,
(6.1.7)
x02 = a21 x1 + a22 x2 .
Wir ordnen die 2 · 2 = 4 Zahlen aij in folgendes 2 × 2 Schema. Das Objekt
 
a11 a12
A = (aij ) = . (6.1.8)
a21 a22
ist eine sog. 2 × 2 Matrix. Die reellen Zahlen aij nennt man Matrixelemente von
A. Der erste Index bei aij gibt die Zeile, der zweite Index die Spalte der Matrix A
an, in der die Zahl aij steht.
Die beiden Gleichungen (6.1.7) kann man auch anders darstellen, z.B. durch
2
X
x0i = aij xj i = 1, 2, (6.1.9)
j=1
124 Einführung in die Theoretische Physik

oder in der Spaltenvektorschreibweise,


 0    
x1 a11 a12 x1
= (6.1.10)
x02 a21 a22 x2

oder in kompakter Matrixform durch

x0 = A x, (6.1.11)

wobei x0 und x die Spaltenvektoren gebildet aus den Komponenten des Vektors x
bezüglich der beiden ONB bezeichnen. Wir benutzen hier diese bereits in (5.3.5),
Kapitel 5 eingeführte Notation, um zwischen dem Vektor x und seinen Komponen-
ten x bzw. x0 bezüglich der ONB {ei } bzw.{e0i } explizit zu unterscheiden.
Fazit: Bei einem Wechsel der ONB, die einer Drehung des Koordinatensystems
in zwei Raumdimensionen entspricht, ändern sich die Komponenten des Vektors x
gemäß (6.1.11). Der Vektor x bleibt unverändert.
Die Matrix A in (6.1.11) ist eine 2 × 2 Drehmatrix. Die Eigenschaften dieser Dreh-
matrix und die Umkehrung von (6.1.11) besprechen wir im folgenden Abschnitt.

6.1.1 Eigenschaften einer Drehmatrix


Drehmatrizen in d = 2 Raumdimensionen:
Die Matrixelemente aij der obigen Drehmatrix A sind durch (6.1.3) bzw. (6.1.4)
festgelegt. Aus (6.1.3) folgt:

e01 · e01 = a11 e01 · e1 +a12 e01 · e2 ,


| {z } | {z } | {z }
1 a11 a12

e02· = e02 0
a21 e2 · e1 0
+a22 e2 · e2 .
| {z } | {z } | {z }
1 a21 a22

Somit
1 = a211 + a212 ,
(6.1.12)
1 = a221 + a222 ,
oder kompakt
2
X
a2ij = 1 i = 1, 2. (6.1.13)
j=1

Wir multiplizieren die erste Gleichung in (6.1.3) mit e02 , die zweite Gleichung mit e01
und benutzen, dass e01 ⊥ e02 . Wir erhalten

0 = a11 a21 + a12 a22 ,


(6.1.14)
0 = a21 a11 + a22 a21 .
6.1 Drehungen eines Koordinatensystems 125

Die Gleichungen (6.1.12) bzw. (6.1.13) und (6.1.14) können folgendermaßen zusam-
mengefasst werden:
X2
aik ajk = δij i, j = 1, 2. (6.1.15)
k=1

Dies sind Bedingungsgleichungen für die Matrixelemente einer 2 × 2 Drehmatrix A


kodiert. Weitere Bedingungen, die A charakterisieren, besprechen wir unten.

Explizite Form einer 2 × 2 Drehmatrix: Aus Gleichung (6.1.4) und Abbildung


6.1 erhalten wir (φij = ∠(e0i , ej )):

a11 = cos φ11 = cos φ ,


π 
a12 = cos φ12 = cos − φ = sin φ ,
2 π
a21 = cos φ21 = cos φ + = − sin φ ,
2
a22 = cos φ22 = cos φ .

Somit  
cos φ sin φ
2 × 2 Drehmatrix A = . (6.1.16)
− sin φ cos φ
Man überzeugt sich sofort davon, dass die Matrixelemente in (6.1.16) die Gleichun-
gen (6.1.15) erfüllen.

Drehmatrizen in d = 3 Raumdimensionen:
Die obigen Gleichungen (6.1.2) bis (6.1.15) lassen sich sofort auf d = 3 Dimensionen
(bzw. d > 3) verallgemeinern. Wir betrachten zwei kartesische Koordinatensysteme
K und K 0 , definiert durch die ONB {e1 , e2 , e3 } bzw. {e01 , e02 , e03 } mit demselben
Ursprung. K und K 0 seien gegeneinander im Raum verdreht. Die Entwicklung eines
gegebenen Vektors x nach den beiden ONB ist

x = x1 e1 + x2 e2 + x3 e3 = x01 e01 + x02 e02 + x03 e03 . (6.1.17)

Die Komponenten x0i erhalten wir aus den Komponenten xj durch die Verallgemei-
nerung von Gleichung (6.1.9) auf drei Raumdimensionen:
3
X
x0i = aij xj i = 1, 2, 3, (6.1.18)
j=1

wobei
aij = e0i · ej = cos φij i, j = 1, 2, 3, (6.1.19)
siehe (6.1.4). In Matrixschreibweise

x0 = Ax , (6.1.20)
126 Einführung in die Theoretische Physik

wobei  
a11 a12 a13
A =  a21 a22 a23  . (6.1.21)
a31 a32 a33
Die Matrixelemente aij einer 3 × 3 Drehmatrix A sind durch (6.1.19) festgelegt.
Analog zu (6.1.15) gelten die folgenden 9 Gleichungen (drei dieser Gleichungen sind
redunant):
X3
aik ajk = δij i, j = 1, 2, 3. (6.1.22)
k=1

Eine Drehmatrix, d.h. eine Matrix mit der Eigenschaft (6.1.22) bzw. (6.1.15) bezeich-
net man auch als orthogonale Matrix. Diese Gleichungen besagen folgendes: Setzt
man i = j erhält man ak 2 = 1 für k = 1, 2, 3, d.h. die Länge jedes Zeilenvektors
einer orthogonalen Matrix ist eins. Für i 6= j besagt (6.1.22), dass die drei Zeilen-
vektoren orthogonal sind. Unten werden wir sehen, dass diese beiden Aussagen auch
für die Spaltenvektoren einer orthogonalen Matrix gelten. Drehmatrizen sind spezi-
elle orthogonale Matrizen, die noch die Zusatzbedingung det A = +1 erfüllen, siehe
Punkt 6 auf Seite 136) unten. Diese Bedingung entspricht folgendem Sachverhalt.
Drehungen führen Rechtssysteme (RS) in Rechtsysteme und Linkssysteme (LS) in
Linkssysteme über, aber niemals RS ↔ LS. Um das zu bewerkstelligen, muss man
neben einer Drehung noch eine (allgemein eine ungerade Anzahl von) Spiegelung(en)
an einer (der) Koordinatenebene(n) durchführen. Diese Transformation wird durch
eine orthogonale Matrix mit det A = −1 vermittelt, siehe unten.

Hintereinanderausführen zweier Drehungen:


Wir betrachten einen Vektor x in R3 und drei kartesische Koordinatensysteme K,
K 0 und K 00 mit demselben Urspung, die gegeneinander verdreht sind. Die Transfor-
mation der Koordinaten von x werde vermittelt durch
Drehmatrix A Drehmatrix B
K −−−−−−−−→ K 0 −−−−−−−−→ K 00 .
Frage: Wie hängen die Komponenten von x bezüglich K 00 und bezüglich K zusam-
men?
Aus (6.1.18) erhält man

X3

x0j = ajk xk 



 3
k=1
X
00
3
⇒ xi = bij ajk xk ,
X 
j,k=1
x00i = bij x0j 




j=1

bzw.
3
X 3
X
x00i = cik xk , wobei cik = bij ajk . (6.1.23)
k=1 j=1
6.1 Drehungen eines Koordinatensystems 127

Gleichung (6.1.23) liefert die 3 × 3 Matrix C = (xij ), die die obige Drehung in einem
Schritt vermittelt:
C
K− → K 00 .
Gleichung (6.1.23) ist gerade die Matrix-Multiplikationsregel für das Produkt BA
der beiden Matrizen – siehe Gl. 6.4.1 unten. Somit haben wir in kompakter Schreib-
weise
x00 = C x = BA x. (6.1.24)

Rückdrehung, inverse Drehmatrix:


Die Drehung eines Koodinatensystems K → K 0 werde durch die Matrix A vermit-
telt. Die Matrix, die die Rückdrehung (= inverse Drehung) K 0 → K beschreibt,
nennt man die zu A inverse Matrix und bezeichnet sie mit A−1 .
Drehmatrix A inverse Matrix A−1
K −−−−−−−−→ K 0 −−−−−−−−−−−→ K.

Wir betrachten einen beliebigen Vektor x in R3 . Für seine Koordinaten gilt (a)
x0 = Ax und (b) A−1 x0 = x.
)
(b) eingesetzt in (a) ⇒ x0 = AA−1 x0
⇒ AA−1 = A−1 A = I, (6.1.25)
(a) eingesetzt in (b) ⇒ x = A−1 Ax

wobei  
1 0 0
I = (δij ) =  0 1 0  (6.1.26)
0 0 1
die dreidimensionale Einheitsmatrix ist.
Die Matrixgleichung (6.1.25) definiert allgemein die zu einer Matrix A inverse
Matrix A−1 – falls diese existiert. Wie man sie im allgemeinen Fall berechnet, bespre-
chen wir in den Abschnitten 6.4.2 und 6.5.3. Im vorliegenden Fall einer orthogonalen
Matrix A können die Matrixelemente (A−1 )ij von A−1 leicht berechnet werden.

3
X
AA−1 = I ⇔ aik (A−1 )kj = δij . (6.1.27)
| {z }
k=1 ajk

Die Identität
(A−1 )kj = ajk (6.1.28)
folgt aus dem Vergleich von (6.1.27) mit der die orthogonalen Matrizen charakteri-
sierenden Gleichungen (6.1.22). Das heißt, die Matrixelemente der inversen Drehma-
trix A−1 erhält man durch Vertauschen der Zeilen und Spalten von A. Das Ergebnis
bezeichnet man als die zu A transponierte Matrix AT .
128 Einführung in die Theoretische Physik

2
~x0

~x
~e2

1
~e1

Abbildung 6.2: Drehung eines Vektors x in einem Koordinatensystem.

Die Transponierte einer allgemeinen 3 × 3 (bzw. n × n) Matrix A ist:


   
a11 a12 a13 a11 a21 a31
T
A=  a21 a22 a23  ⇒ A =  a12 a22 a32  , (6.1.29)
a31 a32 a33 a13 a23 a33

d.h. (AT )ij = aji . Im Falle einer orthogonalen Matrix A besagt das Ergebnis (6.1.28),
dass die Inverse einer orthogonalen Matrix A durch A−1 = AT gegeben ist.

Sei A orthogonale 3 × 3 Matrix: Dann A−1 = AT .


(6.1.30)
Somit gilt für diese Matrix: AAT = AT A = I .

Bemerkung: Die Matrixgleichungen (6.1.30) gelten allgemein für orthogonale n×n


Matrizen – man kann sie als Definitionsgleichungen für diese Klasse von Matrizen
auffassen.

6.2 Passive und aktive Transformationen


Im Abschnitt 6.1 hatten wir ein und denselben Vektor x von zwei verschiedenen,
durch eine Rotation verknüpfte Koordinatensysteme K und K 0 aus betrachtet. Wir
fanden, dass die Komponenten von x in K und in K 0 verknüpft sind durch
3
X
x0i = Rij xj , (6.2.1)
j=1

wobei R = (Rij ) die zugehörige Drehmatrix ist. (Im Folgenden bezeichnen wir or-
thogonale Matrizen, insbesondere Drehmatrizen, mit R.) Eine solche Transformation
wird passive Transformation genannt.
6.3 Skalare und Vektoren im euklidischen Raum 129

Die folgende Operation bezeichnet man als aktive Transformation. Wir be-
trachten einen Vektor x in einem durch e1 , e2 , e3 definierten Koordinatensystem
K. Der Vektor x werde nun in K gedreht; das Ergebnis ist der Vektor x0 – siehe
Abbildung 6.2.
Drehung
x −−−−→ x0 .
Die Entwicklung von x und x0 nach der ONB {ei } ergibt

x = x1 e1 + x2 e2 + x3 e3 ,
(6.2.2)
x0 = x01 e1 + x02 e2 + x03 e3 .

Die Koordinaten hängen folgendermaßen zusammen:


3
X
x0i = R̃ij xj , (6.2.3)
j=1

wobei R̃ die orthogonale Matrix ist, die die gewünschte Drehung vermittelt. Die
Transformationsgesetze (6.2.1) und (6.2.3) sind formal identisch, haben aber ver-
schiedene Bedeutungen. In der Physik wendet man sowohl passive als auch aktive
Transformationen an. Eine passive Transformation kommt zum Zuge, wenn man die
Vektoren eines physikalischen Systems bezüglich zweier gegeneinander verdrehter
Koordinatensysteme analysiert. Eine aktive Transformation verknüpft zwei physi-
kalische Systeme, die durch eine Drehung ineinander übergeführt werden können.

6.3 Skalare und Vektoren im euklidischen Raum


Wir können nun den Begriff eines Vektors im euklidischen Raum prägnanter fassen:
Wir betrachten ein kartesisches Koordinatenystem mit der ONB {e1 , e2 , e3 } im R3 .
Definition: Die drei Größen xi (i = 1, 2, 3) bilden die kartesischen Komponenten
eines Dreier-Vektors (= euklidischer Vektor – in der nichtrelativistischen Physik
einfach Vektor genannt), wenn sie bei einer Drehung des KS transformieren wie
3
X
x0i = Rij xj . (6.3.1)
j=1

Diese Definition bezieht sich nicht nur auf passive, sondern auch auf aktive Trans-
formationen; R ist die zugehörige Drehmatrix.
Das Transformationsgesetz gilt offensichtlich für die kartesischen Komponenten
der uns bereits bekannten Vektoren , z.B. für die Komponenten

(x1 , x2 , x3 ) eines Ortsvektors x,


(v1 , v2 , v3 ) eines Geschwindigkeitsvektors v,
(F1 , F2 , F3 ) eines Kraftvektors F .
130 Einführung in die Theoretische Physik

Beliebige, zu einem dreikomponentigen Objekt zusammengefasste Größen, z.B. (x1 , x2 , |x|)


oder drei Abfahrtszeiten (t1 , t2 , t3 ) eines Zuges bilden offensichtlich keinen Vektor.
Definition: Ein Skalar (= Dreier-Skalar = euklidischer Skalar) ist eine Größe, die
sich bei Drehungen des Koordinatensystems nicht ändert.

Beispiele:
• Masse, Temperatur, Zeit.
• Das Skalarprodukt a · b von zwei Vektoren a, b.
• Der Abstand |x − y| zweier Vektoren x, y.
Die beiden letztgenannten Aussagen zeigen wir in einer Übungsaufgabe.

Dreier-Tensoren: Der Vollständigkeit halber gehen wir hier noch auf den Begriff
des Dreier-Tensors (oder euklidischen Tensors) ein. Sie benötigen Objekte dieser Art
aber erst in der Vorlesung Theoretische Physik I im Kapitel über Starre Körper.
Definition: Ein Dreier-Tensor 2. Stufe ist ein Objekt T = (tij ) (i, j = 1, 2, 3)
bestehend aus 3×3 = 9 Komponenten, das sich bei einer Drehung eines kartesischen
Koordinatensystems wie folgt transformiert:
3
X
t0ij = Rik Rjl tkl . (6.3.2)
k,l=1

Beispiele:
• Seien x1 , x2 , x3 die Komponenten eines Dreier-Vektors, d.h. sie transformieren
unter orthogonalen Transformationen wie (6.3.1). Dann transformiert sich das
9-komponentige Objekt (xi xj ) wie (6.3.2) und ist somit ein Dreier-Tensor 2.
Stufe.
• Das in (5.4.7), Kapitel 5 definierte Kronecker-Delta-Symbol transformiert wie
ein Dreier-Tensor 2. Stufe - und zwar ist dieses Objekt invariant unter ortho-
gonalen Transformationen. Wir wenden das Transformationsgesetz (6.3.2) auf
δkl = ek · el an und erhalten
3 3
X X (6.1.27)
δij0 = Rik Rjl δkl = Rik Rjk = δij . (6.3.3)
k,l=1 k=1

Definition: Ein Dreier-Tensor n-ter Stufe ist ein 3n -komponentiges Objekt (ti1 ,i2 ,...,in ),
das sich bei einer Drehung eines kartesischen Koordinatensystems wie folgt trans-
formiert:
3
X
t0i1 ...in = Ri1 k1 . . . Rin kn tk1 ...kn . (6.3.4)
k1 ,...,kn =1
6.4 Rechenregeln für Matrizen 131

Merkregel: Bei einem Tensor n-ter Stufe (ti1 i2 ...in ) transformiert sich jeder Index il
wie ein Vektorindex. In der Tensor-Terminologie ist ein Vektor (präziser: die Kom-
ponenten eines Vektors) ein Tensor 1. Stufe und ein Skalar ein Tensor 0. Stufe.
Dreier-Skalare und -Vektoren bzw. allgemein Dreier-Tensoren n-ter Stufe sind somit
durch ihr Transformationsverhalten unter räumlichen Drehungen, bzw. etwas allge-
meiner, unter orthogonalen Transformationen im dreidimensionalen Raum definiert.
Die definierenden Transformationsgesetze (6.3.1), (6.3.2) bzw. allgemein (6.3.4) be-
sagen, dass das transformierte Objekt zwar i.A. verschieden vom Ausgangsobjekt
ist, aber in jedem Fall die gleiche Form hat. Man sagt, Dreier-Tensoren n-ter Stu-
fe transformieren sich kovariant (= forminvariant) unter räumlichen Drehungen.
Skalare, also Tensoren 0. Stufe sind nicht nur kovariant, sondern invariant unter
diesen Transformationen. Das Kronecker-Delta ist ein invarianter Tensor 2. Stufe.
Ein weiterer invarianter Tensor ist das -Symbol, siehe unten.
Die Begriffe Dreier-Skalar und -Vektor bzw. Dreier-Tensor dienen vor allem da-
zu, diese Objekte von sog. Vierer-Skalaren, Vierer-Vektoren bzw. Vierer-Tensoren
zu unterscheiden. Das sind Objekte, die durch ihr Verhalten bezüglich Lorentz-
Transformationen definiert sind. Diese Transformationen werden im Rahmen der
Vorlesungen über Theoretische Physik erst am Ende der Vorlesung Theoretische
Physik I im Kapitel über Spezielle Relativitätstheorie besprochen. In der nichtrelati-
vistischen Physik bezeichnet man Dreier-Skalare und -Vektoren einfach als Skalare
bzw. Vektoren.

Zum Schluss dieses Abschnitts noch eine Bemerkung zum -Symbol (5.4.26) aus
Kapitel 5, das auch total antisymmetrischer -Tensor 3. Stufe genannt wird. Diese
Bezeichnung rührt daher, dass sich dieses Objekt unter orthogonalen Transforma-
tionen folgendermaßen transformiert:

3
X
0i1 i2 i3 = Ri1 k1 Ri2 k2 Ri3 k3 k1 k2 k3 = (det R) i1 i2 i3 . (6.3.5)
k1 ,k2 ,k3 =1

Dies wird in einer Übungsaufgabe bewiesen. Gl. (6.3.5) besagt, dass der -Tensor
unter räumlichen Drehungen (det R = +1) invariant ist, aber bei orthogonalen
Transformationen mit det R = −1 sein Vorzeichen wechselt.

6.4 Rechenregeln für Matrizen


Seien A, B zwei m × n Matrizen, d.h. Matrizen mit m Zeilen und n Spalten.

A=B ⇔ aij = bij ∀i, j .

Die Matrixelemente einer Matrix können reelle oder komplexe Zahlen sein. Wir
betrachten hier in der Regel nur reelle Matrizen.
132 Einführung in die Theoretische Physik

6.4.1 Spezielle Matrizen


1. Nullmatrix 0: Alle Elemente sind null.
2. Eine symmetrische Matrix ist eine n × n Matrix mit aij = aji , d.h. A = AT .
3. Einheitsmatrix:  
1 0
 1 
I = (δij ) =  .
 
 ... 
0 1
4. Diagonalmatrix:
 
d1 0
 d2 
D = (di δij ) =  .
 
..
 . 
0 dn
Um Platz zu sparen, benutzt man für Diagonalmatrizen auch die Darstellung
D = diag(d1 , . . . , dn ) .

5. Die transponierte Matrix AT einer m × n Matrix A = (aij ) erhält man


durch Vertauschen der Zeilen und Spalten von A.
 
a11 a21 · · · am1
AT = ((AT )ij ) =  ... .. ..
.
 
. .
a1n a2n · · · amn
AT ist eine n × m Matrix.
6. Eine orthogonale Matrix R ist eine n × n Matrix mit den Eigenschaften
(6.1.30).
7. Eine Drehmatrix R ist eine orthogonale Matrix mit der zusätzlichen Eigen-
schaft det R = +1 – siehe Abschnitt 6.5.
 
a1
8. Der Spaltenvektor  ...  ist eine n × 1 Matrix.
 
an
9. Der Zeilenvektor (a1 , a2 , ..., an ) ist eine 1 × n Matrix. Bei pedantischer An-
wendung der Transpositionsregel ist
 T
a1
(a1 , a2 , ..., an ) =  ...  .
 
an
Die Transposition eines Zeilenvektors ergibt einen Spaltenvektor.
6.4 Rechenregeln für Matrizen 133

Spalte k

k
 
 
ai1 · b1k
   
   
a a(i−1)2 a(i−1)3 ...   
 (i−1)1   +ai2 · b2k   
 ai1 ai2 ai3 ...
     
Zeile i  
+ai3 · b3k 
=

cik

    i 
a(i+1)1 a(i+1)2 a(i+1)3 ...
     
    
.. ..
     
   



 . .  

A B C

Abbildung 6.3: Multiplikation AB = C zweier Matrizen A, B. Man multipliziert


den i-ten Zeilenvektor der Matrix A skalar mit dem k-ten Spaltenvektor der Matrix
B. Dies ergibt das Element cik der Matrix C.

6.4.2 Rechenregeln
1. C = A + B ist definiert durch cij = aij + bij ∀i, j.

2. λA ≡ (λaij ), wobei λ eine reelle oder komplexe Zahl ist. Jedes Matrixelement
wird mit λ multipliziert.

3. Matrixmultiplikation: Es sei A eine m × n Matrix und B eine n × r Matrix.


Die Matrixelemente cik der Produktmatrix C = AB = (cik ) erhält man gemäß
3
X
cik = aij bjk = ai1 b1k + ai2 b2k + ... + ain bnk , (6.4.1)
j=1

siehe Abbildung 6.3. Die Matrix C ist eine m × r Matrix.


Beachte: Im Allgemeinen ist AB 6= BA.

4. Die Transponierte eines Matrixprodukts AB ist

(AB)T = B T AT . (6.4.2)

Zum Beweis dieser Matrixgleichung transponiert man einerseits die Produkt-


matrix AB durch Vertauschen i ↔ j der Zeilen- und Spaltenindizes in (6.4.2)
und man berechnet andererseits das Matrixprodukt B T AT gemäß der obigen
Multiplikationsregel.

Inverse Matrix
Für quadratische, also n × n Matrizen A kann man sich fragen, ob die zu A inverse
Matrix A−1 existiert. Diese Matrix muss, wie bereits oben erwähnt, die folgenden
Matrixgleichungen erfüllen:
AA−1 = A−1 A = I. (6.4.3)
134 Einführung in die Theoretische Physik

Für eine spezielle Klasse von quadratischen Matrizen, den Drehmatrizen R, ha-
ben wir bereits gesehen, dass R−1 existiert; und zwar ist R−1 = RT , siehe (6.1.30).
Wir fragen hier i) nach dem Kriterium für die Existenz der Inversen A−1 einer all-
gemeinen quadratischen Matrix und ii) danach, wie man A−1 berechnet.
Die Matrix A−1 hat n2 Matrixelemente. Gl. (6.4.3) ist in der Tat ein lineares Glei-
chungssystem bestehend aus n2 Gleichungen für diese n2 unbekannten Matrixele-
mente. Die Lösung eines solchen Gleichungssystems ist für n > 2 ohne ein systema-
tisches Verfahren sehr mühevoll. Bei der systematischen Lösungsmethode, die unten
besprochen wird, tritt eine neue mathematische Größe auf, die sog. Determinante
einer Matrix A, die wir im nächsten Abschnitt behandeln. Wir werden sehen, dass
i) der Wert der Determinante von A darüber entscheidet, ob A−1 existiert, ii) dass
bei der Berechnung dieser Matrix ebenfalls diese Determinante auftritt.

6.5 Determinanten
Den Begriff der Determinante einer quadratischen Matrix kennen Sie vermutlich
schon aus der Schule; er tritt bei der Lösung von linearen Gleichungssystemen auf
(siehe unten).
Sei A eine n × n Matrix. Die Determinante von A ist eine Zahl, die die Matrix
A kennzeichnet. Wir definieren sie hier durch folgende rekursive Vorschrift:



a11 · · · a1n


.. ..
det A ≡ |A| = = a11 M11 − a12 M12 + a13 M13 − ... + (−1)n+1 a1n M1n .

. .
an1 · · · ann
(6.5.1)
Dabei sind die Mkl die sogenannten Unterdeterminanten der Untermatrizen A(kl) . 1

Die Matrix A(kl) erhält man aus der Matrix A durch Streichen der Zeile k und der
Spalte l. Das ergibt eine (n − 1) × (n − 1) Matrix. Mkl bezeichnet die Determinante
dieser Matrix A(kl) .
Die Formel (6.5.1) ist rekursiv. Sie führt eine Determinante n-ten Grades auf eine
Summe von Determinanten (n − 1)-ten Grades zurück, usw., solange bis man bei
1 × 1 Matrizen angelangt ist, deren Determinante durch das jeweilige Matrixelement
gegeben ist.
Vorsicht: Verwechseln Sie die Notation |A| nicht mit dem Betragszeichen. Wenn A
eine reelle Matrix ist, dann ist det A eine reelle Zahl, diese kann größer, kleiner oder
gleich Null sein.
Wir machen uns die Formel (6.5.1) für 2 × 2 und 3 × 3 Matrizen klar.

1
Der Doppelindex (kl) ist hier ein Zählindex – nicht zu verwechseln mit dem Doppelindex für
die Matrixelemente einer Matrix.
6.5 Determinanten 135

Determinante einer 2 × 2 Matrix A:


Wir wenden die obige Berechnungsvorschrift an und erhalten

a11 a12
det A ≡
= a11 a22 − a12 a21 . (6.5.2)
a21 a22
Als Merkregel zur Berechnung der Determiante einer 2 × 2 Matrix erhalten wir:
det A ist das Produkt der beiden Hauptdiagonalemelemente minus dem Produkt
der beiden Nebendiagonalelemente.

Determinante einer 3 × 3 Matrix A:


Die Anwendung der obigen Berechnungsvorschrift ergibt:


a11 a12 a13


a11 a12 a13


a11 a12 a13


a11 a12 a13

det A ≡ a21 a22 a23 = a11 a21 a22 a23 − a12 a21 a22 a23 + a13 a21 a22 a23


a31 a32 a33 a31 a32 a33 a31 a32 a33 a31 a32 a33


a22 a23 a21 a23 a21 a22
= a11

− a12

+ a13

a32 a33 a31 a33 a31 a32

= a11 a22 a33 − a11 a23 a32 − a12 a21 a33 + a12 a23 a31 + a13 a21 a32 − a13 a22 a31
(6.5.3)

Merkregel (Sarrus-Regel):

a11 a12 a13 a11 a12 a13 a11 a12






a21 a22 a23 ⇐⇒ a21 a22 a23 a21 a22



a31 a32 a33 a31 a32 a33 a31 a32


(−) (−) (−) (+) (+) (+)


Dieses einfache Schema funktioniert nicht mehr für höherdimensionale Matrizen;
man muss (6.5.1) oder (6.5.5) anwenden.

Darstellung mit Hilfe des -Symbols: Unter Benutzung der Werte des total
antisymmetrischen -Symbols aus Kapitel 5 sieht man sofort, dass die Determinante
(6.5.3) einer 3 × 3 Matrix auch folgendermaßen dargestellt werden kann:
3
X 3
X
det A = ijk ai1 aj2 ak3 = ijk a1i a2j a3k . (6.5.4)
i,j,k=1 i,j,k=1

Diese Relationen zeigt man durch explizites Ausschreiben und Vergleich mit (6.5.3).
Die zweite Gleichung belegt am Beispiel einer 3 × 3 Matrix, dass det A = det(AT ),
siehe unten.
Ausgehend von dieser Darstellung kann man die oben erwähnte Relation (6.3.5)
beweisen.
136 Einführung in die Theoretische Physik

6.5.1 Einige Rechenregeln für Determinanten


Die folgenden Rechenregeln gelten für Determinanten beliebiger n×n Matrizen. Wir
beweisen sie hier nicht für den allgemeinen Fall – man kann die folgenden Regeln
allerdings anhand der obigen Berechnungsvorschrift bzw. Merkregeln sofort für die
Fälle n = 2 und n = 3 nachprüfen. Tun Sie das zu Hause!

1. Die Vertauschung zweier benachbarter Zeilen (zweier benachbarter Spalten)


ändert das Vorzeichen der Determinante.

2. det(αA) = αn det A, wobei α eine Zahl ist.

3. Sei D = (di δij ) eine n × n Diagonalmatrix. Dann ist

det D = d1 · d2 · · · dn .

Insbesondere ist
det I = 1.

4. det(AT ) = det A.

5. Multiplikationsgesetz:

det(AB) = det A · det B .

6. Sei R eine orthogonale Matrix, d.h. es gilt RT R = I. Dann ist

det(RT R) = det RT det R = (det R)2 = 1.

Somit
det R = ±1.
Drehmatrizen sind definiert durch die Zusatzbedingung det R = +1. Beschreibt
R eine Spiegelung an einer Koordinatenebene oder die Spiegelung am Ursprung
eines dreidimensionalen Koordinatensystems, dann ist det R = −1.

Weitere nützliche Rechenregeln lernen Sie in der Vorlesung über Höhere Mathematik.

6.5.2 Entwicklungssatz
Die Berechnungsvorschrift (6.5.1) kann man verallgemeinern. Anstelle nach Zeile 1
kann man nach einer beliebigen Zeile i entwickeln. Es gilt

det A = (−1)i−1 ai1 Mi1 − ai2 Mi2 + ... + (−1)n+1 ain Min

n
X (6.5.5)
= (−1)i+j Mij aij .
j=1
6.5 Determinanten 137

Beweis: Wenn i = 1, dann ist (6.5.5) identisch mit (6.5.1). Wenn i > 1, dann
vertauschen wir die i-te Zeile mit der (i − 1)-ten, usw., solange bis die i-te Zeile zur
ersten Zeile geworden ist und wenden dann (6.5.1) an. Die Vertauschungen erzeugen
nach der Rechenregel 1 jedesmal einen Faktor (−1), also erhält man insgesamt den
Faktor (−1)i−1 .

6.5.3 Anwendungen
Zunächst zwei simple, aber nützliche Anwendungen.

Vektorprodukt:
Das Vektorprodukt
a × b = e1 (a2 b3 − a3 b2 ) + e2 (a3 b1 − b3 a1 ) + e3 (a1 b2 − a2 b1 ). (6.5.6)
kann als Determinante dargestellt werden.

e1 e2 e3

a × b = a1 a2 a3 . (6.5.7)
b1 b2 b3

Man prüft das sofort z.B. mit Hilfe der o.g. Sarrus-Regel nach.

Spatprodukt:
Das Spatprodukt kann ebenfalls als Determinante geschrieben werden:

a1 a2 a3 a1 b1 c1

a · (b × c) = b1 b2 b3 = a2 b2 c2 . (6.5.8)
c1 c2 c3 a3 b3 c3

Hier sind, wie üblich, die ai , bi , ci die Komponenten der jeweiligen Vektoren bezüglich
einer ONB. Die erste Gleichung ergibt sich sofort aus der Darstellung von b×c durch
(6.5.6) bzw. (6.5.7) oder durch direktes Ausrechnen. Das zweite Gleichheitszeichen
folgt aus det A = det(AT ).
Gleichung (6.5.8) impliziert einen wichtigen Sachverhalt: Wir wissen, dass
a · (b × c) = 0, wenn z.B. zwei der drei Vektoren kollinear sind oder allgemeiner,
wenn die drei Vektoren in einer Ebene liegen (man sagt, die drei Vektoren sind
koplanar), also linear abhängig sind. Aus der Darstellung (6.5.8) folgt somit, dass
die Determinante einer 3 × 3 Matrix A gleich null ist,
det A = 0, (6.5.9)
wenn ein Zeilenvektor (Spaltenvektor) ein Vielfaches eines anderen Zeilenvektors
(Spaltenvektors) ist, oder wenn er eine Linearkombination der beiden anderen Zei-
lenvektoren (Spaltenvektoren) ist.
Diese Aussagen gelten auch für n × n Matrizen A.
138 Einführung in die Theoretische Physik

Die zu einer n × n Matrix A inverse Matrix A−1 :


Die Inverse einer quadratischen Matrix ist definiert durch (siehe (6.4.3)):

AA−1 = A−1 A = I.

Zunächst müssen wir uns fragen, unter welcher Bedingung A−1 existiert. Dazu be-
rechnen wir die Determinante der Matrizen auf der linken und rechten Seite dieser
Definitionsgleichung:

1 = det I = det(AA−1 ) = det A det(A−1 )


1
⇒ det(A−1 ) = .
det A
Somit erhalten wir folgende Aussage:

A−1 existiert genau dann, wenn det A 6= 0. (6.5.10)

Die Matrixelemente von A−1 sind durch folgende Formel gegeben (ohne Beweis):

(−1)i+j
(A−1 )ij = Mji . (6.5.11)
det A
Die Mji sind die unterhalb von (6.5.1) definierten Unterdeterminanten. Beachten
Sie die Anordnung der Indizes auf der linken und rechten Seite von (6.5.11)! Einen
Beweis dieser Formel findet man z.B. in den zitierten Büchern von Großmann und
Nolting.

Beispiel:  
1 4
A= ⇒ det A = −18.
5 2
Die Anwendung der Formel (6.5.11) ergibt für die Matrixelemente von A−1 :

1 2

−1 2
(A )11 = − (−1) M11 = −  
18 18 

1 4


−1 3
(A )12 = − (−1) M21 = + 


18 18 ⇒ A−1 A = AA−1 = I.
1 5
(A−1 )21 = − (−1)3 M12 = +  
18 18 


−1 1 4 1 

(A )22 = − (−1) M22 = − 

18 18

Lineare Gleichungssysteme:
Wir betrachten hier nur den Fall n linearer Gleichungen mit n Unbekannten.
6.5 Determinanten 139

a) Inhomogenes Gleichungssystem:

a11 x1 + · · · + a1n xn = b1
.. .. .. (6.5.12)
. . .
an1 x1 + · · · + ann xn = bn ,

wobei die aij , bk gegeben und die xl gesucht sind. Eine kompakte Schreibweise
von (6.5.12) ist
Ax = b. (6.5.13)

Frage: Wann ist (6.5.12) bzw. (6.5.13) lösbar?


Antwort: Wenn det A 6= 0, dann gibt es eine eindeutige Lösung x.

Beweis: Wenn det A 6= 0, dann existiert die zu A inverse Matrix A−1 . Multi-
pliziere die Matrixgleichung (6.5.13) von links mit A−1 .

−1 −1
|A{zA} x = A b
I
⇒ x = A−1 b. (6.5.14)

Das ist die gesuchte Lösung, die offensichtlich eindeutig ist.


Den Lösungsvektor x erhält man gemäß (6.5.14) durch Berechnung von A−1 .
Schneller zum Ziel kommt man in der Regel durch Anwendung der sog. Cra-
merschen Regel. Diese Regel besagt, dass

det Ai
xi = , i = 1, 2, ..., n. (6.5.15)
det A

Die Matrix Ai erhält man durch Ersetzung des i-ten Spaltenvektors von A
durch b, d.h.
 
a11 · · · a1(i−1) b1 a1(i+1) · · · a1n
Ai =  ... .. .. .. ..  .

. . . . 
an1 · · · an(i−1) bn an(i+1) · · · ann

Eine Herleitung von (6.5.15) findet man z.B. im zitierten Buch von Nolting.

Beispiel: Wir betrachten das Gleichungssystem

x1 + x2 + x3 = 2,
3x1 + 2x2 + x3 = 4,
5x1 − 3x2 + x3 = 0.
140 Einführung in die Theoretische Physik

Die Matrizen A, Ai , bzw. ihre Determinanten sind


   
1 1 1 2 1 1
A= 3 2 1  A1 =  4 2 1 
5 −3 1 0 −3 1
⇒ det A = −12 ⇒ det A1 = −6

   
1 2 1 1 1 2
A2 =  3 4 1  A3 =  3 2 4 
5 0 1 5 −3 0
⇒ det A2 = −12 ⇒ det A3 = −6.

Die Cramersche Regel liefert


det A1 1 det A2 det A3 1
x1 = = , x2 = = 1, x3 = = .
det A 2 det A det A 2
Dies ist die Lösung des obigen Gleichungssystems.

Hinweis: Wenn bei einem inhomogenen Gleichungsssystem det A = 0, dann


ist das Gleichungssystem entweder widersprüchlich, d.h. es existiert keine Lösung,
oder es existiert keine eindeutige Lösung, sondern eine Lösungsmenge – d.h.
eine Gerade oder eine Ebene oder im Falle n > 3 eine Hyperebene.
Betrachten wir als Beispiel ein inhomogenes Gleichungssystem von drei Glei-
chungen mit drei Unbekannten.

• Beispielsweise seien zwei der drei Gleichungen von Ax = b:

x1 + x2 + x3 = 2, 3x1 + 3x2 + 3x3 = 9 .

Diese beiden Gleichungen beschreiben zwei parallele Ebenen. Offensicht-


lich kann kein Punkt x gefunden werden, der gleichzeitig auf beiden Ebe-
nen liegt; d.h. das Gleichungssystem Ax = b hat keine Lösung.
• Wenn det A = 0, können die drei Gleichungen aber auch dergestalt sein,
dass sich als Schnittmenge eine Gerade oder eine Ebene ergibt.

Details dazu in der Vorlesung Höhere Mathematik.

b) Homogenes Gleichungssystem:

Ax = 0. (6.5.16)

Dieses System hat immer die triviale Lösung

x1 = x2 = ... = xn = 0. (6.5.17)
6.6 Eigenwerte, Eigenvektoren, Diagonalisierung reell-symm. Matrizen 141

Frage: Hat (6.5.16) nichttriviale Lösungen? Antwort:


Ja, wenn det A = 0. (6.5.18)
Diese Bedingung muss offensichtlich erfüllt sein; denn im Falle von det A 6= 0
folgt aus (6.5.14), dass (6.5.16) die eindeutige Lösung x = 0 hat. Wenn det A =
0, erhält man als Lösung von (6.5.16) eine Lösungsmenge – im Falle von n = 3
ist das eine Gerade oder eine Ebene, die durch x = 0 gehen.
Zur systematischen Diskussion der Lösung von (6.5.13) und von (6.5.16) benötigt
man noch den Begriff des Rangs einer Matrix. Wir können hier aus Zeit-
gründen nicht darauf eingehen, siehe dazu die Vorlesung Höhere Mathematik.
Wir benötigen im Folgenden nur die Aussage (6.5.18).
Beispiel: Wir betrachten folgendes homogene Gleichungssystem:
  
2x1 + x2 = 0 2 1 x1
⇔ = 0.
6x1 + 3x2 = 0 6 3 x2
| {z }
A
Es ist det A = 0. Deshalb hat das Gleichungssystem nichttriviale Lösungen,
nämlich die Menge aller Punkte {x1 , x2 }, die die Gleichung
x2 = −2x1
erfüllen. Das ist die Gleichung einer Geraden durch den Ursprung.

6.6 Eigenwerte, Eigenvektoren, Diagonalisierung


reell-symmetrischer Matrizen
Die folgende mathematische Problemstellung und ihre Lösung wird in vielen Ge-
bieten der Mathematik und der (theoretischen) Physik benötigt. Sie wird Ihnen
spätestens in der Vorlesung Theoretische Physik I: Mechanik bei der Behandlung
des sog. Trägheitstensors starrer Körper begegnen2 .
Problemstellung: Gegeben sei eine quadratische n × n Matrix A. Frage: Gibt es
Spaltenvektoren v 6= 0, so dass die Anwendung von A auf v diesen Vektor bis auf
eine Zahl λ reproduziert?
Av = λv. (6.6.1)
Wenn ja, nennt man λ einen Eigenwert und v den zugehörigen Eigenvektor von A.
Im Folgenden beschränken wir uns auf reelle symmetrische Matrizen A:
A = (aij ) , aij = aji ∈ R, d.h. A = AT . (6.6.2)
Konkrete Rechnungen führen wir nur für reell-symmetrische 2×2 und 3×3 Matrizen
durch – nur für solche Matrizen müssen wir das Problem (6.6.1) in der Mechanik-
Vorlesung behandeln. Mit dieser Einschränkung wird die obige Fragestellung als
Eigenwertproblem für reell-symmetrische Matrizen bezeichnet.
2
Eine Anwendung des Eigenwertproblems besprechen wir in Kapitel 7.3.2, eine andere in einer
Übungsaufgabe zur Berechnung eines bestimmten Typs von n-dimensionalen Integralen.
142 Einführung in die Theoretische Physik

Notation: Wir benutzen hier, d.h. in (6.6.1) und im Folgenden das Symbol v
anstelle von v, um Spaltenvektoren zu kennzeichnen – sonst werden die Formeln
ziemlich hässlich. Somit
 
v1
v =  v2  Spaltenvektor,
v3
v T = (v1 , v2 , v3 ) Zeilenvektor.
Zur Kennzeichnung des Skalarprodukts empfiehlt es sich hier, die Matrixnotation
pedantisch anzuwenden:
 
w1 X3
T
v
| {zw} = (v1 , v2 , v3 )  w2  = vi wi = v · w.
Zeilenvektor × w3 i=1
Spaltenvektor

Auf der rechten Seite steht die übliche Skalarproduktnotation.

Die Lösung des oben formulierten Eigenwertproblems erfolgt in zwei Schritten:


1) Berechnung der Eigenwerte von A und 2) die Berechnung des (der) zu einem
Eigenwert gehörigen Eigenvektors (Eigenvektoren).
In einem dritten Schritt kann mit den Eigenvektoren von A eine orthogonale Ma-
trix R konstruiert werden, mit deren Hilfe A auf eine Diagonalmatrix transformiert
werden kann. Dies bezeichnet man als Hauptachsentransformation.

6.6.1 Berechnung der Eigenwerte


Wir bringen die Matrixgleichung (6.6.1) in die Form eines homogenen Gleichungs-
systems:
(A − Iλ)v = 0. (6.6.3)
Die Bestimmung der Eigenwerte und Eigenvektoren von A läuft somit auf die Be-
antwortung folgender Frage hinaus: Für welche λi gibt es eine nichttriviale Lösung
bzw. Lösungen v von (6.6.3)? Gemäß (6.5.18) existieren solche Lösungen nur, wenn
det(A − Iλ) = 0 . (6.6.4)
Für 2 × 2 Matrizen ergibt das eine Gleichung 2. Grades, für 3 × 3 Matrizen eine
Gleichung 3. Grades, etc. Man bezeichnet
P (λ) ≡ det(A − Iλ) (6.6.5)
als das charakteristische Polynom der Matrix A. Gesucht sind somit die Null-
stellen dieses Polynoms – das sind die Eigenwerte von A.

Satz (ohne Beweis): Für reell-symmetrische n × n Matrizen A hat die Gleichung


(6.6.4) immer n reelle Lösungen λi , wobei eine k-fache Nullstelle von P (λ) wie
üblich k-fach gezählt wird3 .
3
Bei reellen nichtsymmetrischen Matrizen treten i.A. auch komplexe Eigenwerte auf.
6.6 Eigenwerte, Eigenvektoren, Diagonalisierung reell-symm. Matrizen 143

Beispiele:

1.
 
10 −3
A=
−3 2
 
10 − λ −3
⇒ det(A − λI) = det = λ2 − 12λ + 11.
−3 2−λ

Das charakteristische Polynom hat die Nullstellen λ1 = 1, λ2 = 11.

2.  
a 0
A= Diagonalmatrix
0 b
Es ist det(A − λI) = (a − λ)(b − λ). D.h. die Diagonalelemente einer Dia-
gonalmatrix sind identisch mit ihren Eigenwerten; in diesem Beispiel λ1 = a,
λ2 = b.

3. Wenn das charakteristische Polynom einer 2 × 2 Matrix A eine doppelte Null-


stelle hat, λ1 = λ2 = λ, dann muss A von der Form
 
λ 0
A=
0 λ

sein, siehe Seite 147 unten.

Bei reell-symmetrischen 3 × 3 Matrizen A ist das charakteristische Polynom det(A −


λI) ein Polynom 3. Grades, das drei reelle Nullstellen λ1 , λ2 , λ3 hat. Es können drei
Fälle auftreten:

1. λ1 6= λ2 6= λ3 6= λ1 .

2. Es gibt eine doppelte Nullstelle, d.h. zwei Eigenwerte sind gleich

3. λ1 = λ2 = λ3 = λ. In diesem Fall muss A von der Form


 
λ 0 0
A=  0 λ 0 
0 0 λ

sein, siehe Seite 147 unten.

Bei der Berechnung der Eigenvektoren einer reell-symmetrischen 3 × 3 Matrix A


müssen diese drei Fälle unterschieden werden.
144 Einführung in die Theoretische Physik

6.6.2 Berechnung der Eigenvektoren


Nach der Bestimmung der Eigenwerte λi von A werden im zweiten Schritt die zu-
gehörigen Eigenvektoren berechnet. Zunächst einige allgemeine Aussagen.
1) Wenn v ein Eigenvektor von A zum Eigenwert λ ist, dann ist auch cv mit
c ∈ R Eigenvektor4 von A zum selben Eigenwert, denn

A(cv) = cAv = cλv = λ(cv) c ∈ R, c 6= 0. (6.6.6)

Somit ist ein Eigenvektor nur bis auf einen Faktor eindeutig definiert. Deswe-
gen ist es sinnvoll, v auf Eins zu normieren, |v| = 1. Im Folgenden bezeichnen
die v i normierte Eigenvektoren,

|v i | = 1. (6.6.7)

2) Seien v i 6= v j zwei Eigenvektoren von A zu den Eigenwerten λi bzw. λj , d.h.


diese Vektoren erfüllen die Matrixgleichungen

Av j = λj v j . (6.6.8)

Wir multiplizieren diese Gleichung von links mit v Ti und benutzen, dass nach
Voraussetzung AT = A. Die linke Seite von (6.6.8) geht über in
Regel 4
v Ti Av j = AT v i )T v j = (λi v Ti )v j = λi v i · v j .
(|{z} (6.6.9)
S. 133
A

Die rechte Seite von (6.6.8) geht über in

λj v i · v j . (6.6.10)

Da (6.6.9) und (6.6.10) gleich sind, folgt

(λi − λj )v i · v j = 0. (6.6.11)

Es gibt zwei Möglichkeiten, um diese Gleichung zu erfüllen:

(a) λi 6= λj ⇒ vi ⊥ vj .
(b) λi = λj = λ. In diesem Fall können v i und v j beliebig sein. Die Möglich-
keit der linearen Abhängigkeit, v i = cv j , ist durch die Normierungsbe-
dingung (6.6.7) jedoch ausgeschlossen, siehe die Vereinbarung unter 1).
Somit müssen v i , v j linear unabhängig sein, d.h. sie spannen eine zwei-
dimensionale Ebene E auf. Jeder Vektor x ∈ E lässt sich deshalb als
Linearkombination dieser beiden Vektoren darstellen:

x = av i + bv j a, b ∈ R.
4
Die Zahl c kann auch komplex sein.
6.6 Eigenwerte, Eigenvektoren, Diagonalisierung reell-symm. Matrizen 145

Demzufolge ist jeder Vektor x ∈ E Eigenvektor zum Eigenwert λ, denn

Ax = A(av i + bv j ) = aλv i + bλv j = λx.

Man kann deshalb zwei beliebige, normierte Vektoren aus E wählen, die
senkrecht aufeinander stehen.

Folgerungen:
Aus (a) folgt: Wenn die Eigenwerte einer reell-symmetrischen n×n Matrix alle paar-
weise verschieden sind, dann gehört zu jedem Eigenwert λi genau ein Eigenvektor
v i , der einen eindimensionalen Raum, den sog. Eigenraum Ei zum Eigenwert λi auf-
spannt. Die verschiedenen Eigenräume sind orthogonal.
Wenn ein Eigenwert einer reell-symmetrischen n × n Matrix (n ≥ 3) dreifach ent-
artet ist, λi = λj = λk = λ, dann folgt analog zu (b), dass in diesem Fall der zu-
gehörige Eigenraum dreidimensional ist. Dieser Eigenraum wird aufgespannt durch
drei beliebige, linear unabhängige Vektoren v i , die Lösungen des Gleichungssystems
Av i = λv i sind. Man wählt o.B.d.A. orthogonale Vektoren. Der Fall einer l-fachen
Entartung (l ≤ n) sollte klar sein.

Fazit: Die obigen Betrachtungen 1) und 2) zeigen, dass für eine reell-symmetrische
n × n Matrix A folgendes gilt: Zu den n reellen Eigenwerten dieser Matrix gibt es n
normierte Eigenvektoren v i , die senkrecht aufeinander stehen.

v i · v j = δij , |v i | = 1, i, j = 1, ..., n. (6.6.12)

Für reell-nichtsymmetrische Matrizen ist das nicht unbedingt der Fall!

Beispiel: Wir machen uns anhand der Matrix A aus Beispiel 1 auf Seite 143
klar, wie man die zu den Eigenwerten λ1 = 1 und λ2 = 11 von A gehörenden
Eigenvektoren berechnet. Wir müssen die beiden folgenden Gleichungssysteme lösen:

Av 1 = v 1 und Av 2 = 11v 2 .

• λ1 = 1 :   
9 −3 v1,1
(A − 1I)v 1 = 0 ⇒ = 0.
−3 1 v1,2
Alle Werte (v1,1 , v1,2 ), die 3v1,1 = v1,2 erfüllen, sind Lösungen dieses Glei-
chungsystems. Wir setzen
   
v1,1 = t t Normierung 1 1
⇒ v1 = −→ v 1 = √ .
v1,2 = 3t 3t 10 3

• λ2 = 11 :
  
−1 −3 v2,1
(A − 11I)v 2 = 0 ⇒ = 0.
−3 −9 v2,2
146 Einführung in die Theoretische Physik

Wir setzen
   
v2,1 = t t Normierung 1 3
⇒ v2 = −→ v2 = √ .
v2,2 = − 3t − 3t 10 −1

Offensichtlich ist v 1 ⊥ v 2 . Beachten Sie, dass die Vorzeichen von v 1 und v 2 frei
wählbar sind.

6.6.3 Diagonalisierung (Hauptachenstransformation)


Das Ergebnis (6.6.12) besagt, dass die normierten Eigenvektoren {v 1 , v 2 , ..., v n }
einer reell-symmetrischen Matrix A eine Orthonormalbasis bilden. Diese ONB ist
durch eine orthogonale Transformation mit der ONB {e1 , e2 , ..., en } verknüpft. Wir
konstruieren nun die Transformationsmatrix R, die zwischen diesen beiden Basen
vermittelt, und zwar wieder für den Fall reell-symmetrischer 3 × 3 Matrizen A.
Wir bilden aus den normierten Eigenvektoren v 1 , v 2 , v 3 von A die folgende
Matrix:    T 
v1,1 v1,2 v1,3 v1
R =  v2,1 v2,2 v2,3  =  v T2  , (6.6.13)
T
v3,1 v3,2 v3,3 v3
 
v1,1 v2,1 v3,1
RT =  v1,2 v2,2 v3,2  = (v 1 , v 2 , v 3 ). (6.6.14)
v1,3 v2,3 v3,3

Offensichtlich gilt wegen (6.6.12):




1 0 0
RRT = RT R =  0 1 0  , (6.6.15)
0 0 1

d.h. R ist eine orthogonale Matrix.


Beachte: R muss keine reine Drehung sein. Im Allgemeinen ist R von der Form:
Drehung × Spiegelung.

Hinweis: Die Transformation ei → v i wird durch RT vermittelt. Es ist

v 1 = RT e1 , v 2 = RT e2 , v 3 = RT e3 , (6.6.16)

nachrechnen!.

Diagonalisierung von A: Wir bilden das folgende Matrixprodukt und verwen-


6.6 Eigenwerte, Eigenvektoren, Diagonalisierung reell-symm. Matrizen 147

den bei der Berechnung des Produkts die Eigenwertgleichung Av i = λi v i :


 T   T 
v1 v1
T T 
RAR =  v2 A (v 1 , v 2 , v 3 ) =  v T2  (λ1 v 1 , λ2 v 2 , λ3 v 3 )
v T3 v T3
   
λ1 v 1 · v 1 λ2 v 1 · v 2 λ3 v 1 · v 3 λ1 0 0
=  λ1 v 2 · v 1 λ2 v 2 · v 2 λ3 v 2 · v 3  =  0 λ2 0  .
λ1 v 3 · v 1 λ2 v 3 · v 2 λ3 v 3 · v 3 0 0 λ3
Diese Rechnung zeigt folgendes: Wir können jede reell-symmetrische Matrix A mit
Hilfe der gemäß (6.6.13) aus ihren Eigenvektoren v 1 , ..., v n gebildeten, orthogona-
len Matrix R auf eine Diagonalmatrix transformieren. Die Diagonalelemente dieser
Matrix sind die Eigenwerte λi von A.
 
λ1 0 0
RART =  0 λ2 0  . (6.6.17)
0 0 λ3
| {z }
Λ

Die Physiker nennen das Hauptachsentransformation. Der Begriff wird unten erklärt.

Beispiele:
1) Wir betrachten wieder die Matrix A aus Beispiel 1 auf Seite 143. Die normierten
Eigenvektoren dieser Matrix wurden auf Seite 145 berechnet. Wir bilden mit diesen
Eigenvektoren die in (6.6.13) definierte orthogonale Matrix
     
v1,1 v1,2 1 1 3 T 1 1 3
R= =√ ⇒ R =√
v2,1 v2,2 10 3 −1 10 3 −1
     
T 1 1 3 10 −3 1 3 1 0
⇒ RAR = = .
10 3 −1 −3 2 3 −1 0 11
Hinweis: R ist zwar eine orthogonale Matrix, aber in diesem Beispiel keine reine
Drehmatrix, weil det R = −1. Wie bereits betont wurde, ist das Vorzeichen der
Eigenvektoren v 1 und v 2 jedoch beliebig; wir hätten z.B.
   
1 3 0 1 −3
anstelle von v 2 = √ den Eigenvektor v 2 = √
10 −1 10 +1
wählen können. Die resultierende Matrix
 
0 1 1 −1
R =√ ⇒ det R0 = +1
10 3 1
ist eine Drehmatrix. Das Resultat der Hauptachsentransformation bleibt gleich:
R0 AR0T = diag(1, 11).
2) Sei A eine reell-symmetrische n × n Matrix, deren Eigenwerte n-fach entartet
sind: λ1 = . . . = λn = λ. Sei R die orthogonale Matrix, die A diagonalisiert, d.h.
RART = λI. Daraus folgt, dass A = λRT IR = λI.
148 Einführung in die Theoretische Physik

Fazit: In diesem Schritt haben wir gezeigt, wie man für eine gegebene reell-symme-
trische Matrix A aus ihren normierten Eigenvektoren eine orthogonale Matrix R
konstruieren kann, so dass RART = Λ eine Diagonalmatrix ist. Diese Matrixtrans-
formation entspricht geometrisch dem Übergang in ein neues Koordinatensystem.
Das sieht man wie folgt. In der ,,alten” Basis lautet die Eigenwertgleichung:

Av i = λi v i . (6.6.18)

Man erinnere sich, dass v i den Spaltenvektor bezeichnet, dessen Komponenten die
Entwicklungskoeffizienten des jeweiligen Eigenvektors nach der alten Basis sind. Wir
formen die Gleichung (6.6.18) mit Hilfe der Identität I = RT R folgendermaßen um:

Av i = AIv i = ART Rv i . (6.6.19)

Wir setzen (6.6.19) in (6.6.18) ein und multiplizieren von links mit R. Dann
T
RAR Rv i = λi Rv i
| {z } |{z} |{z}
Λ ṽ i ṽ i

⇒ Λṽ i = λi ṽ i ,

wobei Λ die diagonalisierte Matrix und ṽ i = Rv i der Eigenvektor v i in der neuen


Basis ist. Der Spaltenvektor ṽ i hat die Form ṽ Ti = (0, ..0, 1, 0, ..0), wobei die Eins in
der i-ten Zeile steht. Die neue Basis, bezüglich der RART diagonal ist, bezeichnet
man als die Hauptachsen des jeweiligen Problems.

Hinweis: Beachten Sie, dass das Transformationsgesetz RART der Hauptachsen-


transformation (6.6.17) auf der hier gewählten Definition (6.6.13) der orthogonalen
Matrix R beruht. Alternativ kann man R auch durch

R = (v 1 , v 2 , v 3 ) (6.6.20)

definieren. Dann ist  


v T1
RT =  v T2  .
v T3
Das Transformationsgesetz lautet jetzt RT AR; denn gemäß der Regeln der Matrix-
multiplikation wirkt A auf die Spaltenvektoren der rechts von ihr stehenden Matrix,
in diesem Fall also auf die v i . Unter Verwendung der Eigenwertgleichung Av i = λi v i
erhält man
RT AR = diag(λ1 , λ2 , λ3 ) .
Kapitel 7

Funktionen mehrerer reeller


Variablen

Wir besprechen in diesem Kapitel einige für uns wichtige Aspekte der Differential-
und Integralrechnung für reelle Funktionen mehrerer reeller Variablen
f (x1 , x2 , ..., xn ), x1 , x2 , ..., xn ∈ R . (7.0.1)
Zunächst zum Begriff des Feldes in der Physik.

7.1 Felder in der Physik


In der Physik hängen viele Größen von den Koordinaten des Ortes ab, an dem die
jeweilige Größe gemessen wird; manche Größen hängen zudem noch vom Zeitpunkt
t ab, zu dem sie gemessen werden. Eine solche Größe bezeichnet man in der Physik
als Feld.

Beispiele:
1. Temperatur an einem Punkt (x1 , x2 , x3 ) der Erdatmosphäre zur Zeit t:
T = T (x1 , x2 , x3 , t). (7.1.1)

2. Die Massendichte eines (in)homogenen Körpers:


ρ = ρ(x1 , x2 , x3 ). (7.1.2)

3. Eine ortsabhängige, aber nicht explizit zeitabhängige Kraft, z.B. die Gravita-
tionskraft zwischen zwei Massenpunkten mit Massen m1 , m2 , die sich an den
Orten r 1 , r 2 befinden. Die Gravitationskraft, die das Teilchen 2 auf das Teil-
chen 1 ausübt, ist
(r 1 − r 2 )
F G,2→1 (r 1 , r 2 ) = −Gm1 m2 , (7.1.3)
|r 1 − r 2 |3
150 Einführung in die Theoretische Physik

wobei G die Gravitationskonstante bezeichnet. Diese Formel wird im Mechanik-


Teil der Vorlesung besprochen; siehe dazu auch (7.4.11).
Hinweis: Die Gravitationskraft hängt über die Ortsvektoren der Massen im-
plizit von der Zeit t ab:

r 1 = r 1 (t) , r 2 = r 2 (t).

4. Kräfte, die vom Ort und explizit vom Zeitpunkt ihrer Wirkung abhängen:

F = F (x1 , x2 , x3 , t) ≡ F (r, t). (7.1.4)

Konkrete Beispiele dazu im Mechanik-Teil der Vorlesung.

Felder, die nicht explizit von der Zeit abhängen, nennt man stationäre oder statische
Felder.

7.1.1 Skalares Feld


In der nichtrelativistischen Physik bezeichnet man eine Größe φ = φ(x, t) als ska-
R
lares Feld, wenn das Feld bei einer Drehung KS → KS’ des Koordinatensystems,
3
X
x0i = Rij xj R Drehmatrix, (7.1.5)
j=1

folgendes Transformationsgesetz erfüllt:

φ0 (x01 , x02 , x03 , t) = φ(x1 , x2 , x3 , t). (7.1.6)

Dabei ist φ0 das skalare Feld, also die Funktion der Koordinaten x0i , mit der die
physikalische Größe vom gedrehten Koordinatensystem aus beschrieben wird.

Beispiele:

• Das Temperaturfeld T (r, t) aus obigem Beispiel 1.

• Die Dichte ρ(r) aus obigem Beispiel 2.

• φ(r) = a · r, wobei a ein konstanter Vektor ist.

Die funktionale Form von φ0 erhält man durch Einsetzen der Rücktransformation
KS’ → KS, d.h.
3
X
xi = (R−1 )ij x0j (7.1.7)
j=1

in φ(x1 , x2 , x3 , t).
7.1 Felder in der Physik 151

7.1.2 Vektorfeld
In der nichtrelativistischen Physik bezeichnet man eine dreikomponentige Größe

A1 (r, t), A2 (r, t), A3 (r, t)

als Vektorfeld, wenn sie sich bei Drehungen (7.1.5) des Koordinatensystems trans-
formiert wie
3
X
A0i (x01 , x02 , x03 , t) = Rij Aj (x1 , x2 , x3 , t) i = 1, 2, 3. (7.1.8)
j=1

Die funktionale Form der A0i erhält man durch Einsetzen von (7.1.7) in die rechte
Seite von (7.1.8).
Kompakte Notation:
A0 (r 0 , t) = RA(r, t), (7.1.9)

wobei r und r 0 die jeweiligen Koordinatenvektoren bezeichnen; siehe unten.

Beispiele:

• Kraftfelder, etwa das obige Beispiel 2,

• Elektrisches Feld E(r, t),

• Magnetisches Feld B(r, t),

• Geschwindigkeitsfeld v(r, t) einer Flüssigkeit.

Ein Vektorfeld bezeichnet man in der Mathematik auch als vektorwertige Funktion
mehrerer reeller Variablen.
Physikalische Felder sind dimensionsbehaftet. Beispiele:

Temperaturfeld T (r, t) [T ] = Kelvin


Masse
Dichte ρ(r) [ρ] = = kg/m3
Volumen
Kraftfeld K(r, t) [K] = kg m/s2 = N
etc.

Nun zurück zur Mathematik. Im Folgenden kümmern wir uns nicht um die Di-
mension des jeweiligen Feldes, d.h. der jeweiligen Funktion mehrerer reeller Varia-
blen.
152 Einführung in die Theoretische Physik

7.2 Stetigkeit, partielle Ableitungen, totales Dif-


ferential
Notation: Im Folgenden bezeichnen wir die unabhängigen Variablen mit x, y, z, ...
oder x1 , x2 , x3 , .... In kompakter Notation:

r ≡ (x, y, z, ...),
oder r ≡ (x1 , x2 , x3 , ..., xn ), (7.2.1)
oder x ≡ (x1 , x2 , x3 , ..., xn ).

Wir betrachten eine reelle Funktion mehrerer reeller Variablen

f (x, y, z, ...) ≡ f (r), (7.2.2)

oder einen Satz reeller Funktionen

fi (x1 , x2 , ..., xn ), i = 1, ..., m, (7.2.3)

die die Komponenten eines Vektorfeldes bilden:

f (r) = f1 e1 + f2 e2 + ...fm em . (7.2.4)

• In der Mechanik treten typischerweise zwei- oder dreikomponentige Vektorfel-


der auf.

• Bis auf weiteres benutzen wir kartesische ONB

ei · ej = δij , ei konstante Vektoren. (7.2.5)

• Später betrachten wir auch ONB, bei denen die Basisvektoren ei von den
Ortskoordinaten abhängen, insbesondere die Polarkoordinaten- und Zylinder-
koordinatenbasis.

• Anstelle von (7.2.5) benutzen wir oft die Spalten- oder Zeilenvektordarstellung
 
f1
f =  ...  oder f = (f1 , f2 , ..., fm ) .
 
fm

D.h. wir kennzeichnen in der Regel nicht mehr explizit den Unterschied zwi-
schen einem Vektorfeld f und seiner Komponentendarstellung f .
7.2 Stetigkeit, partielle Ableitungen, totales Differential 153

Zunächst betrachten wir eine reelle Funktion f (r). Die Funktion definiert eine Ab-
bildung
f : Ω ⊆ Rn 7→ R .
Wenn das Definitionsgebiet Ω der Funktion nicht der ganze Rn ist, soll es sich um
eine nichtdisjunkte = wegzusammenhängende Teilmenge des Rn handeln, die offen
ist. Mit wegzusammenhängend bezeichnet man eine Teilmenge Ω ⊂ Rn , bei der sich je
zwei Punkte x, y ∈ Ω durch einen Weg = Kurve verbinden lassen, der ganz in Ω liegt.
Beachten Sie, dass im Fall n > 1 ein wegzusammenhängendes Gebiet Ω durchaus
Löcher haben kann. Im Fall n > 2 können auch Volumina aus Ω herausgeschnitten
sein. Offen heisst, dass der Rand der Teilmenge Ω weggelassen wird. Wenn man
abgeschlossene Teilmengen zulässt, kann man die unten eingeführten Eigenschaften
der Stetigkeit und (partiellen) Differenzierbarkeit von Funktionen an einem Punkt
x0 auf dem Rand nur mit Einschränkungen definieren, nämlich für Annäherungen
an x0 innerhalb des Definitionsgebiets (vergleiche mit einseitiger Stetigkeit im Falle
von Funktionen einer Variablen, Kapitel 2). Wir wollen das hier vermeiden; deshalb
soll der Definitionsbereich Ω im Folgenden, falls nicht explizit anders definert, immer
die genannten Eigenschaften haben.
Im Abschnitt 7.7 benötigen wir noch den Begriff des einfach zusammenhängenden
Gebiets.
Möglichkeiten der graphischen Darstellung von f (r):

1. Wenn die Funktion f nur von zwei Variablen abhängt, f = f (x, y) dann ist
eine Darstellung als Fläche über der xy-Ebene möglich; siehe die in den Ab-
bildungen 7.1, 7.2 und 7.3 gezeigten Beispiele. Diese Abbildungen entsprechen
Projektionen von Raumpunkten (x, y, f ) auf die Sichtfläche, die ein Compu-
terprogramm1 – z.B. root, Mathematica oder Maple – für uns erledigen kann.
Man kann sich aber auch durch strikt zweidimensionale Zeichnungen graphisch
einen Einblick in die Eigenschaften einer Funktion f (x, y) verschaffen. Dazu
zeichnet man Höhenlinien, in der Mechanik und Elektrostatik Äquipotential-
linien, bei Temperaturverteilungen T (x, y) Isothermen, bei Luftdruckvertei-
lungen Isobaren genannt. Diese Höhenlinien erhält man folgendermaßen. Man
zeichnet in der xy-Ebene die Menge aller Punkte x, y, die die Gleichung

f (x, y) = c

für einen festen Wert c erfüllen. Diese Menge aller Punkte x, y ist eine Kurve,
die sog. Höhenlinie, auf der die Funktion f (x, y) den Wert c annimmt2 . Man
variiert dann c äquidistant, d.h. man zeichnet ebenfalls die zu 2c, 3c, 4c, etc.
gehörenden Höhenlinien. Die ,,Dichte” der Höhenlinien in der xy-Ebene ist ein
1
Die Abbildungen 7.1, 7.2 und 7.3 wurden mit dem Programm root erstellt, das in der Teil-
chenphysik verbreitet ist.
2
Die Werte c, für die die Gleichung f (x, y) = c erfüllbar ist, hängen offensichtlich von den
Eigenschaften der jeweiligen Funktion f ab. Wenn beispielsweise f (x, y) ≥ 0 ∀x, y ∈ R, dann muss
natürlich c ≥ 0 gewählt werden.
154 Einführung in die Theoretische Physik

2 2
e-x -y

f(x,y)

0.8

0.6

0.4

0.2

0
2
y 1.5
1
0.5
0 1.5 2
-0.5 0.5
1 x
-1 0
-0.5
-1.5 -1
-2 -2 -1.5

2 −y 2
Abbildung 7.1: f (x, y) = e−x .

Maß dafür, wie stark bzw. wie wenig man die Variablen x, y ändern muss, damit
sich der Funktionswert f (x, y) um eine ,,Einheit” c ändert. In Fig. 7.9 sind
Höhenlinien (= Äquipotentiallinien) für die Funktionen aus den Abbildungen
7.1, 7.2 und 7.3 dargestellt. Bei den beiden ersten Beispielen sind das Kreise,
beim dritten Beispiel Hyperbeln.
2. Für Funktionen, die von n ≥ 3 Variablen abhängen, ist eine graphische Ge-
samtdarstellung nicht möglich. Funktionen f = f (x, y, z), die von drei Varia-
blen abhängen, können z.B. folgendermaßen graphisch dargestellt werden:
• Als zweidimensionale Schnitte. Man hält eine Variable fest, beispielsweise
z = z0 und stellt f = f (x, y, z0 ) als Fläche über der xy-Ebene dar.
• Als Niveaufläche, in der Mechanik Äquipotentialfläche genannt. Eine Ni-
veaufläche ist die Menge aller Punkte im R3 , für die die Funktion f einen
vorgegebenen konstanten Wert annimmt: f (x, y, z) = const. Diese Glei-
chung beschreibt eine Fläche im Raum. Wenn f eine lineare Funktion in
x, y, z ist, handelt es sich um eine Ebene.

7.2.1 Stetigkeit
Eine Funktion f (x1 , ..., xn ) von n Variablen heißt stetig im Punkt (x01 , ...x0n ), wenn
f (x1 , ..., xn ) → f (x01 , ...x0n )
7.2 Stetigkeit, partielle Ableitungen, totales Differential 155

x2+y2
f(x,y)

200
180
160
140
120
100
80
60
40
20
0
10
y 8
6
4
2 10
0 8
-2 4 6 x
-4 0 2
-6 -2
-8 -6 -4
-10 -10 -8

Abbildung 7.2: f (x, y) = x2 + y 2 .

x2-y2
f(x,y)

100

50

-50

-100
10
y 8
6
4
2 10
0 8
-2 4 6 x
-4 0 2
-6 -2
-8 -6 -4
-10 -10 -8

Abbildung 7.3: f (x, y) = x2 − y 2 .


156 Einführung in die Theoretische Physik

konvergiert, und zwar für beliebige x → x0 aus Ω wobei der Abstand


v
u n
uX
d = t (xi − x0i )2 → 0 .
i=1

Die in den Abb. 7.1, 7.2 und 7.3 dargestellten Funktionen sind stetig.
Als Beispiel für eine Unstetigkeitsstelle einer Funktion betrachten wir
xy
f (x, y) = falls (x, y) 6= (0, 0) und f (0, 0) = 0 . (7.2.6)
x2 + y2
Diese Funktion ist an der Stelle x0 = (0, 0) unstetig. Zwar ist

lim f (x, 0) = 0 , lim f (0, y) = 0 ,


x→0 y→0

aber
1
lim f (x, x) = lim f (y, y) =
.
x→0 y→0 2
Dieses Beispiel belegt, dass eine Funkion f (x) bei x0 nur dann stetig ist, wenn der
Funktionswert f (x0 ) bei Annäherung an x0 aus allen Richtungen in Ω angenommen
wird.

7.2.2 Partielle Ableitungen


Wir betrachten eine der in den Abb. 7.1, 7.2 und 7.3 gezeigten Funktionen an einem
Punkt x, y. Es werde y festgehalten. Frage: Wie ändert sich f (x, y), wenn wir x
ändern? Die Steigung der Tangente3 an f im Punkt x, y in x-Richtung, d.h.

x, y → x + h, y h ∈ R, h → 0,

ist durch die Ableitung von f (x, y) nach x bei festgehaltenem y gegeben, die man
völlig analog zur Ableitung von Funktionen einer Variablen berechnet. Man nennt
diese Ableitung die partielle Ableitung nach x. Sie ist definiert durch
∂f (x, y) f (x + h, y) − f (x, y)
≡ lim . (7.2.7)
∂x h→0 h

Beispiel:
2 +y 2 )
f (x, y) = e−(x ,
siehe Abbildung 7.1. Die partielle Ableitung nach x ist
∂f (x, y) 2 2
= −2xe−(x +y ) . (7.2.8)
∂x
3
Diese Tangente liegt in der Ebene y = const, das ist die Ebene parallel zur xz-Ebene, in der
der Punkt (x, y) liegt.
7.2 Stetigkeit, partielle Ableitungen, totales Differential 157

Die partielle Ableitung nach y bei festgehaltenem x ist analog definiert:

∂f (x, y) f (x, y + h) − f (x, y)


≡ lim . (7.2.9)
∂y h→0 h

Für das obige Beispiel erhalten wir

∂f (x, y) 2 2
= −2ye−(x +y ) . (7.2.10)
∂y

Oft verwendet man folgende Notation: Es sei

f = f (x1 , x2 , ..., xn ).

Die partielle Ableitung nach einer Variablen xi bei festgehaltenen anderen Va-
riablen wird durch die Symbole


f ≡ ∂xi f ≡ ∂i f (7.2.11)
∂xi

gekennzeichnet. Wir nehmen hier an, dass die Funktionen f hinreichend glatt sind,
so dass die partiellen Ableitungen 1. Ordnung (7.2.11) existieren.
Fazit: Die partielle Ableitung nach einer Variablen xi wird wie die gewöhnliche Ab-
leitung einer Funktion einer Variablen bestimmt – d.h. man kann die Rechenregeln
für die Ableitung aus Kapitel 2 benutzen –, die anderen Variablen werden bei der
Berechnung von ∂xi f wie Konstante behandelt.

7.2.3 Totales Differential, Differenzierbarkeit


Wir betrachten Funktionen f = f (x1 , x2 , ..., xn ), für die ihre partiellen Ableitun-
gen bei x existieren und stetig sind. Das totale Differential df (auch vollständiges
Differential genannt) am Punkt x ist definiert durch

n
X ∂f
df ≡ dxi . (7.2.12)
i=1
∂x i

Wir erinnern uns an die analoge Größe bei einer Funktion einer Variablen, f = f (x):

df
df = dx.
dx

Salopp gesprochen gibt das totale Differential df die infinitesimale Funktionsände-


rung bei einer infinitesimalen Änderung dx von x an.
158 Einführung in die Theoretische Physik

z
z = f (x0 , y)
y
x
f (x, y)
(x0 , y0 ) ∂f
z = f (x, y0 ) ∂x
dx

Ebene entlang des dy


Koordinatensystems dx
∂f ∂f
∂f
df = ∂x
dx + ∂y
dy
∂y
dy Tangentialebene

Abbildung 7.4: Das totale Differential liefert die Gleichung der Tangentialebene an
die Hyperfläche f in einem Punkt P = (x0 , y0 , z0 = f (x0 , y0 )).

Geometrische Interpretation: Die Funktion f = f (x1 , ..., xn ) beschreibt eine


Hyperfläche über der Menge x ∈ Ω ⊆ Rn . Zu x gehört der Punkt (x1 , ..., xn , f ) ≡
P auf dieser Hyperfläche. Das totale Differential (7.2.12) liefert die Gleichung der
Tangential(hyper)ebene an die Hyperfläche im Punkt P , siehe Abbildung 7.4. Im
Fall zweier Variablen ist das vollständige Differential

df = ∂x f (x0 , y0 )dx + ∂y f (x0 , y0 )dy .

Man setzt nun dx = x − x0 , dy = y − y0 , df = z − z0 . Damit erhält man die


Ebenengleichung

z − z0 = ∂x f (x0 , y0 )(x − x0 ) + ∂y f (x0 , y0 )(y − y0 ) .

Diese Gleichung beschreibt die in Fig. 7.4 dargestellte Tangentialebene im Punkt


P = (x0 , y0 , z0 ).
Das totale Differential hat viele Anwendungen, z.B. bei der Fehlerrechnung für eine
Observable f , die von mehreren Variablen xj abhängt. Die xj werden durch Mes-
sungen bestimmt und sind mit Messfehlern behaftet.

Differenzierbarkeit:
Wir besprachen bisher die partiellen Ableitungen einer Funktion mehrerer Variablen.
Wenn eine oder alle partiellen Ableitungen von f existieren, heisst f partiell differen-
zierbar. Wann bezeichnet man eine Funktion als differenzierbar an einem Punkt x0 ?
7.2 Stetigkeit, partielle Ableitungen, totales Differential 159

Salopp gesprochen dann, wenn der jeweilige Differentialquotient bei Annäherung


an f (x0 ) aus jeder Raumrichtung existiert (siehe Vorlesung Höhere Mathematik).
Wir begnügen uns hier damit, auf folgenden Satz (ohne Beweis) hinzuweisen: Eine
Funktion f = f (x1 , . . . , xn ) heißt differenzierbar an der Stelle x0 , wenn alle partiel-
len Ableitungen ∂i f an dieser Stelle existieren und stetig sind.
Allein aus der Existenz der partiellen Ableitungen von f folgt noch nicht ihre Dif-
ferenzierbarkeit. Wir betrachten als Beispiel die bereits oben untersuchte Funktion
(7.2.6). Für diese Funktion existieren die partiellen Ableitungen ∂x f , ∂y f für alle
(x, y) ∈ R2 ; insbesondere ist ∂x f (0, 0) = ∂y f (0, 0) = 0. Prüfen Sie die letztgenannte
Aussage unter Benutzung der Definitionen (7.2.7), (7.2.9) der partiellen Ableitungen
zu Hause nach! Allerdings zeigten wir oben, dass f bei (0, 0) nicht stetig ist. Somit
können auch die partiellen Ableitungen an dieser Stelle nicht stetig sein und f ist
nach dem soeben zitierten Satz bei (0, 0) nicht differenzierbar.

7.2.4 Regeln für die partiellen Ableitungen


Wir besprechen nun einige für die Praxis wichtige Regeln zur Berechnung partieller
Ableitungen. Seien f = f (x1 , ..., xn ) und g = g(x1 , ..., xn ) differenzierbare Funktio-
nen, also hinreichend glatt.

1. Summenregel:
∂i (f + g) = ∂i f + ∂i g .

2. Produktregel:
∂i (f g) = (∂i f )g + f (∂i g) .

3. Quotientenregel:
 
f g∂i f − f ∂i g
∂i = , falls g(x) 6= 0 .
g g2

Diese Regeln können direkt aus der Differentialrechnung für Funktionen einer Va-
riablen übernommen werden.

Kettenregel:
Wir erinnern uns zunächst an diese Regel für Funktionen einer Variablen: f = f (u)
und u = u(t):
df (u(t)) df du
= . (7.2.13)
dt du dt
Nun zu Funktionen mehrerer Variablen – o.B.d.A. betrachten wir Funktionen, die
von drei Variablen abhängen. Es sei

f = f (x1 , x2 , x3 ) und x1 = x1 (t1 , t2 , t3 ), x2 = x2 (t1 , t2 , t3 ), x3 = x3 (t1 , t2 , t3 ) .


160 Einführung in die Theoretische Physik

Berechnet werden sollen die partiellen Ableitungen von f nach t1 , t2 und t3 . Da alle
xj von diesen Variablen abhängen, erhalten wir

∂f ∂f ∂x1 ∂f ∂x2 ∂f ∂x3


= + + , i = 1, 2, 3 . (7.2.14)
∂ti ∂x1 ∂ti ∂x2 ∂ti ∂x3 ∂ti

Die Formel sollte plausibel sein; den Beweis sollten Sie in der Vorlesung über Höhe-
re Mathematik erhalten. Die Verallgemeinerung auf Funktionen von n Variablen ist
evident. Die Kettenregel benötigt man beispielsweise, wenn wir eine physikalische
Größe, etwa die potentielle Energie V eines Teilchens, als Funktion der kartesi-
schen Ortskoordinaten xi des Teilchens kennen. Manchmal ist es sinnvoll, andere
Koordinaten zu wählen, z.B. Kugelkoordinaten r, θ, φ. Man drückt dann die karte-
sischen Koordinaten durch diese Variablen aus, xi = xi (r, θ, φ), siehe Abschnitt 7.5.
Will man z.B. die Änderung von V bei Änderung des Winkels θ bestimmen (bei
festgehaltenen Variablen r und φ), wird ∂V /∂θ mit Hilfe der Kettenregel (7.2.14)
berechnet.

Man benötigt die Kettenregel (7.2.14) oft für verschiedene Spezialfälle, die für uns
von Interesse sind. Dewegen besprechen wir diese Fälle explizit.

1. Spezialfall 1: Sei f = f (u) und u = u(x1 , . . . , xn ). Dann erhalten wir mit


(7.2.14):
df (u)
∂xi f = ∂xi u . (7.2.15)
du
Beispiele: 1) f (x, y) = exp(−x2 − y 2 ), siehe Seite 156. Zur Berechnung von ∂x f
und ∂y f ist es offensichtlich zweckmässig, f als zusammengesetzte Funktion
aufzufassen, f = exp u mit u = −x2 − y 2 und (7.2.15) anzuwenden.
2) Bei der Berechnung der partiellen Ableitungen nach den Ortskoordinaten
xi einer Funktion f = f (r), die nur vom Betrag r = (x21 + x22 + x23 )1/2 des
Ortsvektors abhängt, wird (7.2.15) ebenfalls benutzt – siehe etwa die Beispiele
3 und 4 auf Seite 174.

2. Spezialfall 2: Wir betrachten o.B.d.A. eine Funktion f , die von zwei Variablen
abhängt, f = f (x1 , x2 ), und es sei x1 = x1 (t1 ), x2 = x2 (t2 ). In diesem Fall sind
x1 , x2 Funktionen von zwei verschiedenen, voneinander unabhängigen Varia-
blen ti . Bei einer Änderung von t1 (t2 ) ändert sich nur x1 (x2 ), aber nicht x2
(x1 ). Dann ist die partielle Ableitung von f nach t1 als Spezialfall von (7.2.14)
gegeben durch
∂f (x1 (t1 ), x2 (t2 )) ∂f dx1
= . (7.2.16)
∂t1 ∂x1 dt1
Analog ist
∂f (x1 (t1 ), x2 (t2 )) ∂f dx2
= . (7.2.17)
∂t2 ∂x2 dt2
7.2 Stetigkeit, partielle Ableitungen, totales Differential 161

3. Spezialfall 3: Wir betrachten den Fall, dass alle Variablen xi von der selben
Variablen t abhängen. Beispiel:

f = f (x1 (t), x2 (t)).

Wenn sich t ändert, ändern sich somit beide Variablen x1 , x2 ; d.h. f hängt
offensichtlich nur von einer unabhängigen Variablen t ab. Die gewöhnliche
Ableitung, df /dt, kann man ebenfalls als Spezialfall der allgemeinen Ketten-
regel (7.2.14) erhalten. Wir wollen hier aber df /dt durch Anwendung der De-
finition der Ableitung einer Funktion einer Variablen herleiten. Wir erhalten

df f (x1 (t + ∆t), x2 (t + ∆t)) − f (x1 (t), x2 (t))


= lim
dt ∆t→0 ∆t
0
z }| {
f (x1 + ∆x1 , x2 + ∆x2 ) −f (x1 ,x2 +∆x2 )+f (x1 ,x2 +∆x2 ) −f (x1 , x2 )
= lim
∆t→0 ∆t
f (x1 + ∆x1 , x2 + ∆x2 ) − f (x1 , x2 + ∆x2 ) ∆x1
= lim
∆t→0 ∆x1 ∆t
f (x1 , x2 + ∆x2 ) − f (x1 , x2 ) ∆x2
+ lim .
∆t→0 ∆x2 ∆t
Im Limes ∆t → 0:
∆t→0
∆xi ≡ xi (t + ∆t) − xi (t) −−−→ 0 , i = 1, 2

und
∆xi ∆t→0 dxi
−−−→ .
∆t dt
Somit:
df (x1 (t), x2 (t)) f (x1 + ∆x1 , x2 ) − f (x1 , x2 ) dx1
= lim
dt ∆t→0 ∆x1 dt
f (x1 , x2 + ∆x2 ) − f (x1 , x2 ) dx2
+ lim (7.2.18)
∆t→0 ∆x2 dt
∂f dx1 ∂f dx2
= + .
∂x1 dt ∂x2 dt
Dieses Ergebnis erhält man, wie gesagt, auch als Spezialfall von (7.2.14).
Dieses Resultat lässt sich sofort auf n Variablen übertragen. Es sei

f = f (x1 (t), x2 (t), ..., xn (t)).

Dann ist
n
df X ∂f dxi
= . (7.2.19)
dt i=1
∂xi dt
162 Einführung in die Theoretische Physik

Wenn f noch zudem explizit von t abhängt,

f = f (x1 (t), x2 (t), ..., xn (t), t),

dann
n
df X ∂f dxi ∂f
= + . (7.2.20)
dt i=1
∂xi dt ∂t

Dies ist wiederum ein Spezialfall der allgemeinen Kettenregel (7.2.14).


Beispiel für eine Anwendung in der Mechanik: Die potentielle Energie V eines
Systems aus n0 Massenpunkten im R3 , das keinen weiteren Einschränkungen
unterliegt, hängt von den 3n0 = n Ortskoordinaten dieser Massenpunkte ab,
die Funktionen der Zeit t sind. Falls eine oder mehrere Kräfte, die die Dynamik
des Systems bestimmen, explizit von der Zeit abhängen, hängt V zudem noch
explizit von der Zeit ab. Mit Hilfe von (7.2.19) bzw. (7.2.20) berechnet man
die zeitliche Änderung dV /dt der potentiellen Energie des Systems.

Partielle Ableitungen höherer Ordnung:


Diese sind wie die höheren Ableitungen von Funktionen einer Variablen rekursiv
definiert. Es gibt jetzt aber i. A. eine Vielzahl von Möglichkeiten, partielle Ableitun-
gen höherer Ordnung zu bilden. Wir nehmen an, dass f = f (x1 , . . . , xn ) hinreichend
glatt ist, so dass diese höheren Ableitungen auch existieren. Betrachten wir das obi-
2 2
ge Beispiel, f (x, y) = e−(x +y ) . Wir können ∂f /∂x, Gl. (7.2.8), nach x oder nach y
ableiten:
∂2
 
∂ ∂f 2 2 2 2
≡ 2
f = −2e−(x +y ) + 4x2 e−(x +y ) ,
∂x ∂x ∂x
∂2
 
∂ ∂f 2 2
≡ f = +4xye−(x +y ) .
∂y ∂x ∂y∂x

Ebenso können wir ∂f /∂y, Gleichung (7.2.10), nach x oder nach y ableiten.

∂ ∂f 2 2
= +4xye−(x +y ) ,
∂x ∂y
∂ ∂f 2 2 2 2
= −2e−(x +y ) + 4y 2 e−(x +y ) .
∂y ∂y
Der Vergleich dieser Resultate zeigt, dass
∂ ∂ ∂ ∂
f= f. (7.2.21)
∂y ∂x ∂x ∂y
Frage: Ist das immer so? Auskunft darüber gibt der folgende
Satz (von H.A. Schwarz): Es sei f (x) in einer Umgebung von x0 zweifach stetig dif-
ferenzierbar, d.h. alle ersten partiellen Ableitungen ∂xi f seien stetig differenzierbar
7.3 Taylorentwicklung 163

und alle zweiten partiellen Ableitungen ∂xi ∂xj f seien stetig. Dann kann die Reihen-
folge beim Bilden der gemischten zweiten Ableitungen vertauscht werden:

∂xj ∂xi f |x0 = ∂xi ∂xj f |x0 .

Ein Beispiel, bei dem die Voraussetzungen dieses Satzes nicht erfüllt sind, behandeln
wir in den Übungen.

Notation:
∂ ∂ ∂2
f≡ f ≡ ∂xi ∂xj f ≡ ∂i ∂j f. (7.2.22)
∂xi ∂xj ∂xi ∂xj

7.3 Taylorentwicklung
In Analogie zu Funktionen einer Variablen, f = f (x), wollen wir nun Funktionen
mehrerer Variablen, f = f (x1 , ..., xn ), an einem bestimmten Punkt x0 = (x01 , ..., x0n )
in eine Potenzreihe entwickeln. Das setzt natürlich voraus, dass diese Funktionen be-
liebig oft differenzierbar sind.
In praktischen Anwendungen brauchen wir in der Regel nur die ersten Glieder
dieser Reihe. Deswegen ist unser Ziel hier nur die näherungsweise Darstellung von f
durch ein Polynom in den xi bis zu einer gewünschten Ordnung n. Bei der Taylor-
Entwicklung einer Funktion f bis zur n-ten Ordnung muss die Funktion (n + 1)-fach
differenzierbar sein, siehe unten.

7.3.1 Taylor-Formeln
Wir leiten zunächst die Taylor-Formeln für die Entwicklung von Funktionen zweier
und von drei Veriablen bis zur 2. Ordnung her und geben dann die Formel für die
Potenzreihenentwickung (= Taylor-Reihe) einer Funktion von n Variablen an.

Taylor-Formel für f = f (x, y):


Wir entwickeln eine Funktion f = f (x, y) in eine Potenzreihe in der Umgebung
des Punktes (x0 , y0 ) In Anwendungen ist, wie gesagt, oft nur die explizite Form der
Glieder bis zur einer bestimmten Ordnung von Interesse. Wir bestimmen hier als
Beispiel die explizite Form dieser Glieder bis einschliesslich der 2. Ordnung. Die
Form dieser Reihe ist durch den folgenden Ansatz gegeben:

f (x, y) = c00 + c10 (x − x0 ) + c01 (y − y0 )


+ c20 (x − x0 )2 + c11 (x − x0 )(y − y0 ) + c02 (y − y0 )2 (7.3.1)
+ O (∆xi )3 .


Das Symbol O ((∆xi )3 ) bezeichnet die nicht angegebenen Terme der Potenzreihe,
die mindestens von 3. Ordnung in den kleinen Größen (x − x0 ), (y − y0 ) sind. Das
164 Einführung in die Theoretische Physik

sind Terme, die die Potenzen

(x − x0 )3 , (x − x0 )2 (y − y0 ), (x − x0 )(y − y0 )2 , (y − y0 )3

und höhere Potenzen enthalten.


Die unbekannten Koeffizienten cij in (7.3.1) erhält man analog zum Fall f = f (x)
folgendermaßen:

(a) Einerseits wertet man f , ihre partiellen Ableitungen ∂x f , ∂y f und die höherer
Ordnung bei (x0 , x0 ) aus.

(b) Andererseits wertet man die rechte Seite von (7.3.1) und ihre entsprechenden
partiellen Ableitungen bei (x0 , x0 ) aus und vergleicht mit (a). Man erhält:

(1) f (x0 , y0 ) = c00


(2)

∂x f = c10 + 2c20 (x − x0 ) + c11 (y − y0 ) + ......


|{z}
enthält mindestens
einen Faktor (y−y0 )

⇒ ∂x f (x0 , y0 ) = c10

(3)

∂y f = c01 + c11 (x − x0 ) + 2c02 (y − y0 ) + ...


⇒ ∂y f (x0 , y0 ) = c01

etc.

Einsetzen der soeben hergeleiteten Koeffizienten cij in (7.3.1) liefert die Taylor-
Formel für die Entwicklung einer Funktion zweier Variablen an einen beliebigen
Punkt (x0 , y0 ), wobei die Taylor-Entwicklung hier nur bis zur 2. Ordnung durch-
geführt wurde:

f (x, y) = f (x0 , y0 )
+ (x − x0 )∂x f (x0 , y0 ) + (y − y0 )∂y f (x0 , y0 )
1 
(x − x0 )2 ∂x2 f (x0 , y0 ) + 2(x − x0 )(y − y0 )∂x ∂y f (x0 , y0 ) + (y − y0 )2 ∂y2 f (x0 , y0 )

+
2!
+ O (∆xi )3 .


(7.3.2)
Für das Restglied O ((∆xi )3 ) kann eine Abschätzungsformel angegeben werden, in
der die partiellen Ableitungen ∂i ∂j ∂k f aufteten; siehe z.B. das zitierte Taschenbuch
der Mathematik von I.N. Bronstein et al.
7.3 Taylorentwicklung 165

Taylor-Formel für f = f (x1 , x2 , x3 ):

Für eine Funktion von drei Variablen, f = f (x1 , x2 , x3 ), erhält man völlig ana-
log die Taylorentwicklung inklusive der Terme 2. Ordnung an einen Punkt x0 =
(x01 , x02 , x03 ):

f (x1 , x2 , x3 ) = f (x0 )
+ (x1 − x01 )∂1 f (x0 ) + (x2 − x02 )∂2 f (x0 ) + (x3 − x03 )∂3 f (x0 )
1h
+ (x1 − x01 )2 ∂12 f (x0 )
2!
+ (x2 − x02 )2 ∂22 f (x0 )
+ (x3 − x03 )2 ∂32 f (x0 ) (7.3.3)
+ 2(x1 − x01 )(x2 − x02 )∂1 ∂2 f (x0 )
+ 2(x1 − x01 )(x3 − x03 )∂1 ∂3 f (x0 )
i
+ 2(x2 − x02 )(x3 − x03 )∂2 ∂3 f (x0 )
+ O (∆xi )3 .


Die Abschätzungsformel für das Restglied O ((∆xi )3 ) enthält die partiellen Ablei-
tungen 3. Ordnung (siehe Bronstein et al.). Bei Vernachlässigung des Restglieds
wird die Funktion f (x) durch die Formeln (7.3.2) bzw. (7.3.3) in der Umgebung
des Punktes x0 durch ein Polynom 2. Grades in den Variablen x, y bzw. x1 , x2 , x3
approximiert. Die Güte der Approximation lässt sich durch die Mitnahme höherer
Ordnungen der Taylorentwicklung erhöhen – vorausgesetzt, die Taylorreihe (also die
unendliche Reihe) konvergiert in einer Umgebung von x0 . Auf Konvergenzfragen
gehen wir hier nicht ein.
Der Vollständigkeit halber geben wir hier noch die Formel für die Taylorreihe
einer Funktion f = f (x1 , x2 , ..., xn ) von n Variablen an der Entwicklungsstellle x0 an.
Wir nehmen an, dass f beliebig oft partiell in einer Umgebung von x0 differenzierbar
ist und die folgenden unendlichen Summen in einer Umgebung von x0 konvergieren.
Die Taylorformel für die Potenzreihenentwicklung in n Variablen ist

∞ X
∞ ∞
X X 1 ∂ i1 +i2 +...+in
f (x) = ... (x1 − x01 )i1 · · · (xn − x0n )in i1 i2 f (x0 ).
i1 =0 i2 =0 in =0
i 1 !i 2 ! · · · i n ! ∂x 1 ∂x 2 · · · ∂x
in
n

(7.3.4)
Durch explizites Hinschreiben der ersten Terme dieser Reihe im Falle von zwei bzw.
drei Variablen überzeugt man sich, dass diese Formel die in (7.3.2) bzw. (7.3.3) an-
gegebenen Glieder reproduziert.
Sie müssen sich diese Formel nicht merken – allerdings sollten Sie die Formeln (7.3.2)
bzw. (7.3.3), d.h. die Taylor-Entwicklung von Funktionen zweier und von drei Va-
riablen bis zur 1. oder 2. Ordnung verinnerlichen. Wir werden diese Formeln anhand
etlicher Beispiele in den Übungen anwenden.
166 Einführung in die Theoretische Physik

7.3.2 Lokale Extremwerte, stationäre Punkte


Die Abbildungen 7.1, 7.2 und 7.3 zeigen, dass
2 −y 2
1. f (x, y) = e−x bei (x0 , y0 ) = (0, 0) ein Maximum hat,

2. f (x, y) = x2 + y 2 bei (x0 , y0 ) = (0, 0) ein Minimum hat,

3. f (x, y) = x2 − y 2 bei (x0 , y0 ) = (0, 0) einen sog. Sattelpunkt hat.

Bei einem Sattelpunkt x0 nimmt f (x, y) im Punkt x0 bezüglich einer Richtung ein
relatives Minimum an – im Beispiel 3 ist diese Richtung durch die Gerade y = 0
gegeben –, aber bezüglich einer anderen Richtung ein relatives Maximum – im Bei-
spiel 3 längs der Geraden x = 0.

Bedingung für einen lokalen Extremwert: Eine Funktion f = f (x) von n reel-
len Variablen hat im Punkt x0 = (x01 , x02 , ..., x0n ) ein lokales Minimum (Maximum),
wenn es ein r > 0 gibt, so dass

f (x0 ) ≤ f (x) (f (x0 ) ≥ f (x)) für alle x ∈ Kr (x0 ) . (7.3.5)

Hier bezeichnet Kr (x0 ) o.B.d.A. eine offene Kugelmenge mit Radius r um x0 :

Kr (x0 ) = {x ∈ Ω mit |x − x0 | < r} .

Ein lokales Minumum oder Maximum heißt auch lokaler Extremwert 4 . Beachten Sie,
dass die Bedingung (7.3.5) nicht bedeutet, dass es sich bei x0 um einen isolierten
Punkt handeln muss.
Die Bedingung (7.3.5) gilt natürlich auch für n = 1. In diesem Fall findet man lokale
Extremwerte einer Funktion f = f (x) am einfachsten durch Zeichnen des Funk-
tionsgraphen. Das ist im Fall mehrerer Variablen schwierig (n = 2) bzw. unmöglich
(n > 2).
Analog zum Fall einer Variablen findet man lokale Extremwerte einer Funktion auf
analytische Weise durch Untersuchung der partiellen Ableitungen von f – voraus-
gesetzt, f ist differenzierbar. Das führt uns auf den allgemeineren Begriff des stati-
onären Punktes. Ein Punkt x0 heißt stationärer Punkt einer differenzierbaren Funk-
tion f , wenn er eine Lösung der folgenden n Gleichungen ist:

f (x0 ) = 0 ∀i = 1, 2, ..., n . (7.3.6)
∂xi
Hinweise:
1) Diese Bedingung ist offensichtlich notwendig, aber nicht hinreichend für einen
lokalen Extremwert einer differenzierbaren Funktion. Ein Kriterium dafür, wann ein
4
In den obigen Beispielen 1 und 2 ist (x0 , y0 ) = (0, 0) auch das absolute Maximum bzw.
Minimum der Funktion. Das ergibt sich aber erst aus der globalen Betrachtung der jeweiligen
Funktion.
7.3 Taylorentwicklung 167

isoliertes Minimum oder Maximum vorliegt, geben wir unten an.


2) Beachten Sie, dass es sich bei diesen Gleichungen i.A. um nichtlineare algebraische
Gleichungen handelt. Die Lösung eines solchen Gleichungssystems ist i.A. hochgra-
dig nichttrivial. Auf Lösungsstrategien können wir hier nicht eingehen. Auf jeden Fall
sollte man durch diverse Untersuchungen von f herausfinden, in welchem Teilgebiet
oder Teilgebieten des Definitionsbereichs von f man stationäre Punkte erwarten
kann. Beispielsweise kann man das Definitionsgebiet von f mit einem Gitter über-
ziehen, f an diesen Punkten mit Hilfe eines Computers numerisch auswerten und
dann durch Inspektion der Funktionswerte nach einem Indiz für einen stationären
Punkt fahnden.
3) Je nach Funktion hat dieses Gleichungssystem entweder keine Lösung, Lösungen
in Form eines oder mehrerer isolierter Punkte x0 oder Lösungsmengen, die Kurven
oder (Hyper)Flächen entsprechen – siehe den nächsten Hinweis.
4) Bei stationären Punkten muss es sich nicht um isolierte Punkte x0 handeln.
Beispielsweise können bei Funktionen zweier Variablen ganze Kurven von Maxima
und/oder Minima und/oder Wendepunkten (Sattelpunkten) auftreten5 . Ein Beispiel
ist in Abbildung 7.5 gezeigt. Bei Funktionen von n > 2 Variablen kann die Menge
der stationären Punkte auch einer oder mehreren (Hyper)flächen entsprechen.

Taylorentwicklung um einen stationären Punkt x0 :


Wenn x0 ein stationärer Punkt von f ist, dann verschwinden in der Taylorentwick-
lung von f um x0 aufgrund von (7.3.6) alle Terme der 1. Ordnung – beispielsweise
in den Formeln (7.3.2) und (7.3.3). Somit

f (x) = f (x0 ) + O (∆xi )2 ,



(7.3.7)
wenn x0 ein stationärer Punkt von f ist.

Beispiel: Sei (x0 , y0 ) ein stationärer Punkt von f (x, y). Dann ist die Taylorentwick-
lung von f an dieser Stelle gegeben durch

1h
f (x1 , x2 ) =f (x01 , x02 ) + (x1 − x01 )2 ∂12 f (x0 )
2!
+ 2(x1 − x01 )(x2 − x02 )∂1 ∂2 f (x0 )
i (7.3.8)
2 2
+ (x2 − x02 ) ∂2 f (x0 )
+ O (∆xi )3 .


In der Physik, insbesondere in der Mechanik untersucht man oft eine physikalische
Größe f , die beispielsweise von den Ortskoordinaten eines Teilchens abhängt, in der
Umgebung eines stationären Punktes x0 von f durch Taylor-Entwicklung um x0 –
siehe den Hinweis am Ende des nächsten Abschnittes.
5
Beim Trivialbeispiel einer konstanten Funktion, f (x, y) = const., d.h. einer Ebene parallel zur
xy-Ebene, sind natürlich alle Punkte des R2 stationäre Punkte der Funktion.
168 Einführung in die Theoretische Physik

sin(x2+y2)
f(x,y)

0.5

-0.5

-1
1.5
y
1
0.5
0 1.5
1 x
-0.5 0.5
0
-1 -0.5
-1.5 -1.5 -1

Abbildung 7.5: Darstellung der Funktion f (x, y) = sin(x2 + y 2 ) in der Umgebung


von (x, y) = (0, 0). Dieser Punkt ist ein isoliertes Minimum von f . Man sieht, dass
der Kreis x2 + y 2 = π/2 eine Linie von Maxima bildet. Weitere Linien von Maxima
(Minima) bilden die Kreise x2 + y 2 = (2n + 1)π/2 (x2 + y 2 = nπ), n ∈ N.
7.3 Taylorentwicklung 169

Kriterium für ein isoliertes Minimum/Maximum: Um auf analytische Wei-


se herauszufinden, um welchen Typ es sich bei einem stationären Punkt x0 handelt,
muss man die Matrix der 2. Ableitungen von f an der Stelle x0 berechnen:
 
∂12 f (x0 ) ∂1 ∂2 f (x0 ) · · · ∂1 ∂n f (x0 )
 ∂2 ∂1 f (x0 ) ∂ 2 f (x0 ) · · · ∂2 ∂n f (x0 ) 
(2) 2
D (x0 ) ≡  . (7.3.9)
 
.. .. ..
 . . . 
∂n ∂1 f (x0 ) ∂n ∂2 f (x0 ) · · · ∂n2 f (x0 )

Bei dieser Matrix, die man auch Hesse-Matrix nennt, handelt es sich offensichtlich
(2) (2)
um eine reell-symmetrische Matrix, Dij = Dji . Wie wir in Kapitel 6.6 lernten,
kann diese Matrix diagonalisiert werden; alle Eigenwerte λi dieser Matrix sind reell.
Kriterium: Wenn alle Eigenwerte λi der Matrix der 2. Ableitungen bei x0 posi-
tiv (negativ) sind, dann ist x0 ein isoliertes Minimum/Maximum. Wenn das nicht
der Fall ist, ist die Bestimmung des Typs des stationären Punktes x0 komplizierter.
Wenn sowohl positive als auch negative λi auftreten, aber alle λi 6= 0, dann handelt
es sich bei x0 um einen Sattelpunkt. Wenn ein oder mehrere λi = 0 und alle λi ≥ 0
(alle λi ≤ 0), dann ist x0 Element eines Kontinuums von Minima (Maxima).

Geometrisch ist diese Diagonalisierung folgendermaßen zu interpretieren: Man


kann die Variablen x1 , . . . , xn als Koordinaten eines Vektors bezüglich einer karte-
sischen ONB auffassen. Die Diagonalisierung von D(2) entspricht dem Übergang zu
einer neuen ONB, dem Hauptachsensystem {v i } von D(2) . Bezüglich dieser neuen
0
P
ONB sind die Koordinaten xi = j Rij xj , wobei R die orthogonale Matrix ist, mit
der D(2) (x0 ) diagonalisiert wird. Es istP f 0 (x0 ) = f (x), wobei man die funktionale
Form von f 0 durch Einsetzen von xi = j (RT )ij xj in f (x) erhält. Man betrachtet
nun die 1. partielle Ableitung ∂f 0 /∂x0i als Funktion der Koordinate x0i in der Um-
gebung des Punktes P0 = (x1 , . . . , xn ), der in der neuen Basis die Koordinaten x0j
hat. D.h. man betrachtet f in Richtung v i . Der i-te Eigenwert λi ist die Steigung
der Tangente in v i -Richtung an die Funktion ∂f 0 /∂x0i im Punkt P0 – vergleichen Sie
mit der analogen Diskussion für Funktionen einer Variablen in Kapitel 2.2.3.
Beispiele:
1) Wir berechnen die Hesse-Matrizen der 2. Ableitungen der in den Abbildungen
7.1, 7.2, 7.3 und 7.5 dargestellten Funktionen bei (x0 , y0 ) = (0, 0). Diese Matrizen
sind in der Reihenfolge der genannten Funktionen:

D(2) (0, 0) = diag(−2, −2), diag(2, 2), diag(2, −2), diag(2, 2) .

Da diese Matrizen bereits diagonal sind, kann man die Eigenwerte λ1 , λ2 unmittelbar
ablesen. Die Rechnung bestätigt, was wir den Abbildungen unmittelbar entnehmen
können: Bei (x0 , y0 ) = (0, 0) haben die Funktionen Fig. 7.2 und 7.5 ein lokales Mi-
nimum, die Funktion Fig. 7.1 ein lokales Maximum und die Funktion Fig. 7.3 einen
Sattelpunkt.
2) Wir berechnen die Hesse-Matrix der Funktion Fig. 7.5 an irgendeinem Punkt x0
170 Einführung in die Theoretische Physik

auf dem Kreis x2 + y 2 = π/2. Die Berechnung der beiden Eigenwerte dieser Matrix
ergibt, dass ein Eigenwert negativ und der andere Eigenwert null ist. (Zu Hause
nachprüfen!) Dies bestätigt formal, dass die Funktion auf dem Kreis x2 + y 2 = π/2
eine Linie von Maxima besitzt.

Die eingehende Untersuchung der stationären Punkte von Funktionen f (x1 , ..., xn )
ist für n > 2, insbesondere für n  1 eine (numerisch) anspruchsvolle Aufgabe.
Die Problemstellung hat viele Anwendungen, nicht nur in der Physik. Wir untersu-
chen im Mechanik-Teil der Vorlesung nur für relativ einfache Systeme, ob stationäre
Punkte vorliegen; wir merken uns die Gleichungen (7.3.6) bis (7.3.8). Beispielsweise
entsprechen die stationären Punkte x0 der potentiellen Energie V = V (x1 , . . . , xn )
eines mechanischen Systems aus n0 Massenpunkten im Raum (3n0 = n), das kei-
nen weiteren Einschränkungen unterliegt, den Gleichgewichtslagen des Systems. Nur
wenn es sich bei x0 um ein Minimum handelt, befinden sich die Massenpunkte bei
x0 in einem stabilen Gleichgewicht – falls sich bei x0 um einen anderen Extremwert
handelt, ist die Gleichgewichtslage instabil gegenüber kleinen Störungen.

7.4 Gradient, Divergenz, Rotation


7.4.1 Gradient
Im Abschnitt 7.2 sahen wir, dass die partiellen Ableitungen von f = f (x, y) folgende
Bedeutung haben:


f (x, y) ↔ Steigung am Punkt (x, y) in x-Richtung bei konstantem y,
∂x

f (x, y) ↔ Steigung am Punkt (x, y) in y-Richtung bei kontantem x.
∂y

Man definiert nun einen Vektor – präziser: ein Vektorfeld – das die gesamte Infor-
mation über die Steigungen von f in beliebiger Richtung in der xy-Ebene enthält:

∂f
 

∂f ∂f  ∂x 
grad f (x) ≡ ex + ey = . (7.4.1)
 
∂x ∂y  ∂f 
∂y

Das Symbol “grad” steht für Gradient.


In unserer Terminologie aus Abschnitt 7.1 ist f (x) ein skalares Feld. Somit ist
grad f (x) offensichtlich ein Vektorfeld. Man bezeichnet es auch als das Gradienten-
feld von f .
Die Verallgemeinerung auf n Variable ist evident.
7.4 Gradient, Divergenz, Rotation 171

-x2-y2
grad(e )
2

y
1.5

0.5

-0.5

-1

-1.5

-2
-2 -1.5 -1 -0.5 0 0.5 1 1.5 2

2 −y 2
Abbildung 7.6: Gradientenfeld von f (x, y) = e−x .

!
∂f (x,y)  
∂x −2x exp(−x2 − y 2 )
∇f (x, y) = ∂f (x,y) =
∂y
−2y exp(−x2 − y 2 )

Definition: Sei f (x) ≡ f (x1 , x2 , ..., xn ) ein stetig differenzierbares skalares Feld.
Diesem Feld wird durch folgende Vorschrift an jeder Stelle x ein Vektorfeld, das
sogenannte Gradientenfeld grad f , zugeordnet:
 
∂1 f
n  ∂2 f 
X ∂f
grad f (x) ≡ ei =  ..  . (7.4.2)
 
i=1
∂xi  . 
∂n f

Es ist üblich und bequem – warum, wird im Laufe der Vorlesung klar – in die-
sem Kontext den sogenannten Nabla-Operator ∇ einzuführen. Das ist ein Vektor-
Differentialoperator6 , der bezüglich einer kartesischen ONB {ei } folgendermaßen
definiert ist: n
∂ ∂ X
∇ ≡ e1 + ... + en = ei ∂i
∂x1 ∂xn i=1
 
∂1 (7.4.3)
 .. 
bzw. ∇ =  .  ,
∂n
6
In der Mathematik versteht man unter einem Operator eine Rechenvorschrift; in diesem Fall
die Vorschrift (7.4.4)
172 Einführung in die Theoretische Physik

grad(x2+y2)
10

y
8

-2

-4

-6

-8

-10
-10 -8 -6 -4 -2 0 2 4 6 8 10

Abbildung 7.7: Gradientenfeld von f (x, y) = x2 + y 2 .

!
∂f (x,y)  
∂x 2x
∇f (x, y) = ∂f (x,y) =
∂y
2y

grad(x2-y2)
10
y

-2

-4

-6

-8

-10
-10 -8 -6 -4 -2 0 2 4 6 8 10

Abbildung 7.8: Gradientenfeld von f (x, y) = x2 − y 2 .

!
∂f (x,y)  
∂x 2x
∇f (x, y) = ∂f (x,y) =
∂y
−2y
7.4 Gradient, Divergenz, Rotation 173

wobei in der Spaltenvektordarstellung zu beachten ist, dass sich diese Darstellung


auf die gewählte kartesische ONB {ei } bezieht.
Anwendung von ∇ auf f bedeutet folgende Rechenvorschrift: Bilde die partiellen
Ableitungen und forme daraus einen Vektor gemäß (7.4.3), d.h.
n
X
∇f (x) = ei ∂i f (x). (7.4.4)
i=1

Die Rechenoperationen grad f und ∇f sind somit identisch.


n
X ∂f
grad f (x) ≡ ∇f (x) = ei . (7.4.5)
i=1
∂xi

Am Symbol ∇ erkennt man das Transformationsverhalten von (7.4.2) unter Dre-


hungen auf Anhieb:
∇(skalares Feld) = Vektorfeld.
Bevor wir einige Beispiele behandeln, noch ein Hinweis zur graphischen Dar-
stellung von Vektorfeldern V (x). In zwei bzw. drei Dimensionen kann man in die
Ebene bzw. in den Raum ein äquidistantes kartesisches Gitter legen und an jedem
Gitterpunkt (x1 , x2 ) bzw. (x1 , x2 , x3 ) den Vektor V (x) als Pfeil einzeichnen. Die
Richtung des Pfeils zeigt die Richtung von V bei x an und die Länge des Pfeils ist
proportional zum Betrag |V (x)|. Auf diese Weise sind in den Abbildungen 7.6, 7.7
und 7.8 die Gradientenfelder ∇f einiger Funktionen f (x, y) dargestellt.

Rechenregeln:
Sei f = f (x), g = g(x). Offensichtlich gelten die Summen-, Produkt- und Quo-
tientenregel der partiellen Differentiation, siehe die entsprechenden Regeln für die
partiellen Ableitungen auf Seite 7.2.4:
∇(f + g) = ∇f + ∇g , (7.4.6)
∇(f g) = (∇f )g + f ∇g , (7.4.7)
 
f 1
∇ = 2 (g∇f − f ∇g) , g 6= 0 . (7.4.8)
g g
Außerdem gilt die Kettenregel (7.2.14) bzw. ihre besprochenen Spezialfälle.

Beispiele:
1. Unterhalb der Abbildungen 7.6, 7.7 und 7.8 sind die Gradienten der Funktionen
f (x, y) = x2 + y 2 , f (x, y) = x2 − y 2 und f (x, y) = exp(−x2 − y 2 ) angegeben.
2. f (r) = a · r = 3i=1 ai xi , wobei a ein konstanter Vektor ist. Dann ist
P

3
X
grad f ≡ ∇f = ei ai = a.
i=1
174 Einführung in die Theoretische Physik

p
3. Sei φ(r) = |r| = x21 + x22 + x23 . Dann ist (mit r ≡ |r|)
3
X 1 r
grad r ≡ ∇r = ei 2xi = .
i=1
2|r| |r|
Man sollte sich das merken: Der Gradient des Betrags des Ortvektors eines
Teilchens ist der Einheitvektor r̂ = r/r, der radial (sternförmig) nach außen
zeigt.
p
4. Sei φ = φ(r), d.h. die Funktion φ hängt nur vom Betrag r = x21 + x22 + x23 des
Koordinatenvektors r ab. Unter Verwendung der Kettenregel in der Version
(7.2.15) erhalten wir
3
X dφ dφ r
∇φ(r) = ei ∂i r = . (7.4.9)
i=1
dr dr |r|
D.h. der Gradient eines skalaren Feldes, das nur vom Betrag des Ortsvektors
abhängt, zeigt – je nach Vorzeichen von dφ/dr – radial vom Ursprung weg
oder auf ihn hin. Das sollte man ebenfalls verinnerlichen!

Beachte: Die Operation grad (Vektorfeld) ist sinnlos, d.h. nicht definiert.

Beispiele für Gradientenfelder in der Physik: Gradientenfelder spielen z.B.


in der Mechanik eine zentrale Rolle. Inbesondere lassen sich manche (aber nicht alle)
Kraftfelder als Gradient eines skalaren Feldes darstellen.
F (x) = −∇V (x). (7.4.10)
Der Vektor x entspricht dem Ort eines Teilchens, auf das F (x) einwirkt. Wie wir
im Mechanik-Teil der Vorlesung sehen werden, gibt V (x) die potentielle Energie des
Teilchens in diesem Kraftfeld an. Die Bedeutung der Vorzeichenkonvention bespre-
chen wir unten bzw. ebenfalls im Mechanik-Teil.
Wenn V nicht explizit von der Zeit abhängt, bezeichnet man F als konservative
Kraft. Wenn V explizit von der Zeit abhängt, V = V (x, t), nennt man eine Kraft
der Form F = −∇V eine Potentialkraft.
Ein wichtiger Spezialfall sind konservative Zentralkräfte, deren Zentrum sich an ei-
nem Punkt x0 befindet. An jedem Punkt x im Raum zeigt der Vektorpfeil einer
solchen Kraft sternförmig entweder zum Punkt x0 hin oder von im weg. Wird das
Koordinatensystems so gewählt, dass x0 sein Ursprung ist, also x0 = 0, dann sind
diese Kräfte von der Form (7.4.9). Als Beispiele seien genannt:
1. Hooksche Federkraft: F H = −k(x − x0 ), k > 0.
k
VH (x) = (x − x0 )2 + const. ⇒ F H = −∇VH (x) = −k(x − x0 ) .
2
Wir können das Koordinatenssystem so wählen, dass x0 sein Ursprung ist.
Dann V = kr2 /2 + const.
7.4 Gradient, Divergenz, Rotation 175

2. Gravitationskraft eines Massenpunktes der Masse m2 auf einen Massenpunkt


der Masse m1 : Wir wählen das Koordinatenssystem KS so, dass sich m2 im
Ursprung von KS befindet. Der Abstand von m1 zum Ursprung sei r = |r|
und G bezeichne die Gravitationskonstante. Dann ist
m1 m2 m1 m2
F G,2→1 = −G 3 r = −G 2 r̂ , (7.4.11)
r r
wobei r̂ ≡ r/r. Diese Kraft kann folgendermaßen dargestellt werden:
m1 m2
VG (r) = −G + const. ⇒ F G,2→1 = −∇VG (r) .
r
Hinweise:
1) Die mathematische Form von F H und F G sind Naturgesetze, d.h. durch Mes-
sungen belegt. Diese Beispiele zeigen folgenden wichtigen Sachverhalt: Bei Kräften,
die als Gradient eines skalaren Feldes dargestellt werden können, ist die jeweilige
skalare Funktion nicht eindeutig, sondern durch die empirisch bestimmte Form von
F nur bis auf eine Konstante festgelegt.
2) Bei der Frage, ob ein Vektorfeld F tatsächlich als Gradient eines skalaren Fel-
des darstellbar ist, muss eine mathematische Feinheit beachtet werden, die wir in
Abschnitt 7.7.3 besprechen. Zur o.g. Gravitationskraft, siehe auch Seite 202.

Richtungsableitung:
Wir greifen das Thema “Steigung von f bezüglich einer bestimmten Richtung” wie-
der auf – siehe den Anfang dieses Abschnitts, Seite 170. Anhand von (7.4.5) sieht
man sofort, dass man die Steigung von f in Richtung ei durch skalare Multiplikation
von ∇f mit ei erhält:
∂f
= ei · ∇f. (7.4.12)
∂xi
Dabei benutzten wir, dass die ei eine ONB bilden, ei · ej = δij .
Die Steigung bezüglich einer beliebigen Richtung n erhält man durch die soge-
nannte Richtungsableitung, die wie folgt definiert ist:
∂f
≡ n · ∇f,
∂n (7.4.13)
n Einheitsvektor, |n| = 1.
Beachte: ∂f /∂n ist eine skalare Größe; deswegen wird in diesem Symbol das Vek-
torsymbol n nicht verwendet.

Geometrische Interpretation von ∇f :


Um die geoemtrische Bedeutung des Vektors ∇f zu klären, sei zunächst an folgendes
erinnert. Die Menge der Punkte, für die

f (x) = c, (7.4.14)
176 Einführung in die Theoretische Physik

-x2-y2
grad(e ) grad(x2+y2) grad(x2-y2)
2 10 10
y

y
8 8
1.5

6 6
1
4 4

0.5
2 2

0 0 0

-2 -2
-0.5

-4 -4
-1
-6 -6

-1.5
-8 -8

-2 -10 -10
-2 -1.5 -1 -0.5 0 0.5 1 1.5 2 -10 -8 -6 -4 -2 0 2 4 6 8 10 -10 -8 -6 -4 -2 0 2 4 6 8 10

x x x
2
−y 2
(a) e−x (b) x2 + y 2 (c) x2 − y 2

Abbildung 7.9: Äquipotentiallinien und Gradientenfelder der Funktionen (= skalare


Felder) aus den Abb. 7.6, 7.7 und 7.8. Der Vektor ∇f (x) steht stets senkrecht zu
diesen Äquipotentiallinien und zeigt in Richtung des steilsten Anstiegs von f (x).

wobei c eine vorgegebene Konstante ist, definiert – wie bereits am Anfang dieses
Kapitels erwähnt wurde – eine Hyperfläche, die man in der Physik, insbesondere in
der Mechanik oft Äquipotentialfläche nennt7 . Dieser Begriff stammt aus der Mecha-
nik: Wenn f (x) die potentielle Energie eines Massenpunktes ist, dann ist die Fläche
f (x) = c die Menge aller Ortskoordinaten des Massenpunktes, für die seine poten-
tielle Energie den konstanten Wert c annimmt. Ein wichtiger Spezialfall ist die mit
einer am Ursprung zentrierten Zentralkraft assoziierten potentiellen Energie; sie ist
von der Form V = V (r). D.h. in diesem Fall sind die Äquipotentialflächen Kugeln
um den Ursprung. Ist die Zentralkraft bei x0 6= 0 zentriert, ist V = V (|x − x0 |),
d.h. die Äquipotentialflächen sind Kugeln um das Zentrum x0 .
Im Fall zweier Variablen definiert f (x1 , x2 ) = const. eine Kurve, eine sog. Äquipo-
tentiallinie.

Beispiele für Äquipotentiallinien:


1. Wir betrachten die Funktionen aus den Abbildungen 7.1 7.2 7.3
2 −y 2
(a) f (x, y) = e−x , Abbildung 7.1,
2 2
(b) f (x, y) = x + y , Abbildung 7.2,
(c) f (x, y) = x2 − y 2 , Abbildung 7.3.
In den Beispielen a) und b) sind die Äquipotentiallinien Kreise, im Beispiel c)
sind sie Hyperbeln, siehe Abbildung 7.9.
2. Sei φ(r) = a · r = 3i=1 ai xi . Dann definiert φ = const. eine Ebene im Raum.
P
Der Vektor ∇φ = a steht senkrecht auf dieser Ebene.
7
Bei einem Temperatur- oder Druckfeld, das die Temperatur bzw. den Druck an einem Raum-
punkt angibt, liefert T (x, y, z) = T0 bzw. p(x, y, z) = p0 natürlich die Isothermen bzw. Isobaren,
d.h. Flächen gleicher Temperatur bzw. gleichen Drucks im Raum.
7.4 Gradient, Divergenz, Rotation 177

Totales Differential:
Das totale Differential (7.2.12), das die infinitesimale Funktionsänderung bei infi-
nitesimalen Änderungen dxi aller Variablen xi angibt, kann mit ∇f geschrieben
werden als
n
X ∂f
df = dxi = (∇f ) · dx. (7.4.15)
i=1
∂x i

Wenn wir vom Punkt x auf einer Äquipotentialfläche von f zum Punkt x + dx,
der ebenfalls auf dieser Fläche liegt, fortschreiten, ändert sich der Wert von f
nicht. Demzufolge ist df = 0. Somit

x → x + dx auf d. Äquipotentialfläche ⇒ df = 0
⇒ (∇f ) · dx = 0
⇒ ∇f (x) ⊥ zur Fläche f (x)= const im Punkt x.

Diesem Ergebnis entnehmen wir die geometrische Bedeutung von ∇f (x).


Merke:
1) Die Richtung von ∇f (x) ist senkrecht zu den Flächen f (x) = c am jeweili-
gen Punkt x. Mit anderen Worten: Man erhält den Normalenvektor n einer (Hy-
per)Fläche an einem Punkt x0 durch Berechnung des Gradienten ∇f (x0 ) und an-
schließender Normierung dieses Vektors auf Eins.
2) Der Vektor ∇f (x) zeigt immer in eine Richtung, in der die Funktion f (x) zu-
nimmt. Das folgt aus der Definition (7.4.5) und aus der Bedeutung von ∂i f als
Tangentensteigung in Richtung ei ; siehe dazu die Beispiele in den Abb. 7.6, 7.7 und
7.8. In der Tat gibt die Richtung von ∇f (x0 ) die Richtung des stärksten Anstiegs8
der Funktion f (x) am Punkt x0 an. Das sieht man folgendermaßen: Wir bilden die
Richtungsableitung am Punkt x0 in Richtung eines beliebigen Einheitsvektors a,
|a| = 1, und benutzen die Schwarzsche Ungleichung (5.4.5) aus Kapitel 5:

|a · ∇f (x0 )| ≤ |a||∇f (x0 )| = |∇f (x0 )| .

Falls ∇f (x0 ) 6= 0 wird die Anstiegsstärke maximal, wenn man

∇f (x0 )
a=
|∇f (x0 )|

wählt. Falls ∇f (x0 ) = 0, ist f (x) in einer infinitesimalen Umgebung von x0 kon-
stant, d.h. f steigt bei x0 weder an noch ab.
3) Der Betrag |∇f (x0 )| gibt die Stärke des Anstiegs von f (x) senkrecht zu den
Äquipotentialflächen f (x) = c an. In Abbildung 7.9 ist das durch die Dichte der
Äquipotentiallinien visualisiert.

8
Der Begriff Gradient hat seinen Ursprung im lateinischen Wort gradiens = fortschreiten.
178 Einführung in die Theoretische Physik

An dieser Stelle können wir auch den Grund für die Vorzeichenkonvention in
der Darstellung F = −∇V von konservativen oder Potentialkräften besprechen.
Die ,,von außen” geleistete mechanische Arbeit an einem Körper ist die Energie,
die man aufbringen muss, um den Körper in einem Kraftfeld F vom Punkt x0
nach x1 zu bringen, siehe Abschnitt 7.7. Beispiel: Man hebt einen Stein vom Erd-
boden auf und bringt in auf eine Höhe h. Wegen der Energieerhaltung führt die
von außen zugeführte Energie zu einer Erhöhung der potentiellen Energie V (x) des
Körpers. Stoppt man die Energiezufuhr, d.h. lässt man den Stein los, wird er durch
die Schwerkraft zum Erdboden hin beschleunigt, die potentielle Energie des Steins
nimmt ab. Die Schwerkraft wirkt offensichtlich in Richtung des stärksten Abfalls der
potentiellen Energie; deswegen F = −∇V . Warum V in der Tat der potentiellen
Energie eines Körpers in einem Kraftfeld des genannten Typs entspricht, besprechen
wir im Mechanik-Teil der Vorlesung.

Kompakte Darstellung der Taylor-Formel:


Mit Hilfe des Gradienten lassen sich die in Abschnitt 7.3 besprochenen Taylor-
Entwicklungen kompakter darstellen. Wir betrachten eine Funktion f = f (x), x =
(x1 , . . . , xn ) und entwickeln an der Stelle x0 . Dann können wir die obigen Taylor-
Formeln bis zur 2. Ordnung folgendermaßen angeben:
n
1 X
(xi − x0i )(xj − x0j )∂i ∂j f (x0 ) + O (∆xi )3 .

f (x) = f (x0 ) + (x − x0 ) · ∇f (x0 ) +
2! i,j=1
(7.4.16)

7.4.2 Divergenz
Man kann den Nabla-Operator (7.4.3) auch auf ein differenzierbares Vektorfeld A(x)
anwenden. Erfolgt die Anwendung in Form einer skalaren ,,Multiplikation”, erhält
man ein skalares Feld, das man die Divergenz von A(x) nennt.

Definition: Sei
3
X
A(x) = Ai (x)ei
i=1
ein stetig differenzierbares Vektorfeld, wobei {ei } eine kartesische ONB ist. Seine
Divergenz ist bezüglich dieser Basis definiert als
div A(x) ≡ ∇ · A(x) ≡ ∂1 A1 + ∂2 A2 + ∂3 A3 . (7.4.17)
Man erhält (7.4.17) formal durch Skalarproduktbildung der kartesischen Darstellung
von ∇ mit A.
Merke:
∇ · Vektorfeld = skalares Feld.
Sei φ(x) ein skalares Feld: div φ ist nicht definiert.
7.4 Gradient, Divergenz, Rotation 179

Beispiele:
1. Sei A = a ein konstantes Vektorfeld. Dann ist
3
X
div a ≡ ∇ · a = ∂i ai = 0.
i=1

2. Sei A = r. Dann ist


3
X n
X
div r ≡ ∇ · r = ∂i xi = 3 bzw. im Rn : div r = ∂i xi = n .
i=1 i=1

Rechenregeln:
1. ∇ · (A + B) = ∇ · A + ∇ · B.

2. ∇ · (cA) = c∇ · A, c ∈ C.

3. Sei A(x) ein Vektorfeld und φ(x) ein skalares Feld. Dann gilt

∇ · (φA) = φ∇ · A + A · ∇φ.

Mit den Symbolen div und grad lautet diese Rechenregel:

div (φA) = φ div A + A · grad φ.

Zur Herleitung dieser Formel verwendet man Definition (7.4.17) und die Pro-
duktregel ∂i (φAi ) = φ∂i Ai + Ai ∂i φ .
n
X n
X
∇ · (φA) = ∂i (φAi ) = (φ∂i Ai + Ai ∂i φ)
i=1 i=1
Xn
=φ ∂i Ai + A · ∇φ .
i=1

4. Oft benötigt man die Divergenz eines Gradientenfeldes ∇φ. Durch Bilden des
Skalar,,produkts” von ∇ und ∇φ erhalten wir:
∂2φ ∂2φ ∂2φ
∇ · ∇φ = + + ≡ ∆φ,
∂x21 ∂x22 ∂x23
wobei
∆ ≡ ∂12 + ∂22 + ∂32 (7.4.18)
der sogenannte Laplace-Operator in kartesischen Koordinaten ist. Mit den
Symbolen div und grad lautet dieses Ergebnis:

div grad φ = ∆φ. (7.4.19)


180 Einführung in die Theoretische Physik

Die Identität (7.4.19) gilt natürlich nur für ein skalares Feld. Der Laplace-
Operator (7.4.18) kann auch auf ein Vektorfeld A angewendet werden. In einer
kartesischen Basis ist

∆A = e1 ∆A1 + e2 ∆A2 + e3 ∆A3 .

Bei einer Darstellung von A in einer ,,krummlinigen” Basis (siehe Abschnitt (7.5))
hat ∆A eine kompliziertere Form. Diese lernen Sie in der Vorlesung Theoretische
Physik 2: Elektrodynamik kennen.
Interpretation von div A:
Die Divergenz eines Vektorfeldes A(x) wird als lokale Quellenstärke von A(x) in-
terpretiert. Als Beispiel betrachten wir eine Flüssigkeit. Makroskopisch betrachtet
kann eine Flüssigkeit als Kontinuum von Teilchen (Molekülen) aufgefasst werden.
Der Stromdichtevektor der Flüssigkeit ist j(x, t) = n(x, t)v(x, t), wobei [n] = Zahl
d. Teilchen/Volumen und somit [j] = Zahl d. Teilchen/(Fläche×Zeit). Wir betrach-
ten ein kleines Volumen ∆V am Punkt x. Man kann sich fragen, ob pro Zeiteinheit
mehr Flüssigkeit aus diesem Volumen heraus- als hineinströmt. Im Limes ∆V → 0
ist die Antwort gegeben durch div j(x). (Eine Begründung dieser Aussage finden
Sie z.B. im Buch von S. Großmann.) Man nennt deshalb div j(x) manchmal das
Quellenfeld des Feldes j(x) – jedenfalls ist div j(x) ein Maß für eine Quelle (wenn
div j(x) > 0) oder eine Senke (wenn div j(x) < 0) von j(x) an der Stelle x. Eine
befriedigende Erklärung dieser Aussagen erhält man mit Hilfe des Gaußschen Inte-
gralsatzes, der in der HöMa3- und Theo-2 Vorlesung besprochen wird.
Ein weiteres Beispiel sind Magnetfelder – präzise, die magnetische Induktion B. Da
bisher keine magnetischen Ladungen gefunden wurden, gilt für beliebige B-Felder:
div B(x, t) = 0. (Das lernen Sie in den Vorlesungen zur Elektrodynamik.) D.h. die
magnetische Induktion B(x, t) ist immer quellenfrei.

7.4.3 Rotation
Sei A(x) ein stetig differenzierbares Vektorfeld. Mit Hilfe des Nabla-Operators ∇
und dem Vektorprodukt können wir A ein Vektorfeld zuordnen, die sogenannte
Rotation von A. Diese ist in einer kartesischen Basis definiert durch

3
X ∂
rot A ≡ ∇ × A ≡ ei ijk Ak
i,j,k=1
∂xj (7.4.20)
= (∂2 A3 − ∂3 A2 )e1 + (∂3 A1 − ∂1 A3 )e2 + (∂1 A2 − ∂2 A1 )e3 .

Merke:
rot × Vektorfeld = Vektorfeld.

rot (skalares Feld) ist nicht definiert.


7.4 Gradient, Divergenz, Rotation 181

Beispiele:

1. A = r:
3
X
rot r ≡ ∇ × r = ei ijk ∂j xk = 0 ,
|{z}
i,j,k=1
δjk

wobei verwendet wurde, dass ijj = 0.

2. A = ω × r, wobei ω ein im Raum konstanter Vektor sei:


3
X ∂
rot (ω × r) ≡ ∇ × (ω × r) = ei ijk (ω × r)k
i,j,k=1
∂xj
3 3 3
X ∂ X X
= ei ijk klm ωl xm = ei ijk klm ωl ∂j xm .
i,j,k=1
∂xj l,m=1 i,j,k,l,m=1
| {z }
δjm

Wir verwenden nun, dass ijk = kij und zudem die Relation (5.4.31) aus
Kapitel 5:
X3
kij klm = δil δjm − δim δjl .
k=1

Mit dieser Formel erhalten wir:


3
X 3
X
rot (ω × r) = ei (δil δjm − δim δjl )ωl δjm = ei 2ωi = 2ω , (7.4.21)
i,j,l,m=1 i=1
P P
wobei benutzt wurde, dass j,m δjm δjm = j δjj = 3.
Wer den Umgang mit dem -Symbol (noch) scheut, kann dieses Ergebnis auch
komponentenweise herleiten. Z.B. ist die Komponente von e1 :

(rot A)1 = ∂2 A3 − ∂3 A2 ,

wobei hier A3 = ω1 x2 − ω2 x1 und A2 = ω3 x1 − ω1 x3 .

Interpretation von rot A:


Die Rotation eines Vektorfeldes A kann als Maß für die lokale Wirbelstärke von A
interpretiert werden. Wir betrachten dazu als instruktives Beispiel das Geschwin-
digkeitsfeld v einer Flüssigkeit, das von der Form v(x) = ω × x sei. Hier ist x der
Ortsvektor eines Flüssigkeitsteilchens und ω sei ein konstanter Vektor in Richtung
e3 . (Der Einfachheit halber sei ω auch zeitunabhängig.) Der Geschwindigkeitsvek-
tor v an der Stelle x steht senkrecht auf der von ω und x aufgespannten Ebene; er
liegt immer in einer zu ω senkrechten Ebene. In der graphischen Darstellung von
v(x) in Abbildung 7.10 wurde ω als x3 -Achse des Koordinatensystems gewählt. Die
Abbildung zeigt, dass v(x) einen Wirbel beschreibt, dessen Drehachse die x3 -Achse
ist. Die Beträge der Geschwindigkeitspfeile wachsen linear mit dem Abstand von der
182 Einführung in die Theoretische Physik

Abbildung 7.10: Das Vektorfeld A = ω × r, dargestellt in der x1 x2 -Ebene, wobei


ω ∝ e3 gewählt wurde. Das Bild zeigt auch die Drehrichtung eines sich in diesem
Strömungsfeld befindenden Korkens. (Aus dem Buch von Lang und Pucker.)

x3 -Achse an. Die Drehrichtung des Wirbels ist durch die Richtung von ω festgelegt.
In (7.4.21) zeigten wir, dass rot v = 2ω; d.h. die Rotation von v ist proportional
zum Drehvektor ω, der die Drehrichtung und die Stärke des Wirbels bestimmt.
Vektorfelder mit nichtverschwindender Rotation,
rot A 6= 0 ,
bezeichnet man als Wirbelfelder.

Hinweise:
1) Wenn v = ω ×x die Geschwindigkeit eines Teilchens ist, dann ist ω = |ω| = 2π/T
die Winkelgeschwindigkeit (= Kreisfrequenz) des Teilchens. Das sieht man folgender-
maßen. Es ist |v| = |ω × x| = ωr⊥ , wobei r⊥ = |x| cos θ, θ = ∠(ω, x). Andererseits
ist der bei einer Umdrehung um die Achse zurückgelegte Weg des Teilchens gleich
dem Kreisumfang 2πr⊥ . Somit ist der Betrag der Geschwindigkeit |v| = 2πr⊥ /T ,
wobei T die Umlaufzeit ist. Da die Winkelgeschwindigkeit durch ω = 2π/T definiert
ist, ist die obige Aussage gezeigt: Ein Teilchen mit der Geschwindigkeit v(x) = ω×x
bewegt sich auf einem Kreis ⊥ ω mit Radius r⊥ und hat die Winkelgeschwindigkeit
ω.
2) Wir betrachten das folgende zweidimensionale Vektorfeld in der x1 x2 -Ebene:
1
B= (e3 × r), r = xe1 + ye2 , r ∈ R2 \ {(0, 0)} , (7.4.22)
r2
wobei e3 ⊥ r. Das Feld B ist im Urprung singulär. Die Vektorpfeile dieses Feldes
zirkulieren um den Ursprung. (Die graphische Darstellung von B hat qualitativ die
in Fig. 7.10 gezeigte Form – allerdings ist hier |B| = 1/r.) Man findet mit Hilfe der
Formel (7.4.24) und dem Ergebnis (7.4.21), dass
rot B = 0 ∀r ∈ R2 \ {(0, 0)} . (7.4.23)
Im Ursprung wird rot B singulär. Wir kommen auf dieses Beispiel in Abschnitt 7.7.2
und in einer Übungsaufgabe zurück.
7.4 Gradient, Divergenz, Rotation 183

Rechenregeln:
1. ∇ × (A + B) = ∇ × A + ∇ × B.

2. ∇ × (cA) = c∇ × A, c ∈ C.

3. Seien A(x) und φ(x) ein differenzierbares Vektorfeld bzw. skalares Feld. Dann
gilt
∇ × (φA) = φ∇ × A + (∇φ) × A. (7.4.24)
Mit den Symbolen rot und grad lautet diese Formel:

rot (φA) = φ rot A + grad φ × A.

Zur Herleitung verwendet man die Definition (7.4.20) und die Produktregel
∂i (φAi ) = φ∂i A + Ai ∂i φ.

4. Sei φ(x) zweimal stetig differenzierbar in x ∈ Ω. Dann

rot (grad φ) ≡ ∇ × ∇φ = 0. (7.4.25)

Dies folgt durch Einsetzen von Ak = ∂k φ in die Definition (7.4.20) und der
Verwendung von ijk = −iki und ∂j ∂k φ = ∂k ∂j φ. Die gemischten partiel-
len Ableitungen sind vertauschbar, weil φ nach Voraussetzung zweimal stetig
differenzierbar ist (siehe den Satz von H.A. Schwarz). Man sagt, Gradienten-
felder sind wirbelfrei. Dieses Ergebnis verwenden wir im Abschnitt 7.7 und
im Mechanik-Teil der Vorlesung.

5. Wirbelfelder sind quellenfrei. Sei A(x) ein in x ∈ Ω zweimal stetig diffe-


renzierbares Vektorfeld. Dann

div (rot A) ≡ ∇ · (∇ × A) = 0 x ∈ Ω.

Beweis:
3
X X X
∇ · (∇ × A) = ∂i (∇ × A)i = ∂i ijk ∂j Ak = ijk ∂i ∂j Ak = 0;
i=1 i,j,k i,j,k

denn ∂i ∂j Ak = ∂j ∂i Ak , weil A nach Voraussetzung zweimal stetig differenzier-


bar ist, aber ijk = −jik .

Hinweise:
1) Man kann noch eine Reihe weiterer nützlicher Formeln vom obigen Typ für diffe-
renzierbare Vektorfelder A(x), B(x) herleiten, z.B. für grad (A · B), div (A × B),
rot (A × B), siehe z.B. das Buch von Bronstein et al. Wir benötigen diese Formeln
in dieser Vorlesung nicht.
2) In der Mechanik benötigen wir vor allem ∇φ. Die Operationen div , rot werden
184 Einführung in die Theoretische Physik

Ihnen z.B. in der Vorlesung Theoretische Physik 2: Elektrodynamik ständig begeg-


nen.
3) Beachten Sie, dass wir grad , div , rot hier nur bezüglich einer kartesischen Ba-
sis darstellten. In der (theoretischen) Physik benötigt man die Darstellungen von
grad φ, div A, rot A, ∆φ, ∆A auch bezüglich krummliniger Koordinatenbasen, ins-
besondere bezüglich der Zylinder- und Polarkoordinatenbasis (siehe den nächsten
Abschnitt). Diese Darstellungen lernen Sie in den Vorlesungen zur Theoretischen
Physik ab dem 2. Semester kennen.

7.5 Polarkoordinaten und Zylinderkoordinaten


Nicht immer ist in der Physik die Verwendung eines kartesischen Koordinatensys-
tems zweckmäßig. Weisen physikalische Probleme beispielsweise eine Kugelsymme-
trie oder Zylindersymmetrie auf, so empfiehlt sich die Verwendung diesbezüglicher
Koordinatensysteme.

7.5.1 Ebene Polarkoordinaten


Wir betrachten zunächst zweidimensionale Probleme. Sei r = (x, y) der Ortsvektor
eines Teilchens. Anstelle kartesischer Koordinaten können wir auch ebene Polar-
koordinaten benutzen – siehe Abbildung 7.11. Diese Koordinaten verwendeten wir
bereits im Kapitel 3 über komplexe Zahlen.
p y
r = x2 + y 2 , φ = arctan , x = r cos φ ,
x ⇒ . (7.5.1)
0 ≤ r < ∞, 0 ≤ φ < 2π , y = r sin φ .

Am Usprung x = y = 0 ist φ unbestimmt. Wir können die Koordinaten von r


bezüglich einer kartesischen Basis {e1 , e2 } auch durch Polarkoordinaten ausdrücken:

r = xe1 + ye2 = (r cos φ)e1 + (r sin φ)e2 = r(r, φ). (7.5.2)

Koordinatenlinien:
• Alle Punkte in einer Ebene, deren r-Koordinate den Wert r0 hat, liegen auf
einem Kreis mit Radius r0 um den Ursprung 0, siehe Abbildung 7.11(b).
Dieser Kreis besitzt die Parameterdarstellung

r(r0 , φ) = r0 cos φ e1 + r0 sin φ e2 , 0 ≤ φ < 2π, (7.5.3)

wobei φ die Rolle des Kurvenparameters spielt. Die Kreise (7.5.3) nennt man
die φ-Koordinatenlinen, kurz, die φ-Linien.
• Alle Punkte in einer Ebene, deren φ-Koordinate den Wert φ0 hat, liegen auf
einem vom Ursprung 0 ausgehenden Strahl, der mit der positiven x-Achse den
Winkel φ0 einschließt, siehe Abbildung 7.11(b).
7.5 Polarkoordinaten und Zylinderkoordinaten 185

φ = const
y

r x

φ x
r = const

(a) Koordinaten. (b) Koordinatenlinien.


y

~eφ
~er

~r
x

(c) Basisvektoren.

Abbildung 7.11: Ebene Polarkoordinaten. Die Linien φ = const nennt man die r-
Linien; r = const sind die φ-Linien.
186 Einführung in die Theoretische Physik

Die Parameterdarstellung dieses Strahls mit r als Kurvenparameter ist


r(r, φ0 ) = r cos φ0 e1 + r sin φ0 e2 , 0 ≤ r < ∞. (7.5.4)

Diese Strahlen nennt man die r-Linien.


Das (r, φ)-Koordinatennetz ist offensichtlich krummlinig. Deswegen sind ebene Po-
larkoordinaten, ebenso wie Zylinderkoordinaten und räumliche Polarkoordinaten
(siehe unten), Beispiele für krummlinige Koordinatensysteme. Allerdings schneiden
sich die Koordinatenlinien dieser Systeme an jedem Punkt unter einem rechten Win-
kel, siehe (7.5.6). Es handelt sich bei diesen Systemen um sog. orthogonale krumm-
linige Koordinatensysteme.

Tangentenvektoren:
Durch jeden Punkt der xy-Ebene – außer dem Ursprung 0 – gehen zwei der soeben
besprochenen Koordinatenlinien, d.h. Kurven (7.5.3), (7.5.4), die sich rechtwinklig
schneiden. Dies folgt aus der Orthogonalität der Tangentenvektoren an diese Ko-
ordinatenlinien im Punkt (r0 , φ0 ), die wir jetzt berechnen. (Zur Berechnung dieser
Vektoren siehe (5.5.22) in Kapitel 5.)
   
dr(r0 , φ) ∂r(r, φ)
Kurve (7.5.3) ⇒ Tangentenvektor = .
dφ φ=φ0 ∂φ r=r0
φ=φ0
   
dr(r, φ0 ) ∂r(r, φ)
Kurve (7.5.4) ⇒ Tangentenvektor = .
dr r=r0 ∂r r=r0
φ=φ0

Für einen beliebigen Punkt (r, φ) sind diese Tangentenvektoren gegeben durch
∂r(r, φ) (7.5.2)
= cos φ e1 + sin φ e2 ,
∂r
(7.5.5)
∂r(r, φ) (7.5.2)
= −r sin φ e1 + r cos φ e2 .
∂φ
Diese beiden Vektoren stehen offensichtlich senkrecht aufeinander. Wir dividieren
diese Vektoren noch durch ihre Beträge. Somit erhalten wir zu jedem Punkt (r, φ)
zwei zueinander orthogonale Einheitsvektoren er und eφ (siehe Abbildung 7.11(c)).
∂r
∂r
er ≡ ∂r = cos φ e1 + sin φ e2 ,
∂r
∂r (7.5.6)
∂φ
eφ ≡ ∂φ = − sin φ e1 + cos φ e2 .

∂r

Es ist er · eφ = 0.
Die Einheitsvektoren er , eφ bilden offensichtlich eine ONB im R2 , d.h. wir können
jedes Vektorfeld A(x) ∈ R2 auch nach er , eφ entwickeln:
A(x) = A1 (x, y)e1 + A2 (x, y)e2 = Ar (r, φ)er + Aφ (r, φ)eφ . (7.5.7)
7.5 Polarkoordinaten und Zylinderkoordinaten 187

Die Komponenten Ar (r, φ) und Aφ (r, φ) erhalten wir, indem wir in A1 , A2 die Koor-
dinaten x, y durch r, φ ausdrücken, siehe Gleichung (7.5.1), und dann (7.5.7) skalar
mit er und eφ multiplizieren. Es ist

Ar = A · er , Aφ = A · eφ . (7.5.8)

Ist das Vektorfeld A(x) in der Polarkoordinatenform (rechte Seite von (7.5.7) gege-
ben, dann erhält man seine Komponenten in einer kartesischen Basis durch

A1 = A · e1 , A2 = A · e2 , (7.5.9)

wobei in den Komponentenfunktionen Aρ , Aφ die Polarkoordinaten ρ, φ durch x, y


ausgedrückt werden müssen (siehe oben).

P2
Beispiel: Der Ortsvektor r = i=1 xi ei ist in der Basis er , eφ gegeben durch

r = rer .

Hinweise:
1) Im Gegensatz zu den kartesischen Basisvektoren e1 , e2 hängen er , eφ vom Ort,
d.h. von φ ab.
2) ,,Darstellung eines zweidimensionalen Vektorfeldes in der Polarkoordinatenbasis”
bezieht sich auf die rechte Seite von (7.5.7). Manchmal ist es zweckmäßig, A nach
einer kartesischen Basis zu entwickeln, aber anstelle der Koordinaten x, y die Polar-
koordinaten r, φ zu verwenden, also in den Feldkomponenten A1 , A2 auf der linken
Seite von (7.5.7) die Relationen x = r cos φ, y = r sin φ einzusetzen. Diese beiden
Darstellungen dürfen nicht verwechselt werden! Bei der Darstellung von A in der Po-
larkoordinatenbasis müssen bei der (partiellen) Differentiation von A nach einer der
Koordinaten auch die Basisvektoren er , eφ differenziert werden. Da hier er = er (φ),
eφ = eφ (φ), ist ∂ea /∂φ 6= 0. Wenn φ = φ(t), dann der /dt 6= 0, deφ /dt 6= 0, d.h. die
Richtung dieser Einheitsvektoren ändert sich mit der Zeit. In einer Übung leiten wir
die Darstellung der Geschwindigkeit und der Beschleunigung eines Teilchens in der
Polarkoordinatenbasis her.

7.5.2 Zylinderkoordinaten
Wir betrachten zunächst eine kartesische Basis in drei Dimensionen. Anstelle karte-
sischer Koordinaten verwenden wir Zylinderkoordinaten ρ, φ, z, definiert durch
p y
ρ= x2 + y 2 , φ = arctan , z = z,
x
0 ≤ ρ < ∞, 0 ≤ φ < 2π, −∞ < z < ∞, (7.5.10)
beziehungsweise
x = ρ cos φ, y = ρ sin φ, z = z,
188 Einführung in die Theoretische Physik

siehe Abbildung 7.12. Auf der z-Achse ist φ unbestimmt, d.h. nicht wohldefiniert.
Für den Ortsvektor erhält man
r = xe1 + ye2 + ze3 = ρ cos φ e1 + ρ sin φ e2 + z e3 = r(ρ, φ, z). (7.5.11)
Das Zylinderkoordinatennetz erhält man folgendermaßen. Zunächst führt man Ko-
ordinatenflächen r(ρ0 , φ, z), r(ρ, φ0 , z) und r(ρ, φ, z0 ) ein, deren Gestalt aus der
Abbildung 7.12(b) ersichtlich ist.
ρ = ρ0 ↔ Zylindermantel um z-Achse,
φ = φ0 ↔ Halbebene ⊥ xy-Ebene mit z-Achse als Randlinie,
z = z0 ↔ Ebene parallel zur xy-Ebene.
Die Schnittkurve zweier Koordinatenflächen definiert eine Koordinatenlinie, siehe
Fig. 7.12. Die Koordinatenlinien sind analytisch durch r(ρ0 , φ0 , z), r(ρ, φ0 , z0 ) und
r(ρ0 , φ, z0 ) gegeben; man bezeichnet sie (in der angegebenen Reihenfolge) als z-, ρ-
und φ-Linien. Durch jeden Punkt r(ρ0 , φ0 , z0 ) im Raum laufen drei Koordinatenli-
nien, die sich paarweise senkrecht schneiden. Das folgt aus der Orthogonalität der
Tangentenvektoren, die wir jetzt bestimmen.
Wie in 7.5.1 können wir nun die Tangenteneinheitsvektoren an diese Koordina-
tenlinien im Punkt ρ, φ, z berechnen, siehe Abbildung 7.12(c). Wir erhalten
∂r
∂ρ
eρ ≡ = cos φ e1 + sin φ e2 ,
∂r
∂ρ
∂r
∂φ
eφ ≡ = − sin φ e1 + cos φ e2 , (7.5.12)
∂r
∂φ
∂r
∂z
ez ≡ ∂r = e3 .
∂z

Die Einheitsvektoren eρ , eφ , ez bilden eine ONB.


ea · eb = δab , a, b = ρ, φ, z. (7.5.13)
Wir können jedes Vektorfeld A(x) auch nach dieser Basis entwickeln.
3
X
A(x) = Ai (x, y, z)ei = Aρ (ρ, φ, z)eρ + Aφ (ρ, φ, z)eφ + Az (ρ, φ, z)ez , (7.5.14)
i=1

wobei
Aρ = A · eρ , Aφ = A · eφ , Az = A · ez . (7.5.15)
Ist A(x) in der Zylinderkoordinatenbasis gegeben, berechnet man seine Komponen-
ten in einer kartesischen Basis mit Relationen analog zu (7.5.9).
Beispiel: In der Zylinderkoordinatenbasis ist der Ortsvektor r = ρeρ + zez .
Bemerkung: Die Hinweise auf Seite 187 gelten analog. Hier ist eρ = eρ (φ), eφ =
eφ (φ), während ez ein konstanter Einheitsvektor ist.
7.5 Polarkoordinaten und Zylinderkoordinaten 189

z φ = φ0

z = z0

ρ = ρ0

P (ρ, φ, z) y
0

z
0 y
x
φ
ρ

x
(a) Koordinaten. (b) Koordinatenflächen und -linien.
z

~ez

~eρ

~eφ

~ez
~eφ
~eρ
0 y

x
(c) Basisvektoren.

Abbildung 7.12: Zylinderkoordinaten.


190 Einführung in die Theoretische Physik

z φ = φ0

z
θ = θ0

P (ρ, θ, φ)
r = r0 θ0
r
θ y
0 y r0 0
φ0
φ
x

x
(a) Koordinaten. (b) Koordinatenflächen und -linien.

~er

~eφ
~er
~eφ ~eθ

~eθ
y
0

(c) Basisvektoren.

Abbildung 7.13: Räumliche Polarkoordinaten (Kugelkoordinaten).


7.5 Polarkoordinaten und Zylinderkoordinaten 191

7.5.3 Räumliche Polarkoordinaten (Kugelkoordinaten)


Diese sind definiert durch
√ 
p x2 +y 2
r = x2 + y 2 + z 2 , θ = arctan z
, φ = arctan xy ,
(7.5.16)
0 ≤ r < ∞, 0 ≤ θ ≤ π, 0 ≤ φ < 2π,

beziehungsweise

x = r sin θ cos φ, y = r sin θ sin φ, z = r cos θ , (7.5.17)

siehe Abbildung 7.13. Der Winkel θ ist der sogenannte Polarwinkel, φ heißt Azimut-
winkel. Auf der z-Achse ist φ unbestimmt, d.h. nicht wohldefiniert.
Mit (7.5.17) ist

r(r, θ, φ) = r sin θ cos φ e1 + r sin θ sin φ e2 + r cos θ e3 . (7.5.18)

Die Koordinatenflächen sind definiert durch

r = r0 , θ = θ0 , φ = φ0 ,

und die Koordinatenlinien ergeben sich als Schnittkurven zweier Koordinatenflächen


– siehe Abbildung 7.13(b). Sie sind analytisch durch r(r, θ0 , φ0 ), r(r0 , θ, φ0 ) und
r(r0 , θ0 , φ) gegeben; man bezeichnet sie (in der angegebenen Reihenfolge) als r-,
θ- und φ-Linien. Diese Linien schneiden sich in jedem Punkt unter einem rechten
Winkel – das folgt aus der Orthogonalität der Tangentenvektoren, die wir jetzt
berechnen.
Die Tangenteneinheitsvektoren an die drei Koordinatenlinien im Punkt r, θ, φ sind
∂r
∂r
er ≡ ∂r = (sin θ cos φ)e1 + (sin θ sin φ)e2 + cos θe3 ,
∂r
∂r
∂θ
eθ ≡ ∂r
= (cos θ cos φ)e1 + (cos θ sin φ)e2 − sin θe3 , (7.5.19)
∂θ
∂r
∂φ
eφ ≡ = − sin φe1 + cos φe2 .
∂r
∂φ

Die drei Tangenteneinheitsvektoren – siehe Abbildung 7.13(c) – bilden wieder eine


ONB, denn
ea · eb = δab , a, b = r, θ, φ. (7.5.20)
Wir können deshalb jedes dreidimensionale Vektorfeld A(x) auch nach dieser Basis
entwickeln.
3
X
A(x) = Ai (x, y, z)ei = Ar (r, θ, φ)er + Aθ (r, θ, φ)eθ + Aφ (r, θ, φ)eφ , (7.5.21)
i=1
192 Einführung in die Theoretische Physik

wobei
Aρ = A · eρ , Aθ = A · eθ , Aφ = A · eφ . (7.5.22)
Ist A(x) in der Kugelkoordinatenbasis gegeben, berechnet man seine Komponenten
in einer kartesischen Basis mit Relationen analog zu (7.5.9).
Beispiel: In der Kugelkoordinatenbasis ist der Ortsvektor r = rer .
Bemerkung: Die Hinweise auf Seite 187 gelten analog. Hier ist er = er (θ, φ),
eθ = eθ (θ, φ) und eφ = eφ (φ).

7.6 Integration im Rn
Wir untersuchen nun Integrale über skalare Felder φ = φ(x1 , . . . , xn ) und Vektorfel-
der A = A(x1 , . . . , xn ). Konkret behandeln wir die Fälle n = 2, 3. (Im Fall n = 1
handelt es sich um Integrale über Funktionen einer reellen Variablen, die wir bereits
in Kapitel 2 besprachen.) Folgende Integrationsbereiche sind im R2 bzw. R3 von
Interesse – insbesondere bei Anwendungen in der Physik:

1. Eine Kurve in der Ebene oder im Raum.

2. Ein zusammenhängendes Gebiet Ω ⊆ Rn , z.B. eine Kreisscheibe oder ein


Rechteck in der Ebene oder eine Kugel, ein Zylinder oder Quader im Raum.

3. Eine zweidimensionale Fläche im R3 , z.B. eine Kugel- oder Zylinderoberfläche.

Wir behandeln diese Fälle im Folgenden.

7.7 Kurvenintegrale
Kurvenintegrale über Vektorfelder:
Zunächst betrachten wir sog. Kurvenintegrale über Vektorfelder. Als Beispiel für ein
solches Integral sei die (mechanische) Arbeit genannt, die eine Kraft F längs eines
Weges (= Kurve) C vom Punkt r A nach r B an einem Körper leistet. Wenn F längs
des betrachteten Weges ein konstanter Vektor und C eine Gerade zwischen r A und
r B ist, dann ist die

Arbeit = Kraft · Weg, d.h. W = F · (r B − r A ). (7.7.1)

Im Allgemeinen ist F = F (r) und C eine beliebige Bahnkurve. Somit


Z
(7.7.1) −→ W = F (r) · dr, (7.7.2)
C

wobei r A = r(tA ), r B = r(tB ) und t der Kurvenparameter ist. Das kann, muss aber
nicht die Zeit sein.
7.7 Kurvenintegrale 193

2 2 F~ (~ri+1 )
F~ (~r) C F~ (~ri )

~r(tB ) ∆~ri
~r(ti ) ~r(ti + ∆ti )

~r(tA )
1 1

(a) Beispiel für eine Kurve C und für ein Vektor- (b) Beispiel für eine mögliche Zerlegung.
feld F (r), r ∈ C.

Abbildung 7.14: Zum Kurvenintegral (7.7.3).

Hinweis: Wenn W > 0, dann leistet die Kraft Arbeit an dem Körper. Wenn W < 0,
muss Arbeit gegen die Kraft aufgewandt werden. Mit anderen Worten: die Arbeit,
die man von außen aufbringen muss, um einen Körper in einem Kraftfeld F von
r(tA ) nach r(tB ) zu bringen, ist (−W ). Der Fall W = 0 tritt insbesondere bei der
Bewegung eines Körpers auf einer Potentialfläche bzw. -linie einer konservativen
Kraft auf.
Das Integral in (7.7.2) ist ein sogenanntes Kurvenintegral über ein Vektorfeld.
Es ist – analog zu dem bestimmten Integral (2.4.14) bezüglich einer Variablen aus
Kapitel 2 – definiert als Limes einer Riemann-Summe. Dazu unterteilen wir C in
N + 1 Punkte:
r A = r 1 , r 2 , ..., r N +1 = r B ,
siehe Abbildung 7.14. Dann ist das obige Kurvenintegral über das Vektorfeld F (r)
entlang des Weges C von r A nach r B definiert durch
ZrB N
X
I≡ F (r) · dr ≡ lim F (r i ) · ∆r i , (7.7.3)
N →∞
r A ,C ∆r i →0 i=1

vorausgesetzt, dass der Limes für jede beliebige Zerlegung mit ∆ri → 0 und N → ∞
existiert.
Beachte: Das Kurvenintegral (7.7.3) ist ein Skalar9 .

7.7.1 Methoden zur Berechnung von Kurvenintegralen


Es gibt zwei Methoden zur Berechnung des Kurvenintegrals (7.7.3).
9
R
Man kann auch Kurvenintegrale der Form C
F × dr betrachten. Ein solches Integral ergibt
einen Vektor. Wir gehen hier darauf nicht ein.
194 Einführung in die Theoretische Physik

1. Die Kurve C ist durch eine Parameterdarstellung r = r(t) gegeben. Dann ist
dr
F (r) · dr = F (r(t)) · dt.
dt
Einsetzen in (7.7.3) und Substitution der Integrationsgrenzen r(tA ), r(tB ) →
tA , tB – siehe die Substitutionsregel (2.4.19) in Kapitel 2 – ergibt
ZrB ZtB
I= F (r) · dr = F (r(t)) · ṙdt . (7.7.4)
r A ,C tA

Durch diese Formel wird das Kurvenintegral auf ein gewöhnliches Riemann-
Integral bezüglich des Kurvenparameters t zurückgeführt; der Integrand ist die
skalare Funktion F · ṙ.
Der Faktor F (r(t)) liefert die Werte des gegebenen Feldes entlang der Kur-
ve, der Faktor ṙ ist der nicht-normierte Tangentenvektor an die Kurve bei
r(t); er enthält die Information über C. (Wenn t die Zeit ist, dann ist ṙ die
Geschwindigkeit.) Ein Beispiel besprechen wir unten.
2. Die Kurve C ist nicht durch eine Parameterdarstellung gegeben, sondern durch
einen funktionalen Zusammenhang zwischen den Koordinaten x, y, z – siehe
das unten angegebene Beispiel. Wie können wir in diesem Fall das Kurvenin-
tegral (7.7.3) berechnen? Wir verwenden, dass
∆r i = ∆xi e1 + ∆yi e2 + ∆zi e3 ,
F = F1 e1 + F2 e2 + F3 e3
bezüglich einer kartesischen, d.h. t-unabhängigen ONB. Somit wird (7.7.3) zu
ZrB N
X
F (r) · dr = lim [F1 (r i )∆xi + F2 (r i )∆yi + F3 (r i )∆zi ] . (7.7.5)
N →∞
r A ,C i=1

Wir betrachten zunächt den ersten Summanden. Zu jedem Wert der Koordi-
nate x eines Punktes r = (x, y, z) ∈ C gehören lokal10 eindeutige Werte von y
und z, so dass wir y und z als Funktion von x auffassen können:
y = y(x) , z = z(x).
M.a.W.: Die x-Koordinate übernimmt im ersten Summanden von (7.7.5) die
Rolle des Kurvenparameters. Der erste Summand in (7.7.5) ist dann
N
X ZxB
lim F1 (r i )∆xi = F1 (x, y(x), z(x))dx. (7.7.6)
N →∞
i=1 xA

10
Notfalls muss man C in geeignete Stücke Ci zerlegen, so dass jeder Punkt auf Ci durch x und
die eindeutigen Zuordnungen y = y(x) und z = z(x) festgelegt ist.
7.7 Kurvenintegrale 195

Die rechte Seite ist ein gewöhnliches Integral bezüglich der Variablen x.
Analog verfährt man mit dem zweiten und dritten Summanden in (7.7.5). Im
zweiten Summanden betrachten wir x und z als Funktionen von y, im dritten x
und y als Funktionen von z. Dann erhalten wir für das Kurvenintegral (7.7.3)
bzw. (7.7.5):
ZrB
I= F (r) · dr
r A ,C
ZxB ZyB ZzB
= F1 (x, y(x), z(x))dx + F2 (x(y), y, z(y))dy + F3 (x(z), y(z), z)dz .
xA yA zA
(7.7.7)

Beispiel: Wir berechnen für das Vektorfeld


 2 
3x + 2y
A(r) =  −9yz  (7.7.8)
8xz 2
das Kurvenintegral längs der Geraden C1 von (0, 0, 0) nach (1, 1, 1).
Methode 1: Die Parameterdarstellung von C1 ist
   
t 1
dr  
r(t) =  t , 0≤t≤1 ⇒ = 1 .
dt
t 1
Somit 
  
3t2 + 2t 1
dr 
A(r(t)) · = −9t 2  ·  1  = 8t3 − 6t2 + 2t.
dt 3
8t 1
Das Kurvenintegral ist
Z tZ
B =1
(7.7.4) 1
I= A(r) · dr = (8t3 − 6t2 + 2t)dt = (2t4 − 2t3 + t2 ) 0 = 1.
C1 tA =0

Methode 2: Wir verwenden (7.7.7), wobei (xA , yA , zA ) = (0, 0, 0) und


(xB , yB , zB ) = (1, 1, 1).
ZxB ZyB ZzB
I= A1 dx + A2 dy + A3 dz
xA yA zA
ZxB ZyB ZzB
= (3x2 + 2y(x))dx + (−9yz(y))dy + (8x(z)z 2 )dz.
xA yA zA
196 Einführung in die Theoretische Physik

Auf der Geraden C1 ist y = x, bzw. z = y, bzw. x = z. Wir setzen diese


Relationen in die Integrale ein und erhalten

Z1 Z1 Z1
2 2
I= (3x + 2x)dx + (−9y )dy + 8z 3 dz = 2 − 3 + 2 = 1.
0 0 0

Hinweis:
Verwechseln Sie das Kurvenintegal (7.7.3) über ein Vektorfeld nicht mit dem gewöhn-
lichen Integral (5.5.13) bzw. (5.5.15) über ein Vektorfeld aus Kapitel 5.

Kurvenintegrale über skalare Felder:


Sei φ = φ(r) eine Funktion mehrerer reeller Variablen. Wir betrachten eine Kurve
C im Definitionsgebiet von φ, die durch eine Parameterdarstellung r = r(t) gegeben
sei. Auf dieser Kurve sei φ(r) stetig. Das skalare Kurven- oder Wegintegral von φ
von r A = r(tA ) nach r B = r(tB ) längs der Kurve C ist erklärt durch

Z ZtB
φ ds ≡ φ(r(t)) |ṙ(t)| dt , (7.7.9)
C tA

wobei |ṙ(t)| der Betrag des Vektors ṙ(t) ist. Das Integral (7.7.9) ist ein Skalar11 .

Beispiele:
1) Setzt man φ = 1, ergibt (7.7.9) die Länge s der Kurve C zwischen r(tA ) und r(tB )
– die resultierende Formel und (5.5.19) aus Kapitel 5 sind identisch.
2) Ein inhomogener, sehr dünner Draht mit bekannter Massendichte µ(r) (hier [µ] =
Masse/Länge) werde durch ein Kurvenstück C, d.h. durch r = r(λ) beschrieben.
Man erhält die Masse M des Drahts durch Berechnung von

ZλB
M= µ(r(λ)) |ṙ(λ)| dλ ,
λA

wobei hier ṙ(λ) ≡ dr/dλ.

7.7.2 Eigenschaften von Kurvenintegralen


Im Folgenden betrachten wir das Kurvenintegal (7.7.3) eines Vektorfeldes, das ins-
besondere in der Newtonschen Mechanik eine wichtige Rolle spielt.
11
R
Man kann auch Kurvenintegrale der Form C
φ(r)dr betrachten. Solche Integrale sind Vektoren.
7.7 Kurvenintegrale 197

1. Wenn sich die Kurve C von r A nach r C zusammensetzt aus den Kurven C1 von
r A nach r B und C2 von r B nach r C , dann

ZrC ZrB ZrC


F (r) · dr = F (r) · dr + F (r) · dr. (7.7.10)
r A ,C r A ,C1 r B ,C2

2. Aus (7.7.10) folgt: Wenn eine Kurve C von r A nach r B rückwärts, d.h. von r B
nach r A durhlaufen wird, dann ist

ZrB ZrA
F (r) · dr = − F (r) · dr (7.7.11)
r A ,C r B ,C

3. Im Allgemeinen hängt das Kurvenintegral (7.7.3) für vorgegebenen Anfangs-


und Endpunkt r A , r B von der Form des Wegs C von r A nach r B ab.

Beispiel: Wir betrachten wieder das Vektorfeld A aus (7.7.8) und berechnen das
Kurvenintegral von r A = (0, 0, 0) → r B = (1, 1, 1) – aber diesmal nicht längs der
Geraden C1 , sondern längs des folgenden Parabelbogens C2 :


t
C2 : r(t) =  t2  , 0≤t≤1
4
t
 
1
dr  dr
⇒ = 2t  ⇒ A(r(t)) · = 5t2 − 18t7 + 32t12
dt 3 dt
4t
r
Z B Z1
dr 293
⇒ IC2 = A · dt = (5t2 − 18t7 + 32t12 )dt = 6 IC1 .
=
dt 156
r A ,C2 0

Abhängigkeit von der Form des Integrationsweges:

Frage: Wann ist das Kurvenintegral (7.7.3) für ein gegebenes Vektorfeld A(r) un-
abhängig von der Form des Weges C von r A nach r B ?
Antwort: Wenn das Vektorfeld A(r) ein Gradientenfeld ist, d.h. wenn ein skalares
Feld φ(r) existiert, so dass

A(r) = grad φ(r) ≡ ∇φ(r) . (7.7.12)


198 Einführung in die Theoretische Physik

Beweis:
ZrB ZrB ZrB X3
(7.7.12) ∂φ
A · dr = (∇φ) · dr = dxi
i=1
∂x i
r A ,C r A ,C r A ,C
(7.7.13)
ZrB r B
(7.2.12)
= dφ = φ(r) = φ(r B ) − φ(r A ).

rA
r A ,C

Hinweis: Gl. (7.7.13) ist das Analogon zu folgendem wohlbekannten Ergebnis für
Funktionen einer Variablen: Wenn der Integrand die Ableitung einer Funktion f (x)
ist, dann ist f (x) + c die Stammfunktion, d.h.
ZxB ZxB
df xB
dx = df = f (x) = f (xB ) − f (xA ).

dx xA
xA xA

Wir definieren nun mit Hilfe des Kurvenintegrals (7.7.3) eine Funktion φC (r). Die
Koordinaten des Anfangspunktes r A = r 0 werden festhalten und die des Endpunktes
r B = r seien variabel:

C3

Zr ~r
φC (r) ≡ A(r 0 ) · dr 0 . C2 (7.7.14)
r 0 ,C
~r0
C1

Im Allgemeinen wird für ein gegebenes A(r) die Funktion φC (r) vom Weg C abhängen
– deswegen der Index C an φ. Wir bekommen für verschiedene Wege C i.A. verschie-
dene Funktionen φC . Wir zeigen nun die Umkehrung von (7.7.13):

Wenn (7.7.14) nur vom Anfangs- und Endpunkt r 0 und r, aber nicht vom Weg C
abhängt, dann ist A(r) als Gradientenfeld darstellbar.

Beweis: Wir analysieren die Differenz der beiden folgenden Integrale


r+∆r
Z Zr r+∆r
Z
0 0 (7.7.10)
φ(r + ∆r) − φ(r) = A · dr − A · dr = A · dr 0 . (7.7.15)
r0 r0 r

Der Index C an φ wurde weggelassen, da diese Funktion nach Voraussetzung weg-


unabhängig ist.
7.7 Kurvenintegrale 199

Rechte Seite von (7.7.15): Nach dem Mittelwertsatz der Integralrechnung gibt es
einen Punkt r 00 zwischen r und r + ∆r, so dass das Integral auf der rechten Seite
von 7.7.15 durch A(r 00 ) · ∆r gegeben ist.
Linke Seite von (7.7.15): Die Taylorentwicklung von φ(r + ∆r) um r ergibt
φ(r + ∆r) − φ(r) = (∇φ) · ∆r + O((∆r)2 ).
Setzen wir beide Ergebnisse in (7.7.15) ein und bilden den Limes ∆r → 0, dann
grad φ(r) = A(r),
was zu beweisen war.
In (7.7.13) zeigten wir die Umkehrung dieser Aussage, nämlich: Wenn A von der
Form A = ∇φ, dann ist das Kurvenintegral wegunabhängig.
Somit gilt der folgende wichtige
Satz 1: Kurvenintegrale über ein Vektorfeld A sind dann und nur dann unabhängig
von der Form des Weges C, wenn A von der Form A = ∇φ ist. Das skalare Feld
φ(r) ist durch A nur bis auf eine additive Konstante festgelegt; denn offensichtlich
liefern φ(r) und φ(r) + C dasselbe A(r) = ∇φ(r).
Ein Vektorfeld A(x), das von der Form A(x) = ∇φ(x) ist, nennt man ein konser-
vatives Feld. Man bezeichnet φ oft pauschal als das Potential von A.
Insbesondere nennt man eine Kraft F (x), die in der Form
F (x) = −∇φ(x) (7.7.16)
darstellbar ist, eine konservative Kraft. Dieser Begriff wurde bereits in Abschnitt 7.4.1
eingeführt.
Hinweise:
1) Die Vorzeichenkonvention wurde bereits in Abschnittt 7.4.1 erklärt.
2) Wenn φ explizit von der Zeit abhängt, dann nennt man, wie ebenfalls bereits in
Abschnitt 7.4.1 erwähnt wurde, F (x, t) = −∇φ(x, t) eine Potentialkraft.
3) Wenn das Vektorfeld A eine z.B. auf ein Teilchen wirkende Kraft F beschreibt,
d.h. [F ] = N, dann hat φ die Dimension einer Energie, [φ] = Nm. Die Funktion φ(x)
ist die potentielle Energie des Teilchens am Punkt x. Energien können nicht abso-
lut, sondern nur in Bezug auf eine Referenzenergie gemessen werden. Diese Tatsache
spiegelt sich hier in dem Sachverhalt wieder, dass φ durch eine gegebene Kraft nur
bis auf eine additive Konstante festgelegt wird.

Äquivalent zu Satz 1 ist der


Satz 2: Ein Vektorfeld A hat genau dann die Form A = ∇φ, wenn das Integral
von A über alle geschlossenen Kurven C Null ist.
I
A · dr = 0 ⇔ A = ∇φ. (7.7.17)
C

Die Kurve C muss natürlich im Definitionsgebiet von A liegen. H


Hinweis: Für Integrale über geschlossene Kurven benutzt man oft das Symbol C .
200 Einführung in die Theoretische Physik

Beweis: Sei A = ∇φ.

I Zr2 Zr1
A · dr = A · dr + A · dr C2
C r 1 ,C1 r 2 ,C2
Zr2 Zr2 ~r2
(7.7.11)
= A · dr − A · dr C
r 1 ,C1 r 1 ,C2
Zr2 Zr2 ~r1
= dφ − dφ = 0. C1
r1 r1

Führen Sie den Beweis in umgekehrter Richtung selbst durch!

7.7.3 Hinreichendes Kriterium für ein Gradientenfeld


Es stellt sich die Frage, wie wir feststellen können, ob ein gegebenes Vektorfeld A(r)
ein Gradientenfeld, also von der Form A = ∇φ ist. In (7.4.25) auf Seite 183 zeigten
wir folgendes: Für eine in einem Gebiet zweimal stetig differenzierbare Funktion φ
ist
rot grad φ ≡ ∇ × ∇φ = 0. (7.7.18)
Daraus folgt:
Wenn A = ∇φ, dann rot A = 0. (7.7.19)
Gilt auch die Umkehrung, d.h.

wenn rot A = 0, dann A = ∇φ,


Rr
und somit (aufgrund der obigen Sätze 1 und 2) r12 A · dr wegunabhängig, bzw.
H
C
A · dr = 0? Ja, fast immer. Präzise formuliert gilt folgender Satz:
Wenn rot A = 0 in einem einfach zusammenhängenden Gebiet G ∈ R3 (bzw. G ∈
R2 ), dann existiert ein φ, so dass A = ∇φ. Aufgrund der obigen Sätze 1 und 2
sind somit Kurvenintegrale
H über A in diesem Gebiet unabhängig von der Form des
Weges, bzw. C A · dr = 0.

Ein einfach zusammenhängendes Gebiet G ist ein Gebiet, in dem sich jede geschlosse-
ne Kurve, die ganz in G liegt, auf einen Punkt in G zusammenziehen lässt. Beispiele
im R2 sind in Abbildung 7.15 gezeigt; Beispiele im R3 werden in der Legende dieser
Abbildung erläutert.
Aus Zeitgründen können wir den soeben zitierten Satz nicht beweisen. (Siehe
dazu die Vorlesung Höhere Mathematik III oder beispielsweise das Buch von Groß-
mann, S. 181ff). Wir machen uns aber anhand eines Beispiels im R2 klar, warum
7.7 Kurvenintegrale 201

(a) (b) (c) (d)

Abbildung 7.15: Beispiele für einfach zusammenhängende Gebiete (a,b) und nicht
einfach zusammenhängende Gebiete (c,d) im R2 . Beispiele im R3 : Wir denken uns
die gezeigten Gebiete aus der Zeichenebene heraus ins Dreidimensionale (3D) fortge-
setzt. Die so erzeugten 3D-Gebiete a,b sind ebenfalls einfach zusammenhängend. Aus
den Löchern in den 2D-Gebieten c,d werden in 3D beispielsweise Kugeln, Schläuche
oder krumme Würste. Wenn diese Gebilde ganz innerhalb des jeweiligen 3D-Gebiets
G liegen oder die Randfläche von G nur einmal berühren oder durchstoßen, dann ist
G einfach zusammenhängend; denn jede geschlossene Kurve in G kann dann immer
auf einen Punkt in G zusammengezogen werden. Falls diese Objekte die Randfläche
von G mindestens zweimal berühren oder durchstoßen, dann ist G nicht einfach
zusammenhängend.

die Eigenschaft einfach zusammenhängend wichtig ist. Wir zeigten in (7.4.23), dass
die Rotation des zweidimensionalen Vektorfeldes (7.4.22),
 
1 −y
B(x) = 2 (7.7.20)
x + y2 x

in der ,,punktierten Ebene” verschwindet:

rot B = 0 ∀r ∈ R2 \ {(0, 0)} .

Am Ursprung wird rot B singulär. Die punktierte Ebene R2 \ {(0, 0)} ist aber of-
fensichtlich nicht einfach zusammenhängend.
H Somit kann man aufgrund des obigen
Satzes nicht erwarten, dass C B · dr = 0, wenn C eine geschlossene Kurve ist, die
den Nullpunkt umschließt. Sei C o.B.d.A. der Kreis um den Nullpunkt mit Radius
R. In der Tat findet man, dass
I
B · dr = 2π ,
C

wenn C den Nullpunkt einmal umkreist. Wir zeigen das als Hausaufgabe. Zur Be-
rechnung des KreisintegralsR benutzt man bequemerweise ebene Polarkoordinaten.
r
Konsequenz: Das Integral r0 B(r 0 ) · dr 0 ist wegabhängig; denn wenn von r 0 → r
zum einen auf einem Weg oberhalb und zum anderen auf einem Weg unterhalb des
Ursprungs integriert wird, ist die Differenz der beiden Wegintegrale 2π. Demzufol-
ge kann man keine eindeutige Funktion φ bestimmen, so dass B = ∇φ(r) in der
202 Einführung in die Theoretische Physik

punktierten Ebene.

Hinweise:
1) Wenn man (7.7.20) in einem einfach zusammenhängenden HGebiet G des R2 be-
trachtet, das den Ursprung nicht enthält, dann rot B = 0 und C B · dr = 0 für alle
geschlossenen Kurven in G. D.h. lokal lässt sich B durchaus als der Gradient eines
Potentials darstellen. Diese lokalen Potentiale lassen sich aber nicht widerspruchsfrei
zu einem Potential auf R2 \ {(0, 0)} zusammensetzen.

2) Das Analogon zu (7.7.20) im Raum ist


 
−y
1
B(x) = 2  x , x ∈ R3 \ {z-Achse} . (7.7.21)
x + y2
0
Zwar ist rot B = 0 in G = R3 \ {z-Achse}, aber dieses Gebiet H ist nicht einfach
zusammenhängend. Somit sollte es nicht verwundern, dass C B · dr 6= 0 für jede
geschlossene Kurve, die die z-Achse umschließt.
Beispiel aus der Physik: Gegeben sei ein (unendlich langer) dünner Metalldraht längs
der z-Achse, durch den ein konstanter Gleichstrom fließt. Dieser Gleichstrom erzeugt
ein statisches Magnetfeld, das bis auf eine Proportionalitätskonstante durch (7.7.21)
gegeben ist. Das lernen Sie in den Vorlesungen über Elektrodynamik.

3) Wir betrachten die von einem sich bei r 0 = 0 befindenden Massenpunkt ver-
ursachte Gravitationskraft, bzw. die von einer sich bei r 0 = 0 befindenden Punkt-
ladung verursachten Coulombkraft (auf einen anderen Massenpunkt bzw. Punktla-
dung) an der Stelle r im dreidimensionalen Raum. Beide Kräfte sind von der Form
γ r
F (r) = , r ∈ G = R3 \ {(0, 0, 0)} ,
r2 r
wobei r = |r|. Im Ursprung wird F singulär; in G Hist rot F = 0 – nachrechnen! Das
Gebiet G ist einfach
R r zusammenhängend! Somit ist C F · dr = 0 für jede geschlossene
0 0
Kurve in G, d.h. r0 F (r ) · dr ist wegunabhängig. Demzufolge ist F in G darstellbar
als F = −grad φ, wobei φ = γ/r. Die Gravitationskraft und Coulombkraft sind in
der Tat Gradientenfelder.

Fazit: Das folgende Kriterium ist hinreichend dafür, dass A ein Gradientenfeld
ist:

Wenn rot A = 0 in einem einfach
⇒ Es existiert ein φ(r) mit A = ∇φ.
zusammenhängenden Gebiet

Berechnung der Potentialfunktion:


Wenn das soeben genannte Kriterium für ein Vektorfeld A(r) erfüllt ist, kann man
die Potentialfunktion φ(r) aus A(r) folgendermaßen bestimmen:
7.7 Kurvenintegrale 203

Methode 1: Man löst das Differentialgleichungssystem


φ = A1 (x, y, z) ,
∂x

φ = A2 (x, y, z) , (7.7.22)
∂y

φ = A3 (x, y, z)
∂z

durch Integration der Gleichungen12 , siehe das u.a. Beispiel.


Methode 2: Man berechnet das Kurvenintegral

Zr
φ(r) = A(r 0 ) · dr 0 . (7.7.23)
r0

Da dieses Integral wegen A = ∇φ wegunabhängig ist, wählt man zur Integration


bequemerweise einen Weg von r 0 nach r so, dass das Integral (7.7.23) auf möglichst
einfache Weise berechnet werden kann. Ist das Vektorfeld in einer kartesischen Basis
gegeben, kann man z.B. einen Polygonzug längs der Koordinatenachsen wählen:

C0 : r 0 = (x0 , y0 , z0 ) → (x, y0 , z0 ) → (x, y, z0 ) → (x, y, z).

Zur Berechnung von (7.7.23) längs eines solchen Weges kann man Methode 2 auf Sei-
te 194 benutzen. Die Funktion φ(r) ist, wie gesagt, durch A nur bis auf eine additive
Konstante festgelegt. Dies entspricht in (7.7.23) dem willkürlichen Anfangspunkt r 0 .
Durch Vorgabe von φ(r 0 ) ist φ(r) als Funktion eindeutig festgelegt.

Beispiele:

1. Das Vektorfeld (7.7.8) auf Seite 195


 
3x2 + 2y
A(r) =  −9yz 
8xz 2
R
ist kein Gradientenfeld, weil wir fanden, dass die Kurvenintegrale A · dr
wegabhängig sind. Wir überprüfen das noch einmal mit dem rot A Kriterium.

∇ × A = (∂x A3 − ∂z A2 )e1 + (∂z A1 − ∂x A3 )e2 + (∂x A2 − ∂y A1 )e3


= 9ye1 + 8z 2 e2 − 2e3 6= 0.
12
Es handelt sich hier um ein System von drei partiellen DGL 1. Ordnung für die gesuchte
Funktion φ(x, y, z), das man in der Regel recht einfach lösen kann.
204 Einführung in die Theoretische Physik

2. Sei  
3x
A(r) =  −y 2  .
0
Dieses Feld ist offensichtlich in ganz R3 definiert und

rot A = 0 ∀r ∈ R3 .

Da der R3 einfach zusammenhängend ist, ist A darstellbar als A = ∇φ.


Bestimmung von φ(r): Wir benutzen die obige Methode 1 und lösen das Dif-
ferentialgleichungssystem (7.7.22):

∂x φ = 3x , (1)
∂y φ = −y 2 , (2)
∂z φ = 0 . (3)

Die Integration von (1) ergibt


Z
3
φ(x, y, z) = 3xdx = x2 + f (y, z) . (4)
2
Einsetzen in (2) und Integration liefert

∂y f (y, z) = −y 2
y3
Z
⇒ f (y, z) = − y 2 dy = − + g(z) . (5)
3
Einsetzen in (3) und Integration liefert

∂g(z)
= 0 ⇒ g(z) = const. (6)
∂z
Aus (4), (5) und (6) folgt schließlich

3 y3
φ(x, y, z) = x2 − + const.
2 3
Man kann φ(r) auch mit Methode 2, d.h. durch Berechnung des Integrals
(7.7.23) bestimmen – Hausaufgabe!

7.8 Zweidimensionale Integrale


Wir untersuchen zunächst Integrale der Form
ZZ
I= f (x, y) dx dy, (7.8.1)
F
7.8 Zweidimensionale Integrale 205

xi , yi

∆Fi

Abbildung 7.16: Koordinatennetz für ein zweidimensionales Integral.

wobei F ⊆ R2 ein Gebiet im R2 und f (x, y) eine integrierbare Funktion (siehe un-
ten) ist. Das Integral (7.8.1) ist ein Beispiel für ein zweidimensionales Integral, auch
Doppelintegral oder Flächenintegral genannt. Der Begriff Flächenintegral ist miss-
verständlich, denn
• nur wenn das Produkt der Integrationsvariablen x, y die Dimension einer Fläche
hat und f (x, y) = 1, dann liefert das Doppelintegral (7.8.1) die Fläche des zweidi-
mensionalen Gebiets F im geometrischen Sinn.
• Wenn f 6= 1, sollte man präziser von einem Integral über die ,,Fläche” F sprechen.
Die Dimension von I ist durch die Dimension von f und der Integrationsvariablen
bestimmt.
Zur Definition von (7.8.1): Man überzieht die Fläche F mit einem beliebigen
Koordinatennetz (das nicht kartesisch sein muss), siehe Abbildung 7.16. Das Gebiet
F wird dadurch auf beliebige Weise in N Teilflächenstücke ∆Fi zerlegt. Innerhalb
eines Teilflächenstücks wertet man die Funktion f (x, y) an einem beliebigen Punkt
(xi , yi ) ∈ ∆Fi aus und bildet die Riemann-Summe
N
X
f (xi , yi )∆Fi . (7.8.2)
i=1

Das Doppelintegral (7.8.1) ist definiert als der Limes der Riemann-Summe
ZZ N
X
f (x, y) dx dy = lim f (xi , yi )∆Fi , (7.8.3)
N →∞
F ∆Fi →0 i=1

falls dieser Limes für beliebige Zerlegungen existiert. Die Funktion f (x, y) heißt dann
integrierbar im Gebiet F – die Reihenfoge der Integration kann vertauscht werden.
Bei einer kartesischen Zerlegung ist ∆Fi = ∆xi ∆yi . Beachten Sie, dass mit ∆Fi → 0
206 Einführung in die Theoretische Physik

y y
y = g2 (x)
d
F x = h1 (y) F

x = h2 (y)
c
y = g1 (x)
x x
a b
(a) (b)

Abbildung 7.17: Die Ränder derselben Fläche, verschieden parametrisiert.

gemeint ist, dass sowohl die Länge als auch die Breite des Flächenelements gegen
Null gehen muss: ∆xi → 0 und ∆yi → 0.
Mit der Riemann-Summe (7.8.3) kann man das Doppelintegral näherungsweise
(numerisch) berechnen. Man wählt N  1 und ∆Fi  1 (in adäquaten Einheiten)
und wertet die endliche Summe auf der linken Seite von (7.8.3) aus.
Wie kann man das Doppelintegral analytisch berechnen? Notwendigerweise muss
der Rand der Fläche F durch Funktionen y = y(x) oder x = x(y) in der xy-Ebene
analytisch darstellbar sein.
Die Abbildungen in 7.17 zeigen dasselbe Gebiet F , dessen Rand – der die Inte-
grationsgrenzen bestimmt – auf zwei verschiedene Weisen parametrisiert ist. Man
kann das Integral (7.8.1) für Gebiete dieses Typs demzufolge auf zweifache Weise
berechnen.
ZZ
I= f (x, y) dx dy
F
 
Zb gZ2 (x)

= f (x, y)dy  dx (7.8.4)


 

a g1 (x)
| {z }
≡f1 (x)
 
Zd hZ2 (y)

= f (x, y)dx  dy. (7.8.5)


 

c h1 (y)
| {z }
≡f2 (y)

Gleichung (7.8.4) entspricht der Abbildung 7.17(a). Hier integriert man zunächst
7.8 Zweidimensionale Integrale 207

y
g1 (x)

g2 (x)

g3 (x)

g4 (x)
x
a b c d

Abbildung 7.18: Eine Fläche mit einem komplizierteren Rand als der in Abb. 7.17.

für festgehaltenes x über die Variable y, also längs der gestrichelten Linien parallel
zur y-Achse, von der unteren Grenze y1 = g1 (x) zur oberen Grenze y2 = g2 (x). Das
Ergebnis ist eine Funktion f1 (x), die man dann über die Variable x im Intervall
a ≤ x ≤ b integriert.
Alternativ kann I mit Gleichung (7.8.5) berechnet werden, d.h. es wird erst über
x und dann über y integriert – siehe Abbildung 7.17(b).
Es gibt natürlich auch Gebiete mit komplizierteren Rändern – dergestalt, dass
ein solcher Rand nicht zusammensetzbar ist aus einem jeweils durch eine Funktion
beschreibbaren oberen und unteren (bzw. linken und rechten) Randteil. Ein Beispiel
für ein solches Gebiet ist in Abbildung 7.18 gezeigt. Der linke Rand dieses Gebietes
kann nicht durch eine einzige Funktion beschrieben werden. Man muss in diesem
Fall das Doppelintegral I in eine Summe von Beiträgen zerlegen. Wir benutzen
(7.8.4) und beschreiben den linken Rand in den folgenden x-Intervallen durch die
Funktionen g1 - g4 :

c ≤ x ≤ d : y1 = g4 (x), y2 = g1 (x),
b ≤ x ≤ c : y1 = g4 (x), y2 = g3 (x),
a ≤ x ≤ c : y1 = g2 (x), y2 = g1 (x).

Dann

Zd Zc Zc
I= . . . dx + . . . dx + . . . dx .
c b a
208 Einführung in die Theoretische Physik

Beispiel:
y y = x2

Integriere die Funktion y = 2x

f (x, y) = xy 2 (7.8.6) d=4

über die graue Fläche F . Die


Ränder von F sind

y = x2 und y = 2x
y √
bzw. x = 2 und x = + y .

x
c=0
a=0 b=2
Benutze die Formel (7.8.4):
 
Zb=2 Z2x
I=  xy 2 dy  dx
a=0 x2
| {z }
f1 (x)
y=2x
xy 3 8x4 x7
f1 (x) = = −
3 y=x2 3 3
Z2  4
x7

8x 32
⇒ I= − dx = .
3 3 5
0

Benutze alternativ die Formel (7.8.5):


 √ 
Zd=4 Z y
I= xy 2 dx  dy
 

c=0 y/2
| {z }
f2 (y)

2 2 x= y
xy y3 y4
f2 (y) = = −
2 x=y/2 2 8
Z4  3
y4

y 32
⇒ I= − dy = .
2 8 5
0

7.8.1 Variablentransformation, Jacobi-Determinante


Wie bei Integralen über eine Variable ist es bei zwei- und höherdimensionalen In-
tegralen oft zweckmäßig, neue Integrationsvariable einzuführen. Zum Beispiel em-
7.8 Zweidimensionale Integrale 209

pfiehlt es sich bei Integration über eine Kreisfläche, anstelle von kartesischen Koor-
dinaten x, y ebene Polarkoordinaten ρ, φ zu benutzen:
p
x = ρ cos φ ρ = x2 + y 2 , 0 ≤ ρ < ∞,
−→ y (7.8.7)
y = ρ sin φ φ = arctan , 0 ≤ φ < 2π.
x
Allgemein: x, y → u, v:

x = x(u, v) u = u(x, y)
und Umkehrung (7.8.8)
y = y(u, v) v = v(x, y).

Der funktionale Zusammenhang (7.8.8) zwischen x, y und u, v muss zumindest lokal


(d.h. in geeigneten Gebieten F ⊂ R2 ) umkehrbar eindeutig sein. Wir geben unten
ein Kriterium an, mit dem man überprüfen kann, ob eine Variablentransformation
(7.8.8) umkehrbar ist.
Wie schreibt man das Integral (7.8.1) auf neue Variablen u = u(x, y) und v =
v(x, y) um? Wir suchen das mehrdimensionale Analogon der Substitutionsformel
(2.4.19) für bestimmte Integrale aus Kapitel 2, auf die wir noch einmal eingehen. Die
umkehrbare Variablentransformation (d.h. umkehrbare Funktion) u = u(x) bilde das
Intervall a ≤ x ≤ b auf das Intervall α ≤ u ≤ β ab; die Umkehrfunktion bezeichnen
wir mit x = x(u). Dann nimmt die Formel (2.4.19) folgende Form an:

Zb Zu(b) Zβ
dx dx
f (x)dx = f (x(u)) du = f (x(u)) du. (7.8.9)
du du
a u(a) α

Man beachte die Betragsstriche auf der rechten Seite, die aus folgendem Grund auf-
treten. Bei der im betrachteten Intervall umkehrbaren Transformation u = u(x) ist
entweder du/dx > 0 oder du/dx < 0. Wenn du/dx = 1/(dx/du) < 0, dann ist
u(a) = β und u(b) = α, wobei nach Vereinbarung β > α. Der Vorzeichenwechsel,
der beim Vertauschen der Integrationsgrenzen entsteht, wird durch die Ersetzung
dx/du → |dx/du| kompensiert.

Nun zur Variablentransformation u = u(x, y) und v = v(x, y). Wir betrachten


die Differenzen
∆u ≡ u(x + ∆x, y + ∆y) − u(x, y),
(7.8.10)
∆v ≡ v(x + ∆x, y + ∆y) − v(x, y),
wobei |∆x|, |∆y|  1. Die Taylorentwicklung (mit Hilfe von (7.3.2)) der rechten
Seite um x, y liefert
∂u(x, y) ∂u(x, y)
∆y + O (∆xi )2 ,

∆u = ∆x +
∂x ∂y
(7.8.11)
∂v(x, y) ∂v(x, y)
∆y + O (∆xi )2 .

∆v = ∆x +
∂x ∂y
210 Einführung in die Theoretische Physik

Mit (7.8.11) kann man für jedes Zahlenpaar ∆x, ∆y eindeutig ein Zahlenpaar ∆u,
∆v ausrechnen. Für ∆x, ∆y → 0 erhalten wir
     
∆u ∂x u ∂y u ∆x
= · . (7.8.12)
∆v ∂x v ∂y v ∆y
| {z }
≡D(x,y)

Die Matrix D(x, y) heißt Funktionalmatrix der Transformation (7.8.8). Damit man
umgekehrt jedem ∆u, ∆v eindeutig ein ∆x, ∆y zuordnen kann, muss die inverse
Matrix D−1 existieren. Wie wir in Abschnitt 6.5.3 lernten, ist das der Fall, wenn die
Determinante det D 6= 0.
Dies ist das gesuchte Kriterium: Die Transformation (7.8.8) ist in der Umgebung
eines Punktes x, y genau dann umkehrbar eindeutig, wenn

∂x u ∂y u ∂(u, v)
det D(x, y) ≡ ≡ 6= 0. (7.8.13)
∂x v ∂y v ∂(x, y)

Die Determinante det D heißt Funktionaldeterminante oder Jacobi-Determinante


der Transformation (7.8.8). Die Jacobi-Determinante der Umkehrtransformation

x = x(u, v), y = y(u, v)

ist gemäß der Definition (7.8.13) gegeben durch



∂(x, y) ∂u x ∂v x
= . (7.8.14)
∂(u, v) ∂u y ∂v y

Wenn (7.8.13) von Null verschieden ist, kann vermutet werden, dass auch (7.8.14)
existiert. Tatsächlich gilt die wichtige Formel

∂(x, y) 1
= ∂(u,v)
. (7.8.15)
∂(u, v)
∂(x,y)

Beweis: Wir zeigen diese Formel für den allgemeinen Fall einer Transformation
von n Variablen. Sei xi = xi (u1 , u2 , ..., un ) und ui = ui (z1 , ..., zn ), i = 1, ..., n. Die
Kettenregel besagt, dass
n
∂xi X ∂xi ∂uk
= ⇔ Matrix D1 = D2 D3 .
∂zj ∂uk ∂zj
k=1 | {z }
|{z}
D1 D2 D3

Daraus folgt
det D1 = det D2 det D3 . (7.8.16)
Setze nun zi = xi . Dann ist D1 = δij die Einheitsmatrix, d.h. det D1 = 1. Damit
erhalten wir aus (7.8.16) die Formel (7.8.15).
7.8 Zweidimensionale Integrale 211

y
v-Linien
∂~r(u, v)
dv
∂v
dF dy dF
∂~r(u, v)
dx du
∂u

x
u-Linien
(a) Kartesische Koordinaten x, y. (b) Allgemeine Koordinaten u, v.

Abbildung 7.19: Das Flächenelement dF in der xy- und der uv-Ebene. Zur Bezeich-
nung ,,u, v-Linien”, siehe Abschnitt 7.5.3.

Das Flächenelement dF :
In kartesischen Koordinaten x, y ist das zweidimensionale Flächenelement gegeben
durch dF = dxdy, siehe Abbildung 7.19(a). Wir führen nun eine Variablentransfor-
mation x, y 7→ u, v durch und berechnen dF in den neuen Koordinaten u, v. Diese
sind i.A. krummlinige Koordinaten. Man beachte, dass wir hier Flächen in der Ebene
R2 behandeln. (Den allgemeineren Fall von Flächen im R3 besprechen wir im nächs-
ten Abschnitt.) Die Punkte in der Ebene R2 , insbesondere die einer Teilfläche werden
analytisch beschrieben durch die Parameterform (wir benutzen hier der Einfachheit
halber eine kartesische Basis):
r(u, v) = x(u, v)e1 + y(u, v)e2 . (7.8.17)
Durch x, y 7→ u, v wird die xy-Ebene (≡ R2 ) auf die uv-Ebene (≡ R2 ) abgebildet.
Wir berechnen nun die Tangentenvektoren an die u- und v-Koordinatenlinie im
Punkt (u, v):
∂r ∂r
tu ≡ du , tv ≡ dv, (7.8.18)
∂u ∂v
siehe Abbildung 7.19(b). Beachte, dass es sich um nichtnormierte13 Vektoren han-
delt.
Das Flächenelement dF ist die Fläche des Parallelogramms, das von diesen Tangen-
tenvektoren aufgespannt wird. Diese Fläche ist (vgl. Abbildung 5.5, Seite 106)

∂r ∂r
dF = |tu × tv | =
× du dv. (7.8.19)
∂u ∂v
13
Die Differentiale du und dv in (7.8.18) sind notwendig. Als Beispiel wenden wir (7.8.18) auf
ein kartesisches Koordinatennetz an, d.h. r = xe1 + ye2 . Man erhält
∂r ∂r
dx = e1 dx , dy = e2 dy.
∂x ∂y
Einsetzen in (7.8.19) ergibt dF = dxdy, also das erwartete Ergebnis!
212 Einführung in die Theoretische Physik

y y

y2 = R 2 − x2

b
R x a a x
0 0
b


y 1 = − R 2 − x2
(a) Kreisfläche. (b) 2. Fläche einer Ellipse.

Abbildung 7.20: Zwei Beispiele für Flächen im R2 .

Mit (7.8.17) erhält man für das Vektorprodukt


    
∂u x ∂v x 0
∂r ∂r 
× = ∂u y  ×  ∂v y  =  0 .
∂u ∂v
0 0 ∂u x ∂v y − ∂v x ∂u y

Somit ist
∂(x, y)
dF = |∂u x ∂v y − ∂v x ∂u y|du dv =
du dv. (7.8.20)
∂(u, v)
Mit diesem Ergebnis ist die Transformationsformel für zweidimensionale Integrale:
ZZ ZZ
∂(x, y)
f (x, y)dx dy = f (x(u, v), y(u, v)) du dv . (7.8.21)
∂(u, v)
F F0

Dabei ist F 0 das Bild des Gebiets F in der uv-Ebene.


Beachte: In (7.8.21) tritt der Betrag der Jacobi-Determinante auf. Wenn auf der
linken Seite – also beim Integral über F – die Integrationsgrenzen so sind, dass
die unteren Grenzen kleiner als die oberen sind, x1 ≤ x2 , y1 ≤ y2 , dann müssen
auch Integrationsgrenzen auf rechten Seite diese Bedingung erfüllen. Siehe dazu das
eindimensionale Analogon (7.8.9) und den Hinweis unten.

Beispiele:

1. Integriere die Funktion


f (x, y) = x2 y 2
über die Kreisfläche aus Abbildung 7.20(a).
7.8 Zweidimensionale Integrale 213

(a) Man kann z.B. die Formel (7.8.4) benutzen:

ZR Zy2
 

I=  x2 y 2 dy  dx .
−R y1

Rechnen Sie das zu Hause aus!


(b) Alternativ bietet sich hier an, Polarkoordinaten

x = r cos φ , y = r sin φ

und die Transformationsformel (7.8.21) zu verwenden. Die Jacobi-Determinante


der Transformation ist

∂(x, y) ∂r x ∂φ x cos φ −r sin φ
= = = r cos2 φ + r sin2 φ = r ≥ 0.
∂(r, φ) ∂r y ∂φ y sin φ r cos φ

Somit ist das Flächenelement



∂(x, y)
dF = dr dφ = r dr dφ,
∂(r, φ)

Das Integral von f (x, y) = x2 y 2 über den Kreis aus Fig. 7.20(a) ist dann14

Z2π ZR Z2π
5 2 R6
I= r (cos φ sin φ) dr dφ = (cos φ sin φ)2 dφ
6
0 0 0
6
 2π
R6 π

R φ sin(4φ)
= − = .
6 8 32
0 24

2. Wir berechnen nun den Flächeninhalt der in Abbildung 7.20(b) dargestellten


Ellipse. Diese Fläche besteht aus der Punktmenge

x2 y 2
 
2
F = (x, y) ∈ R : 2 + 2 ≤ 1 ,
a b
deren Rand durch
x2 y 2
+ 2 =1 (7.8.22)
a2 b
beschrieben wird. Zur Berechnung der Fläche der Ellipse müssen wir die Funk-
tion
f (x, y) = 1
14
Der Sachverhalt, dass x, y ↔ ρ, φ am Ursprung nicht definiert ist, d.h. die Jacobi-Determinante
∂(x, y)/∂(u, v) dort Null wird, ist für zweidimensionale Integrale unschädlich, siehe HöMa-
Vorlesung.
214 Einführung in die Theoretische Physik

über die o.a. Punktmenge integrieren.


Es bietet sich die Variablentransformation

x, y → r, φ

mit
x = ar cos φ , y = br sin φ (7.8.23)
an. (Das sind sogenannte verallgemeinerte Polarkoordinaten.) Mit diesen Ko-
ordinaten lässt sich die Ellipsenfläche folgendermaßen beschreiben:

F = (r, φ) ∈ R2 : 0 ≤ φ ≤ 2π, 0 ≤ r ≤ 1 .


Zur Berechnung des Flächeninhalts benutzen wir (7.8.21). Die Jacobi-Determinante


der Transformation ist

∂(x, y) a cos φ −ar sin φ
= = abr ≥ 0.
∂(r, φ) b sin φ br cos φ

Somit ist der Flächeninhalt FI der Ellipse gegeben durch

ZZ Z2π Z1 Z2π
1
FI = dx dy = abr dr dφ = ab dφ = abπ .
2
F 0 0 0

Hinweis: Manchmal ist in der Literatur die Transformationsformel (7.8.21) ohne


die Betragsstriche an der Jacobi-Determinante angegeben. Wir machen uns an einem
Beispiel klar, wie diese Version der Transformationsformel anzuwenden ist.
Wir betrachten wieder das Beispiel (7.8.6) auf Seite 208:

f (x, y) = xy 2 , zu integrieren über die Fläche


mit den Rändern y = x2 und y = 2x, mit 0 ≤ x ≤ 2.

Um die Anwendung besagter Formel zu illustrieren, führen wir neue Variablen u, v


ein:
x = u, y = −v .
Das entspricht einer Spiegelung an der x-Achse. Die Jacobi-Determinante dieser
Transformation ist
∂(x, y) 1 0
= = −1.
∂(u, v) 0 −1
Die Gleichungen für den unteren und oberen Rand der Fläche, y = x2 und y = 2x,
lauten in den neuen Variablen: −v = u2 und −v = 2u, d.h.

y = x2 → v = −u2 ,
0 ≤ u ≤ 2. (7.8.24)
y = 2x → v = −2u ,
7.8 Zweidimensionale Integrale 215

In diesem Intervall ist −u2 ≥ −2u. Somit beschreibt v = −u2 den oberen Rand der
Fläche, während der untere Rand durch v = −2u gegeben ist.
• Bei Anwendung der Transformationsformel (7.8.21) muss zum einen

∂(x, y)
∂(u, v) = +1

und zum anderen die unterhalb Gleichung (7.8.21) angegebene Vorschrift verwendet
werden. D.h. als untere Grenze des Integrals bezüglich v muss die Gleichung für den
unteren Rand, also v1 = −2u, verwendet werden. Mit Formel (7.8.21) erhält man
für f (x, y) = xy 2 = uv 2 :

Z−u2
uZ2 =2
 
32
I=  uv 2 (+1)dv  du = .
5
u1 =0 −2u
| {z }
7 4
− u3 + 8u3

• Die zu (7.8.21) analoge Formel, die die Jacobi-Determinante ohne Betragsstriche


enthält15 ,
ZZ ZZ
∂(x, y)
f (x, y)dx dy = f (x(u, v), y(u, v)) du dv, (7.8.25)
∂(u, v)
F F0

ist folgendermaßen anzuwenden: Auf der rechten Seite benutzt man als untere und
obere Integrationsgrenzen genau diejenigen, die sich aus der Transformation der
ursprünglichen unteren und oberen Grenzen ergeben. Für das obige Beispiel (Spie-
gelung) sind das die Gleichungen auf der rechten Seite von (7.8.24). Dann ist das
Integral gemäß Formel (7.8.25):
xZ2 =2
 2x  uZ2 =2
 −2u 
Z Z
32
I=  xy 2 dy  dx =  uv 2 (−1)dv  du = .
5
x1 =0 x2 u1 =0 −u2

7.8.2 Flächen im Raum, Flächenintegrale über Vektorfelder


Wir betrachten nun eine beliebige Fläche F im dreidimensionalen Raum R3 , siehe
Abbildung 7.21. Flächen im R3 , die wie Flächen in der xy-Ebene zweidimensionale
Gebiete sind, können auf verschiedene Weise mathematisch beschrieben werden.
Eine bequeme Darstellung ist die Parameterform

u1 ≤ u ≤ u2 ,
r(u, v) = x(u, v)e1 + y(u, v)e2 + z(u, v)e3 , (7.8.26)
v1 ≤ v ≤ v2 .
15
Das eindimensionale Analogon dieser Formel ist die mittlere Formel in (7.8.9).
216 Einführung in die Theoretische Physik

v-Linie
dF~ u-Linie
~tv

·· ~tu

~r(u, v)

Abbildung 7.21: Eine Fläche im R3 .

Diese Form liefert den Ortsvektor eines jeden Punktes P ∈ F . Natürlich kann r(u, v),
je nach Zweckmäßigkeit, auch bezüglich einer krummlinigen Basis dargestellt wer-
den.
Man definiert nun an jedem Punkt r ∈ F ein vektorielles Flächenelement dF , in
dem auch die Lage der Fläche im R3 in der infinitesimalen Umgebung von r kodiert
ist. Man definiert den infinitesimalen Vektor

(7.8.19) ∂r ∂r
dF = n dF = n |tu × tv | = n × du dv , (7.8.27)
∂u ∂v

wobei n = n(r) der Einheitsvektor ist, der senkrecht zur der durch die Tangenten-
vektoren tu und tv aufgespannten Tangentialebene an F am Punkt r ist:
tu × tv
n=± . (7.8.28)
|tu × tv |

Die Vereinbarung ,,n ⊥ tu , tv ” legt n offensichtlich nur bis auf ein Vorzeichen fest16 .
An dieser Stelle vereinbaren wir, was man bei einer berandeten, orientierten17 Fläche
und bei einer geschlossenen Fläche unter ,,Ober- und Unterseite” bzw. ,,Außen- und
Innenseite” versteht.
16
Anders gesagt: Das Vorzeichen von tu × tv hängt von der gewählten Parametrisierung r(u, v)
ab.
17
Nicht alle berandeten Flächen haben zwei Seiten und sind orientierbar. Ein bekanntes Gegen-
beispiel ist das sog. Möbius-Band.
7.8 Zweidimensionale Integrale 217

• Welche Seite einer geschlossenen Fläche, z.B. der Oberfläche eines Quaders oder
einer Kugel, die Außenseite ist, ist anschaulich klar. Bei einer geschlossenen Fläche
wird per Konvention das Vorzeichen auf der rechten Seite von (7.8.28) so gewählt,
dass dF = n dF nach außen, also nicht in das umschlossene Volumen hinein zeigt.
• Bei einer orientierbaren, berandeten Fläche soll n per Konvention immer nach
,,oben” zeigen. Die obere Seite einer solchen Fläche definiert man wie folgt: Wenn
der Rand der Fläche im mathematisch positiven, also im Gegenuhrzeigersinn durch-
laufen wird, ist ,,oben” durch die Rechtsschraubenregel (Daumen der rechten Hand)
definiert. Wenn die Parametrisierung r = r(u, v) so ist, dass für u → u + du,
v → v + dv die Änderung r → r 0 am Rand der Fläche im Gegenuhrzeigersinn er-
folgt, dann ist demzufolge n ∝ tu ×tv ; andernfalls muss das Minuszeichen in (7.8.28)
gewählt werden.

Der Vektor n = n(r) hat per Definition den Betrag |n| = 1, ändert aber bei
einer gekrümmten Fläche seine Richtung in Abhängigkeit von r ∈ F . Wenn die
Fläche in der xy-Ebene bzw. in einer dazu parallelen Ebene liegt, dann

n = ±e3 . (7.8.29)

Das Flächenelement (7.8.27) benötigt man beispielsweise zur Berechnung des


Durchflusses eines Vektorfeldes A(r) durch eine beliebige Fläche F im R3 , z.B.
eines Kraftfeldes oder eines elektrischen oder magnetischen Feldes. Dazu muss an
jedem Punkt r ∈ F die Richtung von A in Bezug auf die Fläche bzw. die Flächen-
normale n berücksichtigt werden; denn wenn das Fächenelement parallel zu A(r),
d.h. n(r) ⊥ A(r), verschwindet der Durchfluss durch dieses Element. Das ergibt ein
Flächenintegral des folgenden Typs:
ZZ
A(r) · dF . (7.8.30)
F

Das Ergebnis ist offensichtlich ein Skalar. Weitere Typen von Flächenintegralen sind
ZZ
A(r) × dF , (7.8.31)
F
ZZ
φ(r)dF . (7.8.32)
F

Die Integrale (7.8.31) und (7.8.32) liefern als Resultat jeweils einen Vektor.
Integrale des Typs (7.8.30) - (7.8.32) werden in der Regel erst in der Vorlesung
Theoretische Physik II: Elektrodynamik benötigt. Deswegen gehen wir hier nicht
weiter darauf ein.
218 Einführung in die Theoretische Physik

7.9 Dreidimensionale Integrale


Wir betrachten hier dreidimensionale Integrale des Typs
ZZZ
I= f (x, y, z) dx dy dz, (7.9.1)
V

wobei V ⊆ R3 ein Gebiet im Raum ist. Die Funktion f (r) soll integrierbar in V
sein, wobei integrierbar analog zu (7.8.3) definiert ist. Für eine beliebige Zerlegung
von V in kleine Volumina ∆Vi muss der Limes
N
X
lim f (r i )∆Vi = I (7.9.2)
N →∞
∆Vi →0 i=1

existieren. Integrale der Form (7.9.1) nennt man gelegentlich auch Volumenintegrale,
wobei diese Namensgebung – wie die Bezeichnung Flächenintegral für (7.8.1) – miss-
verständlich ist. Wenn die Dimension [dxdydz] = (Länge)3 liefert (7.9.1) für f = 1
den Volumeninhalt von V im strikten geometrischen Sinn.
Integrale der Form (7.9.1) berechnet man völlig analog zu den Flächenintegralen
(7.8.1). Um (7.9.1) tatsächlich auf analytische Weise zu berechnen zu können, müssen
notwendigerweise für eine gegebene Funktion f (x, y, z) und gegebenes Gebiet V die
Randflächen von V analytisch darstellbar sein.

Generisches Beispiel: Die Randflächen eines dreidimensionalen Gebiets V seien


analytisch beschreibbar durch

x1 ≤ x ≤ x2 , y1 = y1 (x), y2 = y2 (x), z1 = z1 (x, y), z2 = z2 (x, y).

Analog zu (7.8.4) ist


   
ZZZ Zx2 yZ2 (x) z2Z(x,y)

f (x, y, z) dx dy dz = dx  dy  dz f (x, y, z)   . (7.9.3)


   

V x1 y1 (x) z1 (x,y)

Für integrierbare Funktionen f hängt das Integral nicht von der Reihenfolge der
Integrationen bezüglich x, y, z ab. Bei einem konkreten Problem wird die Reihenfolge
der Integration durch die Darstellung der Oberfläche von V diktiert.
Das Volumen V des Gebietes erhält man durch Integration der Funktion f (x, y, z) =
1, d.h. durch Aufsummation der Volumenelemente ∆Vi .
ZZZ
V = dx dy dz. (7.9.4)
V
7.9 Dreidimensionale Integrale 219

Beispiel: Wir integrieren f (r) = x2 + y 2 über den Quader

V = {0 ≤ x ≤ 1, − 1 ≤ y ≤ 2, − 2 ≤ z ≤ 0}.
 2  0  
ZZZ Z1 Z Z
I= f (x, y, z) dx dy dz = dx  dy  dz (x2 + y 2 )   = 8 .
V 0 −1 −2

Prüfen Sie nach, dass I in der Tat unabhängig von der Reihenfolge der Integrationen
ist.
Das Volumen dieses Quaders ist
Z1 Z2 Z0
V = dx dy dz = 6.
0 −1 −2

7.9.1 Variablentransformation, Jacobi-Determinante


Auch bei dreidimensionalen Integralen ist es oft zweckmäßig, neue Integrationsva-
riablen einzuführen. Sei
x, y, z ↔ u, v, w
in einem Gebiet V umkehrbar eindeutig:

x = x(u, v, w), u = u(x, y, z),


y = y(u, v, w), Umkehrung: v = v(x, y, z), (7.9.5)
z = z(u, v, w), w = w(x, y, z).

Demzufolge ist die Jacobi-Determinante



∂u x ∂v x ∂w x
∂(x, y, z)
6= 0 .
= ∂u y ∂v y ∂w y (7.9.6)
∂(u, v, w)
∂u z ∂v z ∂w z

Für die Determinante der Umkehrtransformation gilt (siehe die Formel (7.8.15), die
allgemein für n Variable bewiesen wurde):

∂(u, v, w) 1
= ∂(x,y,z)
. (7.9.7)
∂(x, y, z)
∂(u,v,w)

Analog zu (7.8.21) erhält man die Transformationsformel für Dreifach-Integrale:


ZZZ ZZZ
∂(x, y, z)
f (x, y, z) dx dy dz = f (u, v, w) du dv dw, (7.9.8)
∂(u, v, w)
V V0

wobei V 0 das Bild von V im (u, v, w)-Raum ist. Hinsichtlich der oberen und unteren
Integrationsgrenzen auf der rechten Seite von (7.9.8) ist die Bemerkung unterhalb
220 Einführung in die Theoretische Physik

von (7.8.21) zu beachten. Oft ist folgende Merkregel hilfreich: Wähle die unteren
und oberen Integrationsgrenzen auf der rechten Seite von (7.9.8) so, dass auch das
Integral bezüglich der transformierten Variablen das Volumen V mit dem richtigen
Vorzeichen liefert:
ZZZ ZZZ
∂(x, y, z)
V = dx dy dz = ∂(u, v, w) du dv dw.
(7.9.9)
V V0

Analog zu (7.8.25) findet man in der Literatur auch für Dreifach-Integrale die Trans-
formationsformel (7.9.8) ohne Betragsstriche an der Jacobi-Determinanten. Bei An-
wendung dieser Formel werden die unteren und oberen Integrationsgrenzen analog
zum zweidimensionalen Fall auf Seite 215 bestimmt.

Beispiele:
1. Kartesische Koordinaten ↔ Zylinderkoordinaten: x, y, z ↔ ρ, φ, z,

x = ρ cos φ, y = ρ sin φ, z = z.

Die Jacobi-Determinante dieser Transformation ist



cos φ −ρ sin φ 0
∂(x, y, z)
= sin φ ρ cos φ 0 = ρ ≥ 0.
∂(ρ, φ, z)
0 0 1
Somit transformiert sich das Volumenelement

dx dy dz = ρ dρ dφ dz. (7.9.10)

(Wenn [x] = [y] = [z] = Länge, dann [dxdydz] = [ρdρdφdz] =(Länge)3 .)


2. Kartesische Koordinaten ↔ Kugelkoordinaten: x, y, z ↔ r, θ, φ,

x = r sin θ cos φ, y = r sin θ sin φ, z = r cos θ.

Die Jacobi-Determinante dieser Transformation ist



sin θ cos φ r cos θ cos φ −r sin θ sin φ
∂(x, y, z)
= sin θ sin φ r cos θ sin φ r sin θ cos φ
∂(r, θ, φ)
cos θ −r sin θ 0
= r2 cos2 θ sin θ + r2 sin3 θ = r2 sin θ ≥ 0.

Somit transformiert sich das Volumenelement

dx dy dz = r2 sin θ dr dθ dφ = r2 dr sin θ dθ dφ, (7.9.11)


| {z }
≡dΩ

wobei dΩ = sin θ dθ dφ das sogenannte Raumwinkelelement ist.


7.9 Dreidimensionale Integrale 221

Der Sachverhalt, dass die Transformationen 1) und 2) für Punkte auf der z-Achse
nicht umkehrbar sind, d.h. die obigen Jacobi-Determinanten dort Null werden, ist
für dreidimensionale Integrale unschädlich, siehe HöMa-Vorlesung.

Einfache Anwendungen dieser beiden Variablentransformationen sind:

1. Volumen eines Zylinders Z = {Kreis mit Radius R, Höhe h}:

ZZZ zZ0 +h Z2π ZR


(7.9.10)
VZ = dx dy dz = dz dφ ρ dρ = ρ2 hπ.
Z z0 0 0

2. Volumen einer Kugel mit Radius R:

ZZZ Z2π Zπ ZR
(7.9.11) 4
VK = dx dy dz = dφ sin θ dθ r2 dr = πR3 .
3
0
K
|0 {z }0
R1
−1 d cos θ

Weitere Anwendungen im Mechanik-Teil der Vorlesung.

Zum Schluss noch ein Hinweis zur Notation: Es ist unbequem, bei Mehr-
fachintegralen das Integralsymbol mehrfach hinzuschreiben; deswegen benutzt man
oft nur ein Integralzeichen – die Vielfachheit der jeweiligen Integration ist aus dem
Integrationsmaß, d.h. dem Linien-, Flächen- oder Volumenelement ersichtlich. Für
Flächen- und Volumenelemente in kartesischen Koordinaten sind die Abkürzungen

dx1 dx2 ≡ d2 x und dx1 dx2 dx3 ≡ d3 x

üblich. Somit
Z Z ZZ
2
d x≡ dx1 dx2 ≡ dx1 dx2 ,
Z Z ZZZ
3
d x≡ dx1 dx2 dx3 ≡ dx1 dx2 dx3 .

Das könnte Ihnen auch gefallen