Einführung in Die Theoretische Physik
Einführung in Die Theoretische Physik
1
Kommentare, Druckfehlerhinweise, etc. bitte an die Email-Adresse
[email protected]
Inhaltsverzeichnis
1 Einleitung 5
1.1 Bemerkungen zur Vorlesung . . . . . . . . . . . . . . . . . . . . . . . 5
1.2 Literaturhinweise . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
3 Komplexe Zahlen 57
3.1 Kartesische Darstellung . . . . . . . . . . . . . . . . . . . . . . . . . . 58
3.2 Darstellung in Polarkoordinaten . . . . . . . . . . . . . . . . . . . . . 59
3.3 Funktionen einer komplexen Variablen . . . . . . . . . . . . . . . . . 62
3.4 Anwendungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
4 Gewöhnliche Differentialgleichungen 69
4.1 Beispiele für Differentialgleichungen 1. Ordnung . . . . . . . . . . . . 73
4.1.1 y 0 (x) = f (x) . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
4.1.2 y 0 (x) = H(x, y) . . . . . . . . . . . . . . . . . . . . . . . . . . 73
4.1.3 y 0 + a(x)y = 0 . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
4.1.4 y 0 + a(x)y = f (x) . . . . . . . . . . . . . . . . . . . . . . . . . 77
4.1.5 y 0 + ay = f (x) . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
INHALTSVERZEICHNIS 3
5 Vektorrechnung 94
5.1 Skalare und Vektoren . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
5.2 Elementare Operationen, Vektorräume . . . . . . . . . . . . . . . . . 97
5.3 Bezugssysteme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100
5.4 Skalarprodukt, Vektorprodukt, Mehrfachprodukte von Vektoren . . . 103
5.4.1 Skalarprodukt zweier Vektoren . . . . . . . . . . . . . . . . . . 103
5.4.2 Vektorprodukt zweier Vektoren . . . . . . . . . . . . . . . . . 105
5.4.3 Mehrfachprodukte von Vektoren . . . . . . . . . . . . . . . . . 108
5.4.4 Definition und Eigenschaften des -Tensors . . . . . . . . . . . 109
5.5 Vektorwertige Funktionen, Raumkurven . . . . . . . . . . . . . . . . 110
5.5.1 Parametrisierung von Bahnkurven . . . . . . . . . . . . . . . . 111
5.5.2 Differentiation und Integration vektorwertiger Funktionen . . 113
5.5.3 Charakteristische Größen einer Kurve . . . . . . . . . . . . . . 115
Einleitung
behandeln dann das sog. Eigenwertproblem für reelle symmetrische Matrizen. Diese
Problemstellung hat viele Anwendungen in der Physik (und der Mathematik). Sie
wird Ihnen z.B. in der Vorlesung Theoretische Physik I: Mechanik bei der Behand-
lung der Trägheitseigenschaften von starren Körpern wiederbegegnen.
Kapitel 7 befasst sich mit der Differential- und Integralrechnung von Funktionen
mehrerer Variablen. Viele Messgrößen der Physik hängen von mehreren Variablen
ab. Man denke etwa an die Gravitationskraft zwischen zwei punktförmigen Teilchen
(Massenpunkten), deren Stärke (und Richtung) von den Ortsvektoren der beiden
Teilchen abhängt – also von den 6 Ortskoordinaten, die die Positionen der beiden
Teilchen im Raum zu einem bestimmten Zeitpunkt angeben (siehe den Mechanik-
Teil der Vorlesung). Manche Kräfte sind nicht nur Funktionen der Ortskoordinaten
des Teilchens, auf das sie wirken, sondern hängen auch explizit vom Zeitpunkt ab,
zu dem sie wirken.
Wir werden in dieser Vorlesung die oben genannten mathematischen Objekte einfüh-
ren und vor allem Rechenoperationen üben. Auf strenge Beweise wird weitgehend
verzichtet. Diese Beweise werden in den Vorlesungen über Höhere Mathematik gelie-
fert. (In diesen Vorlesungen lernen Sie natürlich auch noch Begriffe und mathema-
tische Methoden kennen, die hier nicht besprochen werden.) Sie sollten die HöMa-
und diese Vorlesung nicht als redundante Veranstaltungen ansehen. In den HöMa-
Vorlesungen wird die genannte Mathematik in der Regel allgemeiner, abstrakter
und strenger behandelt. Der Stoff wird, salopp gesprochen, aus einem etwas ande-
ren Blickwinkel behandelt – das führt in der Regel zu einem tieferen Verständnis.
Die Physik befasst sich mit der Erforschung der Gesetzmäßigkeiten der unbe-
lebten Natur (die Biophysik auch mit der Untersuchung von Teilen der belebten
Natur). Gegenstand der Untersuchungen sind physikalische Systeme, das sind
Teile der Natur, die real vorhanden oder durch Experimente realisierbar sind. Die
Theoretische Physik befasst sich mit der Untersuchung bzw. Beschreibung solcher
physikalischer Systeme mit mathematischen Methoden. Dazu wird ein System oder
Prozess modelliert. In den einfachsten Fällen sind solche Modelle Idealbilder der Rea-
litiät. Grundlage dieser Untersuchungen bzw. dieser Modellbildung sind einheitliche
Gesetze, sog. Naturgesetze. Natürlich ist es das oberste Ziel jeder Naturwissenschaft,
bisher unbekannte Naturgesetze zu entdecken. Die Grundgesetze der Mechanik sind
allerdings seit langem bekannt.
In der Mechanik wird die Wirkung von Kräften (in der modernen Physik spricht
man allgemeiner von Wechselwirkungen) auf Körper, insbesondere auf deren Bewe-
gung untersucht. Gegenstand der theoretischen Mechanik ist die Berechnung, d.h.
die Vorhersage dieser Kraftwirkung, insbesondere die Berechnung der Bahnen von
Körpern mit Hilfe von Bewegungsgleichungen.
Wir behandeln im Rahmen dieses Mathematik-Teils der Vorlesung nur einfache An-
wendungen aus der Mechanik und verwenden nur Konzepte, die Sie bereits aus der
Schulphysik kennen sollten. Eine umfassende Begriffsbildung liefert der Mechanik-
Teil dieser Vorlesung. Wir idealisieren Körper durch Massenpunkte, soll heissen, man
1.1 Bemerkungen zur Vorlesung 7
denkt sich die gesamte Masse eines (kleinen) Körpers auf einen Punkt im Raum
konzentriert. Wir bezeichnen dies auch pauschal als ein Teilchen. Aus dem Physik-
Unterricht in der Schule sollten Sie wissen, dass die Bewegung eines Teilchens im
Raum festgelegt ist, wenn wir seine Bahn, d.h. seinen Ort als Funktion der Zeit
kennen. Daraus erhält man durch Differentiation nach der Zeit die Geschwindigkeit
und die Beschleunigung des Teilchens:
dr dv d2 r
Ort r = r(t) ⇒ Geschwindigkeit v = ⇒ Beschleunigung a = = 2 .
dt dt dt
Ort, Geschwindigkeit und Beschleunigung sind Vektoren (siehe Kapitel 5). Diese
werden oft durch einen Pfeil über dem jeweiligen Symbol gekennzeichnet, z. B. −
→
r.
In diesem Skript kennzeichnen wir Vektoren in der Regel durch Fettbuchstaben.
Aus dem Schulunterricht sollten Sie auch noch wissen, dass das grundlegende Bewe-
gungsgesetz der Mechanik die Newtonsche Bewegungsgleichung ist: Die Masse eines
Teilchens mal seiner Beschleunigung ist gleich der auf das Teilchen einwirkenden
Kraft. Benutzt man, dass die Beschleunigung die 2. Ableitung des Ortsvektors nach
der Zeit ist, ist dieses Gesetz gegeben durch
d2 r
m =F, (1.1.1)
dt2
wobei m die Masse des Teilchens und F die auf das Teilchen einwirkende Kraft
ist. Die die Bewegung verursachenden Kräfte können wir für unsere Zwecke als be-
kannt voraussetzen; sie werden bzw. wurden in der Regel experimentell bestimmt.
Die Gl. 1.1.1 ist eine Differentialgleichung (2. Ordnung)– tatsächlich handelt es sich
um 3 Differentialgleichungen für die 3 Koordinaten des Ortsvektors. Die Lösung
dieser Differentialgleichung werden wir für einfache Kraftgesetze in Kapitel 4 lösen.
Beispiele für Kräfte, die wir im Rahmen dieses Mathematik-Teils der Vorlesung be-
nutzen, sind:
• Die Gravatitationskraft der Erde F Erde auf ein Objekt der Masse m, das nicht
zu weit von der Erdoberfläche entfernt ist. In diesem Fall ist diese Kraft in sehr
guter Näherung ortsunabhängig und gegeben durch
m
F Erde = mg = −mgez , g = 9, 81 , (1.1.2)
s2
wobei g die sog. Erdbeschleunigung und ez ein von der Erdoberfläche senkrecht nach
oben zeigender Einheitsvektor ist.
• Die Hookesche Federkraft
F H = −k(r − r 0 ) , (1.1.3)
wobei die Federkonstante k die Stärke der jeweiligen Rückstellkraft charakterisiert
und r 0 die Ruhelage des am Ende der Feder befindlichen Massenpunktes ist.
8 Einführung in die Theoretische Physik
• Reibungskräfte, die proportional zur Geschwindigkeit bzw. zum Quadrat der Ge-
schwindigkeit eines Körpers sind, siehe Kapitel 4.
• Die Kraft, die ein elektrisches Feld E auf ein Teilchen der Ladung q ausübt, ist
F E = qE . (1.1.4)
dx dv d2 x
x = x(t) , v= , a= = 2 ,
dt dt dt
und die Newtonsche Bewegungsgleichung lautet
d2 x
m =F. (1.1.5)
dt2
Hinweise:
1.2 Literaturhinweise
Mathematische Methoden:
Lehrbücher, die große Teile der mathematischen Methoden dieser Vorlesung und
etliches mehr behandeln, sind:
S. Großmann: Mathematischer Einführungskurs für die Physik, Teubner Verlag (2009).
C.B. Lang und N. Pucker: Mathematische Methoden in der Physik, Spektrum Aka-
demischer Verlag (2005).
Als Nachschlagewerk zu empfehlen: I. N. Bronstein u. a.: Taschenbuch der Mathe-
matik, Verlag Harri Deutsch (2008).
Newtonsche Mechanik:
Zum Vorlesungsteil Newtonsche Mechanik wird es ein Skriptum geben, das im L2P
als pdf file zur Verfügung gestellt werden wird.
Für Anfänger geeignete Lehrbücher sind:
W. Nolting: Grundkurs Theoretische Physik 1: Klassische Mechanik, Springer Ver-
lag (2006).
W. Greiner u.a.: Klassische Mechanik I, Verlag Harri Deutsch (2008).
S. Brandt, H. D. Dahmen: Mechanik. Eine Einführung in Experiment und Theorie,
Springer-Verlag (2004).
T. Fließbach, Mechanik, Spektrum Akademischer Verlag (2009). Dieses Buch setzt
die o.g. mathematischen Methoden im Wesentlichen voraus und behandelt die New-
tonsche Mechanik nur sehr knapp. Es ist für die Vorlesung Theoretische Physik I,
Mechanik geeignet.
Kapitel 2
Umkehrfunktion:
Wenn eine Funktion f (x) einem bestimmten Gebiet x ∈ D streng monoton steigend
oder fallend ist, d.h. wenn eine der Bedingungen (2.1.2) erfüllt ist, dann ist sie in
diesem Gebiet umkehrbar. Die Umkehrfunktion von f bezeichnet man in der Regel
mit f −1 , d.h. x = f −1 (y). Diese Funktion ist durch Vorschrift
f −1 (f (x)) = x (2.1.4)
definiert. Graphisch erhält man die Umkehrfunktion f −1 durch Spiegelung des Gra-
phen von f an der Geraden y = x.
Vorsicht: Die Notation kann zu Missverständnissen führen; f −1 (y) ist nicht
[f (y)]−1 = f (y)
1
.
√
Beispiel: Die Umkehrfunktion von y = x2 (x ≥ 0) ist y = x und nicht y = x12 .
Sei f (x) : D 7→ WD streng monoton. Der Definitionsbereich der Umkehrfunktion
f −1 (x) ist WD , ihr Wertebereich ist D.
Wenn eine Funktion nicht in ihrem gesamten Definitionsbereich streng monoton ist,
sondern nur in verschiedenen Teilgebieten, kann man sie separat umkehren. Das lie-
fert aber in diesen Teilgebieten verschiedene Umkehrfunktionen.
Beispiel: Die Funktion y = x2 ist in ganz R definiert, aber nur in den Teilgebie-
ten x ≥ 0 und x ≤ 0 streng monoton. Im Gebiet x ≥ 0 nennen wir die Funktion
f1 = f , im Gebiet x ≤ 0 ist durch f die Funktion f2 = √ f definiert. Die Umkehr-
2 −1
funktion von f1 (x) = x im Gebiet x ≥ 0 ist f1 (x) √ = x. Die Umkehrfunktion
von f2 (x) = x2√im Gebiet x ≤ 0 ist f2−1 (x) = − x (wobei hier x ≥ 0); denn
f2−1 (f2 (x)) = − x2 = −|x|.
12 Einführung in die Theoretische Physik
Trigonometrische Funktionen:
Die trigonometischen Funktionen
sin x cos x
sin x , cos x , tan x = , cot x =
cos x sin x
sind die wichtigsten Beispiele für periodische Funktionen. Die Funktionen sin x und
cos x sind auf der ganzen reellen Achse definiert; die Funktionen tan x und cot x wer-
den bei den Nullstellen von cos x bzw. sin x unendlich, d.h. ihr Definitionsbereich
ist R abzüglich dieser Nullstellen. Da es sich bei den trigonometrischen Funktionen
um periodische Funktionen handelt, sind sie nicht in ihren ganzen Definitionsbe-
reichen umkehrbar – ihre Umkehrfunktionen, die sog. inversen trigonometrischen
Funktionen oder Arkusfunktionen sind mehrdeutig. Will man eine eindeutige Um-
kehrfunktion erhalten, muss man den Definitionsbereich der jeweiligen trigonome-
trischen Funktion auf ein Gebiet beschränken, in dem sie streng monoton steigend
oder fallend ist. Man nennt das ein Monotonieintervall. Dies ist am Beispiel von
sin x in Abbildung 2.1(a) dargestellt.
1. y = sin x. Diese Funktion ist in ganz R definiert und ist periodisch mit Periode
2π, also nicht im ihrem ganzen Definitionsbereich umkehrbar. Will man eine
eindeutige Umkehrfunktion erhalten, muss man den Definitionsbereich der je-
weiligen trigonometrischen Funktion auf ein Gebiet beschränken, in dem sin x
streng monoton steigend oder fallend ist. Man wählt das Monotonieintervall
n π πo
Dsin = x − ≤ x ≤ ,
2 2
in dem sin x streng monoton steigend ist. Die zu diesem Intervall des sin x
gehörende Umkehrfunktion wird mit
arcsin x ≡ sin−1 x
Darcsin = {x |−1 ≤ x ≤ 1}
2. y = cos x ist in ganz R definiert und ist periodisch mit Periode 2π. Zur Um-
kehrung beschränkt man sich auf das Monotonieintervall
Dcos = {x |0 ≤ x ≤ π } ,
14 Einführung in die Theoretische Physik
Hinweise:
1) Machen Sie sich mit diesen Funktionen vertraut, z.B. anhand des Buches von
Bronstein et al. Zeichnen Sie diese Funktionen!
2) Die Umkehrfunktionen der trigonometrischen Funktionen nennt man wie gesagt
auch Arkusfunktionen. Die zu den oben gewählten Monotonieintervallen gehörenden
Arkusfunktionen sind die sog. Hauptwerte dieser Funktionen. Wenn man zur Um-
kehrung einer trignonometrischen Funktion ein anderes Monotonieintervall wählt,
verschiebt sich der Wert der zugehörigen Arkusfunktion um eine Konstante; siehe
z.B. das Buch von Bronstein et al.
Stetigkeit:
Die Funktion f (x) sei in einem offenen Intervall (a, b) definiert und es sei x0 ∈
(a, b). Die Funktion heißt stetig an der Stelle x0 , wenn zu jedem beliebig kleinen
> 0 stets eine passende Zahl δ() > 0 angegeben werden kann, so dass |f (x) −
f (x0 )| < für alle x, die |x − x0 | < δ() erfüllen. Diese Definition ist mit folgender
Definition äquivalent: Wenn für jede Zahlenfolge {xn }∞ n=0 , die gegen x0 konvergiert,
die jeweiligen Funktionswerte f (xn ) gegen f (x0 ) konvergieren, dann heißt f in x0
stetig. (Beweis der Äquivalenz in der HöMaI-Vorlesung.) Man schreibt
lim f (x) = f (x0 ) .
x→x0
Man spricht von linksseitiger bzw. rechtsseitiger Stetigkeit, wenn der Grenzwert der
Funktion für von links bzw. von rechts gegen x0 konvergierende Zahlenfolgen exis-
tiert. Demnach ist eine bei x0 stetige Funktion beidseitig stetig.
Salopp gesprochen ist eine Funktion f bei x0 stetig, wenn ihr Graph bei x0 keinen
Sprung hat oder wenn f (x0 ) 6= ±∞. Die Funktionen in Abbildung 2.2a,b sind bei x0
stetig, während die Funktion in Abbildung 2.2c bei x0 unstetig ist – diese Funktion
ist bei x0 nicht definiert. Man kann diese Funktion bei x0 zwar links- oder rechtsei-
tig stetig ergänzen, indem man ihr den linksseitigen oder rechtsseitigen Grenzwert
zuweist,
lim f (x) = y0 , lim f (x) = y00 .
x%x0 x&x0
Da y0 6= y00 kann man ihr nicht beide Werte zuweisen, sonst wäre f nicht eindeutig.
Zwei Grenzwerte:
In Abschnitt 2.2 benötigen wir die beiden folgenden Grenzwerte:
sin x
lim = 1, (2.1.8)
x→0 x
ex − 1
lim = 1. (2.1.9)
x→0 x
Zum Beweis von (2.1.8) benutzt man die Ungleichung
π
| sin x| ≤ |x| ≤ | tan x| für |x| < .
2
16 Einführung in die Theoretische Physik
π
2
-π
2
-π π
2 2
(a)
x
1
π
φ= 2
x
0 φ=
arcsin x
φ = − π2
−1
(b) φ = arcsin x ist ein Bogen
am Einheitskreis.
Abbildung 2.1: (a) Die Funktion sin x ist im Intervall − π2 ≤ x ≤ π2 streng monoton
steigend (durchgezogene rote Kurve). Die Umkehrfunktion in diesem Bereich ist
arcsin x, das ist nur die durchgezogene blaue Kurve! Der Definitionsbereich dieser
Funktion ist −1 ≤ x ≤ 1 und ihr Wertebereich ist − π2 ≤ arcsin x ≤ π2 .
2.1 Reelle Funktionen 17
x0 x0 x0
(a) Stetig bei x0 . (b) Stetig bei x0 . (Aber dort (c) Unstetig bei x0 .
nicht differenzierbar.)
1 ex − 1 1
≤ ≤ für 0 < |x| < 1 . (2.1.10)
1 + |x| x 1 − |x|
Den linken Teil dieser Ungleichung beweist man folgendermaßen: Für x > 0 und
n > 1 ist x 1 x n
1+x= 1+ < 1+ < ex , (2.1.11)
1 n
wobei die binomische Formel (2.2.3) und die Definition (2.1.5) der Exponentialfunk-
tion verwendet wurde. Dieselbe Ungleichung gilt für 0 > x > −1 (nachprüfen).
Somit ist
ex − 1 1
≥1≥ für x > 0 .
x 1+x
Für 0 > x > −1 erhält man mit der Ungleichung (2.1.11):
1 ex − 1 1 1
ex < ⇒ ≥ = .
1−x x 1−x 1 + |x|
Damit ist die linke Seite von (2.1.10) bewiesen. Die rechte Seite dieser Ungleichung
beweist man analog (Hausaufgabe). Den Grenzwert (2.1.9) erhält man im Limes
x → 0 auf der linken und rechten Seite von (2.1.10).
der Umgebung von x0 beschränkt. Der am häufigsten auftretende Typ einer Unste-
tigkeitsstelle einer Funktion sind Punkte x0 , an denen die Funktion unendlich wird,
d.h. divergiert. Viele uns interessierende Funktionen besitzen solche sog. singulären
Punkte2 x0 . Man unterscheidet verschiedene Typen von Singularitäten. Wir führen
hier keine Klassifizierung durch, sondern geben nur einige Beispiele.
a) Pole: Wir betrachten als Beispiele
1 1 1 1
f (x) = , g(x) = 2
= , h(x) = .
1−x 1−x (1 + x)(1 − x) (1 − x)2
Die Funktion f divergiert bei x = 1. Wenn x → 1 von links, dann f → ∞; wenn
x → 1 von rechts, dann f → −∞. Man sagt, f hat einen einfachen Pol bei x = 1.
Somit hat g(x) jeweils einen einfachen Pol bei x = 1 und bei x = −1. Die Funktion
h(x) hat einen Doppelpol bei x = 1. Man sagt, eine Funktion f (x) hat bei x0 einen
n-fachen Pol (n ∈ N), wenn sie sich für x → x0 verhält wie
const
f (x) → .
(x − x0 )n
b) Wurzelsingularitäten: Beispiel:
const
f (x) = √ , x > 0.
x
Die Funktion divergiert für x → 0.
c) Logarithmische Singularitäten: Beispiel:
Der erste Grenzwert ist offensichtlich; den zweiten Grenzwert zeigt man mit der
L’Hospitalschen Regel, siehe Abschnitt 2.3.6.
A) Elementare Funktionen:
Dazu gehören die algebraischen Funktionen und die elementaren transzenden-
ten Funktionen.
y = P (x) = a0 + a1 x + ... + an xn , aj ∈ R , n ∈ N.
Die höchste Potenz n bezeichnet man als den Grad des Polynoms.
A.1.2) Gebrochen rationale Funktionen.
a0 + a1 x + ... + an xn P (x)
y= n
= .
b0 + b1 x + ... + bn x Q(x)
A.1.3) Nichtrationale Funktionen. Diese enthalten Wurzeln. Beispiele:
y = x7/8 ,
q √
y = (x2 + 5) x .
wobei n ∈ N und die Pi (x) Polynome sind. Die Indizes i bezeichnen hier
nicht den Grad von Pi .
A.2) Elementare transzendente Funktionen:
A.2.1) Trigonometrische Funktionen.
A.2.3) Hyperbelfunktionen.
ex − e−x ex + e−x
sinh x = , cosh x = ,
2 2
sinh x cosh x
tanh x = , coth x = ,
cosh x sinh x
und ihre Umkehrfunktionen
arsinhx ≡ sinh−1 x , arcoshx ≡ sinh−1 x ,
artanhx ≡ tanh−1 x , arcothx ≡ coth−1 x .
20 Einführung in die Theoretische Physik
y y
f (x) f (x)
f (x2 ) Sekante
Tangente
f (x1 )
x x
x1 x2 x0
(a) Sekante durch (x1 , f (x1 )) und (x2 , f (x2 ). (b) Tangente an f bei x0 .
2.2 Differentialrechnung
Wir betrachten eine stetige Funktion y = f (x).
Differenzenquotient: Ein Differenzenquotient von f ist ein Verhältnis der Form
∆f (x) f (x1 ) − f (x2 )
≡ . (2.2.1)
∆x x1 − x2
Geometrische Bedeutung: Der Differenzenquotient ist die Steigung der Sekante, die
die Punkte (x1 , f (x1 )) und (x2 , f (x2 )) verbindet, siehe Abbildung 2.3(a).
Differentialquotient: Wir setzen x2 = x0 und x1 = x0 + h, wobei h ∈ R beliebig.
Wir halten x0 fest und lassen h → 0 gehen. Die Funktion f heißt an der Stel-
le x0 differenzierbar, wenn der folgende Limes (der Differentialquotient)
sowohl für positive als auch negative h → 0 existiert:
df (x) f (x0 + h) − f (x0 )
≡ lim . (2.2.2)
dx x=x0 h→0
h
Geometrische Bedeutung: Der Differentialquotient ist die Steigung der Tangente an
den Graphen von f bei x0 , siehe Abbildung 2.3(b).
2.2 Differentialrechnung 21
Notation:
dy df
y0 ≡ ≡ f 0 (x) ≡ .
dx dx
Man nennt den Differentialquotienten auch die (erste) Ableitung von f .
Beispiele:
y = axn ⇒ y0 = naxn−1 , n ∈ N,
y = sin x ⇒ y0 = cos x,
y = cos x ⇒ y0 = − sin x,
y = ex ⇒ y0 = ex .
Zur Herleitung der Ableitungen dieser elementaren Funktionen benutzt man in der
Definition (2.2.2) des Differentialquotienten folgendes: i) Bei der Ableitung von xn
verwendet man die binomische Formel3
n
n
X n
(x0 + h) = xn−k
0 hk . (2.2.3)
k
k=0
ii) Bei der Ableitung von sin x benutzt man, dass sin(x0 + h) − sin x0 = 2 cos(x0 +
h/2) sin(h/2) und zudem, dass sin(h/2)/(h/2) → 1 für h → 0, siehe (2.1.8). iii) Zur
Berechnung der Ableitung von cos x verwendet man, dass cos(x0 + h) − cos x0 =
−2 sin(x0 + h/2) sin(h/2) und wiederum, dass sin(h/2)/(h/2) → 1 für h → 0. iv)
Bei der Ableitung von ex verwendet man, dass (eh −1)/h → 1 für h → 0, siehe (2.1.9).
Hinweis: Die Stetigkeit von f (x) bei x0 ist keine hinreichende Voraussetzung für ihre
Differenzierbarkeit bei x0 . Ein Beispiel dafür ist die in Abbildung 2.2(b) dargestellte
Funktion, die bei x0 stetig ist. Wenn man den Limes der Differenzenquotienten
mit h → 0, h < 0 bildet, erhält man offensichtlich für den Differentialquotienten
(2.2.2) eine negative Zahl, während der Limes der Differenzenquotienten mit h → 0,
h > 0 eine positive Zahl liefert. Man kann im Sinne dieses Beispiels die links- und
rechtsseitige Ableitung von f an einer Stelle x0 definieren. Eine Funktion f ist dann
bei x0 differenzierbar, wenn die links- und rechtsseitige Ableitung existiert und beide
gleich sind.
Eine stetige Funktion
p muss nicht unbedingt einseitig differenzierbar sein. Beispiel:
die Funktion y = |x| ist insbesondere bei x0 = 0 stetig, aber es existieren keine
einseitigen Ableitungen an dieser Stelle (siehe Übungen).
3
Der Binomialkoeffizient
n n!
≡ , 0 ≤ k ≤ n.
k k!(n − k)!
Per Definition ist i) der Koeffizient null für k > n und ii) 0! = 1.
22 Einführung in die Theoretische Physik
2.2.1 Rechenregeln
Man will bei der Differentiation komplizierter Funktionen natürlich nicht jedesmal
auf die Definition (2.2.2) zurückgreifen. Dazu benutzt man folgende Rechenregeln:
(f ± g)0 = f 0 ± g 0 , (2.2.4)
(f · g)0 = f 0 g + f g 0 (Produktregel), (2.2.5)
0
1 g0
=− 2 (2.2.6)
g g
0
f f 0g − f g0
= (Quotientenregel). (2.2.7)
g g2
Der Beweis der ersten Regel ist trivial. Zum Beweis der anderen Regeln siehe die
HöMaI-Vorlesung. Weitere wichtige Rechenregeln besprechen wir gleich.
Beispiele für die Anwendung der Quotientenregel:
cos x 1
y = cot x = ⇒ y0 = − 2 .
sin x sin x
Kettenregel: Sei y = f (z) und z = g(x) und somit y = f (g(z)). (Man nennt das
eine zusammengesetzte Funktion.) Dann ist
d df (g) dg
f (g(x)) = (Kettenregel). (2.2.8)
dx dg dx
Beispiele:
1. √
y = tan x2 + 1 ,
dy dy dg dz
=
dx dg dz dx
1 1 −1/2
= z 2x
cos2 g 2
1 x
= √ √ .
cos2 2 2
x +1 x +1
2. Allgemeine Exponentialfunktion
y = bx = ex ln b b ∈ R, b > 0.
Daher
dy
= ex ln b ln b = bx ln b.
dx
d ˜ d df (x)
1= f (f (x)) = f˜(y)
dx dy dx
df˜(y) 1
⇒ = . (2.2.9)
dy df (x)/dx
Dies ist die sog. Umkehrfunktionsregel. Die Formel (2.2.9) ist wie folgt zu verstehen.
In (2.2.9) ist die Umkehrfunktion f˜ als Funktion der Variablen y dargestellt. Auf der
rechten Seite muss man nach der Berechnung der Ableitung df (x)/dx die Ersetzung
x = f˜(y) durchführen. Will man zur üblichen Konvention zurückkehren und f˜ als
Funktion von x darstellen, dann vertausche man y ↔ x in (2.2.9) und erhält
df˜(x) 1
= , (2.2.10)
dx df (y)/dy
24 Einführung in die Theoretische Physik
wobei man auf der rechten Seite nach der Berechnung der Ableitung df /dy die Er-
setzung y = f˜(x) vornehmen muss.
Hinweis: Mit den Ableitungen von exp x, sin x, cos x, den Regeln (2.2.4) – (2.2.7),
der Kettenregel (2.2.8) und der Umkehrfunktionsregel (2.2.9) bzw. (2.2.10) kann
man alle (zusammengesetzten) elementaren Funktionen differenzieren. Nichtelemen-
tare Funktionen, die durch Potenzreihen – siehe Abschnitt 2.3 – dargestellt werden
können, kann man damit ebenfalls differenzieren. Die Ableitung
R x einer nichtelemen-
taren Funktion F (x), die in Form eines Integrals F (x) = a dtf (t) darstellbar ist
–siehe etwa das Beispiel (2.4.25) –, ist dF(x)/dx =f(x). Das wird in (2.4.20) gezeigt.
Eine andere Ableitungsregel für Funktionen, die durch ein Integral definiert sind, ist
(2.4.24) unten.
Beispiele:
1. y = ln x ist die Umkehrfunktion von x = ey mit der Ableitung dx/dy = ey .
Mit (2.2.10) erhalten wir (0 ≡ d/dx):
1 1 1
(ln x)0 = y
= ln x = .
e e x
2.
y = ln |x|,
d.h. y = ln x für x > 0 und y = ln(−x) für x < 0. Unter Benutzung des soeben
erzielten Ergebnisses erhalten wir
dy 1
= .
dx x
Für x < 0 wurde zudem die Kettenregel benutzt:
d 1 1
ln(−x) = (−1) = .
dx (−x) x
3.
y = xr = er ln x , r ∈ R.
Unter Benutzung der Kettenregel erhält man
r
(xr )0 = (r ln x)0 er ln x = xr = rxr−1 .
x
4. y = arcsin x ist die Umkehrfunktion von x = sin y. Mit (2.2.10) ergibt sich:
1 1 1
(arcsin x)0 = d sin y
= =p
dy
cos y 1 − sin2 y
1
=√ , |x| < 1 .
1 − x2
2.2 Differentialrechnung 25
5. y = arccos x ist die Umkehrfunktion von x = cos y. Mit (2.2.10) erhält man:
1 1 1
(arccos x)0 = d cos y
= = −p
dy
− sin y 1 − cos2 y
1
= −√ , |x| < 1 .
1 − x2
Differential:
df
Man kann die Ableitung einer Funktion, dx = f 0 (x), als Differentialquotient ernst
nehmen. Multiplikation mit der infinitesimalen Größe dx ergibt:
df = f 0 (x)dx . (2.2.11)
Man bezeichnet df als das Differential von f an der Stelle x. Gl. (2.2.11) besagt,
dass sich die Funktion vom Wert f (x) zum Wert f (x) + df (x) infinitesmal ändert,
wenn man die Variable von x nach x + dx infinitesmal ändert.
Beispiel: y = xr ⇒ dy = rxr−1 dx.
2. Vergleich der Vorzeichen der 1. Ableitung: Sei x ∈ Gx0 . Wenn f 0 (x) > 0 für
x < x0 und f 0 (x) < 0 für x > x0 (d.h. Steigung erst positiv, dann negativ),
dann liegt bei x0 ein Minimum vor. Wenn f 0 (x) < 0 für x < x0 und f 0 (x) > 0
für x > x0 , dann handelt es sich um ein Maximum. Wenn f 0 (x) in einer
Umgebung von x0 sein Vorzeichen nicht ändert, d.h. f in dieser Umgebung
monoton steigt oder fällt, dann handelt es sich um einen Wendepunkt.
3. Methode der höheren Ableitungen: Wenn die dritte und höhere Ableitungen
von f existieren, kann man anhand ihres Verhaltens ebenfalls den Typ des
stationären Punktes bestimmen. Z.B. wenn f 00 (x0 ) = 0 und f 000 (x0 ) 6= 0, dann
liegt bei x0 ein Wendepunkt (siehe z.B. das Buch von Bronstein et al.).
Beispiele:
1) f (x) = x4 . Die Funktion hat offensichtlich bei x0 = 0 ein (globales) Minimum.
Da f 00 (0) = 0, muss man sich einer der o.g. Methoden bedienen, um das formal zu
zeigen. Z.B. folgt die Aussage f (0) = Minimum aus dem Wechsel des Vorzeichens
von f 0 (x) = 4x3 von Minus nach Plus beim Wechsel von x < 0 nach x > 0.
2) f (x) = x5 . Bei x0 = 0 liegt ein Wendepunkt vor; denn i) f 0 (0) = f 00 (0) = 0 und
ii) f 0 (x) = 5x4 wechselt sein Vorzeichen beim Übergang von x < 0 nach x > 0 nicht.
b 0 , b 1 , . . . , b i , . . . , bN .
Dass wir hier den Zählindex i mit i = 0 beginnen lassen, ist eine Konvention. Die
Summe (= endliche Reihe) dieser Folge ist die (reelle) Zahl
N
X
SN = b 0 + b 1 + . . . + b N = bi ,
i=0
P
wobei hier das Summenzeichen verwendet wurde.
Ein bekanntes Beispiel ist die geometrische Folge (auch geometrische Progression
genannt):
b0 = a, b1 = aq, b2 = aq 2 , . . . , bn = aq n .
Die Summe dieser n + 1 Glieder ist
a(1 − q n+1 )
Sn = a + aq + aq 2 + . . . + aq n = . (2.3.1)
1−q
Man erhält dieses Ergebnis, indem man zunächst Sn mit q multipliziert,
qSn = aq + aq 2 + aq 3 + . . . + aq n+1
b0 , b 1 , . . . , b i , . . . ≡ {bi }∞
i=0 .
b = lim bi existiert.
i→∞
nennt man Partialsummen. Die mit der Folge assoziierte unendliche Reihe ist formal
gegeben durch
X∞
S≡ bi .
i=0
2.3 Potenzreihen und Taylorentwicklung 29
Die unendliche Reihe existiert, wenn die Folge der Partialsummen konvergiert, d.h.
Eine offensichtlich notwendige, aber nicht hinreichende Bedingung dafür, dass der
Grenzwert S existiert ist, dass die Folge der bi gegen Null konvergiert:
lim bi = 0 .
i→∞
Beispiele:
1) Für die geometrische Reihe {bi = aq i }∞
i=0 sind die Partialsummen Sn durch (2.3.1)
gegeben. Die Partialsummen konvergieren, wenn |q| < 1:
a
|q| < 1 ⇒ S = lim Sn = . (2.3.2)
n→∞ 1−q
Die geometrischen Reihe konvergiert somit für |q| < 1.
2) Wir betrachten die sog. harmonische Reihe und die sog. alternierende harmonische
Reihe: ∞ ∞
X 1 X (−1)k+1 1 1 1
und = 1 − + − ... (2.3.3)
k=1
k k=1
k 2 3 4
Die mit diesen Reihen assoziierten Folgen sind Nullfolgen; denn in beiden Fällen
ist limk→∞ bk = 0. Allerdings konvergiert nur die alternierende harmonische Reihe;
die harmonische Reihe ist divergent. Die Divergenz dieser Reihe kann man mit ele-
mentaren Mitteln zeigen. Die Konvergenz der alternierenden harmonischen Reihe
kann man z.B. mit dem Leibniz-Kriterium für alternierende Reihen beweisen – siehe
HöMa-Vorlesung. Wir werden unten auf diese Reihen zurückkommen.
Rechenregeln für konvergente Reihen: Bei einer konvergenten Reihe mit dem
Wert S darf man jedes Glied mit einer Zahl a ∈ R multiplizieren; die neue Reihe
ist wieder konvergent und hat den Wert aS. Zwei konvergente Reihen darf man
gliedweise addieren und subtrahieren. Man darf in einer konvergenten Reihe auch
beliebig viele Klammern setzen, ohne den Grenzwert der Reihe zu verändern.
Nun zum Begriff der absoluten Konvergenz einer Reihe. Wir betrachten
∞
X ∞
X
bk (R1) und |bk | . (R2)
k=1 k=1
Die Glieder in (R1) können verschiedene Vorzeichen haben. Wenn die Reihe (R2)
konvergiert, dann konvergiert offensichtlich auch die Reihe (R1). Man sagt, die Rei-
he (R1) konvergiert absolut. Wenn Reihe (R2) divergiert, ist zunächst nicht klar, ob
(R1) auch divergiert oder konvergiert. Falls (R1) konvergiert, bezeichnet man sie als
bedingt konvergent. Ein Beispiel dafür sind die beiden Reihen in (2.3.3). Die kon-
vergente alternierende harmonische Reihe entspricht (R1), die harmonische Reihe
(R2). Wie erwähnt, divergiert diese Reihe; deswegen ist die alternierende harmo-
nische Reihe bedingt konvergent. Im Gegensatz dazu ist die geometrische Reihe
30 Einführung in die Theoretische Physik
dann gilt:
1
ρ < 1 ⇒ Reihe ist absolut konvergent,
Sei ρ = lim |bn | n . Falls ρ = 1 ⇒ keine Aussage mit diesem K. möglich,
n→∞
ρ > 1 ⇒ Reihe ist divergent.
(2.3.5)
2.3.2 Potenzreihen
Die Glieder der obigen Reihen und ihre Werte sind Konstanten – aber man kann
auch Reihen betrachten, deren Glieder Funktionen einer Variablen sind. Der ein-
fachste und am häufigsten auftretende Fall einer solchen Funktionenreihe ist der
einer Potenzreihe. Das ist eine unendliche Reihe der Form
∞
X ∞
X
n
an x oder S(x) = an (x − x0 )n , an , x0 , x ∈ R.
n=0 n=0
Die Zahlen an sind die Koeffizienten der Potenzreihe, x0 ist der Entwicklungspunkt
(siehe unten) und x bezeichnet eine reelle Variable. Die erste Reihe ist offensichtlich
ein Spezialfall (x0 = 0) der zweiten Reihe. Eine Potenzreihe ist – falls sie konvergiert
– eine Funktion S(x) der Variablen x. Solche Reihen können auf verschiedene Wei-
se verwendet werden. Man kann einerseits eine bekannte Funktion innerhalb eines
bestimmten Gebietes durch eine Potenzreihe darstellen. Das werden wir unten an-
hand etlicher wichtiger Beispiele tun. Man kann andererseits eine Potenzreihe durch
Vorgabe von Koeffizienten an auch zur Definition neuer Funktionen benutzen. Vie-
le nichtelementare Funktionen können auf diese Weise definiert werden. Wir gehen
darauf hier nicht ein.
Falls eine Potenzreihe nur endlich viele Glieder hat, d.h. wenn an = 0 ∀n > N , dann
handelt es sich offensichtlich um ein Polynom PN (x) vom Grad N .
2.3 Potenzreihen und Taylorentwicklung 31
|x − x0 | < ρ
Beispiel: Wir betrachten die oben besprochene geometrische Reihe und setzen
q = x und a = 1. Die Partialsumme SN der Reihe ist
N
2 N
X 1 − xN +1
SN (x) = 1 + x + x + ... + x = xn = .
n=0
1−x
N →∞
Für |x| < 1 ⇒ xN +1 −−−→ 0, d.h.
1
S(x) = lim SN (x) = .
N →∞ 1−x
Fazit: Man kann die Funktion 1/(1 − x) für |x| < 1 durch folgende Potenzreihe
darstellen: ∞
1 X
= xn für |x| < 1.
1 − x n=0
Für |x| < 1 konvergiert diese Reihe absolut. Anhand der linken Seite dieser Gleichung
sehen wir, dass die Reihe auch bei x = −1 konvergiert, aber bei x = 1 divergiert.
Was hat man durch diese Darstellung gewonnen? Man kann die Funktion 1/(1 − x)
z.B. in der Umgebung von x0 = 0 näherungsweise durch eine endliche Summe, d.h.
ein Polynom darstellen, mit dem es sich in der Regel einfacher rechnen lässt. Je
mehr Glieder man berücksichtigt, desto genauer wird die Approximation.
1
1+x
1 + x + x2
..
.
Ohne Beweis listen wir noch einige Aussagen auf, die für das Rechnen mit Po-
tenzeihen wichtig sind (Beweis siehe HöMa-Vorlesung):
4
Bei Funktionenreihen kommt noch der Begriff der gleichmäßigen Konvergenz der Reihe ins
Spiel. Wir gehen hier nicht darauf ein.
32 Einführung in die Theoretische Physik
2. Man kann auch den Quotienten zweier Potenzreihen bilden. Die Nennerreihe
darf aber entweder keine Nullstelle am Entwicklungspunkt x0 haben, d.h. es
muss a0 6= 0 sein, oder die Nullstelle n-ter Ordnung der Nennerreihe bei x0 wird
durch eine Nullstelle mindestens n-ter Ordnung der Zählerreihe aufgehoben.
2.3.3 Taylorentwicklung um x0 = 0
In vielen Anwendungen stellt sich folgendes Problem: Gegeben ist eine Funktion
f (x), die sich in der Umgebung eines Punktes x0 ,,anständig” verhält. Man möchte
diese Funktion bei x0 in eine Potenzreihe entwickeln.
Wir wollen zunächst eine Formel für den Fall x0 = 0 herleiten. Die Funktion f sei an
dieser Stelle unendlich oft differenzierbar. Die allgemeine Form der gesuchten Reihe
ist ∞
X
f (x) = an xn = a0 + a1 x + a2 x2 + ... (2.3.6)
n=0
Man erhält
1 (n)
an = f (0). (2.3.7)
n!
Mit (2.3.7) erhalten wir aus (2.3.6) die Potenzreihenentwicklung einer Funktion f (x)
an der Stelle x0 = 0. Das ist die sog. Taylor-Reihe der Funktion bei x0 = 0:
∞
X f (n) (0)
f (x) = xn . (2.3.8)
n=0
n!
dn x
e = ex → f (n) (0) = 1 ∀n.
dxn
Somit
∞
x
X xn
e = . (2.3.9)
n=0
n!
Exponentialfunktion, y=ex
8
y
ex
7 1
1+x
6 2
1+x+x
2
2 3
5 1+x+ +x
x
2 6
2 3 4
1+x+ +x + x
x
2 6 24
4
0
-2 -1.5 -1 -0.5 0 0.5 1 1.5 2
x
Allgemein: Approximiert man eine Funktion f (x) bei x0 = 0 durch die ersten N
Glieder ihrer Potenzreihe, dann schreibt man oft
N N
X f (n) (0) X f (n) (0)
f (x) = xn + O(xN +1 ) ≈ xn . (2.3.10)
n! n!
|n=0 {z } n=0
O(xN +1 ) ist eine symbolische Schreibweise für das, was in der unendlichen Reihe weg-
gelassen wurde. Das Symbol zeigt an, dass der nichtberücksichtigte Term mindestens
von der Größenordnung = Ordnung xN +1 ist. Für dieses sogenannte Restglied gibt
es Abschätzungsformeln, in denen die (N + 1)-te Ableitung von f auftritt, siehe
HöMaI-Vorlesung.
Wir nehmen wieder an, dass der Konvergenzradius dieser Reihe verschieden von Null
ist. Dann dürfen wir die Reihe im Konvergenzgebiet gliedweise differenzieren.
1. x = x0 einsetzen ergibt b0 = f (x0 ).
f (1) = 0
1
f 0 (x) = ⇒ f 0 (1) = 1
x
1
f 00 (x) = − ⇒ f 00 (1) = −1
x2
1
f 000 (x) = (−1)(−2) ⇒ f 000 (1) = 2
x3
..
.
Somit ist
1 1
ln x = 0 + (x − 1) − (x − 1)2 + (x − 1)3 + O (x − 1)4 .
2 3
• Für f (x) = ex haben wir das bereits in (2.3.9) getan; das Ergebnis war
∞
x
X xn
e = .
n=0
n!
f (0) = ln 1 = 0
1
f 0 (x) = ⇒ f 0 (0) = 1
1+x
1
f 00 (x) = (−1) ⇒ f 00 (0) = −1
(1 + x)2
1
f 000 (x) = (−1)(−2) ⇒ f 000 (0) = 2
(1 + x)3
..
.
1
f (n) (x) = (−1)n−1 (n − 1)! ⇒ f (n) (0) = (−1)n−1 (n − 1)! .
(1 + x)n
Hinweis: Diese Potenzreihe konvergiert absolut für −1 < x < 1, siehe HöMaI-
Vorlesung. Die Reihe konvergiert bei x = 1; dort entspricht sie der alternie-
renden harmonischen Reihe in (2.3.3). Die Reihe divergiert bei x = −1; dort
entspricht sie der harmonischen Reihe in (2.3.3). Anhand von (2.3.15) sieht
man, dass der Wert der alternierenden harmonischen Reihe S = ln 2 ist.
Hyperbolische Funktionen
Für cosh x und sinh x erhalten wir die Potenzreihenentwicklung um x0 = 0 mit Hilfe
der Potenzreihendarstellung (2.3.9) von ex .
"∞ ∞
# ∞
ex + e−x (2.3.9) 1 X xn X (−x)n 1X xn
cosh x = = = + = [1 + (−1)n ]
2 2 n=0 n! n=0 n! 2 n=0 n!
∞
X x2n
= .
n=0
(2n)!
(2.3.16)
Analog findet man
∞
ex − e−x X x2n+1
sinh x = = . (2.3.17)
2 n=0
(2n + 1)!
Hinweis: Diese beiden Potenzreihen konvergieren absolut für alle x ∈ R.
Bemerkung: Für tanh x und coth x haben die Koeffizienten der Glieder ihrer
Potenzreihe eine kompliziertere Form, aber man kann die ersten Terme der entspre-
chenden Reihen problemlos berechnen, siehe Übungen.
38 Einführung in die Theoretische Physik
Trigonometrische Funktionen
Wir entwickeln f (x) = sin x um x0 = 0.
f (0) = 0
0
f (x) = cos x ⇒ f 0 (0) = 1
f 00 (x) = − sin x ⇒ f 00 (0) = 0
f 000 (x) = − cos x ⇒ f 000 (0) = −1
f (4) (x) = sin x ⇒ f (4) (0) = 0
..
.
Hinweise:
2.3.6 Anwendungen
Taylor-Approximation:
Die Entwicklung von Funktionen in Potenzreihen ist in der (theoretischen) Physik
gang und gäbe. In vielen Anwendungen braucht man aber nicht die exakte Darstel-
lung der Funktion als unendliche Reihe, sondern nur eine näherungsweise Darstellung
als endliche Reihe (= Polynom) bis zu einer bestimmten Ordnung. Man spricht dann
von von einer Taylor-Approximation. Bei der Taylor-Approximation einer Funktion
zur N -ten Ordnung in der Umgebung eines Punktes x0 muss die Funktion bei x0
nur N -fach differenzierbar sein. Aus Formel (2.3.13) erhalten wir
N N
X f (n) (x0 ) X f (n) (x0 )
f (x) = (x − x0 )n + O (x − x0 )N +1 ≈ (x − x0 )n . (2.3.20)
n! n!
|n=0 {z } n=0
Für das Restglied gibt es wie gesagt Abschätzungsformeln, in denen die (N + 1)-te
Ableitung von f auftritt, siehe HöMaI-Vorlesung.
Hinweise:
1. Die Approximation der Funktion f (x) durch das Polynom N -ter Ordnung
auf der rechten Seite von (2.3.20) macht i.A. nur für x-Werte Sinn, für die
|x − x0 | < 1 gilt. Dann ist der weggelassene Term, der von der Größenordnung
(x − x0 )N +1 ist, in der Regel hinreichend klein.
2. In Anwendungen in der Physik ist x in der Regel dimensionsbehaftet, d.h. die
Aussage ,,x bzw. (x−x0 ) klein” oder ,,x bzw. (x−x0 ) groß” muss sich auf einen
Vergleich mit einer für das jeweilige physikalische Problem charakteristischen
Größe beziehen, die dieselbe physikalische Dimension wie x hat.
Beispiel: Sei
r
V (x) =
(a + x)2
die potentielle Energie eines Teilchens mit der Koordinate x. Es ist [x] =
[a] =Länge und [r]=Energie×Länge2 . Wir wollen V (x) für ,,kleine” x durch
Taylorapproximation bis zur 1. Ordnung nähern – präzise, für |x| |a|, d.h.
|x/a| 1. Stures Anwenden der Taylorformel für x0 = 0, d.h. (2.3.8) bzw.
(2.3.10) bis zur 1. Ordnung ergibt
r 2r
V (x) = 2
− 3 x + O(x2 ) .
a a
Die Abschätzung des vernachlässigten Restgliedes durch die dimensionsbe-
haftete Größe x2 macht wenig Sinn. Geschickter ist es, eine dimensionslose
Variable z = x/a einzuführen. Damit erhalten wir
r r
⇒ V (z) = 2 1 − 2rz + O(z 2 ) .
V (z) = 2 2
a (1 + z) a
40 Einführung in die Theoretische Physik
3. Will man eine Funktion, die aus Produkten von Funktionen besteht, bis zu
einer bestimmten Ordnung entwickeln, ist es in der Regel am geschicktesten,
die Taylorentwicklung der Produkte zu verwenden, und diese konsistent bis
zur gewünschten Ordnung auszumultiplizieren.
Beispiel: Bestimme die Taylor-Approximation der Funktion ex sin x bis zur
Ordnung x3 bei x0 = 0.
x2 x3 x3
x 4 5
e sin x = 1 + x + + + O(x ) x − + O(x )
2! 3! 3!
3x2 x3
=x+ − + O(x4 ) .
2 6
4. Analog kann man vorgehen, wenn man eine Funktion der Form f (x)/g(x)
entwickeln will.
L’Hospitalsche Regel:
Diese Regel ist sehr nützlich, wenn man Funktionen der Form f (x)/g(x) an einer
Stelle x0 auswerten will, an der sowohl der Zähler als auch der Nenner beide null
oder beide unendlich werden – man erhält dann 0/0 bzw. ∞/∞. Bei Produkten
f (x)g(x) kann eine unbestimmte Form 0 · ∞ auftreten. In vielen dieser Fälle kann
der Grenzwert x → x0 mit der sog. L’Hospitalschen Regel durchgeführt werden. Sie
besagt, dass
f (x) f 0 (x)
lim = lim 0 , wenn f (x0 ) = g(x0 ) = 0 . (2.3.21)
x→x0 g(x) x→x0 g (x)
Man differenziert somit zunächst die Funktionen im Zähler und Nenner und bildet
erst dann den Grenzwert. Wenn der Ausdruck auf der rechten Seite von (2.3.21) wie-
der eine unbestimmte Form 0/0 bzw. ∞/∞ liefert, wendet man die Regel nochmal
an – und zwar so lange, bis man entweder einen wohldefinierten Limes erhält oder
feststellt, dass der Grenzwert divergiert.
Man kann (2.3.21) einfach beweisen, indem man die Taylor-Formel (2.3.13) für die
Funktionen f (x) und g(x) benutzt. Wir wollen das hier nicht tun. Stattdessen be-
trachten wir einige Beispiele:
ex − 1 sin x
f1 (x) = , f2 (x) = , f3 (x) = xr ln x , r > 0 .
x x
Wir wollen f1 bei x = 0 auswerten. Wir hatten bereits in (2.1.9) – ohne Verwendung
von dex /dx = ex – gezeigt, dass f1 (0) = 1. Mit Hilfe von (2.3.21) können wir uns im
Nachhinein davon überzeugen. Es ist (ex − 1)0 /(x)0 = ex , also f1 (0) = 1.
In (2.1.8) hatten wir gezeigt, dass f2 (0) = 1. Bei der Herleitung von d sin x/dx =
cos x hatten wir benutzt, Auch hiervon können wir uns im Nachhinein mit (2.3.21)
überzeugen.
2.4 Integralrechnung 41
Die Auswertung von f3 bei x = 0 ergibt die unbestimmte Form 0·∞. Zur Anwendung
von (2.3.21) schreiben wir f3 = f /g, wobei f = ln x und g = x−r . Dann
Dies zeigt, dass der Logarithmus ln x für x → 0 schwächer divergiert als jede negative
Potenz x−r .
2.4 Integralrechnung
Nun zur Integralrechnung mit Funktionen, die von einer Variablen abhängen. Die
Grundbegriffe und elementaren Rechenregeln sollten Sie bereits aus der Schule ken-
nen. Das unbestimmte Integral einer Funktion ist die Umkehrung ihrer Differentia-
tion. Das bestimmte Integral einer Funktion weist der Funktion eine reelle Zahl (ggf.
komplexe Zahl) zu. In Anwendungen in der Physik hängt die physikalische Bedeu-
tung dieser Zahl (Fläche, Geschwindigkeit, Ort, Arbeit, etc.) von der physikalischen
Bedeutung der Funktion und der Variablen ab, über die integriert wird.
d
y 0 = f (x) 0
≡ . (2.4.1)
dx
Gesucht ist die Lösung dieser Gleichung6 . Mit anderen Worten, wir suchen eine
Funktion y(x) = F (x), so dass
F 0 (x) = f (x).
Diese Funktion nennt man Stammfunktion oder unbestimmtes Integral von f (x). Es
ist klar, dass F nur bis auf eine additive Konstante c festgelegt ist. Wenn F (x) eine
Stammfunktion von f (x) ist, dann ist auch F (x) + c eine Stammfunktion.
6
Hinweis: Die Gleichung (2.4.1) ist der einfachste Typ einer Differentialgleichung 1. Ordnung
– siehe Kapitel 4.
42 Einführung in die Theoretische Physik
Beispiele:
Funktion f (x) Stammfunktion (SF) F (x)
1
xn , n 6= −1 xn+1 + c
n+1
1
sin(ax), a 6= 0 − cos(ax) + c
a
1
cos(ax), a = 6 0 sin(ax) + c
a
1 ax
eax , a 6= 0 e +c
a
1
ln |x| + c
x
1
arctan x + c
1 + x2
Die Notation SF [f (x)] wird z.B. im Skript von Prof. Meden verwendet. Wir be-
nutzen sie
R in diesem Abschnitt ebenfalls, verwenden dann aber das häufig benutzte
Symbol f (x)dx. Bei diesem Symbol steht x für die Variable, von der die Stamm-
funktion abhängt. Das Symbol sollte Sie in Bezug auf Definition des bestimmten
Integrals (siehe unten) nicht verwirren – dort steht die Variable hinter dem Integral-
zeichen für diejenige, die ,,ausintegriert” wird.
Beispiel:
1 1
f (x) = sin2 x = − cos(2x)
2 2
1 1
⇒ F (x) = x − sin(2x) + c.
2 4
2. Partielle Integration:
Aus der Produktregel der Differentiation,
(f (x)g(x))0 = f 0 (x)g(x) + f (x)g 0 (x) ,
2.4 Integralrechnung 43
SF [f 0 g + f g 0 ] = f (x)g(x)
oder
SF [f g 0 ] = f (x)g(x) − SF [f 0 g]
Z Z
0
f (x)g (x) dx = f (x)g(x) − f 0 (x)g(x) dx.
Beispiel: Bestimme die SF von y = x sin x. Zur Anwendung von (2.4.3) stellen
wir y in der Form y = f g 0 dar, wobei
f = x, g 0 = sin x ⇒ g = − cos x + c.
Dann ist
3. Substitutionsmethode:
Sei F (x) eine SF von f (x) und g(x) eine differenzierbare Funktion. Wir erin-
nern uns an die Kettenregel der Differentiation, Gl. (2.2.8):
dF (g(x)) dF dg
= = f (g(x))g 0 (x).
dx dg |{z}
dx
|{z}
f g0
Somit ist
Z Z
f (x) dx = f (g(t))g 0 (t) dt.
44 Einführung in die Theoretische Physik
Beispiel: Gesucht ist die SF von y = x sin x2 . Wir verwenden die obere Formel
in (2.4.4). Wir setzen
und somit
1
x sin x2 = g 0 (x) sin g(x).
2
Die Stammfunktion von f (g) ist
F (g) = − cos g + c.
Da capo: Wir verwenden nun die untere Formel in (2.4.4). Setze x2 = t, d.h.
√ √ 1
x= t, g(t) = t ⇒ g 0 (t) = t−1/2 .
2
Somit
Z Z √ Z
1 1 1
2
x sin x dx = t sin t t−1/2 dt = sin t dt = − cos t + c
2 2 2
1
= − cos x2 + c.
2
Vorbemerkung 2: Der Grad des Polynoms Q sei n und Q ist o.B.d.A. von der Form
Q(x) = b0 + b1 x + . . . + xn , bj ∈ R ,
siehe die Bemerkung in der Fußnote7 . Wir verwenden im Folgenden die Aussage, dass
ein reelles Polynom Q(x) vom Grad n maximal n reelle Nullstellen, d.h. maximal
n reelle Lösungen der Gleichung Q(x) = 0 hat. Es kann sich a) um n einfache
Nullstellen handeln; b) es können auch mehrfache Nullstellen auftreten, wobei eine
i-fache Nullstelle i-fach gezählt wird; c) es kann auch sein, dass die Zahl der reellen
Nullstellen kleiner als n ist. Welcher der drei Fälle realisiert ist, hängt von den
Werten der reellen Zahlen bj ab. Wir kommen darauf im Kapitel 3 über komplexe
Zahlen zurück.
Q(x) = (x − a1 )(x − a2 ) · · · (x − an ) , ai 6= aj , ai ∈ R .
P (x) A1 A2 An
= + + ... + . (2.4.7)
Q(x) x − a1 x − a2 x − an
Die Koeffizienten A1 , ..., An erhält man, indem man die rechte Seite auf den Haupt-
nenner bringt und die Koeffizienten der Potenzen von x in den Zählern der Quoti-
enten auf der linken und rechten Seite der Gleichung vergleicht.
Beispiel:
2x + 3 2x + 3 A1 A2 A3
= = + + . (2.4.8)
x3 2
+ x − 2x x(x − 1)(x + 2) x x−1 x+2
Rechte Seite auf den Hauptnenner bringen:
A1 (x − 1)(x + 2) + A2 x(x + 2) + A3 x(x − 1) ! 2x + 3
= .
x(x − 1)(x + 2) x(x − 1)(x + 2)
Der Koeffizientenvergleich der Potenzen von x der Zähler auf der rechten und linken
Seite der Gleichung ergibt
x 2 : A1 + A2 + A3 = 0
3 5 1
x : A1 + 2A2 − A3 = 2 ⇒ A1 = − , A 2 = , A 3 = − .
2 3 6
x0 : −2A1 = 3
7
Im Allgemeinen ist Q(x) = cn xn + ... Durch Ausklammern der Konstanten cn in Q, d.h.
P (x)
f (x) = cn Q(x)/cn
können wir o.B.d.A. von Q(x) = xn + ... ausgehen.
46 Einführung in die Theoretische Physik
erhält man durch Integration der rechten Seite von (2.4.8) unter Verwendung von
Z
A
dx = A ln |x − a| + c.
x−a
Fall b) Q(x) hat n reelle Nullstellen, einige davon seien mehrfache Nullstellen.
Anhand eines Beispiels sei erläutert, wie man in diesem Fall die Partialbruchzerle-
gung vornehmen muss.
Beispiel:
x3 + 1 A1 A2 A3 A4
3
= + + 2
+ . (2.4.9)
x(x − 1) x x − 1 (x − 1) (x − 1)3
Der Koeffizientenvergleich der Potenzen von x ergibt
A1 = −1, A2 = 2, A3 = 1, A4 = 2.
Das unbestimmte Integral von (2.4.9) ist somit
x3 + 1
−1
Z Z
2 1 2
dx = dx + + +
x(x − 1)3 x x − 1 (x − 1)2 (x − 1)3
1 1
= − ln |x| + 2 ln |x − 1| − − + c.
x − 1 (x − 1)2
Fall c) Das Polynom Q hat die Produktdarstellung:
Q(x) = (x − a1 )k1 · · · (x − ar )kr (x2 + p1 x + q1 )l1 · · · (x2 + ps x + qs )ls ,
| {z }
sollen keine reellen Nullstellen haben
verwendet man folgenden Trick: Wir differenzieren das folgende Integral, dessen
Integrand vom Parameter q abhängt, nach diesem Parameter:
Z Z
d Bx + C d Bx + C
dx = dx
dq (x2 + px + q)l−1 dq (x2 + px + q)l−1
Z
Bx + C
= −(l − 1) dx.
(x2 + px + q)l
Somit ist
Z Z
Bx + C 1 d Bx + C
2 l
dx = dx. (2.4.11)
(x + px + q) (1 − l) dq (x2 + px + q)l−1
Durch sukzessive Anwendung dieser Formel können wir uns bis l − 1 = 1 “herunter-
hangeln” und dann die Formel (2.4.10) anwenden.
Beispiel:
Z Z
Bx + C (2.4.11) d Bx + C
2 2
dx = −1 2
dx . (2.4.12)
(x + px + q) dq x + px + q
Das Integral auf der rechten Seite ist durch (2.4.10) gegeben. Wir müssen (2.4.10)
nur noch nach −d/dq differenzieren, um das unbestimmte Integral auf der rechten
Seite von (2.4.12) zu erhalten.
Weitere Methoden:
Es gibt eine Reihe weiterer Methoden, d.h. Substitutionen = Variablentransforma-
tionen zur Berechnung unbestimmter Integrale. Hier seien nur zwei Beispiele ge-
nannt.
• Integrale der Form
Z
P (u, v)
R(sin x, cos x)dx , wobei R(u, v) = ,
Q(u, v)
lassen sich mit der Variablentransformation (sog. Halbwinkelmethode)
x
t = tan
2
auf ein Integral einer rationalen Funktion zurückführen.
• Integrale der Form Z √
R(x, x2 + a2 )dx
48 Einführung in die Theoretische Physik
f(x) = 20 x2 e-x
f(x)
10
0
0 1 2 3 4 5
x
Abbildung 2.5: Beispiel für die Berechnung eines bestimmten Integrals. Die Funktion
f (x) = 20x2 e−x wurde im Intervall 1 ≤ x ≤ 4 in N +1 äquidistante Stützstellen x0 =
1, . . . , xN = 4 eingeteilt
PN (hier N = 25). Die Summe der Flächen der abgebildeten
Rechtecksäulen ist n=1 f (a + n∆x)∆x, wobei ∆x = (b − a)/N .
50 Einführung in die Theoretische Physik
Im Inneren oder auch am Rand eines jeden Elementarintervalls [xn−1 , xn ] wählt man
einen beliebigen Punkt zn , berechnet die Rechtecksfläche f (zn )∆xn und addiert die
N Flächen. Wir wählen hier die rechten Stützpunkte der jeweiligen Rechtecke, siehe
das Beispiel in Abbildung 2.5.
zn = a + n∆x , n = 1, ..., N.
Das bestimmte Integral, das man auch das Riemann-Integral nennt, ist definiert
durch den Grenzwert N → ∞ und folglich ∆xn → 0 bzw. ∆x → 0:
Zb N
X
f (x)dx = lim f (a + n∆x)∆x . (2.4.14)
N →∞
a n=1
Bemerkungen:
1) Das bestimmte Integral existiert, wenn der Grenzwert eine endliche Zahl ergibt,
die unabhängig von der Wahl der Stützstellen ist.
2) Damit der Grenzwert existiert, muss f (x) im Intervall [a, b] nicht stetig sein. Für
in [a, b] unstetige aber beschränkte Funtionen existiert (2.4.14) ebenfalls. Das be-
stimmte Integral existiert sogar, wenn f in [a, b] einen oder mehrere singuläre Punkte
besitzt, an denen f ,,hinreichend schwach divergiert”, siehe das Beispiel unterhalb
Gl. (2.4.15). Präzisere Aussagen dazu erhalten Sie in der HöMaII-Vorlesung.
3) Das Bilden der Riemann-Summe, d.h. die Berechnung der endlichen Summe
P N
0 f (zn )∆xn ist ein praktisches Verfahren zur näherungsweisen Berechnung eines
bestimmten Integrals. Im Gaußschen Näherungsverfahren (und seinen diversen Va-
rianten) zur numerischen Berechnung eines bestimmten Integrals wird die Stützstel-
lenwahl dahingehend optimiert, dass man für eine bestimmte Klasse von Funktionen
einen möglichst guten Näherungswert für das bestimmte Integral bei nicht zu vielen
Stützstellenauswertungen erhält.
Sei F (x) eine Stammfunktion von f (x), d.h. es ist F 0 (x) = f (x). Dann gilt der
Hauptsatz der Differential- und Integralrechnung:
Zb
f (x)dx = F (b) − F (a) . (2.4.15)
a
Beispiele: √ √
1) Die Stammfunktion von f (x) = 1/ x ist F (x) = 2 x + c. Somit ist
Z1 √ √
1
dx √ = 2( 1 − 0) = 2 .
x
0
Zb
1
dx = ln b − ln a
x
a
Hinweis:
Das bestimmte Integral (2.4.13) bzw. (2.4.15) ist nur dann eine Fläche im Sinne
ihrer eigentlichen geometrischen Bedeutung, wenn z.B. x und f (x) die Dimension
einer Länge haben, [x] = [dx] = [f ] = Länge bzw. [F ] =Fläche. In Anwendungen,
z.B. in der Physik, haben x und f oft andere Bedeutungen. Z.B. kann x für die
Zeit und f (x) für die Beschleunigung eines Körpers als Funktion der Zeit stehen.
(Wir verwenden dann in der Regel die Variable t und a(t).) Dann ist das bestimmte
Integral, d.h. die rechte Seite von (2.4.15) die Differenz der Geschwindigkeiten des
Körpers zu den Zeiten b und a.
Ein anderes Beispiel ist die Arbeit, die eine auf einen Körper einwirkende Kraft an
dem Körper verichtet. Die Kraft wirke in x-Richtung und beschleunige den Körper
von x = a nach x = b. Hier ist [x] = [dx] = Länge, [f ] = Kraft und das bestimmte
Integral bzw. F haben die Dimension einer Energie, [F ] = Energie = Arbeit. Das
bestimmte Integral (2.4.15) ergibt dann die Differenz der Energien des Körpers an
den Punkten b und a.
Elementare Regeln:
1. Beispiel: Sei f (x) von der Form wie in der Skizze dargestellt.
Es ist
f
Zb
f (x) = Fläche ⊕ −Fläche .
a
⊕
D.h. der Beitrag zu einem be- a x
stimmten Integral, bei dem b
f (x) < 0 ist, hat ein negatives
Vorzeichen.
2. Intervalladdition: Es gilt
Zb Zc Zc
f (x)dx + f (x)dx = f (x)dx. (2.4.16)
a b a
52 Einführung in die Theoretische Physik
Partielle Integration:
Zb Zb
0
b
f (x)g(x)dx = f (x)g(x)a − f (x)g 0 (x)dx . (2.4.18)
| {z }
a f (b)g(b)−f (a)g(a) a
Substitutionsregel:
Oft kann die Variable x einer Funktion f (x) als Funktion x = g(t) einer anderen
Variablen betrachtet werden. Die Funktion g sei im Integrationsgebiet umkehrbar,
die Umkehrfunktion ist t = g̃(x). Dann gilt:
Zb Zg̃(b)
f (x)dx = f (g(t))g 0 (t)dt . (2.4.19)
a g̃(a)
Beispiel:
Zb
2
I= xe−cx dx.
0
2
Substitution t = −cx . Dann
dt 1
= −2cx ⇒ xdx = − dt .
dx 2c
Transformation der Integrationsgrenzen:
x=0 → t(0) = 0,
x=b → t(b) = −cb2 .
Somit
Z 2
−cb
1 t 1 t −cb2 1 −cb2 1
I=− dt e = − e 0 = − e − − .
2c 2c 2c 2c
0
2.4 Integralrechnung 53
die Funktion F (x). Es ist klar, dass die Integrationsvariable und die variable (obere)
Grenze verschieden voneinander sind; d.h. man muss verschiedene Symbole benut-
zen.
Die Differentiation nach der oberen Grenze ergibt
Zx
d dF (x) d
f (x0 )dx0 = − F (a) = f (x). (2.4.20)
dx | dx |dx {z }
a
{z }
Per Def. f (x) =0, da
a=const.
Analog ist
Zb
d d dF (x)
f (x0 )dx0 = F (b) − = −f (x). (2.4.21)
dx dx dx
x
Für viele Funktionen f (x) kennt man die analytische Form der Stammfunktion
nicht. Man kann, wie gesagt, über ein Integral der Form
Zx
I(x) = dx0 f (x0 ) (2.4.22)
x0
eine Funktion I(x) definieren, von der man dann eben nur ihre Integraldarstellung
analytisch kennt. Eine andere Möglichkeit zur Definition einer Funktion J(x) ist
Zb
J(x) = dt f (t, x) . (2.4.23)
a
wobei hier ∂f (t, x)/∂x die sog. partielle Ableitung der Funktion f (t, x) zweier Va-
riablen nach x ist. Diese partielle Ableitung bildet man wie die oben besprochene
gewöhnliche Ableitung von Funktionen einer Variablen; die Variable t wird dabei
festgehalten, d.h. als Konstante betrachtet. Voraussetzung für die Anwendung von
(2.4.24) ist, dass f in einem zweidimensionalen Gebiet partiell nach x differenzier-
bar ist und diese Ableitung dort stetig ist. Wir behandeln partielle Ableitungen von
Funktionen mehrerer Variablen im Detail in Kapitel 7; siehe auch das Beispiel 3)
unten.
Beispiele:
1) Beispiel zu (2.4.22): Die aus der Statistik bekannte Gaußsche Fehlerfunktion
Zx
2 2
erf (x) ≡ √ e−t dt , (2.4.25)
π
0
Z∞
Γ(x) = tx−1 e−t dt , x > 0. (2.4.26)
0
Wir untersuchen diese Funktion in einer Übung etwas näher. Die Ableitung dΓ(x)/dx
berechnet man mit (2.4.24).
3) Beispiel zu (2.4.24): Wir betrachten das Integral
Z1
t
J(x) = dt arctan .
x
0
Z1 Z1
x2
dJ(x) ∂ t t 1
= dt arctan =− dt 2 = ln .
dx ∂x x t + x2 2 1 + x2
0 0
Dieses Beispiel ist relativ trivial insofern, als das Integral J(x) auch in analytischer
Form berechenbar ist (tun Sie das zu Hause).
2.4 Integralrechnung 55
Uneigentliche Integrale:
Die beiden Haupttypen der sog. uneigentlichen Integrale sind
Analog definiert man uneigentliche Integrale auf der Halbachse (−∞, b] oder der
ganzen reellen Zahlengeraden (−∞, ∞). Wir wollen hier nicht darauf eingehen, un-
ter welchen Voraussetzungen ein solches Integral existiert, siehe dazu z.B. das Buch
von Bronstein et al. Notwendigerweise muss f (x) → 0 für x → ±∞. Wir begnügen
uns mit einigen Beispielen:
Z∞ Zb
dx dx
1) = lim = lim ln b = ∞ ,
x b→∞ x b→∞
1 1
Z∞ Zb
dx dx 1
2) = lim = lim − + 1 = 1 .
x2 b→∞ x2 b→∞ b
1 1
Z∞
2 √ √
3) e−x dx = π lim erf (y) = π.
y→∞
−∞
Zb Zb−
f (x) dx = lim+ f (x) dx . (2.4.27)
→0
a a
Die Exsitenz (d.h. Endlichkeit) des Grenzwertes hängt von der Schwäche bzw. Stärke
der Singularität von von f (b − ) für → 0+ ab.
Analog: Sei f (x) im halboffenen Intervall (a, b] definiert und divergiere für x → a.
56 Einführung in die Theoretische Physik
Dann
Zb Zb
f (x) dx = lim+ f (x) dx . (2.4.28)
→0
a a+
√
Beispiel: Die Funktion f (x) = 1/ x ist bei x = 0 singulär. Es ist
Zb Zb √ √
dx dx √
√ = lim √ = lim (2 b − 2 ) = 2 b .
x →0+ x →0+
0
Für das Integral der Funktion f (x) = x−r , r > 0 mit denselben Integrationsgrenzen
findet man, dass dieses uneigentliche Integral für für r < 1 existiert, während es für
r ≥ 1 unendlich wird.
Kapitel 3
Komplexe Zahlen
Sie wissen aus der Schule, dass viele quadratische Gleichungen – oder algebraische
Gleichungen höheren Grades – keine reellen Lösungen haben. Beispiele:
Dies war der Anlass zur Erweiterung der reellen Zahlen auf die Menge der komplexen
Zahlen:
R ⊂ C.
Menge der reellen Zahlen Menge der komplexen Zahlen
Man führt die sog. imaginäre Einheit i ein, die definiert ist durch
imaginäre Einheit: i2 ≡ −1 .
Somit ist die Lösung von z 2 + 1 = 0 gegeben durch z = ±i. Aus i2 ≡ −1 folgt
i3 = i2 i = −i
i4 = i2 i2 = (−1)(−1) = +1
i5 = i4 i = i
etc.
Man bezeichnet
Im z Im z
z1 + z2
b z = a + ib z1
b1
a Re z
b2 z2
Re z
a1 a2
(a) Komplexe Ebene. (b) Addition zweier komplexer Zahlen z1 , z2 .
Addition/Subtraktion:
Multiplikation:
Division:
Den Quotienten z1 /z2 berechnet man, indem man mit dem komplex konjugierten
des Nenners erweitert.
z1 a1 + ib1 a1 + ib1 a2 − ib2 a1 a2 + b1 b2 a2 b1 − a1 b2
= = = 2 2
+i 2 . (3.1.5)
z2 a2 + ib2 a2 + ib2 a2 − ib2 a2 + b2 a2 + b22
Hinweis:
Beachten Sie folgendes: Seien z1 , z2 zwei komplexe Zahlen. Dann ist im Allgemeinen
Re(z1 z2 ) 6= Re z1 Re z2 , Im(z1 z2 ) 6= Im z1 Im z2 ; (3.1.6)
denn
Re(z1 z2 ) = Re z1 Re z2 − Im z1 Im z2 , Im(z1 z2 ) = Re z1 Im z2 + Im z1 Re z2 ,
wie man sofort an Gl. (3.1.3) ablesen kann. Nur wenn eine der beiden Zahlen reell
ist, z.B. z1 = a ∈ R, z2 = z ∈ C, dann
Re(az) = aRe z , Im(az) = aIm z .
Diese elementaren Resultate sollten Sie verinnerlichen – wir benötigen sie beispiels-
weise in Kapitel 4.2.
b z
ρ
z
b
ρ
φ φ
a a
− arctan(b/a)
φ φ
a a
ρ
ρ
b b
z z
wobei man auf die Addition von 2π in der letzten Zeile verzichten kann, weil cos(φ +
2π) = cos φ und sin(φ + 2π) = sin φ.
Beachte: Das Argument φ einer komplexen Zahl ist nur bis auf ganzzahlige Vielfa-
che von 2π festgelegt, wie aus (3.2.3) ersichtlich ist.
Mit a = ρ cos φ und b = ρ sin φ erhalten wir die Darstellung von z in Polarkoor-
dinaten:
z = a + ib = ρ cos φ + iρ sin φ = ρeiφ . (3.2.5)
Die letzte Gleichung, die sog. Euler-Formel
eix = cos x + i sin x (3.2.6)
müssen wir noch beweisen. Dazu benutzen wir die Potenzreihenentwicklungen der
Exponentialfunktion, Gl. (2.3.9), des Sinus, Gl. (2.3.18), und des Kosinus, Gl. (2.3.19).
∞ ∞ ∞
X (ix)n X (ix)2n X (ix)2n+1
eix = = +
n=0
n! n=0
(2n)! n=0
(2n + 1)!
∞ ∞
X xn n
X x2n+1
= (−1) +i (−1)n
n=0
(2n)! n=0
(2n + 1)!
= cos x + i sin x.
Aus (3.2.6) folgt, dass die Exponentialfunktion einer rein imaginären Variablen
z = iφ eine periodische Funktion mit Periode 2π ist:
ei(φ+2πk) = eiφ , k = 0, ±1, ±2, ... (3.2.7)
Daraus folgt, dass jede Zahl z unendlich viele Exponentialdarstellungen besitzt:
Multiplikation:
Nun nochmal zur Multiplikation und Division zweier komplexer Zahlen, die in der
Darstellung (3.2.5) besonders einfach durchgeführt werden können.
Komplexe Konjugation:
(3.2.5)
z = eiφ ⇒ z ∗ = e−iφ (3.2.10)
Geometrisch entspricht die komplexe Konjugation von z der Spiegelung von z an
der reellen Achse. D.h.
Absolutbetrag:
1/2
|z| = (zz ∗ )1/2 = ρeiφ ρe−iφ = ρ. (3.2.11)
Division:
z1 ρ1 eiφ1 ρ1 i(φ1 −φ2 )
= iφ
= e . (3.2.12)
z2 ρ2 e 2 ρ2
Als Erweiterung der Euler-Formel (3.2.6) erhält man die Formel von Moivre
für die n-te Potenz einer komplexem Zahl:
k=2 k=1
π
k=3 3 k=0
1
k=4 k=5
gezählt werden.
Beispiel: Die reelle Gleichung x6 − 1 hat 2 relle Nullstellen x1,2 = ±1. Die komplexe
Gleichung z 6 − 1 = 0 hat 4 weitere komplexe Nullstellen.
Zum Auffinden dieser Lösungen benutzen wir die Exponentialdarstellung, z = ρeiφ .
z 6 = 1 ⇒ (z 6 )∗ = (z ∗ )6 = 1
!
⇒ (zz ∗ )6 = ρ12 = 1
⇒ ρ = 1, da ρ ≥ 0.
Somit sind die gesuchten Nullstellen von der Form z = eiφ . Es muss gelten:
!
z 6 = ei6φ = 1 = ei2πk k ∈ Z, vgl. (3.2.8)
⇒ 6φ = 2πk
π
⇒ φ= k k = 0, ±1, ±2, ...
3
Wir erhalten somit die 6 Nullstellen
siehe Abbildung 3.3. Die Lösungen für k = 1 und k = 5 bzw. k = 2 und k = 4 sind
komplex konjugiert zueinander. Für k = 6 ergibt sich dieselbe Lösung wie für k = 0,
die Lösung für k = 7 ist identisch mit der Lösung für k = 1, die Lösung für k = −1
ist identisch mit der für k = 5, etc.
Wir benutzten die Aussage des Fundamentalsatzes der Algebra bereits in Kapi-
tel 2.4, und zwar für den Fall, dass die Koeffizienten ai des Polynoms (3.3.1) reell
64 Einführung in die Theoretische Physik
sind. In diesem Fall ist die Zahl nr der reellen Nullstellen xj des Polynoms PN (x)
kleiner oder gleich N . Wenn nr < N , dann sind die verbleibenden Nullstellen paar-
weise konjugiert komplex zueinander – d.h. deren Anzahl (N − nr ) ist eine gerade
Zahl.
Anhand dieser Darstellung sieht man folgendes: Wenn z = |z| exp(iφ) die Menge der
komplexen Zahlen z 6= 0 durchläuft, 0 < |z| < ∞, 0 ≤ φ < 2π, dann überdeckt die
Funktion w = z n die komplexe Zahlenebene n-mal2 . Jeweils n verschiedene z-Werte
zk ,
2π 2π
zk = ρeiφk , φk = φ + k , k = 0, . . . , n − 1 , 0 ≤ φ <
n n
n
liefern
√ denselben Funktionswert w = z . Das bedeutet, dass die Umkehrfunktion
z = w für n > 1 mehrdeutig ist.
n
Für die Funktion w = z 2 stellt sich das wie folgt dar. Wir variieren z in der kom-
plexen Ebene längs eines Kreises mit festem Radius um den Nullpunkt, d.h. festem
|z|. Die Phase von z wird in mathematisch positiver Richtung = Gegenuhrzeiger-
richtung geändert, siehe Abbildung 3.4. Der Bildpunkt w = z 2 variiert ebenfalls auf
einem Kreis mit Radius |z|2 um den Nullpunkt, aber doppelt so schnell. Mit anderen
Worten: wenn durch Variation von z die komplexe Ebene einmal überdeckt wird,
wird durch w = z 2 die Bildebene
√ zweimal überdeckt.
Für die Umkehrfunktion z = w bedeutet dies:
√
w = ρeiφ , z= ρeiφ/2 . (3.3.2)
Bei einer kompletten Umkreisung des Nullpunktes in der w-Ebene sind wir wieder
beim selben w, aber z nimmt einen anderen Wert an:
√ √
w = ρei(φ+2π) = ρeiφ , aber z = ρei(φ+2π)/2 = − ρeiφ/2 .
Bei einer zweifachen kompletten Umkreisung des Nullpunktes in der w-Ebene erhal-
ten wir allerdings wieder denselben Wert von z wie in (3.3.2):
√ √
w = ρei(φ+4π) = ρeiφ , z= ρei(φ+4π)/2 = + ρeiφ/2 .
Abbildung 3.4: Umlauf auf einen Kreis um den Nullpunkt in der z-Ebene in mathe-
matisch positiver Richtung.
durchgeführt, die wir uns anhand dieses Beispiels klarmachen. Man schneidet die
beiden übereinander liegend gedachten w-Ebenen längs der negativen rellen Ach-
se auf und denkt sich die beiden ,,Ufer” des Schnittes im oberen Blatt mit den
beiden Ufern des Schnittes im unteren Blatt gemäß Abbildung 3.5 verklebt.
√ Die
3
so konstruierte Fläche heisst Riemannsche Fläche der Funktion z = w. Wir
nennen diese Fläche hier R2 . Das Aufschneiden der Ebenen längs der negativen
reellen Achse ist eine (allgemein übliche) Konvention – man könnte den Schnitt
auch längs einer beliebigen anderen Geraden von Null nach Unendlich legen. Die
komplexen Zahlen w mit −π < φ ≤ π liegen auf dem unteren Blatt von R2 ;
dann wandert man in das obere Blatt von R2 , das den komplexen Zahlen w mit
π < φ ≤ 3π entspricht. Bei √ φ = 3π geht es wieder in das untere Blatt, etc. Was
machen die Bildpunkte z = w ? Wir betrachten Zahlen w auf dem Einheitskreis
|w| = 1. Im ersten Blatt startet man konventionsgemäß mit Zahlen w = exp(iφ) mit
φ > −π. (Für das nicht im ersten Blatt liegende φ = −π, d.h. w = exp(−iπ) = −1
wäre z = exp(−iπ/2) = −i.) Am Ende der Umkreisung des ersten Blattes ist
w = exp(iπ) = −1 und somit z = exp(iπ/2) = i. Am Ende der Umkreisung des
√ Blattes ist w = exp(i3π) = −1 und z = exp(−i3π/2) = −i. Somit definiert
zweiten
z = w eine eindeutige Abbildung von R2 7→ C.
Transzendente Funktionen: Hier nur der Vollständigkeit halber ein paar kurze
Bemerkungen zu den Umkehrfunktionen der komplexen Exponentialfunktion und
der trigonometrischen Funktionen.
Die komplexe Exponentialfunktion
w = ez = ex eiy
3
Der Nullpunkt ist ein sog. Verzweigungspunkt dieser Funktion. (Der andere ist z = ∞.) Man
√ anderen Punktes w 6= 0 bei dieser Funktion
kann sich überlegen, dass die Umkreisung irgend eines
zu keinen Mehrdeutigkeiten führt. Bei der Funktion w − w0 ist w0 der Verzweigungspunkt.
66 Einführung in die Theoretische Physik
√
Abbildung 3.5: Die zweiblättrige Riemannsche Fläche der Funktion z = w.
√
Abbildung 3.6: Die dreiblättrige Riemannsche Fläche der Funktion z = 3
w.
3.4 Anwendungen 67
Hinweis: Für unsere Zwecke benötigen wir das Konzept der Riemannschen Fläche
nicht. Wenn wir den Logarithmus oder insbesondere die Wurzel einer komplexen Zahl
z berechnen müssen, legen wir das Argument der Variablen z durch
− π < arg z ≤ π (3.3.4)
fest4 . Somit wird ln z gemäß (3.3.3) berechnet. Wollen wir die Wurzel aus einer
negativen reellen Zahl z = −a, a > 0 ziehen, wird diese Zahl demzufolge durch
a exp(iπ)
√ dargestellt
√ – aber nicht√durch a exp(−iπ) oder durch
√ a exp(i3π) etc. Somit
ist −a = a exp(iπ/2) = +i a. Die Funktion w = z bildet für Werte z mit
der in (3.3.4) gewählten Festlegung die komplexe Zahlenebene C auf die rechte
Halbebene {w| − π/2 < argw ≤ π/2} ab.
3.4 Anwendungen
Von den vielfältigen mathematischen Anwendungen komplexer Zahlen seien hier nur
zwei einfache, für uns relevante Beispiele erwähnt. Man kann die trigonometrischen
Additionstheoreme
sin(x ± y) = sin x cos y ± cos x sin y , cos(x ± y) = cos x cos y ∓ sin x sin y ,
4
Beachten Sie, dass es bei der Festlegung von argz nur darum geht, keine ganzzahligen Vielfachen
von 2π zuzulassen. Man könnte argz beispielsweise auch durch π/2 ≤ argz < 5π/2 festlegen.
68 Einführung in die Theoretische Physik
wobei x, y reell oder komplex sein können, schnell mit Hilfe der Darstellungen
1 ix 1 ix
e + e−ix e − e−ix ,
cos x = sin x = (3.4.1)
2 2i
die man aus der Euler-Formel erhält, beweisen. Wir machen das in einer Übung.
Wozu braucht man komplexe Zahlen und/oder komplexe Funktionen in der Phy-
sik? Wie Sie wissen, sind die Messwerte physikalischer Observablen durch reelle
Zahlen gegeben. In vielen Gebieten der (theoretischen) Physik ist es allerdings be-
quem und nützlich, bestimmte Messgrößen zunächst durch komplexe Zahlen bzw.
durch komplexwertige Funktionen darzustellen und damit zu rechnen. So beschreibt
man beispielsweise in der Elektrodynamik zeitabhängige elektromagnetische Felder,
die sich als Lösungen der zeitabhängigen Maxwell-Gleichungen im Vakuum oder in
linearen Medien ergeben, vorzugsweise durch komplexwertige Funktionen. In der
Quantentheorie ergibt sich die Aufenthaltswahrscheinlichkeitsdichte |ψ|2 eines Teil-
chens an einem Ort zu einer bestimmten Zeit aus einer i.A. komplexwertigen ,,Wel-
lenfunktion” ψ. (Auch in der theoretischen Hydro- und Aerodynamik, die nicht Teil
des Bachelor-Curriculums sind, findet man Anwendungen der Theorie der komple-
xen Funktionen.) Im Rahmen der Mechanik benutzen wir komplexe Zahlen bzw.
Funktionen vornehmlich bei der Lösung linearer Schwingungsdifferentialgleichungen
– siehe nächstes Kapitel. Wir benötigen im Wesentlichen nur die elementaren alge-
braischen Operationen mit komplexen √ Zahlen, die Euler- und Moivre-Formeln, die
z
Exponentialfunktion e , die Wurzel z und den Zusammenhang (3.4.1) zwischen
dem Sinus und Kosinus und exp(±ix) für reelle x.
Kapitel 4
Gewöhnliche
Differentialgleichungen
Im Folgenden behandeln wir nur gewöhnliche DGL, vor allem gewöhnliche DGL
1. und 2. Ordnung. Die Dynamik von Punktteilchen und starren Körpern wird
70 Einführung in die Theoretische Physik
F = mg,
g = 9, 81 m/s2 Erdbeschleunigung,
m
dx
v(t) = Geschwindigkeit.
dt x
g
1
In drei Raumdimensionen erhalten wir für x(t), y(t) und z(t) drei Differentialgleichungen, die
im Allgemeinen – je nach funktionaler Abhängigkeit der Komponenten des Kraftvektors F von den
Bahnkoordinaten und/oder ihren Ableitungen – gekoppelt sind. In diesem einführenden Kapitel
in die Thematik behandeln wir keine DGL-Systeme, sondern nur eindimensionale Bewegungen.
2
Die Kraft ist ein Vektor, d.h. hat in drei Raumdimensionen drei Komponenten - siehe nächstes
Kapitel. In diesem Kapitel behandeln wir, wie gesagt, als physikalische Beispiele der Einfachheit
halber nur eindimensionale Bewegungen.
KAPITEL 4. GEWÖHNLICHE DIFFERENTIALGLEICHUNGEN 71
Da in diesem Beispiel die Kraft nicht von x abhängt, können wir (4.0.3) durch
die Ersetzung ẋ = v in eine DGL 1. Ordnung bezüglich v(t) umwandeln:
mẍ = mv̇ = mg
⇒ v̇ = g.
Diese DGL 1. Ordnung für v löst man durch Integration, d.h. Bestimmung der
Stammfunktion. Das Ergebnis ist
v(t) = gt + C,
wobei C eine beliebige reelle Konstante ist.
An diesem simplen Beispiel sehen wir folgenden Sachverhalt: Eine gewöhnliche
DGL 1. Ordnung des Typs (4.0.2) hat in der Regel eine Schar von Lösungen (d.h.
unendlich viele Lösungen), die durch eine beliebige Konstante C parametrisiert
ist. Um eine Vorhersage machen zu können, muss die Lösung eindeutig sein. Dies
erreichen wir dadurch, dass wir v zu einer bestimmten Zeit vorgeben, d.h. kennen
müssen. Sei also v(t0 ) = v0 gegeben. Dann ist die Lösung für v(t) eindeutig.
v(t) = gt + C
⇒ v0 = gt0 + C
v(t0 ) = v0
⇒C = v0 − gt0 .
Um die Bahn x(t) zu berechnen, müssen wir den Ausdruck für v(t) integrieren,
was man sofort machen kann. Wir sehen, dass dabei wieder eine willkürliche
Integrationskonstante C 0 auftritt. Diese wird festgelegt, indem wir uns den Ort
des Teilchens zu einer bestimmten Zeit vorgeben, x(t0 ) = x0 .
Fazit: Dieses einfache Beispiel illustriert folgenden wichtigen, recht allgemeinen
Sachverhalt: Viele – aber nicht alle – gewöhnlichen DGL n-ter Ordnung des Typs
(4.0.2) besitzen eine Schar von Lösungen = allgemeine Lösung. Diese hängt von
n willkürlichen Integrationskonstanten ab. Diese Konstanten werden festgelegt
durch Vorgabe von n Anfangs- oder Randbedingungen an die Funktion bzw.
ihrer Ableitungen; siehe unten.
238
b) Radioaktiver Zerfall: Wir betrachten ein radioaktives Material, z.B. Uran U,
das instabil ist:
238
92 U −→ 234 90 Th + 4
2 He .
|{z}
sog. α-Teilchen
Es sei N (t) die Anzahl der zur Zeit t noch nicht zerfallener Atomkerne. Das Zer-
fallsgesetz ergibt sich aus folgenden Sachverhalten: Während eines Zeitintervalls
dt finden im statistischen Mittel dN Kernzerfälle statt. Diese mittlere Änderung
ist proportional zur Zahl N (t) der zur Zeit t noch vorhandener Kerne und zum
Zeitintervall dt. Die Zahl N (t) nimmt mit der Zeit ab; d.h. dN/dt ist negativ.
Somit ist das Zerfallsgesetz:
d
N (t) = −λN (t) , λ > 0, (4.0.4)
dt
72 Einführung in die Theoretische Physik
wobei λ die Zerfallskonstante bzw. Zerfallsrate pro zur Zeit t noch vorhandener
Kerne N (t) ist; [λ] = 1/Zeit. Gl. (4.0.4) ist eine lineare DGL 1. Ordnung. Die
allgemeine Lösung von (4.0.4) erhält man entweder durch Erraten,
N (t) = Ce−λt , C beliebige Konstante, (4.0.5)
oder mit Hilfe einer systematischen Lösungsmethode, der sog. Trennung der Va-
riablen, siehe unten.
Durch Vorgabe einer Anfangsbedingung N (t = 0) = N0 wird C fixiert. Einsetzen
in (4.0.5) ergibt
N (t) = N0 e−λt . (4.0.6)
Die Beispiele a) und b) sind Beispiele für lineare DGL.
Lösungsmethoden:
Um eine DGL zu lösen, muss man sie auf irgendeine Weise ,,integrieren”. Wir wissen
bereits aus Kapitel 2, dass man ein Integral oft nicht in analytischer Form angeben
kann, obwohl man weiss, das es existiert. Genauso verhält es sich bei vielen DGL.
Manchmal helfen Transformationen der unabhängigen Variablen und/oder der ge-
suchten Funktion, um die DGL in eine analytisch lösbare Form zu bringen. Man
kann in jedem Fall (wenn man sich über die Existenz einer Lösung im Klaren ist)
numerische Verfahren anwenden, auf die wir hier nicht eingehen können. Diese Ver-
fahren sind aber in der Praxis (extrem) wichtig – Sie sollten sich im Laufe Ihres
Studiums einen Einblick in diese Methoden gönnen.
Für alle linearen DGL n-ter Ordnung mit konstanten Koeffizienten und für etliche
Typen nichtlinearer DGL 1. Ordnung lassen sich glücklicherweise allgemeine ana-
lytische Lösungsverfahren angeben. Wir besprechen im Folgenden nur einige dieser
Methoden, die wir zur Lösung einfacher Probleme der Mechanik brauchen.
Die allgemeine Lösung ist natürlich die Menge der Stammfunktionen von f (x).
Zx
y(x) = f (x0 )dx0 = F (x) −F (a) = F (x) + C. (4.1.2)
| {z }
a C
Die untere Integrationsgrenze a bzw. äquivalent dazu die Konstante C ist beliebig.
Eine eindeutige Lösung erhält man durch Vorgabe eines Anfangswertes y(x0 ) = y0 .
Einsetzen in (4.1.2) ergibt
C = y0 − F (x0 ). (4.1.3)
Wir wissen bereits, dass sich für komplizierte Funktionen f (x) die analytische Form
der Stammfunktion möglicherweise nicht angeben lässt. Man kann aber in jedem
Fall das Integral in (4.1.2) numerisch auswerten.
Mit Hilfe der Umkehrfunktion G̃ von G können wir diese algebraische Gleichung
nach y auflösen und erhalten die gesuchte Lösung von (4.1.4):
Hinweise:
(i) Diese Lösung ist eindeutig, weil wir in (4.1.8) die Anfangsbedingung schon
einsetzten. Hätten wir das nicht getan, d.h., hätten wir in (4.1.8) unbestimmte
Integrale verwendet, dann würde Gl. (4.1.9) ersetzt werden durch
(ii) Man kann die Umkehrfunktion G̃ von G nicht immer berechnen. Die gesuchte
Lösung y ist dann implizit durch die algebraische Gleichung (4.1.9) gegeben.
(iii) Beachte, dass DGL 1. Ordnung des Typs (4.1.6) sowohl linear als auch nicht-
linear sein können.
FL
dv
m = −a dt
vZ2 Z
1
⇒ m dv = −a dt
v2
m
⇒ − + c1 = −at + c2
v
m
⇒ = at + c1 − c2 .
v | {z }
c
Einsetzen in In (4.1.12) ergibt c = m/v0 . Somit erhalten wir für die Geschwindigkeit
des Objekts
v0 m
v(t) = τ≡ , (4.1.13)
1 + t/τ av0
wobei τ ein das Problem charakterisierender Parameter ist; [τ ] = Zeit. Wie erwartet
wird das Objekt immer langsamer; für t τ geht v(t) → 0.
Unterscheide
Zx
y > 0 ⇒ |y| = y ⇒ y = c̃ exp − a(x0 ) dx0 ,
x0
Zx
y < 0 ⇒ |y| = −y ⇒ y = −c̃ exp − a(x0 ) dx0 .
x0
Fazit: Die allgemeine Lösung von (4.1.14) ist vor Implementierung der Anfangs-
bedingung: x
Z
y(x) = C exp − a(x0 ) dx0 , (4.1.15)
x0
4.1 Beispiele für Differentialgleichungen 1. Ordnung 77
y(x0 ) = Ce−0 = C
⇒ C = y0 .
Setzt man Gleichungen (4.1.17) und (4.1.18) in (4.1.16) ein, erhält man
x x
Z Z
C 0 (x) exp − a(x0 ) dx0 − a(x)y + a(x)y = f (x) · exp + a(x0 ) dx0
x0 x0
(4.1.19)
Zx
dC
⇒ = f (x) exp + a(x0 ) dx0 . (4.1.20)
dx
x0
Das ist eine Differentialgleichung für die gesuchte Funktion C(x), die durch Integrie-
ren – d.h. durch Bestimmung der Stammfunktion der rechten Seite – gelöst werden
kann. Für C(x) erhalten wir
Zx R x00
00 + a(x0 ) dx0
C(x) = f (x )e x0
dx00 + C0 , (4.1.21)
x0
78 Einführung in die Theoretische Physik
wobei C0 eine Integrationskonstante ist. Wir setzen C(x) in (4.1.17) ein und benut-
zen, dass
Zx0 Zx Zx
− a(x ) dx − a(x ) dx = − a(x0 ) dx0 .
0 0 0 0
x00 x0 x00
Dieser Sachverhalt gilt allgemein für lineare DGL, siehe unten und Abschnitt 4.4.2.
Aus der allgemeinen Lösung (4.1.22) der inhomogenen (!) DGL (4.1.16) müssen wir
noch diejenige Lösung bestimmen, welche die Anfangsbedingung y(x0 ) = y0 erfüllt.
Einsetzen in (4.1.22) ergibt
y0 = 0 + C0 · 1 ⇒ C0 = y0 . (4.1.23)
Satz: Das in (4.1.22) dargestellte Ergebnis lässt sich in folgendem Satz zusammen-
fassen. Die allgemeine Lösung y einer inhomogenen, linearen DGL n-ter Ordnung
ist die Summe aus der allgemeinen Lösung yhom der zugehörigen homogenen DGL
und einer speziellen Lösung ys der inhomogenen DGL
y(x) = yhom (x) + ys (x). (4.1.24)
Der Beweis wird in der Vorlesung HöMa II geliefert. Wir überzeugen uns hier nur
davon, wie sich diese Aussage im Falle der DGL (4.1.16) darstellt. Dazu setzen wir
(4.1.24) in (4.1.16) ein:
0
yhom + ys0 + ayhom + ays = f
0
⇒ yhom + ayhom + ys0 + ays = f .
| {z } | {z }
= 0 per Definition von löst diese DGL per Defi-
yhom nition von ys
Einsetzen von (4.1.26) in (4.1.22) ergibt die allgemeine Lösung der DGL (4.1.25):
Zx
−ax 00
y(x) = e f (x00 )eax dx00 + C0 eax0 e−ax . (4.1.27)
x0
Die Lösung, welche die Anfangsbedingung y(x0 ) = y0 erfüllt, ergibt sich wieder mit
C0 = y0 .
mẍ = Fg + FR , (4.1.28)
bv
wobei Fg = mg mit g = 9, 81 m/s2 (Erdbeschleuni- mg
gung). Für kleine Teilchen ist die mit der Luftrei- x
bung assoziierte Kraft gegeben durch das Stokes-
sche Reibungsgesetz FR = −bv, b > 0.
Da die rechte Seite von (4.1.28) nur von der Geschwindigkeit v(t), aber nicht von
x(t) abhängt, verwenden wir den gleichen ,,Trick” wie in Gleichung (4.1.11): Wir
benutzen auf der linken Seite von (4.1.28), dass ẍ = v̇, d.h.
Somit haben wir aus der DGL 2. Ordnung in der Ortsvariablen eine DGL 1. Ordnung
in der Geschwindigkeit gemacht. Aus (4.1.29) folgt:
1
v̇ + v = g, (4.1.30)
τ
wobei τ ≡ m/b, [τ ] = Zeit. Die DGL (4.1.30) ist von der Form (4.1.25), mit a = 1/τ
und f (x) = g = const.
Nun zur Lösung dieser DGL:
1. Die allgemeine Lösung von (4.1.30) ist gegeben durch (4.1.22), wobei (4.1.26)
benutzt werden kann. Die Berücksichtigung der Anfangsbedingung v(t0 = 0) =
v0 ergibt, dass C0 = v0 . Somit ist die gesuchte Lösung von (4.1.29) gegeben
4
Die Abbildung sollte nicht missverstanden werden. Ein Wassertröpfchen, das in feuchter Luft
fällt, sammelt durch Kondensation von Wasserdampf Masse auf; d.h. seine Masse nimmt im Laufe
der Zeit zu. Bewegungsgleichungen für den Fall zeitabhängiger Massen behandeln wir im Mechanik-
Teil der Vorlesung.
80 Einführung in die Theoretische Physik
durch
Zt Zt
1
v(t) = v0 e−t/τ + g exp − dt0 dt00
τ
0 00
| {z t }
00 00
exp(− τt + tτ )=e−t/τ e+t /τ
Zt
00
⇒ v(t) = v0 e−t/τ + ge −t/τ
et /τ dt00
|0 {z }
00 t
τ |
et /τ =τ et/τ −τ
0
2. Man muss die Formel (4.1.22) für die allgemeine Lösung nicht auswendig ken-
nen. Merken sollte man sich aber die Schritte und Methoden zur Lösung ei-
ner inhomogenen linearen DGL 1. Ordnung. i) Bestimmung der allgemeinen
Lösung yhom der assoziierten homogenen DGL. ii) Bestimmung einer Lösung
ys (x) der inhomogenen DGL durch Variation der Konstanten. iii) Implemen-
tierung der Anfangsbedingung y(x0 ) = y0 in die allgemeine Lösung y(x) =
yhom (x) + ys (x) der inhomogenen DGL.
Zu i): Die zu (4.1.30) gehörende homogene DGL ist
1
v̇ + v = 0 .
τ
Diese DGL löst man durch Trennung der Variablen.
1 1
dv = − dt ⇒ v(t) = Ce−t/τ .
v τ
Zu ii): Ansatz zur Suche einer Lösung der inhomogenen DGL (4.1.29). Wir er-
setzen die Integrationskonstante C durch C(t) und machen den Lösungsansatz
v(t) = C(t) exp(−t/τ ). Diesen setzen wir in (4.1.29) ein. Wir erhalten
1 1
Ċe−t/τ − Ce−t/τ + Ce−t/τ = g ,
τ τ
und somit
Wir sehen, dass wir wie im allgemeineren Fall (4.1.21) nicht nur eine Lösung,
sondern eine Lösungsschar erhalten. Somit ist die allgemeine Lösung von (4.1.29):
Man sieht, dass diese Lösung die Struktur (4.1.24) hat; ys = gτ ist eine spe-
zielle Lösung der inhomogenen DGL und C0 e−t/τ die allgemeine Lösung der
4.2 Beispiele für lineare DGL 2. und höherer Ordnung 81
homogenen DGL.
Zu iii): Festlegung der Integrationskonstanten durch die Anfangsbedingung
v(t0 = 0) = v0 :
v0 = v(0) = gτ + C0 ⇒ C0 = v0 − gτ .
Die so fixierte, eindeutige Lösung von (4.1.29) stimmt natürlich mit der obigen
Lösung (4.1.31) überein.
Bahn und Diskussion der Lösung:
• Die Bahn x(t) des Teilchens erhält man sofort durch Integration der Geschwindig-
keit (4.1.31). Die dabei auftretende Integrationskonstante wird durch Vorgabe eines
Anfangswertes x(t0 = 0) = x0 festgelegt.
• Für Zeiten t τ geht e−t/τ → 0 und somit
t→∞ mg
v(t) −−−→ vfinal := gτ = konstante Geschwindigkeit.
b
D.h. die Gravitationskraft, die beschleunigt, und die bremsende Luftreibungskraft
linear in v kompensieren sich für Zeiten t τ nahezu.
Das sind lineare, homogene DGL n-ter bzw. 2. Ordnung mit konstanten Koeffizi-
enten. Beachte, dass wir Differentialgleichungen dieses Typs immer auf die Form
(4.2.1) bzw. (4.2.2) bringen können (durch Division der jeweiligen Gleichung durch
den Koeffizienten von y 00 , falls dieser verschieden von 1 ist).
y = A1 y 1 + A2 y 2 , A1 , A2 Konstanten (4.2.3)
Beweis für die DGL 2. Ordnung: Wir setzen (4.2.3) in (4.2.2) ein:
Hinweise:
2. Das Superpositionsprinzip gilt nicht nur für DGL der Form (4.2.2), sondern
für alle linearen, homogenen DGL n-ter Ordnung, wobei die Koeffizienten auch
Funktionen von x sein können.
II. Lösungsmethode:
Zum Lösen einer linearen, homogenen DGL n-ter Ordnung mit konstanten Koeffi-
zienten, also der DGL (4.2.1), gibt es eine Standardmethode, nämlich den Ansatz
Differenziere y n-mal:
y (n) = Cλn eλx .
Setze dies in (4.2.1) ein und teile durch C. Man erhält
Die linke Seite dieser algebraischen Gleichung ist ein Polynom n-ten Grades in λ.
Man nennt es das charakteristische Polynom der DGL (4.2.1). Nach dem Fundamen-
talsatz der Algebra aus Kapitel 3 hat dieses Polynom n Nullstellen λi , die – selbst
wenn die aj alle reell sind – auch komplex sein können.
λi 6= λj ∀i, j = 1, ..., n,
4.2 Beispiele für lineare DGL 2. und höherer Ordnung 83
Die allgemeine Lösung hängt von n beliebigen Konstanten C ab. Eine eindeu-
tige Lösung erhält man durch Festlegung der Konstanten. Bei physikalischen
Anwendungen bestimmt die jeweilige physikalische Situation nicht nur nur die
Form der DGL, sondern auch wie diese Konstanten festgelegt werden. Eine
typische Problemstellung ist das sogenannte Anfangswertproblem: Man sucht
eine Lösung der DGL (4.2.1), die den n Anfangsbedingungen
y(x0 ) = y0 , y 0 (x0 ) = y1 , ..., y (n−1) (x0 ) = yn−1 (4.2.9)
genügt. Einsetzen der n Anfangswerte (4.2.9) in die allgemeine Lösung (4.2.8)
bzw. in deren Ableitungen ergibt ein lineares Gleichungssystem, d.h. n Glei-
chungen für die gesuchten Ci , die dadurch festgelegt sind.
• Das charakteristische Polynom (4.2.6) kann mehrfache Nullstellen haben. In
diesem Fall sind die entsprechenden Lösungen (4.2.7) nicht mehr linear un-
abhängig. Tritt zum Beispiel eine zweifache Nullstelle auf, λ1 = λ2 , dann ist
eλ1 x = eλ2 x .
Wie man in diesem Fall n linear unabhängige Lösungen konstruiert, besprechen
wir im nächsten Abschnitt am Beispiel der DGL 2. Ordnung, Gl. (4.2.2).
eine Lösung dieser DGL. Wir zeigen dieses grundlegende Ergebnis anhand der DGL
2. Ordnung, Gl. (4.2.2), wobei wie gesagt a, b reell sein müssen. Es sei
y(x) = Re y + iIm y
Die rechte Seite dieser Gleichung ist eine komplexe Zahl bzw. eine komplexwertige
Funktion. Sie kann nur verschwinden, wenn sowohl ihr Realteil als auch ihr Ima-
ginärteil verschwinden5 , d.h. wenn die beiden Klammern separat null sind. Dieses
Argument kann sofort auf die DGL n-ter Ordnung, Gl. (4.2.1) übertragen werden.
Außerdem sollte klar sein, dass die obige Aussage auch für homogene lineare DGL
mit reellen Koeffizientenfunktionen aj (x) (j = 0, . . . , n − 1) gilt.
wobei wie bereits oben betont wurde, wir letztendes nur an der allgemeinen reellen
Lösung dieser DGL interessiert sind.
Setzt man den Ansatz (4.2.5)
y(x) = C eλx
in (4.2.12) ein, erhält man das charakteristische Polynom bzw. die charakteristische
Gleichung 2. Grades,
λ2 + aλ + b = 0 , (4.2.13)
mit den zwei Lösungen
a a2 1/2
λ1,2 = − ± −b . (4.2.14)
2 4
| {z }
≡d Diskriminante
y1 = C1 eλ1 x , y2 = C2 eλ2 x
5
Beachte: wenn a und/oder b komplex sind, dann sind die Terme oberhalb der beiden Klammern
i.A. nicht reell, d.h. entsprechen nicht dem Real- und Imaginärteil des Ausdrucks auf der rechten
Seite der Gleichung; siehe (3.1.6) in Kapitel 3.
4.2 Beispiele für lineare DGL 2. und höherer Ordnung 85
wachsen oder fallen in diesem Fall exponentiell mit x. Die allgemeine Lösung
von (4.2.12) ist gegeben durch
y(x) = C1 eλ1 x + C2 eλ2 x , (4.2.15)
wobei C1 , C2 zwei beliebige reelle Konstante sind (weil wir nur an reellen
Lösungen interessiert sind). Diese beiden Konstanten werden durch Vorgabe
von zwei Anfangsbedingungen festgelegt:
y(x0 ) = y0 , y 0 (x0 ) = y1 .
Zur Implementierung dieser Anfangsbedingungen müssen wir (4.2.15) noch
differenzieren: y 0 = C1 λ1 eλ1 x + C2 λ2 eλ2 x . Einsetzen der Anfangsbedingungen
in y und y 0 ergibt
C1 eλ1 x0 + C2 eλ2 x0 = y0 , C1 λ1 eλ1 x0 + C2 λ2 eλ2 x0 = y1 .
Dieses lineare, inhomogene algebraische Gleichungssystem (zwei Gleichungen,
zwei Unbekannte) lässt sich problemlos nach C1 und C2 auflösen.
2. Falls d < 0, dann
s r
a a2 a a2
λ1,2 =− ± (−1) b − =− ±i b− .
2 4 2 | {z 4 }
≡ω>0
wobei C1 und C2 beliebige, i.A. komplexe Konstanten sind. Mit der Euler-
Formel aus Kapitel 3 ist
u(x) = C1 (cos ωx + i sin ωx) + C2 (cos ωx − i sin ωx)
= (C1 + C2 ) cos ωx + (iC1 − iC2 ) sin ωx.
Mit der Umbenennung
A1 := C1 + C2
beliebig komplex
A2 := iC1 − iC2
6
√
Wir benutzten hier die in Kapitel
√ 3.3 besprochene Definition der der Wurzel z einer komple-
√
xen Zahl. Demzufolge ist −1 = eiπ = eiπ/2 = +i.
86 Einführung in die Theoretische Physik
erhalten wir
u(x) = A1 cos ωx + A2 sin ωx,
und die allgemeine Lösung von (4.2.12) hat die Form
a
y(x) = e− 2 x u(x). (4.2.17)
Im Allgemeinen sind A1 , A2 komplexe Konstanten, d.h. y(x) ist eine komple-
xe Funktion der reellen Variablen x. Da die DGL (4.2.12) linear ist und a, b
reell sein sollen, ist wie bereits oben gezeigt der Realteil von y(x) ebenfalls
eine Lösung von (4.2.12) – und das ist die allgemeine reelle, d.h. physikalisch
relevante Lösung von (4.2.12) im Falle von d < 0:
a
yphys (x) = Re y(x) = e− 2 x (a1 cos ωx + a2 sin ωx), (4.2.18)
wobei a1 = Re A1 , a2 = Re A2 zwei beliebige reelle Konstanten sind. Die
Anfangsbedingung an y und y 0 wird analog zur Vorgehensweise in 1) imple-
mentiert.
3. Falls d = 0, dann hat das charakteristische Polynom (4.2.13) die doppelte
Nullstelle
a
λ1 = λ2 = − .
2
Das liefert nur eine Lösung von (4.2.12):
a
y1 (x) = C e− 2 x . (4.2.19)
Wie erhalten wir in diesem Fall eine zweite, linear unabhängige Lösung? Man
benutzt die Methode Variation der Konstanten. Wir machen den Ansatz
a
y(x) = C(x) e− 2 x . (4.2.20)
Dann ist
a a a
y 0 = C 0 e− 2 x − C e− 2 x
2
a a a a a a2 a
y 00 = C 00 e− 2 x − C 0 e− 2 x − C 0 e− 2 x + C e− 2 x .
2 2 4
Wir setzen y und diese Ableitungen in die DGL (4.2.12) ein und erinnern uns
daran, dass wir den Fall d = 0, d.h. b = a2 /4 diskutieren. Das ergibt
a a a2 − a x a a2 a a2 a
C 00 e− 2 x − aC 0 e− 2 x + Ce 2 + aC 0 e− 2 x − Ce− 2 x + Ce− 2 x = 0.
4 2 4
Die Terme proportional zu C 0 und zu C kürzen sich weg und wir verbleiben
mit der folgenden, einfach zu lösenden DGL 2. Ordnung:
C 00 (x) = 0 .
⇒ C 0 (x) = A1 ,
⇒ C(x) = A1 x + A2 . (4.2.21)
4.3 Beispiele aus der Physik 87
FH
0
Masse m FH
Ruhelage Auslenkung
Setzen wir (4.2.21) in (4.2.20) ein, erhalten wir als Lösung von (4.2.12):
a
y(x) = (A1 x + A2 ) e− 2 x .
Der zweite Term und die Lösung (4.2.19) sind linear abhängig, während der
erste Term und (4.2.19) linear unabhängig sind. Somit ist die allgemeine reelle
Lösung von (4.2.12) im Falle d = 0:
a a
y(x) = (A1 x e− 2 x + A2 e− 2 x ) A1 , A2 reell. (4.2.22)
Gravitationskraft, sondern nur die rücktreibende Kraft der Feder. Wenn die Feder
nicht überdehnt wird, gilt das Hookessche Gesetz:
FH = −k(x − x0 ), x0 = 0 , (4.3.2)
wobei k > 0 und sich die Ruhelage des Pendels o.B.d.A. bei x0 = 0 befinden soll.
Gl. (4.3.2) in (4.3.1) eingesetzt ergibt
mẍ + kx = 0 ,
⇒ ẍ + ω 2 x = 0 , (4.3.3)
wobei ω 2 ≡ k/m > 0. Man findet die Lösung dieser linearen DGL 2. Ordnung mit
Hilfe des Standard-Ansatzes (4.2.5):
x(t) = C eλt
⇒ λ2 + ω 2 = 0
⇒ λ1,2 = ±iω.
Die allgemeine Lösung von (4.3.3) ist somit
x(t) = C1 eiωt + C2 e−iωt . (4.3.4)
Die physikalisch relevante Lösung ist gegeben durch den Realteil von x(t) – siehe
Gl. (4.2.18).
xphys (t) = Re x(t) = a1 cos ωt + a2 sin ωt. (4.3.5)
Die reellen Konstanten a1 , a2 werden festgelegt durch Berücksichtigung der Anfangs-
bedingungen. Wir geben uns den Ort und die Geschwindigkeit des Massenpunktes
zu einer bestimmten Zeit t0 vor:
x(t0 ) = x0 , ẋ(t0 ) = v0 .
Einsetzen in (4.3.5) bzw. in die 1. Zeitableitung liefert zwei Gleichungen für a1 und
a2 .
Die DGL (4.3.3) ist das einfachste Beispiel einer Schwingungsdifferentialgleichung
– sie beschreibt eine eine freie, ungedämpfte Schwingung mit der Kreisfrequenz ω
in einer Raumdimension. Die Amplitude der Schwingung als Funktion der Zeit ist
gegeben durch die Lösung (4.3.5), wobei a1,2 wie gesagt durch die jeweilige Anfangs-
bedingung festgelegt sind. Man bezeichnet ein System, das der Bewegungsgleichung
(4.3.3) genügt, als eindimensionalen ungedämpften harmonischen Oszillator. Dieses
simple mechanische Beispiel dient als Modell für viele ungedämpfte eindimensionale
Schwingungen in der Physik.
mẍ = FH + FR
= −kx − κẋ ,
d.h.
κ k
ẍ + ẋ + x = 0. (4.3.7)
m m
Dies ist die DGL einer eindimensionalen Schwingung mit einem Dämpfungsterm.
Die allgemeine Lösung fanden wir bereits im Abschnitt 4.2.2. Wie dort müssen wir
drei Fälle unterscheiden:
κ2 k κ2 k κ2 k
1) 2
> , 2) 2
< , 3) 2
= .
4m m 4m m 4m m
Diese Fälle beschreiben drei verschiedene physikalische Vorgänge, nämlich (1) dem
sog. überdämpften Fall, (2) den Fall einer gedämpften Schwingung und (3) den sog.
aperiodischen Grenzfall. Wir werden sie im Detail in den Übungen behandeln und
nochmal im Mechanik-Teil der Vorlesung darauf eingehen. Dort besprechen wir auch
den Fall, dass auf den Oszillator noch eine zusätzliche äußere Kraft einwirkt. Das
führt zu einer inhomogenen DGL 2. Ordnung. In diesem Fall müssen wir zusätzlich
zur allgemeinen Lösung der assoziierten homogenen DGL noch eine spezielle Lösung
der inhomogenen DGL finden.
besitzen ebenfalls eine Schar von Lösungen. Wir nehmen an, dass diese Lösungen
existieren. Das ist unter relativ milden Anforderungen an F der Fall. Diese allge-
meine Lösung hängt von n beliebigen Konstanten C1 , ..., Cn ab:
y = y(x, C1 , ..., Cn ). (4.4.2)
Die allgemeine Lösungsschar (4.4.2) ist wenig aussagekräftig. In Anwendungen (in
der Physik, Chemie, Biologie, den Ingenieurwissenschaften, usw.) ist das Ziel, eine
eindeutige Lösung zu bestimmen – nur diese ermöglicht eine Vorhersage. Dazu muss
man Anfangs- oder Randbedingungen vorgeben, die die gesuchte Lösung erfüllen
soll. Diese Bedingungen werden vom jeweiligen Problem, in unserem Kontext von
der Physik diktiert!
Anfangswertproblem:
Unter relativ allgemeinen Voraussetzungen an die Eigenschaften der DGL (4.4.1)
erhält man eine eindeutige Lösung dieser DGL durch Vorgabe der n Anfangswerte:
y(x0 ) = y0 ,
y 0 (x0 ) = y1 ,
.. (4.4.3)
.
y (n−1) (x0 ) = yn .
Einsetzen dieser Anfangswerte in die allgemeine Lösung (4.4.2) bzw. deren Ablei-
tungen ergibt n algebraische Gleichungen für die Konstanten C1 , ..., Cn , die zu lösen
sind. Die Suche nach einer eindeutigen Lösung von (4.4.1), welche den Anfangsbe-
dingungen (4.4.3) genügt, nennt man ein Anfangswertproblem 7 .
Randwertproblem:
Hier sucht man eine eine eindeutige Lösung von (4.4.1) durch Vorgabe von n Be-
dingungen an y und/oder ihren Ableitungen an den Rändern x = a und x = b
des Lösungsintervalls a ≤ x ≤ b. Ein Beispiel dafür ist die Temperaturverteilung
längs eines eindimensionalen Stabes der Länge L, der sich in einem Medium befin-
det, dessen Temperatur TM sei. Die beiden Enden des Stabes sollen auf konstanter
Temperatur T1 bzw. T2 mit T1 6= T2 gehalten werden. Nach einer gewissen Zeit stellt
sich ein stationärer Zustand ein, d.h. die Temperaturverteilung T hängt nur von der
Ortsvariablen x, aber nicht mehr von der Zeit ab. Zu lösen ist dann das folgende
Randwertproblem:
T 00 (x) = a2 (T (x) − TM ) mit T (0) = T1 , T (L) = T2 6= T1 .
7
Nicht jedes Anfangswertproblem hat eine eindeutige Lösung. Ein Gegenbeispiel ist
√
y 0 (x) = y mit y(0) = 0 , wobei 0 ≤ x < ∞ .
Sowohl y(x) = 0 als auch die Schar yλ (x) = 0 für 0 ≤ x ≤ λ, yλ (x) = (x − λ)2 /4 für λ < x < ∞
lösen dieses Anfangswertproblem.
4.4 Allgemeine Hinweise 91
Auf die physikalische Herleitung dieser DGL gehen wir hier nicht ein. Dieses Beispiel
soll nur zeigen, dass in der Physik auch Randwertprobleme mit gewöhnlichen DGL
eine Rolle spielen.
Das wohl berühmteste Beispiel für ein Randwertproblem ist die DGL einer schwin-
genden Saite, die an ihren Enden x = a und x = b fixiert ist. (Es handelt sich dabei
aber um eine partielle DGL.) Mit diesem Problem schlugen sich Großmeister von
Pythagoras bis hin zu Euler, J. und D. Bernoulli, d’Alembert und Lagrange herum.
Eine Saite ist ein elastischer, nicht-starrer Körper – man behandelt solche Objekte
in der Kontinuumsmechanik.
Randwertaufgaben sind nicht immer lösbar. Es gibt auch einfache Beispiele dafür,
dass eine Randwertaufgabe zwar eine Lösung besitzt, die Lösung aber nicht eindeutig
ist. Da wir uns im Mechanik-Teil dieser Vorlesung nur mit Anfangswertproblemen
für Massenpunkte bzw. in der Vorlesung Theoretische Physik I für starre Körper
befassen, gehen wir darauf nicht ein.
Diese hat n Lösungen λi , von denen einige oder alle komplex sein können.
* Falls alle λi einfache Nullstellen des charakteristischen Polynoms sind,
erhält man die n linear unabhängigen Lösungen
yi = Ci eλi x , i = 1, . . . , n .
wobei die Komponenten Fi der (bekannten) Kraft, je nach Problem, von den Orts-
und/oder Geschwindigkeitskomponenten eines Objekts (der Masse m) und ggf. auch
explizit von der Zeit t abhängen.
Man muss versuchen, dieses System durch geeignete Manipulationen zu entkoppeln,
d.h. in DGL überzuführen, die jeweils nur noch von einer der drei unbekannten
Funktionen xi (t) und ihren Ableitungen abhängen. Wir werden bei den Problemen,
die wir im Mechanik-Teil der Vorlesung behandeln, durch geeignete Addition, Sub-
traktion, etc. der Gleichungen die resultierenden entkoppelten DGL lösen. Durch
4.4 Allgemeine Hinweise 93
Auch hier ist wieder zu beachten, dass die Anfangswerte (bzw. die Randwerte) nicht
der allgemeinen Lösung des homogenen Systems, sondern der allgemeinen Lösung
des inhomogenen Systems aufgeprägt werden müssen!
Kapitel 5
Vektorrechnung
Im Laufe dieser Vorlesung und in der Vorlesung Theoretische Physik I wird präzi-
siert, wie die Begriffe Skalar und Vektor in der nichtrelativistischen und in der rela-
tivistischen Physik definiert und benutzt werden. Die folgenden Beispiele beziehen
sich auf die nichtrelativistische Physik, insbesondere auf die nichtrelativistische Me-
chanik.
5.1 Skalare und Vektoren 95
Skalare
Anschauliche Definition: Ein Skalar ist eine Größe, die durch Angabe einer
einzigen Zahl – bezogen auf die jeweilige Maßeinheit der physikalischen Größe –
gekennzeichnet ist. Diese Zahl darf nicht von Bezugssystem1 abhängen, in dem man
die Größe misst.
Beispiele:
• Zahl der Atome in einem Stück Materie,
Vektoren:
Anschauliche Definition: Ein Vektor ist – in der nichtrelativistischen Physik –
eine Größe, die gekennzeichnet ist durch eine nichtnegative Zahl – das ist der Betrag
der Größe in der jeweiligen Maßeinheit – und durch eine Richtung 3 im Raum.
• Beschleunigung,
• Kraft,
• elektrische Feldstärke,
1
Ein Bezugssystem ist ein Koordinatensystem versehen mit Uhren, in dem physikalische Pro-
zesse untersucht werden. Von grundlegender Bedeutung sind sog. Inertialsysteme – siehe den
Mechanik-Teil der Vorlesung. In diesen Systemen nehmen die Grundgesetze der Physik eine einfa-
che Form an.
2
Die Zeit und der räumliche Abstand zweier Punkte sind nur in der nichtrelativistischen Physik
skalare Größen – nicht aber in der relativistischen Physik.
3
In der Regel beziehen wir uns auf den dreidimensionalen Raum, in dem sich das physikalische
Geschehen abspielt. Der Begriff des Vektors lässt sich aber problemlos auf einen n-dimensionalen
Raum (n = 1, 2, 3, 4, ...) verallgemeinern bzw. noch abstrakter fassen (siehe unten).
96 Einführung in die Theoretische Physik
• magnetische Feldstärke.
Vektoren stellt man graphisch durch Pfeile dar, z.B. durch die gerichtete gerad-
linige Verbindung zwischen zwei Punkten.
Q1
~a
P1 −−−→
a = P1 Q 1
−−−→
P2 b = P2 Q 2
~b Q2
Freie und gebundene Vektoren: Die obige Definition besagt, dass ein Vektor
−−→
P Q nicht davon abhängt, wo der Punkt P , von dem der Vektor ausgeht, im Raum
liegt. Die geometrische Interpretation eines Vektors4 ist die einer Parallelverschie-
bung, der jeden Punkt P im Raum in eine feste Richtung um eine feste Strecke
−−−→ −−−→
verschiebt. Zwei Vektoren, d.h. zwei Verschiebepfeile P1 Q1 , P2 Q2 sind gleich, wenn
sie gleichsinnig parallel sind und die gleiche Länge, d.h. den gleichen Betrag haben.
In der Physik- und Ingenieur-Literatur bezeichnet man Bezugspunkt-unabhängige
Vektoren als freie Vektoren. Als Beispiel sei die Geschwindigkeit genannt. Wenn ein
Pkw in Aachen und ein anderer in Köln jeweils mit 100 km/h strikt nach Westen
fahren, ordnen wir beiden Fahrzeugen den gleichen Geschwindigkeitsvektor v zu.
Analog gilt das z.B. auch für die Beschleunigung oder für eine von Ort unabhängige
Kraft. Die Operationen mit Vektoren, die im nächsten Abschnitt besprochen werden,
gelten für freie Vektoren.
Im Gegenssatz dazu ist ein sog. gebundener Vektor, wie z.B. der Ortsvektor eines
Massenpunktes, an einen Bezugspunkt gebunden, von dem er ausgeht. Wir kommen
in Abschnitt 5.3 auf den Ortsvektor zurück.
4
Wir reden hier von konstanten, nicht von ortsabhängigen Vektoren.
5.2 Elementare Operationen, Vektorräume 97
~b ~a
~a + ~b
~a + ~b
~a ~b
a3) Es gibt einen Nullvektor 0, d.h. |0| = 0, Angriffs- und Zielpunkt fallen beim
Nullvektor zusammen. Es gilt a + 0 = a.
a4) Zu jedem Vektor a gibt es einen Vektor −a (mit gleicher Länge wie a, aber
entgegengesetzter Richtung), so dass a − a = 0.
Das legt folgende Definition nahe: Multipliziert man einen Vektor a mit einer reellen
Zahl λ, so ist das Ergebnis der Vektor λa. Dieser Vektor hat die gleiche Richtung
wie a (er ist parallel zu a), wenn λ > 0, bzw. die zu a entgegengesetzte Richtung
(er ist antiparallel zu a), wenn λ < 0. Für seine Länge (Betrag) gilt:
|λa| = |λ||a|.
Aus dieser Definition ergeben sich sofort folgende Regeln für die Multiplikation von
Vektoren mit reellen Zahlen λ, α ∈ R:
98 Einführung in die Theoretische Physik
m1) 1 · a = a.
Die Menge der Vektoren in drei Raumdimensionen, für die die Additionsregeln
a1) – a4) und die Multiplikationsregeln m1) – m4) mit reellen Zahlen gelten, bil-
den einen sogenannten Vektorraum; präziser, einen dreidimensionalen Vektorraum
V3 über dem sogenannten Körper der reellen Zahlen R. Die Dimension eines Vek-
torraums wird unten im Abschnitt über lineare Unabhängigkeit definiert.
In der Physik ist es nützlich, Vektoren auch in ein, zwei oder allgemein in d Raumdi-
mensionen zu betrachten. Diese Vektoren bilden einen d-dimensionalen Vektorraum
Vd .
Notation: Vd = Rd = R × R × . . . × R.
Diese Notation bringt zum Ausdruck, dass die Menge der Verschiebepfeile im d-
dimensionalen ,,Anschauungsraum” isomorph5 zum ,,d-fachen Produkt der reellen
Zahlenmenge” ist. Das wird in Abschnitt 5.3 erläutert.
Hinweise:
1. In der Mathematik wird der Begriff eines Vektors bzw. eines Vektorraums ab-
strakter gefasst. Man bezeichnet eine Menge V von Objekten, in der die Additi-
onsregeln a1) – a4) und die Multiplikationsregeln m1) – m4) gelten (mit reellen
Zahlen, oder mit komplexen Zahlen, oder allgemeiner mit Objekten aus einem
Körper K), als Vektorraum. So bildet z.B. die Menge {f (x)} der auf dem In-
tervall [a, b] integrierbaren reellen Funktionen einen (unendlich-dimensionalen)
Vektorraum. Die Addition f + g zweier Vektoren f und g und die Multipli-
kation mit reellen Zahlen α, β ist durch αf (x) + βg(x) definiert. Vektorräume
dieser Art werden Ihnen auch in den Vorlesungen über Theoretische Physik in
den höheren Semestern begegnen.
2. Wenden wir die Multiplikationsregeln m1)– m4) auf die oben eingeführten
Begriffe Skalar und Vektor an, so besagen diese Regeln, dass
3. Die Additionsgesetze a1) – a4) machen natürlich nur für Vektoren mit dersel-
ben physikalischen Dimension Sinn.
Lineare Unabhängigkeit
Wir betrachten den Vektorraum Vd = Rd . Eine Anzahl von n Vektoren g 1 , ..., g n
heißt linear unabhängig, wenn die Gleichung
λ1 g 1 + λ2 g 2 + ... + λn g n = 0
nur dann gilt, wenn alle Koeffizienten λi = 0 sind. Falls es mindestens eine reelle
Zahl λj 6= 0 gibt, so dass diese Gleichung gilt, heissen die Vektoren g 1 , ..., g n linear
abhängig.
Beispiele:
1. V1 = R. Hier gibt es nur einen linear unabhängigen Vektor, wir nennen ihn g.
Alle anderen Vektoren sind Vielfache von g:
b = λg λ ∈ R.
M.a.W.: In V1 = R sind zwei oder mehr Vektoren immer linear abhängig.
2. V2 = R2 . Hier gibt es maximal zwei linear unabhängige Vektoren.
~g1
Beispiel: ~g 2
Jeder weitere Vektor in der Ebene kann als Linearkombination von g 1 und g 2
dargestellt werden:
b = λ1 g 1 + λ2 g 2 .
M.a.W.: In V2 = R2 sind drei oder mehr Vektoren immer linear abhängig.
3. Vd = Rd . Hier gibt es maximal d linear unabhängige Vektoren.
5.3 Bezugssysteme
Die Gleichung (5.2.1) besagt, dass jeder Vektor b ∈ V = Rn eindeutig durch den
Satz von Zahlen
b1 , ..., bd ←→ b (5.3.1)
bezüglich der gewählten Basis g 1 , ..., g d festgelegt ist. Die Zahlen (5.3.1) heißen Kom-
ponenten oder Koordinaten des Vektors b bezüglich der Basis {g i }. Der Einfachheit
halber wählt man in der Regel sogenannte Orthonormalbasen. Das sind d Einheits-
vektoren, die alle senkrecht6 aufeinander stehen:
e1 , e2 , ..., ed
(5.3.2)
mit |ei | = 1 ∀i = 1, ..., n und ei ⊥ ej ∀i 6= j.
{e1 , e2 , e3 } , (5.3.3)
also eine Basis mit der Eigenschaft (5.3.2), definiert ein sog. kartesisches Koordi-
natensystem im R3 .
1. Man wählt einen beliebigen Punkt O im Raum, bei dem die Pfeile e1 , e2 , e3
der Länge Eins beginnen. Den Punkt O nennt man Nullpunkt oder Koordi-
natenursprung. Die Winkel ∠(ei , ej ) sind jeweils 90◦ . Die Verlängerung der
Pfeile ergeben die Koordinatenachsen, die mit Maßzahlen versehen werden.
2. Für die ONB (5.3.3) sind zwei Orientierungen möglich, siehe Abbildung 5.2.
Rechts- und linkshändige ONB können nicht durch Drehungen ineinander
übergeführt werden.
∧ ∧ ∧
e1 = positive x- e2 = positive y- e3 = positive z-
Achse Achse Achse
∧ ∧ ∧
rechtshändig ori- = Daumen der = Zeigefinger der = Mittelfinger der
entiertes System rechten Hand rechten Hand rechten Hand
∧ ∧ ∧
linkshändig orien- = Daumen der lin- = Zeigefinger der = Mittelfinger der
tiertes System ken Hand linken Hand linken Hand
Wir wählen in der Regel ein rechtshändig orientiertes System = Rechtssystem.
6
Man muss im Allgemeinen zunächst im jeweiligen Vektorraum das Skalarprodukt zweier Vek-
toren definieren. Mit einem Skalarprodukt kann man festlegen, was Orthogonalität zweier Vektoren
bedeuten soll. Im euklidischen Rd können wir allerdings auf geometrische Weise zueinander senk-
rechte Vektoren konstruieren.
5.3 Bezugssysteme 101
z z
y
y
~e3 ~e3
~e2 ~e2
~e1 x x ~e1
~a
a3
a1
x a2
y
Abbildung 5.3: Bezüglich einer vorgegebenen ONB (5.3.3) hat ein Vektor die ein-
deutige Zerlegung (5.3.4).
Auf diese Weise werden die obigen geometrischen Überlegungen auf algebraische
Betrachtungen und somit auf das Rechnen mit reellen Zahlen zurückgeführt. Die
Rechenregeln a1) – a4) und m1) – m4) lassen sich sofort auf (5.3.5) übertragen.
Seien a, b ∈ V3 = R3 und α, β ∈ R, dann
c1 a1 b1 αa1 + βb1
c = αa + βb ⇔ c2 = α a2 + β b2 = αa2 + βb2 . (5.3.6)
c3 a3 b3 αa3 + βb3
Völlig analog stellt man Vektoren aus Vd = Rd dar und rechnet mit ihnen. Das
Symbol Rd sollte nun klar sein. Es bezeichnet die Menge der d-komponentigen reellen
Spaltenvektoren.
formuliert man diese Grundgesetze in der Regel basisunabhängig – d.h. mit Vekto-
ren unabhängig von ihrer Koordinatendarstellung bezüglich einer bestimmten Basis.
Zum Beispiel lautet das Newtonsche Bewegungsgesetz in Bezugssystem-unabhängi-
ger Vektordarstellung:
d2
m 2 x(t) = F . (5.3.7)
dt
Dieses Gesetz gilt in jedem Inertialsystem (dies wird im Mechanik-Teil behandelt).
Für konkrete Rechnungen ist es aber meistens notwendig, ein geeignetes Koordina-
tensystem (KS) zu wählen. Wählt man ein kartesisches KS mit der ONB (5.3.2),
dann ist
3
X X3
x(t) = xi (t)ei , F = Fi ei ,
i=1 i=1
und die Bewegungsgleichung (5.3.7) nimmt bezüglich des gewählten KS die Form
d2
m x(t) = F
dt2
an.
~b
φab a · b = |a| |b| cos φab , (5.4.1)
~a
wobei 0 ≤ φab ≤ π der Winkel zwischen den Vektoren a und b ist. Weil cos φab =
cos(2π − φab ), spielt es keine Rolle, welchen der beiden Winkel zwischen a und b
104 Einführung in die Theoretische Physik
man nimmt.
Wenn der in der Abbildung gezeigte Winkel
φab spitz ⇒ a · b > 0,
φab stumpf ⇒ a · b < 0,
π
φab = d.h. a ⊥ b ⇒ a · b = 0.
2
Beispiel aus der Physik: Die mechanische Arbeit A, die an einem Körper bei Bewe-
gung um eine kleine Strecke ∆r = r 2 −r 1 gegen eine Kraft F bzw. unter Einwirkung
einer Kraft verrichtet werden muss, ist A = F · ∆r.
Das Skalarprodukt ist
kommutativ a · b = b · a (5.4.2)
und
distributiv (a + b) · c = a · c + b · c. (5.4.3)
Die Eigenschaft (5.4.2) ist offensichtlich. Den Beweis der Eigenschaft (5.4.3) finden
Sie z.B. im zitierten Buch von S. Großmann.
Da φab = 0 zur Folge hat, dass a · a = |a||a| cos 0 = |a||a|, kann man die Länge
eines Vektors a mit Hilfe des Skalarproduktes ausdrücken.
√
|a| = a · a. (5.4.4)
Das Skalarprodukt erfüllt die Schwarzsche Ungleichung
|a · b| ≤ |a||b| , (5.4.5)
die sich in einer Vielzahl von Anwendungen als nützlich erweist. Diese Ungleichung
folgt sofort aus der Definition (5.4.1) und | cos φab | ≤ 1.
Aus (5.4.6) folgt, dass das Skalarprodukt zweier Vektoren a und b durch ihre Kom-
ponenten bezüglich dieser Basis gegeben ist durch
a · b = (a1 e1 + a2 e2 + a3 e3 ) · (b1 e1 + b2 e2 + b3 e3 )
(5.4.7) (5.4.8)
= a1 b1 + a2 b2 + a3 b3 .
5.4 Skalarprodukt, Vektorprodukt, Mehrfachprodukte von Vektoren 105
~b
φ̃ab
~a
Abbildung 5.4: Der Winkel φ̃ab in der Definition (5.4.10) ist der kleinere der beiden
Winkel zwischen a und b.
Die Länge, also der Betrag eines Vektors a folgt aus (5.4.8):
√ q
a ≡ |a| = a · a = a21 + a22 + a23 . (5.4.9)
Dieses Ergebnis erhält man auch aus Abbildung 5.3 durch zweimalige Anwendung
des Satzes von Pythagoras.
Hinweis: Man nennt den Vektorraum Rd versehen mit dem Skalarprodukt (5.4.1)
einen d-dimensionalen euklidischen Raum. Der Grund für diese Namensgebung
sollte klar sein – in diesem Raum werden die Regeln der euklidische Geometrie auf
algebraische Rechenoperationen zurückgeführt.
Merkregel: Wenn der Daumen der rechten Hand in Richtung von a zeigt und der
Zeigefinger der rechten Hand, den Handrücken verlängernd ausgestreckt, in Richtung
von b zeigt, dann zeigt der senkrecht dazu von der Handinnenfläche weg ausgestreck-
te Mittelfinger der rechten Hand in Richtung von n, also in die Richtung von a × b.
106 Einführung in die Theoretische Physik
~b
φ̃ab
~a
Abbildung 5.5: Das von a und b aufgespannte Parallelogramm hat die Fläche F =
ab sin φ̃ab = |a × b|.
Aus der Definition (5.4.10) folgt, dass das Vektorprodukt zweier paralleler oder
antiparalleler Vektoren null ist.
a (anti)parallel zu b ⇔ a × b = 0. (5.4.11)
Weitere Eigenschaften:
Die Relationen (5.4.12) und (5.4.13) folgen unmittelbar aus der Definition (5.4.10).
Gl. (5.4.12) besagt, dass das Vektorprodukt nicht kommutativ ist – wegen des
Minuszeichens in (5.4.12) bezeichnet man das Vektorprodukt als antikommutativ.
Das Vektorprodukt ist jedoch distributiv; denn es gilt
a × (b + c) = a × b + a × c. (5.4.14)
Diese Relation kann man z.B. mit der Komponentendarstellung (5.4.18) des Vektor-
produkts herleiten.
1 1
3 2 3 2
(1, 2, 3); (2, 3, 1); (3, 1, 2) (1, 3, 2); (3, 2, 1); (2, 1, 3)
(a) Zyklische Vertauschungen (b) Antizyklische Vertau-
von (1, 2, 3). schungen von (1, 2, 3).
L = r × p, N =r×F .
8
Für den Drehimpuls eines Körpers gilt die Bewegungsgleichung dL/dt = N , die aus der New-
tonschen Bewegungsgleichung folgt – siehe den Mechanik-Teil der Vorlesung.
108 Einführung in die Theoretische Physik
~c
Volumen
F ·h
h = ~n · ~c
~b
~n k ~a × ~b F = |~a × ~b|
φ̃ab
~a
Der Drehimpuls und das Drehmoment sind wie der Ortsvektor vom Bezugspunkt O
des Koordinatensystems – aber nicht von der Orientierung seiner Achsen – abhängig,
sind also weitere Beispiele für gebundene Vektoren.
3. Dreifaches Vektorprodukt a × (b × c). Dies ist ein Vektor, und zwar gilt
Merkregel: “bac minus cab”. Die Relation (5.4.23) beweisen wir auf Sei-
te 110. Beachten Sie, dass hier das Assoziativgesetz nicht gilt!
(a × b) × c 6= a × (b × c). (5.4.24)
Der Vektor in (5.4.23) liegt in der von b und c aufgespannten Ebene, während
(5.4.23)
(a × b) × c = −c × (a × b) = −a(c · b) + b(c · a) (5.4.25)
Das Symbol ijk heißt total antisymmetrischer -Tensor9 , oder total antisymmetri-
sches -Symbol oder Levi-Civita-Symbol. Es handelt sich um ein Objekt bestehend
aus 3 · 3 · 3 = 27 Zahlen. Aus der Definition folgt, dass
123 = 312 = 231 = +1,
(5.4.27)
213 = 321 = 132 = −1,
und dass der Wert des Symbols null ist, wenn mindestens zwei Indizes gleich sind:
und dass ijk antisymmetrisch unter Vertauschung zweier benachbarter Indizes ist:
9
In Kapitel 6 wird erklärt, warum man dieses Objekt als Tensor bezeichnet.
110 Einführung in die Theoretische Physik
Man beweist diese Formel z.B. durch explizites Einsetzen der Werte des -Symbols
und Verwendung seiner Antisymmetrieeigenschaften.
Anwendungen:
1) Zunächst stellen wir fest, dass wir die Relationen (5.4.16) mit dem -Symbol
folgendermaßen kompakt darstellen können:
ei × ej = ijk ek , i, j, k = 1, 2, 3 . (5.4.32)
2) Als nächstes betrachten wir das Vektorprodukt b × c, das mit (5.4.32) die Form
3
X 3
X
b×c= bi cj ei × ej = ijk bi cj ek (5.4.33)
i,j=1 i,j,k=1
annimmt.
3) Mit (5.4.33), (5.4.32) und (5.4.31) beweisen wir nun die Relation (5.4.23).
3
! 3
!
X X
a × (b × c) = al el × ijk bi cj ek
l=1 i,j,k=1
3 3
X (5.4.31) X
= al bi cj ijk lkm em = − al bi cj em (δil δjm − δim δjl )
|{z}
i,j,k,l,m=1 −lmk i,j,l,m=1
3
X
=− (ai bi cj ej − aj cj bi ei ) = b(a · c) − c(a · b) .
i,j
Natürlich kann man diese Relation auch auf Fußgängerart herleiten, soll heißen durch
zweimalige Anwendung von (5.4.18) unter Verwendung von (5.4.16).
Hinweise:
5.5 Vektorwertige Funktionen, Raumkurven 111
x2
~r(t)
x1
0
1. Der Parameter t in der obigen Definition muss nicht die Zeit sein; je nach
Zweckmäßigkeit kann eine Koordinate, ein Winkel, die Bogenlänge, usw. zur
Parametrisierung einer vektorwertigen Funktion benutzt werden – siehe unten.
2. Der Ortsvektor r = r(t) beschreibt analytisch die Bahnkurve eines Teilchens
im Ortsraum. Natürlich kann jede vektorwertige Funktion geometrisch als Kur-
ve in einem abstrakten Raum interpretiert werden. So beschreibt z.B. die Ge-
schwindigkeit v = v(t) eines Massenpunktes eine Kurve im ,,Geschwindigkeits-
raum”, eine nicht vom Ort abhängige Kraft F = F (t) eine Kurve im ,,Raum
der Kraftvektoren”, usw.
x2
~r
R
φ x1
wobei das Pluszeichen für die obere, das Minuszeichen für die untere Halbebene
gilt.
3. Parametrisierung durch die Koordinate x2 .
q
r(x2 ) = (± R2 − x22 , x2 , 0) − R ≤ x2 ≤ R,
Differentiation:
Eine vektorwertige Funktion r(t) ist differenzierbar, wenn der Limes
unabhängig von der Folge ∆t → 0. Die Ableitung dr(t)/dt ist wieder eine vektor-
wertige Funktion. In der Darstellung (5.5.1) durch t-unabhängige Basisvektoren ist
r(t) stetig und differenzierbar, wenn alle Komponenten xi (t) in (5.5.1) stetig und
differenzierbar sind. In dieser Komponetendarstellung ist die 1. Ableitung
d da db
a(t) + b(t) = + , (5.5.6)
dt dt dt
d da db
a(t) · b(t) = ·b+a· , (5.5.7)
dt dt dt
d da db
a(t) × b(t) = ×b+a× , (5.5.8)
dt dt dt
d df da
f (t)a(t) = a + f , (5.5.9)
dt dt dt
d da df
a f (t) = . (5.5.10)
dt df dt
Die Regeln (5.5.7), (5.5.8) und (5.5.9) sind Produktregeln, (5.5.10) ist die Kettenre-
gel.
dn d dn−1
r(t) = r(t) . (5.5.11)
dtn dt dtn−1
114 Einführung in die Theoretische Physik
Beispiel: Wenn r(t) der Ortsvektor eines Teilchens und die Variable t die Zeit ist,
dann sind
dr(t) d2 r(t)
v(t) ≡ ≡ ṙ(t) und a(t) ≡ ≡ r̈(t) (5.5.12)
dt dt2
die Geschwindigkeit und die Beschleunigung des Teilchens zur Zeit t.
Integration:
Nun zur Integration vektorwertiger Funktionen f (t). Wir entwickeln f (t) nach einer
t-unabhängigen Basis:
f (t) = f1 (t)e1 + f2 (t)e2 + f3 (t)e3 .
Definition: Das (unbestimmte oder bestimmte) Riemann-Integral über eine vek-
torwertige Funktion f (t) ist derjenige Vektor, dessen Komponenten die jeweiligen
Integrale über die Komponentenfunktionen sind. Das unbestimmte Integral ist
Z Z Z Z
f (t) dt = e1 f1 (t) dt + e2 f2 (t) dt + e3 f3 (t) dt . (5.5.13)
Beispiel:
Von einem Teilchen sei seine Beschleunigung a = a(t) als Funktion der Zeit t be-
kannt, und außerdem seine Geschwindigkeit v(0) und sein Ort r(0) zur Zeit t = 0.
Man berechne seine Geschwindigkeit und seine Bahn als Funktionen der Zeit.
Da a(t) = dv(t)/dt, ist
Zt
v(t) = a(t0 )dt0 + v(0) .
0
Die Addition von v(0) auf der rechten Seite sorgt dafür, dass die Geschwindigkeit
bei t = 0 den vorgegebenen vektoriellen Wert annimmt. Da v = dr/dt, erhält man
die Bahn durch Berechnung des Integrals
Zt
r(t) = v(t0 )dt0 + r(0) .
0
Die Länge s(t) der zur Zeit t zurückgelegten Bahn berechnet man mit der Formel
(5.5.19) unten.
5.5 Vektorwertige Funktionen, Raumkurven 115
x2
ta = t0
t1
t2
~r(ta )
t = tN
~r(t)
x1
Bogenlänge:
Die Bogenlänge s ist die Länge der Raumkurve, die, ausgehend von einem (willkürlich
gewählten) Anfangspunkt Pa , entlang der Kurve gemessen wird. Man wählt eine dis-
∧ ∧
krete Anzahl von Punkten Pn = r(tn ) auf der Kurve, beginnend bei Pa = r(ta ) und
∧
endend bei PN = r(tN ) – siehe Abbildung 5.10. Wir setzen
t − ta
∆t = > 0,
N (5.5.16)
tn = ta + n∆t , n = 0, 1, 2, ..., N.
Die geradlinige Verbindung der Punkte ergibt einen Polygonzug der Länge
N
X −1
LN (ta , t) = |r(tn+1 ) − r(tn )|
n=0
N −1 (5.5.17)
X r(tn+1 ) − r(tn )
= ∆t.
n=0
∆t
In diesem Limes geht der Differenzenquotient aus (5.5.17) über in die Ableitung
r(tn+1 ) − r(tn ) ∆t→0 dr
−−−→
∆t dt t=tn
und aus der Summe in (5.5.17) wird ein Riemann-Integral – siehe (2.4.14):
Zt Zt q
dr(t0 ) 0
s(t) = dt = ẋ21 + ẋ22 + ẋ23 dt0 . (5.5.19)
dt0
ta ta
Beispiel: Wir betrachten eine ebene Kreisbewegung, siehe das Beispiel auf Sei-
te 112. Die Bewegung soll mit konstanter Winkelgeschwindigkeit erfolgen, d.h. der
Winkel φ in der Parametrisierung 1) auf Seite 112 ist φ = ωt, wobei die Kreisfrequenz
ω konstant ist.
r(t) = (R cos ωt, R sin ωt, 0)
dr
⇒ = (−Rω sin ωt, Rω cos ωt, 0)
dt
dr
⇒ = Rω
dt
Zt
⇒ s(t) = Rωdt0 = Rωt (setze ta = 0)
0
s
⇒ t(s) =
Rω
Damit ist die Parametrisierung dieser Kreisbewegung durch die Bogenlänge gegeben
durch s s
r(s) = R cos , R sin ,0 .
R R
Nach einem Umlauf muss s/R = 2π sein. Das entspricht der Bogenlänge s = 2πR,
also dem Umfang des Kreises.
5.5 Vektorwertige Funktionen, Raumkurven 117
x2 d~r
dt
∆~r
~r(t)
~r(t + ∆t)
x1
Abbildung 5.11: Der Vektor dr/dt ist parallel zur Tangente im Kurvenpunkt r(t).
Tangenteneinheitsvektor, Bahnkrümmung:
Nun zur geometrischen Bedeutung des Vektors dr/dt. Wir betrachten den Differenz-
vektor – siehe Abbildung 5.11:
∆r = r(t + ∆t) − r(t).
Division durch den Skalar ∆t ergibt den Vektor
∆r ∆t→0 dr
−−−→ .
∆t dt
∧
Der Vektor dr/dt ist parallel zur Tangente im Kurvenpunkt P = r(t). Die Division
dieses Vektors durch seinen Betrag ergibt den Tangenteneinheitsvektor t.
dr/dt
t≡ , |t| = 1. (5.5.22)
|dr/dt|
Wir parametriseren nun r durch die Bogenlänge, r = r(s). Verwendet man das
Resultat (5.5.20) in der Formel (5.5.22), erhält man
dr/dt dr dt dr
t≡ = = . (5.5.23)
ds/dt dt ds ds
Diese Formel liefert den Tangenteneinheitsvektor t als Funktion von s, t = t(s).
Der Vektor t hat per Definition den Betrag 1; er kann aber seine Richtung mit
t bzw. mit s ändern. Diese Richtungsänderung ist ein Maß für die Krümmung der
Bahn. Man definiert deshalb
dt(s)
Krümmung: κ ≡ ,
ds (5.5.24)
−1
Krümmungsradius: ρ ≡ κ .
Wenn die Bahn eine Gerade ist, dann ist κ = 0 und der Krümmungsradius ρ = ∞.
118 Einführung in die Theoretische Physik
Normaleneinheitsvektor:
Nach der obigen Definition von t ist
t(s) · t(s) = 1.
Die Differentiation dieser Gleichung ergibt
dt dt dt
·t+t· =0 ⇒ t· = 0.
ds ds ds
Demzufolge ist der Vektor
dt
N≡ ⊥ t.
ds
Der sog. Normaleneinheitsvektor, auch Hauptnormale oder Krümmungsvektor gen-
nannt (vgl. (5.5.24)) genannt, ist der normierte Vektor N :
dt(s)/ds (5.5.24) 1 dt
n≡ = = n(s). (5.5.25)
|dt/ds| κ ds
Man definiert einen dritten Vektor, die sogenannte Binormale b(s), durch
b ≡ t × n. (5.5.26)
Offensichtlich ist b ⊥ t und b ⊥ n und
π
|b| = |t × n| = |t| |n| sin = 1. (5.5.27)
|{z} |{z} | {z2}
1 1
1
Die drei Einheitsvektoren t(s), n(s), b(s) bilden ein rechtshändiges ONS, das mit
einem Massenpunkt auf seiner Bahnkurve r(s) mitwandert und i.A. ständig seine
Richtung ändert. Man nennt dieses ONS das begleitende Dreibein.
Hinweise:
1. Bei einer ebenen Bewegung ist b ein konstanter Einheitvektor, der immer senk-
recht auf der Bahnebene steht.
2. Ein Maß für eine nichtebene Bewegung ist die sog. Torsion. Die Differentiation
von b nach der Bogenlänge liefert unter Verwendung von db/ds ⊥ b (siehe z.B.
das Lehrbuch von Lang und Pucker, Kapitel 7):
db
= −τ n .
ds
Diese Formel definiert die Torsion oder Windung τ an einen Kurvenpunkt P ,
dem der Wert s entspricht. Sie charakterisiert in der unmittelbaren Umgebung
von P die Abweichung der Kurve von einer ebenen Kurve. Ein Beispiel für eine
Kurve mit τ 6= 0 ist die in einer Übungsaufgabe behandelte Schraubenlinie
(Helix).
3. Bei einer Geraden verschwinden sowohl die Krümmung als auch die Torsion.
5.5 Vektorwertige Funktionen, Raumkurven 119
dr dr ds (5.5.23) ds
v(t) = = = t. (5.5.28)
dt ds dt dt
Gleichung (5.5.20) besagt, dass ds/dt der Betrag der Geschwindigkeit ist:
ds
v(t) ≡ |v(t)| = . (5.5.29)
dt
Nochmaliges Differenzieren von (5.5.28) nach t ergibt die Beschleunigung a(t):
d2 r dt dt ds
a(t) = 2
= v̇t + v = v̇t + v . (5.5.30)
dt dt ds dt
Unter Verwendung von (5.5.25), (5.5.24) und (5.5.29) erhält man
d2 r v2
a(t) = = v̇t + n. (5.5.31)
dt2 ρ
Man nennt die Komponente längs t die Tangentialbeschleunigung
at ≡ v̇ ,
v2
an ≡ ,
ρ
siehe Abbildung 5.12.
Hinweis: Die Formeln (5.5.29) und (5.5.31) liefern per se natürlich keine Vorher-
sage der Beträge v(t) und v̇(t) der Geschwindigkeit und der Beschleunigung eines
Teilchens, das sich unter dem Einfluß einer Kraft bewegt. Um durch Rechnung her-
auszufinden, ob das Teilchen eine Tangential- und/oder eine Normalbeschleunigung
erfährt, muss man zunächst die Newtonsche Bewegungsgleichung
mr̈(t) = F
lösen, d.h. die Bahn r = r(t) für vorgegebene Anfangsbedingungen r(t0 ) = r 0 und
ṙ(t0 ) = v 0 bestimmen. Dies besprechen wir im Mechanik-Teil der Vorlesung.
120 Einführung in die Theoretische Physik
x2
~b
~t
·
~n v2
ρ
~b
v̇ ·
~n ~t
v2
v̇ ρ
x1
Matrizen, Determinanten,
Eigenwertproblem
Den Begriffen Matrix und Determinante einer Matrix begegnet man in der Mathe-
matikausbildung in der Regel zum ersten Mal bei der Lösung linearer algebraischer
Gleichungssysteme. Ein solches System lässt sich mit Hilfe einer Matrix in kompak-
ter Form darstellen. Die Determinante dieser Matrix liefert ein Kriterium dafür, ob
das Gleichungssystem lösbar ist.
Wir führen hier Matrizen in einem anderen Kontext ein. Drehungen von Koor-
dinatenystemen im Raum werden durch einen bestimmten Typ von Matrizen be-
schrieben. Dies bietet uns die Möglichkeit zu präzisieren, wie die Begriffe Skalar und
Vektor in der nichtrelativistischen Physik verwendet werden. Danach besprechen
wir die Eigenschaften bestimmter Matrix-Typen und behandeln die Lösung linearer
Gleichungssysteme. Zum Schluss dieses Kapitels behandeln wir das sog. Eigenwert-
problem. Diese Problemstellung tritt in vielen Gebieten der Mathematik und Physik
auf.
definiert ist. Mit diesem Skalarprodukt werden die Regeln der euklidischen Geome-
trie auf algebraische Rechenoperationen im R3 zurückgeführt. Insbesondere erhält
man
122 Einführung in die Theoretische Physik
• a·b=0 ⇔ a ⊥ b,
• der Abstand zwischen zwei Punkten mit Koordinaten (x1 , x2 , x3 ) und (y1 , y2 , y3 )
bezüglich einer ONB ist gegeben durch
p p
d = |x − y| = (x − y) · (x − y) = (x1 − y1 )2 + (x2 − y2 )2 + (x3 − y3 )2 ,
20
x2 ~x
10
φ21
x01
x02
φ22
= φ12
φ
φ11 = φ 1
0 x1
Wir multiplizieren nun Gl. (6.1.2) skalar mit e01 und benutzen (6.1.4):
x0 = A x, (6.1.11)
wobei x0 und x die Spaltenvektoren gebildet aus den Komponenten des Vektors x
bezüglich der beiden ONB bezeichnen. Wir benutzen hier diese bereits in (5.3.5),
Kapitel 5 eingeführte Notation, um zwischen dem Vektor x und seinen Komponen-
ten x bzw. x0 bezüglich der ONB {ei } bzw.{e0i } explizit zu unterscheiden.
Fazit: Bei einem Wechsel der ONB, die einer Drehung des Koordinatensystems
in zwei Raumdimensionen entspricht, ändern sich die Komponenten des Vektors x
gemäß (6.1.11). Der Vektor x bleibt unverändert.
Die Matrix A in (6.1.11) ist eine 2 × 2 Drehmatrix. Die Eigenschaften dieser Dreh-
matrix und die Umkehrung von (6.1.11) besprechen wir im folgenden Abschnitt.
e02· = e02 0
a21 e2 · e1 0
+a22 e2 · e2 .
| {z } | {z } | {z }
1 a21 a22
Somit
1 = a211 + a212 ,
(6.1.12)
1 = a221 + a222 ,
oder kompakt
2
X
a2ij = 1 i = 1, 2. (6.1.13)
j=1
Wir multiplizieren die erste Gleichung in (6.1.3) mit e02 , die zweite Gleichung mit e01
und benutzen, dass e01 ⊥ e02 . Wir erhalten
Die Gleichungen (6.1.12) bzw. (6.1.13) und (6.1.14) können folgendermaßen zusam-
mengefasst werden:
X2
aik ajk = δij i, j = 1, 2. (6.1.15)
k=1
Somit
cos φ sin φ
2 × 2 Drehmatrix A = . (6.1.16)
− sin φ cos φ
Man überzeugt sich sofort davon, dass die Matrixelemente in (6.1.16) die Gleichun-
gen (6.1.15) erfüllen.
Drehmatrizen in d = 3 Raumdimensionen:
Die obigen Gleichungen (6.1.2) bis (6.1.15) lassen sich sofort auf d = 3 Dimensionen
(bzw. d > 3) verallgemeinern. Wir betrachten zwei kartesische Koordinatensysteme
K und K 0 , definiert durch die ONB {e1 , e2 , e3 } bzw. {e01 , e02 , e03 } mit demselben
Ursprung. K und K 0 seien gegeneinander im Raum verdreht. Die Entwicklung eines
gegebenen Vektors x nach den beiden ONB ist
Die Komponenten x0i erhalten wir aus den Komponenten xj durch die Verallgemei-
nerung von Gleichung (6.1.9) auf drei Raumdimensionen:
3
X
x0i = aij xj i = 1, 2, 3, (6.1.18)
j=1
wobei
aij = e0i · ej = cos φij i, j = 1, 2, 3, (6.1.19)
siehe (6.1.4). In Matrixschreibweise
x0 = Ax , (6.1.20)
126 Einführung in die Theoretische Physik
wobei
a11 a12 a13
A = a21 a22 a23 . (6.1.21)
a31 a32 a33
Die Matrixelemente aij einer 3 × 3 Drehmatrix A sind durch (6.1.19) festgelegt.
Analog zu (6.1.15) gelten die folgenden 9 Gleichungen (drei dieser Gleichungen sind
redunant):
X3
aik ajk = δij i, j = 1, 2, 3. (6.1.22)
k=1
Eine Drehmatrix, d.h. eine Matrix mit der Eigenschaft (6.1.22) bzw. (6.1.15) bezeich-
net man auch als orthogonale Matrix. Diese Gleichungen besagen folgendes: Setzt
man i = j erhält man ak 2 = 1 für k = 1, 2, 3, d.h. die Länge jedes Zeilenvektors
einer orthogonalen Matrix ist eins. Für i 6= j besagt (6.1.22), dass die drei Zeilen-
vektoren orthogonal sind. Unten werden wir sehen, dass diese beiden Aussagen auch
für die Spaltenvektoren einer orthogonalen Matrix gelten. Drehmatrizen sind spezi-
elle orthogonale Matrizen, die noch die Zusatzbedingung det A = +1 erfüllen, siehe
Punkt 6 auf Seite 136) unten. Diese Bedingung entspricht folgendem Sachverhalt.
Drehungen führen Rechtssysteme (RS) in Rechtsysteme und Linkssysteme (LS) in
Linkssysteme über, aber niemals RS ↔ LS. Um das zu bewerkstelligen, muss man
neben einer Drehung noch eine (allgemein eine ungerade Anzahl von) Spiegelung(en)
an einer (der) Koordinatenebene(n) durchführen. Diese Transformation wird durch
eine orthogonale Matrix mit det A = −1 vermittelt, siehe unten.
bzw.
3
X 3
X
x00i = cik xk , wobei cik = bij ajk . (6.1.23)
k=1 j=1
6.1 Drehungen eines Koordinatensystems 127
Gleichung (6.1.23) liefert die 3 × 3 Matrix C = (xij ), die die obige Drehung in einem
Schritt vermittelt:
C
K− → K 00 .
Gleichung (6.1.23) ist gerade die Matrix-Multiplikationsregel für das Produkt BA
der beiden Matrizen – siehe Gl. 6.4.1 unten. Somit haben wir in kompakter Schreib-
weise
x00 = C x = BA x. (6.1.24)
Wir betrachten einen beliebigen Vektor x in R3 . Für seine Koordinaten gilt (a)
x0 = Ax und (b) A−1 x0 = x.
)
(b) eingesetzt in (a) ⇒ x0 = AA−1 x0
⇒ AA−1 = A−1 A = I, (6.1.25)
(a) eingesetzt in (b) ⇒ x = A−1 Ax
wobei
1 0 0
I = (δij ) = 0 1 0 (6.1.26)
0 0 1
die dreidimensionale Einheitsmatrix ist.
Die Matrixgleichung (6.1.25) definiert allgemein die zu einer Matrix A inverse
Matrix A−1 – falls diese existiert. Wie man sie im allgemeinen Fall berechnet, bespre-
chen wir in den Abschnitten 6.4.2 und 6.5.3. Im vorliegenden Fall einer orthogonalen
Matrix A können die Matrixelemente (A−1 )ij von A−1 leicht berechnet werden.
3
X
AA−1 = I ⇔ aik (A−1 )kj = δij . (6.1.27)
| {z }
k=1 ajk
Die Identität
(A−1 )kj = ajk (6.1.28)
folgt aus dem Vergleich von (6.1.27) mit der die orthogonalen Matrizen charakteri-
sierenden Gleichungen (6.1.22). Das heißt, die Matrixelemente der inversen Drehma-
trix A−1 erhält man durch Vertauschen der Zeilen und Spalten von A. Das Ergebnis
bezeichnet man als die zu A transponierte Matrix AT .
128 Einführung in die Theoretische Physik
2
~x0
~x
~e2
1
~e1
d.h. (AT )ij = aji . Im Falle einer orthogonalen Matrix A besagt das Ergebnis (6.1.28),
dass die Inverse einer orthogonalen Matrix A durch A−1 = AT gegeben ist.
wobei R = (Rij ) die zugehörige Drehmatrix ist. (Im Folgenden bezeichnen wir or-
thogonale Matrizen, insbesondere Drehmatrizen, mit R.) Eine solche Transformation
wird passive Transformation genannt.
6.3 Skalare und Vektoren im euklidischen Raum 129
Die folgende Operation bezeichnet man als aktive Transformation. Wir be-
trachten einen Vektor x in einem durch e1 , e2 , e3 definierten Koordinatensystem
K. Der Vektor x werde nun in K gedreht; das Ergebnis ist der Vektor x0 – siehe
Abbildung 6.2.
Drehung
x −−−−→ x0 .
Die Entwicklung von x und x0 nach der ONB {ei } ergibt
x = x1 e1 + x2 e2 + x3 e3 ,
(6.2.2)
x0 = x01 e1 + x02 e2 + x03 e3 .
wobei R̃ die orthogonale Matrix ist, die die gewünschte Drehung vermittelt. Die
Transformationsgesetze (6.2.1) und (6.2.3) sind formal identisch, haben aber ver-
schiedene Bedeutungen. In der Physik wendet man sowohl passive als auch aktive
Transformationen an. Eine passive Transformation kommt zum Zuge, wenn man die
Vektoren eines physikalischen Systems bezüglich zweier gegeneinander verdrehter
Koordinatensysteme analysiert. Eine aktive Transformation verknüpft zwei physi-
kalische Systeme, die durch eine Drehung ineinander übergeführt werden können.
Diese Definition bezieht sich nicht nur auf passive, sondern auch auf aktive Trans-
formationen; R ist die zugehörige Drehmatrix.
Das Transformationsgesetz gilt offensichtlich für die kartesischen Komponenten
der uns bereits bekannten Vektoren , z.B. für die Komponenten
Beispiele:
• Masse, Temperatur, Zeit.
• Das Skalarprodukt a · b von zwei Vektoren a, b.
• Der Abstand |x − y| zweier Vektoren x, y.
Die beiden letztgenannten Aussagen zeigen wir in einer Übungsaufgabe.
Dreier-Tensoren: Der Vollständigkeit halber gehen wir hier noch auf den Begriff
des Dreier-Tensors (oder euklidischen Tensors) ein. Sie benötigen Objekte dieser Art
aber erst in der Vorlesung Theoretische Physik I im Kapitel über Starre Körper.
Definition: Ein Dreier-Tensor 2. Stufe ist ein Objekt T = (tij ) (i, j = 1, 2, 3)
bestehend aus 3×3 = 9 Komponenten, das sich bei einer Drehung eines kartesischen
Koordinatensystems wie folgt transformiert:
3
X
t0ij = Rik Rjl tkl . (6.3.2)
k,l=1
Beispiele:
• Seien x1 , x2 , x3 die Komponenten eines Dreier-Vektors, d.h. sie transformieren
unter orthogonalen Transformationen wie (6.3.1). Dann transformiert sich das
9-komponentige Objekt (xi xj ) wie (6.3.2) und ist somit ein Dreier-Tensor 2.
Stufe.
• Das in (5.4.7), Kapitel 5 definierte Kronecker-Delta-Symbol transformiert wie
ein Dreier-Tensor 2. Stufe - und zwar ist dieses Objekt invariant unter ortho-
gonalen Transformationen. Wir wenden das Transformationsgesetz (6.3.2) auf
δkl = ek · el an und erhalten
3 3
X X (6.1.27)
δij0 = Rik Rjl δkl = Rik Rjk = δij . (6.3.3)
k,l=1 k=1
Definition: Ein Dreier-Tensor n-ter Stufe ist ein 3n -komponentiges Objekt (ti1 ,i2 ,...,in ),
das sich bei einer Drehung eines kartesischen Koordinatensystems wie folgt trans-
formiert:
3
X
t0i1 ...in = Ri1 k1 . . . Rin kn tk1 ...kn . (6.3.4)
k1 ,...,kn =1
6.4 Rechenregeln für Matrizen 131
Merkregel: Bei einem Tensor n-ter Stufe (ti1 i2 ...in ) transformiert sich jeder Index il
wie ein Vektorindex. In der Tensor-Terminologie ist ein Vektor (präziser: die Kom-
ponenten eines Vektors) ein Tensor 1. Stufe und ein Skalar ein Tensor 0. Stufe.
Dreier-Skalare und -Vektoren bzw. allgemein Dreier-Tensoren n-ter Stufe sind somit
durch ihr Transformationsverhalten unter räumlichen Drehungen, bzw. etwas allge-
meiner, unter orthogonalen Transformationen im dreidimensionalen Raum definiert.
Die definierenden Transformationsgesetze (6.3.1), (6.3.2) bzw. allgemein (6.3.4) be-
sagen, dass das transformierte Objekt zwar i.A. verschieden vom Ausgangsobjekt
ist, aber in jedem Fall die gleiche Form hat. Man sagt, Dreier-Tensoren n-ter Stu-
fe transformieren sich kovariant (= forminvariant) unter räumlichen Drehungen.
Skalare, also Tensoren 0. Stufe sind nicht nur kovariant, sondern invariant unter
diesen Transformationen. Das Kronecker-Delta ist ein invarianter Tensor 2. Stufe.
Ein weiterer invarianter Tensor ist das -Symbol, siehe unten.
Die Begriffe Dreier-Skalar und -Vektor bzw. Dreier-Tensor dienen vor allem da-
zu, diese Objekte von sog. Vierer-Skalaren, Vierer-Vektoren bzw. Vierer-Tensoren
zu unterscheiden. Das sind Objekte, die durch ihr Verhalten bezüglich Lorentz-
Transformationen definiert sind. Diese Transformationen werden im Rahmen der
Vorlesungen über Theoretische Physik erst am Ende der Vorlesung Theoretische
Physik I im Kapitel über Spezielle Relativitätstheorie besprochen. In der nichtrelati-
vistischen Physik bezeichnet man Dreier-Skalare und -Vektoren einfach als Skalare
bzw. Vektoren.
Zum Schluss dieses Abschnitts noch eine Bemerkung zum -Symbol (5.4.26) aus
Kapitel 5, das auch total antisymmetrischer -Tensor 3. Stufe genannt wird. Diese
Bezeichnung rührt daher, dass sich dieses Objekt unter orthogonalen Transforma-
tionen folgendermaßen transformiert:
3
X
0i1 i2 i3 = Ri1 k1 Ri2 k2 Ri3 k3 k1 k2 k3 = (det R) i1 i2 i3 . (6.3.5)
k1 ,k2 ,k3 =1
Dies wird in einer Übungsaufgabe bewiesen. Gl. (6.3.5) besagt, dass der -Tensor
unter räumlichen Drehungen (det R = +1) invariant ist, aber bei orthogonalen
Transformationen mit det R = −1 sein Vorzeichen wechselt.
Die Matrixelemente einer Matrix können reelle oder komplexe Zahlen sein. Wir
betrachten hier in der Regel nur reelle Matrizen.
132 Einführung in die Theoretische Physik
Spalte k
k
ai1 · b1k
a a(i−1)2 a(i−1)3 ...
(i−1)1 +ai2 · b2k
ai1 ai2 ai3 ...
Zeile i
+ai3 · b3k
=
cik
i
a(i+1)1 a(i+1)2 a(i+1)3 ...
.. ..
. .
A B C
6.4.2 Rechenregeln
1. C = A + B ist definiert durch cij = aij + bij ∀i, j.
2. λA ≡ (λaij ), wobei λ eine reelle oder komplexe Zahl ist. Jedes Matrixelement
wird mit λ multipliziert.
(AB)T = B T AT . (6.4.2)
Inverse Matrix
Für quadratische, also n × n Matrizen A kann man sich fragen, ob die zu A inverse
Matrix A−1 existiert. Diese Matrix muss, wie bereits oben erwähnt, die folgenden
Matrixgleichungen erfüllen:
AA−1 = A−1 A = I. (6.4.3)
134 Einführung in die Theoretische Physik
Für eine spezielle Klasse von quadratischen Matrizen, den Drehmatrizen R, ha-
ben wir bereits gesehen, dass R−1 existiert; und zwar ist R−1 = RT , siehe (6.1.30).
Wir fragen hier i) nach dem Kriterium für die Existenz der Inversen A−1 einer all-
gemeinen quadratischen Matrix und ii) danach, wie man A−1 berechnet.
Die Matrix A−1 hat n2 Matrixelemente. Gl. (6.4.3) ist in der Tat ein lineares Glei-
chungssystem bestehend aus n2 Gleichungen für diese n2 unbekannten Matrixele-
mente. Die Lösung eines solchen Gleichungssystems ist für n > 2 ohne ein systema-
tisches Verfahren sehr mühevoll. Bei der systematischen Lösungsmethode, die unten
besprochen wird, tritt eine neue mathematische Größe auf, die sog. Determinante
einer Matrix A, die wir im nächsten Abschnitt behandeln. Wir werden sehen, dass
i) der Wert der Determinante von A darüber entscheidet, ob A−1 existiert, ii) dass
bei der Berechnung dieser Matrix ebenfalls diese Determinante auftritt.
6.5 Determinanten
Den Begriff der Determinante einer quadratischen Matrix kennen Sie vermutlich
schon aus der Schule; er tritt bei der Lösung von linearen Gleichungssystemen auf
(siehe unten).
Sei A eine n × n Matrix. Die Determinante von A ist eine Zahl, die die Matrix
A kennzeichnet. Wir definieren sie hier durch folgende rekursive Vorschrift:
a11 · · · a1n
.. ..
det A ≡ |A| = = a11 M11 − a12 M12 + a13 M13 − ... + (−1)n+1 a1n M1n .
. .
an1 · · · ann
(6.5.1)
Dabei sind die Mkl die sogenannten Unterdeterminanten der Untermatrizen A(kl) . 1
Die Matrix A(kl) erhält man aus der Matrix A durch Streichen der Zeile k und der
Spalte l. Das ergibt eine (n − 1) × (n − 1) Matrix. Mkl bezeichnet die Determinante
dieser Matrix A(kl) .
Die Formel (6.5.1) ist rekursiv. Sie führt eine Determinante n-ten Grades auf eine
Summe von Determinanten (n − 1)-ten Grades zurück, usw., solange bis man bei
1 × 1 Matrizen angelangt ist, deren Determinante durch das jeweilige Matrixelement
gegeben ist.
Vorsicht: Verwechseln Sie die Notation |A| nicht mit dem Betragszeichen. Wenn A
eine reelle Matrix ist, dann ist det A eine reelle Zahl, diese kann größer, kleiner oder
gleich Null sein.
Wir machen uns die Formel (6.5.1) für 2 × 2 und 3 × 3 Matrizen klar.
1
Der Doppelindex (kl) ist hier ein Zählindex – nicht zu verwechseln mit dem Doppelindex für
die Matrixelemente einer Matrix.
6.5 Determinanten 135
a22 a23 a21 a23 a21 a22
= a11
− a12
+ a13
a32 a33 a31 a33 a31 a32
= a11 a22 a33 − a11 a23 a32 − a12 a21 a33 + a12 a23 a31 + a13 a21 a32 − a13 a22 a31
(6.5.3)
Merkregel (Sarrus-Regel):
a11 a12 a13 a11 a12 a13 a11 a12
a21 a22 a23 ⇐⇒ a21 a22 a23 a21 a22
a31 a32 a33 a31 a32 a33 a31 a32
Darstellung mit Hilfe des -Symbols: Unter Benutzung der Werte des total
antisymmetrischen -Symbols aus Kapitel 5 sieht man sofort, dass die Determinante
(6.5.3) einer 3 × 3 Matrix auch folgendermaßen dargestellt werden kann:
3
X 3
X
det A = ijk ai1 aj2 ak3 = ijk a1i a2j a3k . (6.5.4)
i,j,k=1 i,j,k=1
Diese Relationen zeigt man durch explizites Ausschreiben und Vergleich mit (6.5.3).
Die zweite Gleichung belegt am Beispiel einer 3 × 3 Matrix, dass det A = det(AT ),
siehe unten.
Ausgehend von dieser Darstellung kann man die oben erwähnte Relation (6.3.5)
beweisen.
136 Einführung in die Theoretische Physik
det D = d1 · d2 · · · dn .
Insbesondere ist
det I = 1.
4. det(AT ) = det A.
5. Multiplikationsgesetz:
Somit
det R = ±1.
Drehmatrizen sind definiert durch die Zusatzbedingung det R = +1. Beschreibt
R eine Spiegelung an einer Koordinatenebene oder die Spiegelung am Ursprung
eines dreidimensionalen Koordinatensystems, dann ist det R = −1.
Weitere nützliche Rechenregeln lernen Sie in der Vorlesung über Höhere Mathematik.
6.5.2 Entwicklungssatz
Die Berechnungsvorschrift (6.5.1) kann man verallgemeinern. Anstelle nach Zeile 1
kann man nach einer beliebigen Zeile i entwickeln. Es gilt
det A = (−1)i−1 ai1 Mi1 − ai2 Mi2 + ... + (−1)n+1 ain Min
n
X (6.5.5)
= (−1)i+j Mij aij .
j=1
6.5 Determinanten 137
Beweis: Wenn i = 1, dann ist (6.5.5) identisch mit (6.5.1). Wenn i > 1, dann
vertauschen wir die i-te Zeile mit der (i − 1)-ten, usw., solange bis die i-te Zeile zur
ersten Zeile geworden ist und wenden dann (6.5.1) an. Die Vertauschungen erzeugen
nach der Rechenregel 1 jedesmal einen Faktor (−1), also erhält man insgesamt den
Faktor (−1)i−1 .
6.5.3 Anwendungen
Zunächst zwei simple, aber nützliche Anwendungen.
Vektorprodukt:
Das Vektorprodukt
a × b = e1 (a2 b3 − a3 b2 ) + e2 (a3 b1 − b3 a1 ) + e3 (a1 b2 − a2 b1 ). (6.5.6)
kann als Determinante dargestellt werden.
e1 e2 e3
a × b = a1 a2 a3 . (6.5.7)
b1 b2 b3
Man prüft das sofort z.B. mit Hilfe der o.g. Sarrus-Regel nach.
Spatprodukt:
Das Spatprodukt kann ebenfalls als Determinante geschrieben werden:
a1 a2 a3 a1 b1 c1
a · (b × c) = b1 b2 b3 = a2 b2 c2 . (6.5.8)
c1 c2 c3 a3 b3 c3
Hier sind, wie üblich, die ai , bi , ci die Komponenten der jeweiligen Vektoren bezüglich
einer ONB. Die erste Gleichung ergibt sich sofort aus der Darstellung von b×c durch
(6.5.6) bzw. (6.5.7) oder durch direktes Ausrechnen. Das zweite Gleichheitszeichen
folgt aus det A = det(AT ).
Gleichung (6.5.8) impliziert einen wichtigen Sachverhalt: Wir wissen, dass
a · (b × c) = 0, wenn z.B. zwei der drei Vektoren kollinear sind oder allgemeiner,
wenn die drei Vektoren in einer Ebene liegen (man sagt, die drei Vektoren sind
koplanar), also linear abhängig sind. Aus der Darstellung (6.5.8) folgt somit, dass
die Determinante einer 3 × 3 Matrix A gleich null ist,
det A = 0, (6.5.9)
wenn ein Zeilenvektor (Spaltenvektor) ein Vielfaches eines anderen Zeilenvektors
(Spaltenvektors) ist, oder wenn er eine Linearkombination der beiden anderen Zei-
lenvektoren (Spaltenvektoren) ist.
Diese Aussagen gelten auch für n × n Matrizen A.
138 Einführung in die Theoretische Physik
AA−1 = A−1 A = I.
Zunächst müssen wir uns fragen, unter welcher Bedingung A−1 existiert. Dazu be-
rechnen wir die Determinante der Matrizen auf der linken und rechten Seite dieser
Definitionsgleichung:
Die Matrixelemente von A−1 sind durch folgende Formel gegeben (ohne Beweis):
(−1)i+j
(A−1 )ij = Mji . (6.5.11)
det A
Die Mji sind die unterhalb von (6.5.1) definierten Unterdeterminanten. Beachten
Sie die Anordnung der Indizes auf der linken und rechten Seite von (6.5.11)! Einen
Beweis dieser Formel findet man z.B. in den zitierten Büchern von Großmann und
Nolting.
Beispiel:
1 4
A= ⇒ det A = −18.
5 2
Die Anwendung der Formel (6.5.11) ergibt für die Matrixelemente von A−1 :
1 2
−1 2
(A )11 = − (−1) M11 = −
18 18
1 4
−1 3
(A )12 = − (−1) M21 = +
18 18 ⇒ A−1 A = AA−1 = I.
1 5
(A−1 )21 = − (−1)3 M12 = +
18 18
−1 1 4 1
(A )22 = − (−1) M22 = −
18 18
Lineare Gleichungssysteme:
Wir betrachten hier nur den Fall n linearer Gleichungen mit n Unbekannten.
6.5 Determinanten 139
a) Inhomogenes Gleichungssystem:
a11 x1 + · · · + a1n xn = b1
.. .. .. (6.5.12)
. . .
an1 x1 + · · · + ann xn = bn ,
wobei die aij , bk gegeben und die xl gesucht sind. Eine kompakte Schreibweise
von (6.5.12) ist
Ax = b. (6.5.13)
Beweis: Wenn det A 6= 0, dann existiert die zu A inverse Matrix A−1 . Multi-
pliziere die Matrixgleichung (6.5.13) von links mit A−1 .
−1 −1
|A{zA} x = A b
I
⇒ x = A−1 b. (6.5.14)
det Ai
xi = , i = 1, 2, ..., n. (6.5.15)
det A
Die Matrix Ai erhält man durch Ersetzung des i-ten Spaltenvektors von A
durch b, d.h.
a11 · · · a1(i−1) b1 a1(i+1) · · · a1n
Ai = ... .. .. .. .. .
. . . .
an1 · · · an(i−1) bn an(i+1) · · · ann
Eine Herleitung von (6.5.15) findet man z.B. im zitierten Buch von Nolting.
x1 + x2 + x3 = 2,
3x1 + 2x2 + x3 = 4,
5x1 − 3x2 + x3 = 0.
140 Einführung in die Theoretische Physik
1 2 1 1 1 2
A2 = 3 4 1 A3 = 3 2 4
5 0 1 5 −3 0
⇒ det A2 = −12 ⇒ det A3 = −6.
b) Homogenes Gleichungssystem:
Ax = 0. (6.5.16)
x1 = x2 = ... = xn = 0. (6.5.17)
6.6 Eigenwerte, Eigenvektoren, Diagonalisierung reell-symm. Matrizen 141
Notation: Wir benutzen hier, d.h. in (6.6.1) und im Folgenden das Symbol v
anstelle von v, um Spaltenvektoren zu kennzeichnen – sonst werden die Formeln
ziemlich hässlich. Somit
v1
v = v2 Spaltenvektor,
v3
v T = (v1 , v2 , v3 ) Zeilenvektor.
Zur Kennzeichnung des Skalarprodukts empfiehlt es sich hier, die Matrixnotation
pedantisch anzuwenden:
w1 X3
T
v
| {zw} = (v1 , v2 , v3 ) w2 = vi wi = v · w.
Zeilenvektor × w3 i=1
Spaltenvektor
Beispiele:
1.
10 −3
A=
−3 2
10 − λ −3
⇒ det(A − λI) = det = λ2 − 12λ + 11.
−3 2−λ
2.
a 0
A= Diagonalmatrix
0 b
Es ist det(A − λI) = (a − λ)(b − λ). D.h. die Diagonalelemente einer Dia-
gonalmatrix sind identisch mit ihren Eigenwerten; in diesem Beispiel λ1 = a,
λ2 = b.
1. λ1 6= λ2 6= λ3 6= λ1 .
Somit ist ein Eigenvektor nur bis auf einen Faktor eindeutig definiert. Deswe-
gen ist es sinnvoll, v auf Eins zu normieren, |v| = 1. Im Folgenden bezeichnen
die v i normierte Eigenvektoren,
|v i | = 1. (6.6.7)
Av j = λj v j . (6.6.8)
Wir multiplizieren diese Gleichung von links mit v Ti und benutzen, dass nach
Voraussetzung AT = A. Die linke Seite von (6.6.8) geht über in
Regel 4
v Ti Av j = AT v i )T v j = (λi v Ti )v j = λi v i · v j .
(|{z} (6.6.9)
S. 133
A
λj v i · v j . (6.6.10)
(λi − λj )v i · v j = 0. (6.6.11)
(a) λi 6= λj ⇒ vi ⊥ vj .
(b) λi = λj = λ. In diesem Fall können v i und v j beliebig sein. Die Möglich-
keit der linearen Abhängigkeit, v i = cv j , ist durch die Normierungsbe-
dingung (6.6.7) jedoch ausgeschlossen, siehe die Vereinbarung unter 1).
Somit müssen v i , v j linear unabhängig sein, d.h. sie spannen eine zwei-
dimensionale Ebene E auf. Jeder Vektor x ∈ E lässt sich deshalb als
Linearkombination dieser beiden Vektoren darstellen:
x = av i + bv j a, b ∈ R.
4
Die Zahl c kann auch komplex sein.
6.6 Eigenwerte, Eigenvektoren, Diagonalisierung reell-symm. Matrizen 145
Man kann deshalb zwei beliebige, normierte Vektoren aus E wählen, die
senkrecht aufeinander stehen.
Folgerungen:
Aus (a) folgt: Wenn die Eigenwerte einer reell-symmetrischen n×n Matrix alle paar-
weise verschieden sind, dann gehört zu jedem Eigenwert λi genau ein Eigenvektor
v i , der einen eindimensionalen Raum, den sog. Eigenraum Ei zum Eigenwert λi auf-
spannt. Die verschiedenen Eigenräume sind orthogonal.
Wenn ein Eigenwert einer reell-symmetrischen n × n Matrix (n ≥ 3) dreifach ent-
artet ist, λi = λj = λk = λ, dann folgt analog zu (b), dass in diesem Fall der zu-
gehörige Eigenraum dreidimensional ist. Dieser Eigenraum wird aufgespannt durch
drei beliebige, linear unabhängige Vektoren v i , die Lösungen des Gleichungssystems
Av i = λv i sind. Man wählt o.B.d.A. orthogonale Vektoren. Der Fall einer l-fachen
Entartung (l ≤ n) sollte klar sein.
Fazit: Die obigen Betrachtungen 1) und 2) zeigen, dass für eine reell-symmetrische
n × n Matrix A folgendes gilt: Zu den n reellen Eigenwerten dieser Matrix gibt es n
normierte Eigenvektoren v i , die senkrecht aufeinander stehen.
Beispiel: Wir machen uns anhand der Matrix A aus Beispiel 1 auf Seite 143
klar, wie man die zu den Eigenwerten λ1 = 1 und λ2 = 11 von A gehörenden
Eigenvektoren berechnet. Wir müssen die beiden folgenden Gleichungssysteme lösen:
Av 1 = v 1 und Av 2 = 11v 2 .
• λ1 = 1 :
9 −3 v1,1
(A − 1I)v 1 = 0 ⇒ = 0.
−3 1 v1,2
Alle Werte (v1,1 , v1,2 ), die 3v1,1 = v1,2 erfüllen, sind Lösungen dieses Glei-
chungsystems. Wir setzen
v1,1 = t t Normierung 1 1
⇒ v1 = −→ v 1 = √ .
v1,2 = 3t 3t 10 3
• λ2 = 11 :
−1 −3 v2,1
(A − 11I)v 2 = 0 ⇒ = 0.
−3 −9 v2,2
146 Einführung in die Theoretische Physik
Wir setzen
v2,1 = t t Normierung 1 3
⇒ v2 = −→ v2 = √ .
v2,2 = − 3t − 3t 10 −1
Offensichtlich ist v 1 ⊥ v 2 . Beachten Sie, dass die Vorzeichen von v 1 und v 2 frei
wählbar sind.
v 1 = RT e1 , v 2 = RT e2 , v 3 = RT e3 , (6.6.16)
nachrechnen!.
Die Physiker nennen das Hauptachsentransformation. Der Begriff wird unten erklärt.
Beispiele:
1) Wir betrachten wieder die Matrix A aus Beispiel 1 auf Seite 143. Die normierten
Eigenvektoren dieser Matrix wurden auf Seite 145 berechnet. Wir bilden mit diesen
Eigenvektoren die in (6.6.13) definierte orthogonale Matrix
v1,1 v1,2 1 1 3 T 1 1 3
R= =√ ⇒ R =√
v2,1 v2,2 10 3 −1 10 3 −1
T 1 1 3 10 −3 1 3 1 0
⇒ RAR = = .
10 3 −1 −3 2 3 −1 0 11
Hinweis: R ist zwar eine orthogonale Matrix, aber in diesem Beispiel keine reine
Drehmatrix, weil det R = −1. Wie bereits betont wurde, ist das Vorzeichen der
Eigenvektoren v 1 und v 2 jedoch beliebig; wir hätten z.B.
1 3 0 1 −3
anstelle von v 2 = √ den Eigenvektor v 2 = √
10 −1 10 +1
wählen können. Die resultierende Matrix
0 1 1 −1
R =√ ⇒ det R0 = +1
10 3 1
ist eine Drehmatrix. Das Resultat der Hauptachsentransformation bleibt gleich:
R0 AR0T = diag(1, 11).
2) Sei A eine reell-symmetrische n × n Matrix, deren Eigenwerte n-fach entartet
sind: λ1 = . . . = λn = λ. Sei R die orthogonale Matrix, die A diagonalisiert, d.h.
RART = λI. Daraus folgt, dass A = λRT IR = λI.
148 Einführung in die Theoretische Physik
Fazit: In diesem Schritt haben wir gezeigt, wie man für eine gegebene reell-symme-
trische Matrix A aus ihren normierten Eigenvektoren eine orthogonale Matrix R
konstruieren kann, so dass RART = Λ eine Diagonalmatrix ist. Diese Matrixtrans-
formation entspricht geometrisch dem Übergang in ein neues Koordinatensystem.
Das sieht man wie folgt. In der ,,alten” Basis lautet die Eigenwertgleichung:
Av i = λi v i . (6.6.18)
Man erinnere sich, dass v i den Spaltenvektor bezeichnet, dessen Komponenten die
Entwicklungskoeffizienten des jeweiligen Eigenvektors nach der alten Basis sind. Wir
formen die Gleichung (6.6.18) mit Hilfe der Identität I = RT R folgendermaßen um:
Wir setzen (6.6.19) in (6.6.18) ein und multiplizieren von links mit R. Dann
T
RAR Rv i = λi Rv i
| {z } |{z} |{z}
Λ ṽ i ṽ i
⇒ Λṽ i = λi ṽ i ,
R = (v 1 , v 2 , v 3 ) (6.6.20)
Wir besprechen in diesem Kapitel einige für uns wichtige Aspekte der Differential-
und Integralrechnung für reelle Funktionen mehrerer reeller Variablen
f (x1 , x2 , ..., xn ), x1 , x2 , ..., xn ∈ R . (7.0.1)
Zunächst zum Begriff des Feldes in der Physik.
Beispiele:
1. Temperatur an einem Punkt (x1 , x2 , x3 ) der Erdatmosphäre zur Zeit t:
T = T (x1 , x2 , x3 , t). (7.1.1)
3. Eine ortsabhängige, aber nicht explizit zeitabhängige Kraft, z.B. die Gravita-
tionskraft zwischen zwei Massenpunkten mit Massen m1 , m2 , die sich an den
Orten r 1 , r 2 befinden. Die Gravitationskraft, die das Teilchen 2 auf das Teil-
chen 1 ausübt, ist
(r 1 − r 2 )
F G,2→1 (r 1 , r 2 ) = −Gm1 m2 , (7.1.3)
|r 1 − r 2 |3
150 Einführung in die Theoretische Physik
r 1 = r 1 (t) , r 2 = r 2 (t).
4. Kräfte, die vom Ort und explizit vom Zeitpunkt ihrer Wirkung abhängen:
Felder, die nicht explizit von der Zeit abhängen, nennt man stationäre oder statische
Felder.
Dabei ist φ0 das skalare Feld, also die Funktion der Koordinaten x0i , mit der die
physikalische Größe vom gedrehten Koordinatensystem aus beschrieben wird.
Beispiele:
Die funktionale Form von φ0 erhält man durch Einsetzen der Rücktransformation
KS’ → KS, d.h.
3
X
xi = (R−1 )ij x0j (7.1.7)
j=1
in φ(x1 , x2 , x3 , t).
7.1 Felder in der Physik 151
7.1.2 Vektorfeld
In der nichtrelativistischen Physik bezeichnet man eine dreikomponentige Größe
als Vektorfeld, wenn sie sich bei Drehungen (7.1.5) des Koordinatensystems trans-
formiert wie
3
X
A0i (x01 , x02 , x03 , t) = Rij Aj (x1 , x2 , x3 , t) i = 1, 2, 3. (7.1.8)
j=1
Die funktionale Form der A0i erhält man durch Einsetzen von (7.1.7) in die rechte
Seite von (7.1.8).
Kompakte Notation:
A0 (r 0 , t) = RA(r, t), (7.1.9)
Beispiele:
Ein Vektorfeld bezeichnet man in der Mathematik auch als vektorwertige Funktion
mehrerer reeller Variablen.
Physikalische Felder sind dimensionsbehaftet. Beispiele:
Nun zurück zur Mathematik. Im Folgenden kümmern wir uns nicht um die Di-
mension des jeweiligen Feldes, d.h. der jeweiligen Funktion mehrerer reeller Varia-
blen.
152 Einführung in die Theoretische Physik
r ≡ (x, y, z, ...),
oder r ≡ (x1 , x2 , x3 , ..., xn ), (7.2.1)
oder x ≡ (x1 , x2 , x3 , ..., xn ).
• Später betrachten wir auch ONB, bei denen die Basisvektoren ei von den
Ortskoordinaten abhängen, insbesondere die Polarkoordinaten- und Zylinder-
koordinatenbasis.
• Anstelle von (7.2.5) benutzen wir oft die Spalten- oder Zeilenvektordarstellung
f1
f = ... oder f = (f1 , f2 , ..., fm ) .
fm
D.h. wir kennzeichnen in der Regel nicht mehr explizit den Unterschied zwi-
schen einem Vektorfeld f und seiner Komponentendarstellung f .
7.2 Stetigkeit, partielle Ableitungen, totales Differential 153
Zunächst betrachten wir eine reelle Funktion f (r). Die Funktion definiert eine Ab-
bildung
f : Ω ⊆ Rn 7→ R .
Wenn das Definitionsgebiet Ω der Funktion nicht der ganze Rn ist, soll es sich um
eine nichtdisjunkte = wegzusammenhängende Teilmenge des Rn handeln, die offen
ist. Mit wegzusammenhängend bezeichnet man eine Teilmenge Ω ⊂ Rn , bei der sich je
zwei Punkte x, y ∈ Ω durch einen Weg = Kurve verbinden lassen, der ganz in Ω liegt.
Beachten Sie, dass im Fall n > 1 ein wegzusammenhängendes Gebiet Ω durchaus
Löcher haben kann. Im Fall n > 2 können auch Volumina aus Ω herausgeschnitten
sein. Offen heisst, dass der Rand der Teilmenge Ω weggelassen wird. Wenn man
abgeschlossene Teilmengen zulässt, kann man die unten eingeführten Eigenschaften
der Stetigkeit und (partiellen) Differenzierbarkeit von Funktionen an einem Punkt
x0 auf dem Rand nur mit Einschränkungen definieren, nämlich für Annäherungen
an x0 innerhalb des Definitionsgebiets (vergleiche mit einseitiger Stetigkeit im Falle
von Funktionen einer Variablen, Kapitel 2). Wir wollen das hier vermeiden; deshalb
soll der Definitionsbereich Ω im Folgenden, falls nicht explizit anders definert, immer
die genannten Eigenschaften haben.
Im Abschnitt 7.7 benötigen wir noch den Begriff des einfach zusammenhängenden
Gebiets.
Möglichkeiten der graphischen Darstellung von f (r):
1. Wenn die Funktion f nur von zwei Variablen abhängt, f = f (x, y) dann ist
eine Darstellung als Fläche über der xy-Ebene möglich; siehe die in den Ab-
bildungen 7.1, 7.2 und 7.3 gezeigten Beispiele. Diese Abbildungen entsprechen
Projektionen von Raumpunkten (x, y, f ) auf die Sichtfläche, die ein Compu-
terprogramm1 – z.B. root, Mathematica oder Maple – für uns erledigen kann.
Man kann sich aber auch durch strikt zweidimensionale Zeichnungen graphisch
einen Einblick in die Eigenschaften einer Funktion f (x, y) verschaffen. Dazu
zeichnet man Höhenlinien, in der Mechanik und Elektrostatik Äquipotential-
linien, bei Temperaturverteilungen T (x, y) Isothermen, bei Luftdruckvertei-
lungen Isobaren genannt. Diese Höhenlinien erhält man folgendermaßen. Man
zeichnet in der xy-Ebene die Menge aller Punkte x, y, die die Gleichung
f (x, y) = c
für einen festen Wert c erfüllen. Diese Menge aller Punkte x, y ist eine Kurve,
die sog. Höhenlinie, auf der die Funktion f (x, y) den Wert c annimmt2 . Man
variiert dann c äquidistant, d.h. man zeichnet ebenfalls die zu 2c, 3c, 4c, etc.
gehörenden Höhenlinien. Die ,,Dichte” der Höhenlinien in der xy-Ebene ist ein
1
Die Abbildungen 7.1, 7.2 und 7.3 wurden mit dem Programm root erstellt, das in der Teil-
chenphysik verbreitet ist.
2
Die Werte c, für die die Gleichung f (x, y) = c erfüllbar ist, hängen offensichtlich von den
Eigenschaften der jeweiligen Funktion f ab. Wenn beispielsweise f (x, y) ≥ 0 ∀x, y ∈ R, dann muss
natürlich c ≥ 0 gewählt werden.
154 Einführung in die Theoretische Physik
2 2
e-x -y
f(x,y)
0.8
0.6
0.4
0.2
0
2
y 1.5
1
0.5
0 1.5 2
-0.5 0.5
1 x
-1 0
-0.5
-1.5 -1
-2 -2 -1.5
2 −y 2
Abbildung 7.1: f (x, y) = e−x .
Maß dafür, wie stark bzw. wie wenig man die Variablen x, y ändern muss, damit
sich der Funktionswert f (x, y) um eine ,,Einheit” c ändert. In Fig. 7.9 sind
Höhenlinien (= Äquipotentiallinien) für die Funktionen aus den Abbildungen
7.1, 7.2 und 7.3 dargestellt. Bei den beiden ersten Beispielen sind das Kreise,
beim dritten Beispiel Hyperbeln.
2. Für Funktionen, die von n ≥ 3 Variablen abhängen, ist eine graphische Ge-
samtdarstellung nicht möglich. Funktionen f = f (x, y, z), die von drei Varia-
blen abhängen, können z.B. folgendermaßen graphisch dargestellt werden:
• Als zweidimensionale Schnitte. Man hält eine Variable fest, beispielsweise
z = z0 und stellt f = f (x, y, z0 ) als Fläche über der xy-Ebene dar.
• Als Niveaufläche, in der Mechanik Äquipotentialfläche genannt. Eine Ni-
veaufläche ist die Menge aller Punkte im R3 , für die die Funktion f einen
vorgegebenen konstanten Wert annimmt: f (x, y, z) = const. Diese Glei-
chung beschreibt eine Fläche im Raum. Wenn f eine lineare Funktion in
x, y, z ist, handelt es sich um eine Ebene.
7.2.1 Stetigkeit
Eine Funktion f (x1 , ..., xn ) von n Variablen heißt stetig im Punkt (x01 , ...x0n ), wenn
f (x1 , ..., xn ) → f (x01 , ...x0n )
7.2 Stetigkeit, partielle Ableitungen, totales Differential 155
x2+y2
f(x,y)
200
180
160
140
120
100
80
60
40
20
0
10
y 8
6
4
2 10
0 8
-2 4 6 x
-4 0 2
-6 -2
-8 -6 -4
-10 -10 -8
x2-y2
f(x,y)
100
50
-50
-100
10
y 8
6
4
2 10
0 8
-2 4 6 x
-4 0 2
-6 -2
-8 -6 -4
-10 -10 -8
Die in den Abb. 7.1, 7.2 und 7.3 dargestellten Funktionen sind stetig.
Als Beispiel für eine Unstetigkeitsstelle einer Funktion betrachten wir
xy
f (x, y) = falls (x, y) 6= (0, 0) und f (0, 0) = 0 . (7.2.6)
x2 + y2
Diese Funktion ist an der Stelle x0 = (0, 0) unstetig. Zwar ist
aber
1
lim f (x, x) = lim f (y, y) =
.
x→0 y→0 2
Dieses Beispiel belegt, dass eine Funkion f (x) bei x0 nur dann stetig ist, wenn der
Funktionswert f (x0 ) bei Annäherung an x0 aus allen Richtungen in Ω angenommen
wird.
x, y → x + h, y h ∈ R, h → 0,
ist durch die Ableitung von f (x, y) nach x bei festgehaltenem y gegeben, die man
völlig analog zur Ableitung von Funktionen einer Variablen berechnet. Man nennt
diese Ableitung die partielle Ableitung nach x. Sie ist definiert durch
∂f (x, y) f (x + h, y) − f (x, y)
≡ lim . (7.2.7)
∂x h→0 h
Beispiel:
2 +y 2 )
f (x, y) = e−(x ,
siehe Abbildung 7.1. Die partielle Ableitung nach x ist
∂f (x, y) 2 2
= −2xe−(x +y ) . (7.2.8)
∂x
3
Diese Tangente liegt in der Ebene y = const, das ist die Ebene parallel zur xz-Ebene, in der
der Punkt (x, y) liegt.
7.2 Stetigkeit, partielle Ableitungen, totales Differential 157
∂f (x, y) 2 2
= −2ye−(x +y ) . (7.2.10)
∂y
f = f (x1 , x2 , ..., xn ).
Die partielle Ableitung nach einer Variablen xi bei festgehaltenen anderen Va-
riablen wird durch die Symbole
∂
f ≡ ∂xi f ≡ ∂i f (7.2.11)
∂xi
gekennzeichnet. Wir nehmen hier an, dass die Funktionen f hinreichend glatt sind,
so dass die partiellen Ableitungen 1. Ordnung (7.2.11) existieren.
Fazit: Die partielle Ableitung nach einer Variablen xi wird wie die gewöhnliche Ab-
leitung einer Funktion einer Variablen bestimmt – d.h. man kann die Rechenregeln
für die Ableitung aus Kapitel 2 benutzen –, die anderen Variablen werden bei der
Berechnung von ∂xi f wie Konstante behandelt.
n
X ∂f
df ≡ dxi . (7.2.12)
i=1
∂x i
Wir erinnern uns an die analoge Größe bei einer Funktion einer Variablen, f = f (x):
df
df = dx.
dx
z
z = f (x0 , y)
y
x
f (x, y)
(x0 , y0 ) ∂f
z = f (x, y0 ) ∂x
dx
Abbildung 7.4: Das totale Differential liefert die Gleichung der Tangentialebene an
die Hyperfläche f in einem Punkt P = (x0 , y0 , z0 = f (x0 , y0 )).
Differenzierbarkeit:
Wir besprachen bisher die partiellen Ableitungen einer Funktion mehrerer Variablen.
Wenn eine oder alle partiellen Ableitungen von f existieren, heisst f partiell differen-
zierbar. Wann bezeichnet man eine Funktion als differenzierbar an einem Punkt x0 ?
7.2 Stetigkeit, partielle Ableitungen, totales Differential 159
1. Summenregel:
∂i (f + g) = ∂i f + ∂i g .
2. Produktregel:
∂i (f g) = (∂i f )g + f (∂i g) .
3. Quotientenregel:
f g∂i f − f ∂i g
∂i = , falls g(x) 6= 0 .
g g2
Diese Regeln können direkt aus der Differentialrechnung für Funktionen einer Va-
riablen übernommen werden.
Kettenregel:
Wir erinnern uns zunächst an diese Regel für Funktionen einer Variablen: f = f (u)
und u = u(t):
df (u(t)) df du
= . (7.2.13)
dt du dt
Nun zu Funktionen mehrerer Variablen – o.B.d.A. betrachten wir Funktionen, die
von drei Variablen abhängen. Es sei
Berechnet werden sollen die partiellen Ableitungen von f nach t1 , t2 und t3 . Da alle
xj von diesen Variablen abhängen, erhalten wir
Die Formel sollte plausibel sein; den Beweis sollten Sie in der Vorlesung über Höhe-
re Mathematik erhalten. Die Verallgemeinerung auf Funktionen von n Variablen ist
evident. Die Kettenregel benötigt man beispielsweise, wenn wir eine physikalische
Größe, etwa die potentielle Energie V eines Teilchens, als Funktion der kartesi-
schen Ortskoordinaten xi des Teilchens kennen. Manchmal ist es sinnvoll, andere
Koordinaten zu wählen, z.B. Kugelkoordinaten r, θ, φ. Man drückt dann die karte-
sischen Koordinaten durch diese Variablen aus, xi = xi (r, θ, φ), siehe Abschnitt 7.5.
Will man z.B. die Änderung von V bei Änderung des Winkels θ bestimmen (bei
festgehaltenen Variablen r und φ), wird ∂V /∂θ mit Hilfe der Kettenregel (7.2.14)
berechnet.
Man benötigt die Kettenregel (7.2.14) oft für verschiedene Spezialfälle, die für uns
von Interesse sind. Dewegen besprechen wir diese Fälle explizit.
2. Spezialfall 2: Wir betrachten o.B.d.A. eine Funktion f , die von zwei Variablen
abhängt, f = f (x1 , x2 ), und es sei x1 = x1 (t1 ), x2 = x2 (t2 ). In diesem Fall sind
x1 , x2 Funktionen von zwei verschiedenen, voneinander unabhängigen Varia-
blen ti . Bei einer Änderung von t1 (t2 ) ändert sich nur x1 (x2 ), aber nicht x2
(x1 ). Dann ist die partielle Ableitung von f nach t1 als Spezialfall von (7.2.14)
gegeben durch
∂f (x1 (t1 ), x2 (t2 )) ∂f dx1
= . (7.2.16)
∂t1 ∂x1 dt1
Analog ist
∂f (x1 (t1 ), x2 (t2 )) ∂f dx2
= . (7.2.17)
∂t2 ∂x2 dt2
7.2 Stetigkeit, partielle Ableitungen, totales Differential 161
3. Spezialfall 3: Wir betrachten den Fall, dass alle Variablen xi von der selben
Variablen t abhängen. Beispiel:
Wenn sich t ändert, ändern sich somit beide Variablen x1 , x2 ; d.h. f hängt
offensichtlich nur von einer unabhängigen Variablen t ab. Die gewöhnliche
Ableitung, df /dt, kann man ebenfalls als Spezialfall der allgemeinen Ketten-
regel (7.2.14) erhalten. Wir wollen hier aber df /dt durch Anwendung der De-
finition der Ableitung einer Funktion einer Variablen herleiten. Wir erhalten
und
∆xi ∆t→0 dxi
−−−→ .
∆t dt
Somit:
df (x1 (t), x2 (t)) f (x1 + ∆x1 , x2 ) − f (x1 , x2 ) dx1
= lim
dt ∆t→0 ∆x1 dt
f (x1 , x2 + ∆x2 ) − f (x1 , x2 ) dx2
+ lim (7.2.18)
∆t→0 ∆x2 dt
∂f dx1 ∂f dx2
= + .
∂x1 dt ∂x2 dt
Dieses Ergebnis erhält man, wie gesagt, auch als Spezialfall von (7.2.14).
Dieses Resultat lässt sich sofort auf n Variablen übertragen. Es sei
Dann ist
n
df X ∂f dxi
= . (7.2.19)
dt i=1
∂xi dt
162 Einführung in die Theoretische Physik
dann
n
df X ∂f dxi ∂f
= + . (7.2.20)
dt i=1
∂xi dt ∂t
Ebenso können wir ∂f /∂y, Gleichung (7.2.10), nach x oder nach y ableiten.
∂ ∂f 2 2
= +4xye−(x +y ) ,
∂x ∂y
∂ ∂f 2 2 2 2
= −2e−(x +y ) + 4y 2 e−(x +y ) .
∂y ∂y
Der Vergleich dieser Resultate zeigt, dass
∂ ∂ ∂ ∂
f= f. (7.2.21)
∂y ∂x ∂x ∂y
Frage: Ist das immer so? Auskunft darüber gibt der folgende
Satz (von H.A. Schwarz): Es sei f (x) in einer Umgebung von x0 zweifach stetig dif-
ferenzierbar, d.h. alle ersten partiellen Ableitungen ∂xi f seien stetig differenzierbar
7.3 Taylorentwicklung 163
und alle zweiten partiellen Ableitungen ∂xi ∂xj f seien stetig. Dann kann die Reihen-
folge beim Bilden der gemischten zweiten Ableitungen vertauscht werden:
Ein Beispiel, bei dem die Voraussetzungen dieses Satzes nicht erfüllt sind, behandeln
wir in den Übungen.
Notation:
∂ ∂ ∂2
f≡ f ≡ ∂xi ∂xj f ≡ ∂i ∂j f. (7.2.22)
∂xi ∂xj ∂xi ∂xj
7.3 Taylorentwicklung
In Analogie zu Funktionen einer Variablen, f = f (x), wollen wir nun Funktionen
mehrerer Variablen, f = f (x1 , ..., xn ), an einem bestimmten Punkt x0 = (x01 , ..., x0n )
in eine Potenzreihe entwickeln. Das setzt natürlich voraus, dass diese Funktionen be-
liebig oft differenzierbar sind.
In praktischen Anwendungen brauchen wir in der Regel nur die ersten Glieder
dieser Reihe. Deswegen ist unser Ziel hier nur die näherungsweise Darstellung von f
durch ein Polynom in den xi bis zu einer gewünschten Ordnung n. Bei der Taylor-
Entwicklung einer Funktion f bis zur n-ten Ordnung muss die Funktion (n + 1)-fach
differenzierbar sein, siehe unten.
7.3.1 Taylor-Formeln
Wir leiten zunächst die Taylor-Formeln für die Entwicklung von Funktionen zweier
und von drei Veriablen bis zur 2. Ordnung her und geben dann die Formel für die
Potenzreihenentwickung (= Taylor-Reihe) einer Funktion von n Variablen an.
Das Symbol O ((∆xi )3 ) bezeichnet die nicht angegebenen Terme der Potenzreihe,
die mindestens von 3. Ordnung in den kleinen Größen (x − x0 ), (y − y0 ) sind. Das
164 Einführung in die Theoretische Physik
(x − x0 )3 , (x − x0 )2 (y − y0 ), (x − x0 )(y − y0 )2 , (y − y0 )3
(a) Einerseits wertet man f , ihre partiellen Ableitungen ∂x f , ∂y f und die höherer
Ordnung bei (x0 , x0 ) aus.
(b) Andererseits wertet man die rechte Seite von (7.3.1) und ihre entsprechenden
partiellen Ableitungen bei (x0 , x0 ) aus und vergleicht mit (a). Man erhält:
⇒ ∂x f (x0 , y0 ) = c10
(3)
etc.
Einsetzen der soeben hergeleiteten Koeffizienten cij in (7.3.1) liefert die Taylor-
Formel für die Entwicklung einer Funktion zweier Variablen an einen beliebigen
Punkt (x0 , y0 ), wobei die Taylor-Entwicklung hier nur bis zur 2. Ordnung durch-
geführt wurde:
f (x, y) = f (x0 , y0 )
+ (x − x0 )∂x f (x0 , y0 ) + (y − y0 )∂y f (x0 , y0 )
1
(x − x0 )2 ∂x2 f (x0 , y0 ) + 2(x − x0 )(y − y0 )∂x ∂y f (x0 , y0 ) + (y − y0 )2 ∂y2 f (x0 , y0 )
+
2!
+ O (∆xi )3 .
(7.3.2)
Für das Restglied O ((∆xi )3 ) kann eine Abschätzungsformel angegeben werden, in
der die partiellen Ableitungen ∂i ∂j ∂k f aufteten; siehe z.B. das zitierte Taschenbuch
der Mathematik von I.N. Bronstein et al.
7.3 Taylorentwicklung 165
Für eine Funktion von drei Variablen, f = f (x1 , x2 , x3 ), erhält man völlig ana-
log die Taylorentwicklung inklusive der Terme 2. Ordnung an einen Punkt x0 =
(x01 , x02 , x03 ):
f (x1 , x2 , x3 ) = f (x0 )
+ (x1 − x01 )∂1 f (x0 ) + (x2 − x02 )∂2 f (x0 ) + (x3 − x03 )∂3 f (x0 )
1h
+ (x1 − x01 )2 ∂12 f (x0 )
2!
+ (x2 − x02 )2 ∂22 f (x0 )
+ (x3 − x03 )2 ∂32 f (x0 ) (7.3.3)
+ 2(x1 − x01 )(x2 − x02 )∂1 ∂2 f (x0 )
+ 2(x1 − x01 )(x3 − x03 )∂1 ∂3 f (x0 )
i
+ 2(x2 − x02 )(x3 − x03 )∂2 ∂3 f (x0 )
+ O (∆xi )3 .
Die Abschätzungsformel für das Restglied O ((∆xi )3 ) enthält die partiellen Ablei-
tungen 3. Ordnung (siehe Bronstein et al.). Bei Vernachlässigung des Restglieds
wird die Funktion f (x) durch die Formeln (7.3.2) bzw. (7.3.3) in der Umgebung
des Punktes x0 durch ein Polynom 2. Grades in den Variablen x, y bzw. x1 , x2 , x3
approximiert. Die Güte der Approximation lässt sich durch die Mitnahme höherer
Ordnungen der Taylorentwicklung erhöhen – vorausgesetzt, die Taylorreihe (also die
unendliche Reihe) konvergiert in einer Umgebung von x0 . Auf Konvergenzfragen
gehen wir hier nicht ein.
Der Vollständigkeit halber geben wir hier noch die Formel für die Taylorreihe
einer Funktion f = f (x1 , x2 , ..., xn ) von n Variablen an der Entwicklungsstellle x0 an.
Wir nehmen an, dass f beliebig oft partiell in einer Umgebung von x0 differenzierbar
ist und die folgenden unendlichen Summen in einer Umgebung von x0 konvergieren.
Die Taylorformel für die Potenzreihenentwicklung in n Variablen ist
∞ X
∞ ∞
X X 1 ∂ i1 +i2 +...+in
f (x) = ... (x1 − x01 )i1 · · · (xn − x0n )in i1 i2 f (x0 ).
i1 =0 i2 =0 in =0
i 1 !i 2 ! · · · i n ! ∂x 1 ∂x 2 · · · ∂x
in
n
(7.3.4)
Durch explizites Hinschreiben der ersten Terme dieser Reihe im Falle von zwei bzw.
drei Variablen überzeugt man sich, dass diese Formel die in (7.3.2) bzw. (7.3.3) an-
gegebenen Glieder reproduziert.
Sie müssen sich diese Formel nicht merken – allerdings sollten Sie die Formeln (7.3.2)
bzw. (7.3.3), d.h. die Taylor-Entwicklung von Funktionen zweier und von drei Va-
riablen bis zur 1. oder 2. Ordnung verinnerlichen. Wir werden diese Formeln anhand
etlicher Beispiele in den Übungen anwenden.
166 Einführung in die Theoretische Physik
Bei einem Sattelpunkt x0 nimmt f (x, y) im Punkt x0 bezüglich einer Richtung ein
relatives Minimum an – im Beispiel 3 ist diese Richtung durch die Gerade y = 0
gegeben –, aber bezüglich einer anderen Richtung ein relatives Maximum – im Bei-
spiel 3 längs der Geraden x = 0.
Bedingung für einen lokalen Extremwert: Eine Funktion f = f (x) von n reel-
len Variablen hat im Punkt x0 = (x01 , x02 , ..., x0n ) ein lokales Minimum (Maximum),
wenn es ein r > 0 gibt, so dass
Ein lokales Minumum oder Maximum heißt auch lokaler Extremwert 4 . Beachten Sie,
dass die Bedingung (7.3.5) nicht bedeutet, dass es sich bei x0 um einen isolierten
Punkt handeln muss.
Die Bedingung (7.3.5) gilt natürlich auch für n = 1. In diesem Fall findet man lokale
Extremwerte einer Funktion f = f (x) am einfachsten durch Zeichnen des Funk-
tionsgraphen. Das ist im Fall mehrerer Variablen schwierig (n = 2) bzw. unmöglich
(n > 2).
Analog zum Fall einer Variablen findet man lokale Extremwerte einer Funktion auf
analytische Weise durch Untersuchung der partiellen Ableitungen von f – voraus-
gesetzt, f ist differenzierbar. Das führt uns auf den allgemeineren Begriff des stati-
onären Punktes. Ein Punkt x0 heißt stationärer Punkt einer differenzierbaren Funk-
tion f , wenn er eine Lösung der folgenden n Gleichungen ist:
∂
f (x0 ) = 0 ∀i = 1, 2, ..., n . (7.3.6)
∂xi
Hinweise:
1) Diese Bedingung ist offensichtlich notwendig, aber nicht hinreichend für einen
lokalen Extremwert einer differenzierbaren Funktion. Ein Kriterium dafür, wann ein
4
In den obigen Beispielen 1 und 2 ist (x0 , y0 ) = (0, 0) auch das absolute Maximum bzw.
Minimum der Funktion. Das ergibt sich aber erst aus der globalen Betrachtung der jeweiligen
Funktion.
7.3 Taylorentwicklung 167
Beispiel: Sei (x0 , y0 ) ein stationärer Punkt von f (x, y). Dann ist die Taylorentwick-
lung von f an dieser Stelle gegeben durch
1h
f (x1 , x2 ) =f (x01 , x02 ) + (x1 − x01 )2 ∂12 f (x0 )
2!
+ 2(x1 − x01 )(x2 − x02 )∂1 ∂2 f (x0 )
i (7.3.8)
2 2
+ (x2 − x02 ) ∂2 f (x0 )
+ O (∆xi )3 .
In der Physik, insbesondere in der Mechanik untersucht man oft eine physikalische
Größe f , die beispielsweise von den Ortskoordinaten eines Teilchens abhängt, in der
Umgebung eines stationären Punktes x0 von f durch Taylor-Entwicklung um x0 –
siehe den Hinweis am Ende des nächsten Abschnittes.
5
Beim Trivialbeispiel einer konstanten Funktion, f (x, y) = const., d.h. einer Ebene parallel zur
xy-Ebene, sind natürlich alle Punkte des R2 stationäre Punkte der Funktion.
168 Einführung in die Theoretische Physik
sin(x2+y2)
f(x,y)
0.5
-0.5
-1
1.5
y
1
0.5
0 1.5
1 x
-0.5 0.5
0
-1 -0.5
-1.5 -1.5 -1
Bei dieser Matrix, die man auch Hesse-Matrix nennt, handelt es sich offensichtlich
(2) (2)
um eine reell-symmetrische Matrix, Dij = Dji . Wie wir in Kapitel 6.6 lernten,
kann diese Matrix diagonalisiert werden; alle Eigenwerte λi dieser Matrix sind reell.
Kriterium: Wenn alle Eigenwerte λi der Matrix der 2. Ableitungen bei x0 posi-
tiv (negativ) sind, dann ist x0 ein isoliertes Minimum/Maximum. Wenn das nicht
der Fall ist, ist die Bestimmung des Typs des stationären Punktes x0 komplizierter.
Wenn sowohl positive als auch negative λi auftreten, aber alle λi 6= 0, dann handelt
es sich bei x0 um einen Sattelpunkt. Wenn ein oder mehrere λi = 0 und alle λi ≥ 0
(alle λi ≤ 0), dann ist x0 Element eines Kontinuums von Minima (Maxima).
Da diese Matrizen bereits diagonal sind, kann man die Eigenwerte λ1 , λ2 unmittelbar
ablesen. Die Rechnung bestätigt, was wir den Abbildungen unmittelbar entnehmen
können: Bei (x0 , y0 ) = (0, 0) haben die Funktionen Fig. 7.2 und 7.5 ein lokales Mi-
nimum, die Funktion Fig. 7.1 ein lokales Maximum und die Funktion Fig. 7.3 einen
Sattelpunkt.
2) Wir berechnen die Hesse-Matrix der Funktion Fig. 7.5 an irgendeinem Punkt x0
170 Einführung in die Theoretische Physik
auf dem Kreis x2 + y 2 = π/2. Die Berechnung der beiden Eigenwerte dieser Matrix
ergibt, dass ein Eigenwert negativ und der andere Eigenwert null ist. (Zu Hause
nachprüfen!) Dies bestätigt formal, dass die Funktion auf dem Kreis x2 + y 2 = π/2
eine Linie von Maxima besitzt.
Die eingehende Untersuchung der stationären Punkte von Funktionen f (x1 , ..., xn )
ist für n > 2, insbesondere für n 1 eine (numerisch) anspruchsvolle Aufgabe.
Die Problemstellung hat viele Anwendungen, nicht nur in der Physik. Wir untersu-
chen im Mechanik-Teil der Vorlesung nur für relativ einfache Systeme, ob stationäre
Punkte vorliegen; wir merken uns die Gleichungen (7.3.6) bis (7.3.8). Beispielsweise
entsprechen die stationären Punkte x0 der potentiellen Energie V = V (x1 , . . . , xn )
eines mechanischen Systems aus n0 Massenpunkten im Raum (3n0 = n), das kei-
nen weiteren Einschränkungen unterliegt, den Gleichgewichtslagen des Systems. Nur
wenn es sich bei x0 um ein Minimum handelt, befinden sich die Massenpunkte bei
x0 in einem stabilen Gleichgewicht – falls sich bei x0 um einen anderen Extremwert
handelt, ist die Gleichgewichtslage instabil gegenüber kleinen Störungen.
∂
f (x, y) ↔ Steigung am Punkt (x, y) in x-Richtung bei konstantem y,
∂x
∂
f (x, y) ↔ Steigung am Punkt (x, y) in y-Richtung bei kontantem x.
∂y
Man definiert nun einen Vektor – präziser: ein Vektorfeld – das die gesamte Infor-
mation über die Steigungen von f in beliebiger Richtung in der xy-Ebene enthält:
∂f
∂f ∂f ∂x
grad f (x) ≡ ex + ey = . (7.4.1)
∂x ∂y ∂f
∂y
-x2-y2
grad(e )
2
y
1.5
0.5
-0.5
-1
-1.5
-2
-2 -1.5 -1 -0.5 0 0.5 1 1.5 2
2 −y 2
Abbildung 7.6: Gradientenfeld von f (x, y) = e−x .
!
∂f (x,y)
∂x −2x exp(−x2 − y 2 )
∇f (x, y) = ∂f (x,y) =
∂y
−2y exp(−x2 − y 2 )
Definition: Sei f (x) ≡ f (x1 , x2 , ..., xn ) ein stetig differenzierbares skalares Feld.
Diesem Feld wird durch folgende Vorschrift an jeder Stelle x ein Vektorfeld, das
sogenannte Gradientenfeld grad f , zugeordnet:
∂1 f
n ∂2 f
X ∂f
grad f (x) ≡ ei = .. . (7.4.2)
i=1
∂xi .
∂n f
Es ist üblich und bequem – warum, wird im Laufe der Vorlesung klar – in die-
sem Kontext den sogenannten Nabla-Operator ∇ einzuführen. Das ist ein Vektor-
Differentialoperator6 , der bezüglich einer kartesischen ONB {ei } folgendermaßen
definiert ist: n
∂ ∂ X
∇ ≡ e1 + ... + en = ei ∂i
∂x1 ∂xn i=1
∂1 (7.4.3)
..
bzw. ∇ = . ,
∂n
6
In der Mathematik versteht man unter einem Operator eine Rechenvorschrift; in diesem Fall
die Vorschrift (7.4.4)
172 Einführung in die Theoretische Physik
grad(x2+y2)
10
y
8
-2
-4
-6
-8
-10
-10 -8 -6 -4 -2 0 2 4 6 8 10
!
∂f (x,y)
∂x 2x
∇f (x, y) = ∂f (x,y) =
∂y
2y
grad(x2-y2)
10
y
-2
-4
-6
-8
-10
-10 -8 -6 -4 -2 0 2 4 6 8 10
!
∂f (x,y)
∂x 2x
∇f (x, y) = ∂f (x,y) =
∂y
−2y
7.4 Gradient, Divergenz, Rotation 173
Rechenregeln:
Sei f = f (x), g = g(x). Offensichtlich gelten die Summen-, Produkt- und Quo-
tientenregel der partiellen Differentiation, siehe die entsprechenden Regeln für die
partiellen Ableitungen auf Seite 7.2.4:
∇(f + g) = ∇f + ∇g , (7.4.6)
∇(f g) = (∇f )g + f ∇g , (7.4.7)
f 1
∇ = 2 (g∇f − f ∇g) , g 6= 0 . (7.4.8)
g g
Außerdem gilt die Kettenregel (7.2.14) bzw. ihre besprochenen Spezialfälle.
Beispiele:
1. Unterhalb der Abbildungen 7.6, 7.7 und 7.8 sind die Gradienten der Funktionen
f (x, y) = x2 + y 2 , f (x, y) = x2 − y 2 und f (x, y) = exp(−x2 − y 2 ) angegeben.
2. f (r) = a · r = 3i=1 ai xi , wobei a ein konstanter Vektor ist. Dann ist
P
3
X
grad f ≡ ∇f = ei ai = a.
i=1
174 Einführung in die Theoretische Physik
p
3. Sei φ(r) = |r| = x21 + x22 + x23 . Dann ist (mit r ≡ |r|)
3
X 1 r
grad r ≡ ∇r = ei 2xi = .
i=1
2|r| |r|
Man sollte sich das merken: Der Gradient des Betrags des Ortvektors eines
Teilchens ist der Einheitvektor r̂ = r/r, der radial (sternförmig) nach außen
zeigt.
p
4. Sei φ = φ(r), d.h. die Funktion φ hängt nur vom Betrag r = x21 + x22 + x23 des
Koordinatenvektors r ab. Unter Verwendung der Kettenregel in der Version
(7.2.15) erhalten wir
3
X dφ dφ r
∇φ(r) = ei ∂i r = . (7.4.9)
i=1
dr dr |r|
D.h. der Gradient eines skalaren Feldes, das nur vom Betrag des Ortsvektors
abhängt, zeigt – je nach Vorzeichen von dφ/dr – radial vom Ursprung weg
oder auf ihn hin. Das sollte man ebenfalls verinnerlichen!
Beachte: Die Operation grad (Vektorfeld) ist sinnlos, d.h. nicht definiert.
Richtungsableitung:
Wir greifen das Thema “Steigung von f bezüglich einer bestimmten Richtung” wie-
der auf – siehe den Anfang dieses Abschnitts, Seite 170. Anhand von (7.4.5) sieht
man sofort, dass man die Steigung von f in Richtung ei durch skalare Multiplikation
von ∇f mit ei erhält:
∂f
= ei · ∇f. (7.4.12)
∂xi
Dabei benutzten wir, dass die ei eine ONB bilden, ei · ej = δij .
Die Steigung bezüglich einer beliebigen Richtung n erhält man durch die soge-
nannte Richtungsableitung, die wie folgt definiert ist:
∂f
≡ n · ∇f,
∂n (7.4.13)
n Einheitsvektor, |n| = 1.
Beachte: ∂f /∂n ist eine skalare Größe; deswegen wird in diesem Symbol das Vek-
torsymbol n nicht verwendet.
f (x) = c, (7.4.14)
176 Einführung in die Theoretische Physik
-x2-y2
grad(e ) grad(x2+y2) grad(x2-y2)
2 10 10
y
y
8 8
1.5
6 6
1
4 4
0.5
2 2
0 0 0
-2 -2
-0.5
-4 -4
-1
-6 -6
-1.5
-8 -8
-2 -10 -10
-2 -1.5 -1 -0.5 0 0.5 1 1.5 2 -10 -8 -6 -4 -2 0 2 4 6 8 10 -10 -8 -6 -4 -2 0 2 4 6 8 10
x x x
2
−y 2
(a) e−x (b) x2 + y 2 (c) x2 − y 2
wobei c eine vorgegebene Konstante ist, definiert – wie bereits am Anfang dieses
Kapitels erwähnt wurde – eine Hyperfläche, die man in der Physik, insbesondere in
der Mechanik oft Äquipotentialfläche nennt7 . Dieser Begriff stammt aus der Mecha-
nik: Wenn f (x) die potentielle Energie eines Massenpunktes ist, dann ist die Fläche
f (x) = c die Menge aller Ortskoordinaten des Massenpunktes, für die seine poten-
tielle Energie den konstanten Wert c annimmt. Ein wichtiger Spezialfall ist die mit
einer am Ursprung zentrierten Zentralkraft assoziierten potentiellen Energie; sie ist
von der Form V = V (r). D.h. in diesem Fall sind die Äquipotentialflächen Kugeln
um den Ursprung. Ist die Zentralkraft bei x0 6= 0 zentriert, ist V = V (|x − x0 |),
d.h. die Äquipotentialflächen sind Kugeln um das Zentrum x0 .
Im Fall zweier Variablen definiert f (x1 , x2 ) = const. eine Kurve, eine sog. Äquipo-
tentiallinie.
Totales Differential:
Das totale Differential (7.2.12), das die infinitesimale Funktionsänderung bei infi-
nitesimalen Änderungen dxi aller Variablen xi angibt, kann mit ∇f geschrieben
werden als
n
X ∂f
df = dxi = (∇f ) · dx. (7.4.15)
i=1
∂x i
Wenn wir vom Punkt x auf einer Äquipotentialfläche von f zum Punkt x + dx,
der ebenfalls auf dieser Fläche liegt, fortschreiten, ändert sich der Wert von f
nicht. Demzufolge ist df = 0. Somit
x → x + dx auf d. Äquipotentialfläche ⇒ df = 0
⇒ (∇f ) · dx = 0
⇒ ∇f (x) ⊥ zur Fläche f (x)= const im Punkt x.
∇f (x0 )
a=
|∇f (x0 )|
wählt. Falls ∇f (x0 ) = 0, ist f (x) in einer infinitesimalen Umgebung von x0 kon-
stant, d.h. f steigt bei x0 weder an noch ab.
3) Der Betrag |∇f (x0 )| gibt die Stärke des Anstiegs von f (x) senkrecht zu den
Äquipotentialflächen f (x) = c an. In Abbildung 7.9 ist das durch die Dichte der
Äquipotentiallinien visualisiert.
8
Der Begriff Gradient hat seinen Ursprung im lateinischen Wort gradiens = fortschreiten.
178 Einführung in die Theoretische Physik
An dieser Stelle können wir auch den Grund für die Vorzeichenkonvention in
der Darstellung F = −∇V von konservativen oder Potentialkräften besprechen.
Die ,,von außen” geleistete mechanische Arbeit an einem Körper ist die Energie,
die man aufbringen muss, um den Körper in einem Kraftfeld F vom Punkt x0
nach x1 zu bringen, siehe Abschnitt 7.7. Beispiel: Man hebt einen Stein vom Erd-
boden auf und bringt in auf eine Höhe h. Wegen der Energieerhaltung führt die
von außen zugeführte Energie zu einer Erhöhung der potentiellen Energie V (x) des
Körpers. Stoppt man die Energiezufuhr, d.h. lässt man den Stein los, wird er durch
die Schwerkraft zum Erdboden hin beschleunigt, die potentielle Energie des Steins
nimmt ab. Die Schwerkraft wirkt offensichtlich in Richtung des stärksten Abfalls der
potentiellen Energie; deswegen F = −∇V . Warum V in der Tat der potentiellen
Energie eines Körpers in einem Kraftfeld des genannten Typs entspricht, besprechen
wir im Mechanik-Teil der Vorlesung.
7.4.2 Divergenz
Man kann den Nabla-Operator (7.4.3) auch auf ein differenzierbares Vektorfeld A(x)
anwenden. Erfolgt die Anwendung in Form einer skalaren ,,Multiplikation”, erhält
man ein skalares Feld, das man die Divergenz von A(x) nennt.
Definition: Sei
3
X
A(x) = Ai (x)ei
i=1
ein stetig differenzierbares Vektorfeld, wobei {ei } eine kartesische ONB ist. Seine
Divergenz ist bezüglich dieser Basis definiert als
div A(x) ≡ ∇ · A(x) ≡ ∂1 A1 + ∂2 A2 + ∂3 A3 . (7.4.17)
Man erhält (7.4.17) formal durch Skalarproduktbildung der kartesischen Darstellung
von ∇ mit A.
Merke:
∇ · Vektorfeld = skalares Feld.
Sei φ(x) ein skalares Feld: div φ ist nicht definiert.
7.4 Gradient, Divergenz, Rotation 179
Beispiele:
1. Sei A = a ein konstantes Vektorfeld. Dann ist
3
X
div a ≡ ∇ · a = ∂i ai = 0.
i=1
Rechenregeln:
1. ∇ · (A + B) = ∇ · A + ∇ · B.
2. ∇ · (cA) = c∇ · A, c ∈ C.
3. Sei A(x) ein Vektorfeld und φ(x) ein skalares Feld. Dann gilt
∇ · (φA) = φ∇ · A + A · ∇φ.
Zur Herleitung dieser Formel verwendet man Definition (7.4.17) und die Pro-
duktregel ∂i (φAi ) = φ∂i Ai + Ai ∂i φ .
n
X n
X
∇ · (φA) = ∂i (φAi ) = (φ∂i Ai + Ai ∂i φ)
i=1 i=1
Xn
=φ ∂i Ai + A · ∇φ .
i=1
4. Oft benötigt man die Divergenz eines Gradientenfeldes ∇φ. Durch Bilden des
Skalar,,produkts” von ∇ und ∇φ erhalten wir:
∂2φ ∂2φ ∂2φ
∇ · ∇φ = + + ≡ ∆φ,
∂x21 ∂x22 ∂x23
wobei
∆ ≡ ∂12 + ∂22 + ∂32 (7.4.18)
der sogenannte Laplace-Operator in kartesischen Koordinaten ist. Mit den
Symbolen div und grad lautet dieses Ergebnis:
Die Identität (7.4.19) gilt natürlich nur für ein skalares Feld. Der Laplace-
Operator (7.4.18) kann auch auf ein Vektorfeld A angewendet werden. In einer
kartesischen Basis ist
Bei einer Darstellung von A in einer ,,krummlinigen” Basis (siehe Abschnitt (7.5))
hat ∆A eine kompliziertere Form. Diese lernen Sie in der Vorlesung Theoretische
Physik 2: Elektrodynamik kennen.
Interpretation von div A:
Die Divergenz eines Vektorfeldes A(x) wird als lokale Quellenstärke von A(x) in-
terpretiert. Als Beispiel betrachten wir eine Flüssigkeit. Makroskopisch betrachtet
kann eine Flüssigkeit als Kontinuum von Teilchen (Molekülen) aufgefasst werden.
Der Stromdichtevektor der Flüssigkeit ist j(x, t) = n(x, t)v(x, t), wobei [n] = Zahl
d. Teilchen/Volumen und somit [j] = Zahl d. Teilchen/(Fläche×Zeit). Wir betrach-
ten ein kleines Volumen ∆V am Punkt x. Man kann sich fragen, ob pro Zeiteinheit
mehr Flüssigkeit aus diesem Volumen heraus- als hineinströmt. Im Limes ∆V → 0
ist die Antwort gegeben durch div j(x). (Eine Begründung dieser Aussage finden
Sie z.B. im Buch von S. Großmann.) Man nennt deshalb div j(x) manchmal das
Quellenfeld des Feldes j(x) – jedenfalls ist div j(x) ein Maß für eine Quelle (wenn
div j(x) > 0) oder eine Senke (wenn div j(x) < 0) von j(x) an der Stelle x. Eine
befriedigende Erklärung dieser Aussagen erhält man mit Hilfe des Gaußschen Inte-
gralsatzes, der in der HöMa3- und Theo-2 Vorlesung besprochen wird.
Ein weiteres Beispiel sind Magnetfelder – präzise, die magnetische Induktion B. Da
bisher keine magnetischen Ladungen gefunden wurden, gilt für beliebige B-Felder:
div B(x, t) = 0. (Das lernen Sie in den Vorlesungen zur Elektrodynamik.) D.h. die
magnetische Induktion B(x, t) ist immer quellenfrei.
7.4.3 Rotation
Sei A(x) ein stetig differenzierbares Vektorfeld. Mit Hilfe des Nabla-Operators ∇
und dem Vektorprodukt können wir A ein Vektorfeld zuordnen, die sogenannte
Rotation von A. Diese ist in einer kartesischen Basis definiert durch
3
X ∂
rot A ≡ ∇ × A ≡ ei ijk Ak
i,j,k=1
∂xj (7.4.20)
= (∂2 A3 − ∂3 A2 )e1 + (∂3 A1 − ∂1 A3 )e2 + (∂1 A2 − ∂2 A1 )e3 .
Merke:
rot × Vektorfeld = Vektorfeld.
Beispiele:
1. A = r:
3
X
rot r ≡ ∇ × r = ei ijk ∂j xk = 0 ,
|{z}
i,j,k=1
δjk
Wir verwenden nun, dass ijk = kij und zudem die Relation (5.4.31) aus
Kapitel 5:
X3
kij klm = δil δjm − δim δjl .
k=1
(rot A)1 = ∂2 A3 − ∂3 A2 ,
x3 -Achse an. Die Drehrichtung des Wirbels ist durch die Richtung von ω festgelegt.
In (7.4.21) zeigten wir, dass rot v = 2ω; d.h. die Rotation von v ist proportional
zum Drehvektor ω, der die Drehrichtung und die Stärke des Wirbels bestimmt.
Vektorfelder mit nichtverschwindender Rotation,
rot A 6= 0 ,
bezeichnet man als Wirbelfelder.
Hinweise:
1) Wenn v = ω ×x die Geschwindigkeit eines Teilchens ist, dann ist ω = |ω| = 2π/T
die Winkelgeschwindigkeit (= Kreisfrequenz) des Teilchens. Das sieht man folgender-
maßen. Es ist |v| = |ω × x| = ωr⊥ , wobei r⊥ = |x| cos θ, θ = ∠(ω, x). Andererseits
ist der bei einer Umdrehung um die Achse zurückgelegte Weg des Teilchens gleich
dem Kreisumfang 2πr⊥ . Somit ist der Betrag der Geschwindigkeit |v| = 2πr⊥ /T ,
wobei T die Umlaufzeit ist. Da die Winkelgeschwindigkeit durch ω = 2π/T definiert
ist, ist die obige Aussage gezeigt: Ein Teilchen mit der Geschwindigkeit v(x) = ω×x
bewegt sich auf einem Kreis ⊥ ω mit Radius r⊥ und hat die Winkelgeschwindigkeit
ω.
2) Wir betrachten das folgende zweidimensionale Vektorfeld in der x1 x2 -Ebene:
1
B= (e3 × r), r = xe1 + ye2 , r ∈ R2 \ {(0, 0)} , (7.4.22)
r2
wobei e3 ⊥ r. Das Feld B ist im Urprung singulär. Die Vektorpfeile dieses Feldes
zirkulieren um den Ursprung. (Die graphische Darstellung von B hat qualitativ die
in Fig. 7.10 gezeigte Form – allerdings ist hier |B| = 1/r.) Man findet mit Hilfe der
Formel (7.4.24) und dem Ergebnis (7.4.21), dass
rot B = 0 ∀r ∈ R2 \ {(0, 0)} . (7.4.23)
Im Ursprung wird rot B singulär. Wir kommen auf dieses Beispiel in Abschnitt 7.7.2
und in einer Übungsaufgabe zurück.
7.4 Gradient, Divergenz, Rotation 183
Rechenregeln:
1. ∇ × (A + B) = ∇ × A + ∇ × B.
2. ∇ × (cA) = c∇ × A, c ∈ C.
3. Seien A(x) und φ(x) ein differenzierbares Vektorfeld bzw. skalares Feld. Dann
gilt
∇ × (φA) = φ∇ × A + (∇φ) × A. (7.4.24)
Mit den Symbolen rot und grad lautet diese Formel:
Zur Herleitung verwendet man die Definition (7.4.20) und die Produktregel
∂i (φAi ) = φ∂i A + Ai ∂i φ.
Dies folgt durch Einsetzen von Ak = ∂k φ in die Definition (7.4.20) und der
Verwendung von ijk = −iki und ∂j ∂k φ = ∂k ∂j φ. Die gemischten partiel-
len Ableitungen sind vertauschbar, weil φ nach Voraussetzung zweimal stetig
differenzierbar ist (siehe den Satz von H.A. Schwarz). Man sagt, Gradienten-
felder sind wirbelfrei. Dieses Ergebnis verwenden wir im Abschnitt 7.7 und
im Mechanik-Teil der Vorlesung.
div (rot A) ≡ ∇ · (∇ × A) = 0 x ∈ Ω.
Beweis:
3
X X X
∇ · (∇ × A) = ∂i (∇ × A)i = ∂i ijk ∂j Ak = ijk ∂i ∂j Ak = 0;
i=1 i,j,k i,j,k
Hinweise:
1) Man kann noch eine Reihe weiterer nützlicher Formeln vom obigen Typ für diffe-
renzierbare Vektorfelder A(x), B(x) herleiten, z.B. für grad (A · B), div (A × B),
rot (A × B), siehe z.B. das Buch von Bronstein et al. Wir benötigen diese Formeln
in dieser Vorlesung nicht.
2) In der Mechanik benötigen wir vor allem ∇φ. Die Operationen div , rot werden
184 Einführung in die Theoretische Physik
Koordinatenlinien:
• Alle Punkte in einer Ebene, deren r-Koordinate den Wert r0 hat, liegen auf
einem Kreis mit Radius r0 um den Ursprung 0, siehe Abbildung 7.11(b).
Dieser Kreis besitzt die Parameterdarstellung
wobei φ die Rolle des Kurvenparameters spielt. Die Kreise (7.5.3) nennt man
die φ-Koordinatenlinen, kurz, die φ-Linien.
• Alle Punkte in einer Ebene, deren φ-Koordinate den Wert φ0 hat, liegen auf
einem vom Ursprung 0 ausgehenden Strahl, der mit der positiven x-Achse den
Winkel φ0 einschließt, siehe Abbildung 7.11(b).
7.5 Polarkoordinaten und Zylinderkoordinaten 185
φ = const
y
r x
φ x
r = const
~eφ
~er
~r
x
(c) Basisvektoren.
Abbildung 7.11: Ebene Polarkoordinaten. Die Linien φ = const nennt man die r-
Linien; r = const sind die φ-Linien.
186 Einführung in die Theoretische Physik
Tangentenvektoren:
Durch jeden Punkt der xy-Ebene – außer dem Ursprung 0 – gehen zwei der soeben
besprochenen Koordinatenlinien, d.h. Kurven (7.5.3), (7.5.4), die sich rechtwinklig
schneiden. Dies folgt aus der Orthogonalität der Tangentenvektoren an diese Ko-
ordinatenlinien im Punkt (r0 , φ0 ), die wir jetzt berechnen. (Zur Berechnung dieser
Vektoren siehe (5.5.22) in Kapitel 5.)
dr(r0 , φ) ∂r(r, φ)
Kurve (7.5.3) ⇒ Tangentenvektor = .
dφ φ=φ0 ∂φ r=r0
φ=φ0
dr(r, φ0 ) ∂r(r, φ)
Kurve (7.5.4) ⇒ Tangentenvektor = .
dr r=r0 ∂r r=r0
φ=φ0
Für einen beliebigen Punkt (r, φ) sind diese Tangentenvektoren gegeben durch
∂r(r, φ) (7.5.2)
= cos φ e1 + sin φ e2 ,
∂r
(7.5.5)
∂r(r, φ) (7.5.2)
= −r sin φ e1 + r cos φ e2 .
∂φ
Diese beiden Vektoren stehen offensichtlich senkrecht aufeinander. Wir dividieren
diese Vektoren noch durch ihre Beträge. Somit erhalten wir zu jedem Punkt (r, φ)
zwei zueinander orthogonale Einheitsvektoren er und eφ (siehe Abbildung 7.11(c)).
∂r
∂r
er ≡ ∂r = cos φ e1 + sin φ e2 ,
∂r
∂r (7.5.6)
∂φ
eφ ≡ ∂φ = − sin φ e1 + cos φ e2 .
∂r
Es ist er · eφ = 0.
Die Einheitsvektoren er , eφ bilden offensichtlich eine ONB im R2 , d.h. wir können
jedes Vektorfeld A(x) ∈ R2 auch nach er , eφ entwickeln:
A(x) = A1 (x, y)e1 + A2 (x, y)e2 = Ar (r, φ)er + Aφ (r, φ)eφ . (7.5.7)
7.5 Polarkoordinaten und Zylinderkoordinaten 187
Die Komponenten Ar (r, φ) und Aφ (r, φ) erhalten wir, indem wir in A1 , A2 die Koor-
dinaten x, y durch r, φ ausdrücken, siehe Gleichung (7.5.1), und dann (7.5.7) skalar
mit er und eφ multiplizieren. Es ist
Ar = A · er , Aφ = A · eφ . (7.5.8)
Ist das Vektorfeld A(x) in der Polarkoordinatenform (rechte Seite von (7.5.7) gege-
ben, dann erhält man seine Komponenten in einer kartesischen Basis durch
A1 = A · e1 , A2 = A · e2 , (7.5.9)
P2
Beispiel: Der Ortsvektor r = i=1 xi ei ist in der Basis er , eφ gegeben durch
r = rer .
Hinweise:
1) Im Gegensatz zu den kartesischen Basisvektoren e1 , e2 hängen er , eφ vom Ort,
d.h. von φ ab.
2) ,,Darstellung eines zweidimensionalen Vektorfeldes in der Polarkoordinatenbasis”
bezieht sich auf die rechte Seite von (7.5.7). Manchmal ist es zweckmäßig, A nach
einer kartesischen Basis zu entwickeln, aber anstelle der Koordinaten x, y die Polar-
koordinaten r, φ zu verwenden, also in den Feldkomponenten A1 , A2 auf der linken
Seite von (7.5.7) die Relationen x = r cos φ, y = r sin φ einzusetzen. Diese beiden
Darstellungen dürfen nicht verwechselt werden! Bei der Darstellung von A in der Po-
larkoordinatenbasis müssen bei der (partiellen) Differentiation von A nach einer der
Koordinaten auch die Basisvektoren er , eφ differenziert werden. Da hier er = er (φ),
eφ = eφ (φ), ist ∂ea /∂φ 6= 0. Wenn φ = φ(t), dann der /dt 6= 0, deφ /dt 6= 0, d.h. die
Richtung dieser Einheitsvektoren ändert sich mit der Zeit. In einer Übung leiten wir
die Darstellung der Geschwindigkeit und der Beschleunigung eines Teilchens in der
Polarkoordinatenbasis her.
7.5.2 Zylinderkoordinaten
Wir betrachten zunächst eine kartesische Basis in drei Dimensionen. Anstelle karte-
sischer Koordinaten verwenden wir Zylinderkoordinaten ρ, φ, z, definiert durch
p y
ρ= x2 + y 2 , φ = arctan , z = z,
x
0 ≤ ρ < ∞, 0 ≤ φ < 2π, −∞ < z < ∞, (7.5.10)
beziehungsweise
x = ρ cos φ, y = ρ sin φ, z = z,
188 Einführung in die Theoretische Physik
siehe Abbildung 7.12. Auf der z-Achse ist φ unbestimmt, d.h. nicht wohldefiniert.
Für den Ortsvektor erhält man
r = xe1 + ye2 + ze3 = ρ cos φ e1 + ρ sin φ e2 + z e3 = r(ρ, φ, z). (7.5.11)
Das Zylinderkoordinatennetz erhält man folgendermaßen. Zunächst führt man Ko-
ordinatenflächen r(ρ0 , φ, z), r(ρ, φ0 , z) und r(ρ, φ, z0 ) ein, deren Gestalt aus der
Abbildung 7.12(b) ersichtlich ist.
ρ = ρ0 ↔ Zylindermantel um z-Achse,
φ = φ0 ↔ Halbebene ⊥ xy-Ebene mit z-Achse als Randlinie,
z = z0 ↔ Ebene parallel zur xy-Ebene.
Die Schnittkurve zweier Koordinatenflächen definiert eine Koordinatenlinie, siehe
Fig. 7.12. Die Koordinatenlinien sind analytisch durch r(ρ0 , φ0 , z), r(ρ, φ0 , z0 ) und
r(ρ0 , φ, z0 ) gegeben; man bezeichnet sie (in der angegebenen Reihenfolge) als z-, ρ-
und φ-Linien. Durch jeden Punkt r(ρ0 , φ0 , z0 ) im Raum laufen drei Koordinatenli-
nien, die sich paarweise senkrecht schneiden. Das folgt aus der Orthogonalität der
Tangentenvektoren, die wir jetzt bestimmen.
Wie in 7.5.1 können wir nun die Tangenteneinheitsvektoren an diese Koordina-
tenlinien im Punkt ρ, φ, z berechnen, siehe Abbildung 7.12(c). Wir erhalten
∂r
∂ρ
eρ ≡ = cos φ e1 + sin φ e2 ,
∂r
∂ρ
∂r
∂φ
eφ ≡ = − sin φ e1 + cos φ e2 , (7.5.12)
∂r
∂φ
∂r
∂z
ez ≡ ∂r = e3 .
∂z
wobei
Aρ = A · eρ , Aφ = A · eφ , Az = A · ez . (7.5.15)
Ist A(x) in der Zylinderkoordinatenbasis gegeben, berechnet man seine Komponen-
ten in einer kartesischen Basis mit Relationen analog zu (7.5.9).
Beispiel: In der Zylinderkoordinatenbasis ist der Ortsvektor r = ρeρ + zez .
Bemerkung: Die Hinweise auf Seite 187 gelten analog. Hier ist eρ = eρ (φ), eφ =
eφ (φ), während ez ein konstanter Einheitsvektor ist.
7.5 Polarkoordinaten und Zylinderkoordinaten 189
z φ = φ0
z = z0
ρ = ρ0
P (ρ, φ, z) y
0
z
0 y
x
φ
ρ
x
(a) Koordinaten. (b) Koordinatenflächen und -linien.
z
~ez
~eρ
~eφ
~ez
~eφ
~eρ
0 y
x
(c) Basisvektoren.
z φ = φ0
z
θ = θ0
P (ρ, θ, φ)
r = r0 θ0
r
θ y
0 y r0 0
φ0
φ
x
x
(a) Koordinaten. (b) Koordinatenflächen und -linien.
~er
~eφ
~er
~eφ ~eθ
~eθ
y
0
(c) Basisvektoren.
beziehungsweise
siehe Abbildung 7.13. Der Winkel θ ist der sogenannte Polarwinkel, φ heißt Azimut-
winkel. Auf der z-Achse ist φ unbestimmt, d.h. nicht wohldefiniert.
Mit (7.5.17) ist
r = r0 , θ = θ0 , φ = φ0 ,
wobei
Aρ = A · eρ , Aθ = A · eθ , Aφ = A · eφ . (7.5.22)
Ist A(x) in der Kugelkoordinatenbasis gegeben, berechnet man seine Komponenten
in einer kartesischen Basis mit Relationen analog zu (7.5.9).
Beispiel: In der Kugelkoordinatenbasis ist der Ortsvektor r = rer .
Bemerkung: Die Hinweise auf Seite 187 gelten analog. Hier ist er = er (θ, φ),
eθ = eθ (θ, φ) und eφ = eφ (φ).
7.6 Integration im Rn
Wir untersuchen nun Integrale über skalare Felder φ = φ(x1 , . . . , xn ) und Vektorfel-
der A = A(x1 , . . . , xn ). Konkret behandeln wir die Fälle n = 2, 3. (Im Fall n = 1
handelt es sich um Integrale über Funktionen einer reellen Variablen, die wir bereits
in Kapitel 2 besprachen.) Folgende Integrationsbereiche sind im R2 bzw. R3 von
Interesse – insbesondere bei Anwendungen in der Physik:
7.7 Kurvenintegrale
Kurvenintegrale über Vektorfelder:
Zunächst betrachten wir sog. Kurvenintegrale über Vektorfelder. Als Beispiel für ein
solches Integral sei die (mechanische) Arbeit genannt, die eine Kraft F längs eines
Weges (= Kurve) C vom Punkt r A nach r B an einem Körper leistet. Wenn F längs
des betrachteten Weges ein konstanter Vektor und C eine Gerade zwischen r A und
r B ist, dann ist die
wobei r A = r(tA ), r B = r(tB ) und t der Kurvenparameter ist. Das kann, muss aber
nicht die Zeit sein.
7.7 Kurvenintegrale 193
2 2 F~ (~ri+1 )
F~ (~r) C F~ (~ri )
~r(tB ) ∆~ri
~r(ti ) ~r(ti + ∆ti )
~r(tA )
1 1
(a) Beispiel für eine Kurve C und für ein Vektor- (b) Beispiel für eine mögliche Zerlegung.
feld F (r), r ∈ C.
Hinweis: Wenn W > 0, dann leistet die Kraft Arbeit an dem Körper. Wenn W < 0,
muss Arbeit gegen die Kraft aufgewandt werden. Mit anderen Worten: die Arbeit,
die man von außen aufbringen muss, um einen Körper in einem Kraftfeld F von
r(tA ) nach r(tB ) zu bringen, ist (−W ). Der Fall W = 0 tritt insbesondere bei der
Bewegung eines Körpers auf einer Potentialfläche bzw. -linie einer konservativen
Kraft auf.
Das Integral in (7.7.2) ist ein sogenanntes Kurvenintegral über ein Vektorfeld.
Es ist – analog zu dem bestimmten Integral (2.4.14) bezüglich einer Variablen aus
Kapitel 2 – definiert als Limes einer Riemann-Summe. Dazu unterteilen wir C in
N + 1 Punkte:
r A = r 1 , r 2 , ..., r N +1 = r B ,
siehe Abbildung 7.14. Dann ist das obige Kurvenintegral über das Vektorfeld F (r)
entlang des Weges C von r A nach r B definiert durch
ZrB N
X
I≡ F (r) · dr ≡ lim F (r i ) · ∆r i , (7.7.3)
N →∞
r A ,C ∆r i →0 i=1
vorausgesetzt, dass der Limes für jede beliebige Zerlegung mit ∆ri → 0 und N → ∞
existiert.
Beachte: Das Kurvenintegral (7.7.3) ist ein Skalar9 .
1. Die Kurve C ist durch eine Parameterdarstellung r = r(t) gegeben. Dann ist
dr
F (r) · dr = F (r(t)) · dt.
dt
Einsetzen in (7.7.3) und Substitution der Integrationsgrenzen r(tA ), r(tB ) →
tA , tB – siehe die Substitutionsregel (2.4.19) in Kapitel 2 – ergibt
ZrB ZtB
I= F (r) · dr = F (r(t)) · ṙdt . (7.7.4)
r A ,C tA
Durch diese Formel wird das Kurvenintegral auf ein gewöhnliches Riemann-
Integral bezüglich des Kurvenparameters t zurückgeführt; der Integrand ist die
skalare Funktion F · ṙ.
Der Faktor F (r(t)) liefert die Werte des gegebenen Feldes entlang der Kur-
ve, der Faktor ṙ ist der nicht-normierte Tangentenvektor an die Kurve bei
r(t); er enthält die Information über C. (Wenn t die Zeit ist, dann ist ṙ die
Geschwindigkeit.) Ein Beispiel besprechen wir unten.
2. Die Kurve C ist nicht durch eine Parameterdarstellung gegeben, sondern durch
einen funktionalen Zusammenhang zwischen den Koordinaten x, y, z – siehe
das unten angegebene Beispiel. Wie können wir in diesem Fall das Kurvenin-
tegral (7.7.3) berechnen? Wir verwenden, dass
∆r i = ∆xi e1 + ∆yi e2 + ∆zi e3 ,
F = F1 e1 + F2 e2 + F3 e3
bezüglich einer kartesischen, d.h. t-unabhängigen ONB. Somit wird (7.7.3) zu
ZrB N
X
F (r) · dr = lim [F1 (r i )∆xi + F2 (r i )∆yi + F3 (r i )∆zi ] . (7.7.5)
N →∞
r A ,C i=1
Wir betrachten zunächt den ersten Summanden. Zu jedem Wert der Koordi-
nate x eines Punktes r = (x, y, z) ∈ C gehören lokal10 eindeutige Werte von y
und z, so dass wir y und z als Funktion von x auffassen können:
y = y(x) , z = z(x).
M.a.W.: Die x-Koordinate übernimmt im ersten Summanden von (7.7.5) die
Rolle des Kurvenparameters. Der erste Summand in (7.7.5) ist dann
N
X ZxB
lim F1 (r i )∆xi = F1 (x, y(x), z(x))dx. (7.7.6)
N →∞
i=1 xA
10
Notfalls muss man C in geeignete Stücke Ci zerlegen, so dass jeder Punkt auf Ci durch x und
die eindeutigen Zuordnungen y = y(x) und z = z(x) festgelegt ist.
7.7 Kurvenintegrale 195
Die rechte Seite ist ein gewöhnliches Integral bezüglich der Variablen x.
Analog verfährt man mit dem zweiten und dritten Summanden in (7.7.5). Im
zweiten Summanden betrachten wir x und z als Funktionen von y, im dritten x
und y als Funktionen von z. Dann erhalten wir für das Kurvenintegral (7.7.3)
bzw. (7.7.5):
ZrB
I= F (r) · dr
r A ,C
ZxB ZyB ZzB
= F1 (x, y(x), z(x))dx + F2 (x(y), y, z(y))dy + F3 (x(z), y(z), z)dz .
xA yA zA
(7.7.7)
Z1 Z1 Z1
2 2
I= (3x + 2x)dx + (−9y )dy + 8z 3 dz = 2 − 3 + 2 = 1.
0 0 0
Hinweis:
Verwechseln Sie das Kurvenintegal (7.7.3) über ein Vektorfeld nicht mit dem gewöhn-
lichen Integral (5.5.13) bzw. (5.5.15) über ein Vektorfeld aus Kapitel 5.
Z ZtB
φ ds ≡ φ(r(t)) |ṙ(t)| dt , (7.7.9)
C tA
wobei |ṙ(t)| der Betrag des Vektors ṙ(t) ist. Das Integral (7.7.9) ist ein Skalar11 .
Beispiele:
1) Setzt man φ = 1, ergibt (7.7.9) die Länge s der Kurve C zwischen r(tA ) und r(tB )
– die resultierende Formel und (5.5.19) aus Kapitel 5 sind identisch.
2) Ein inhomogener, sehr dünner Draht mit bekannter Massendichte µ(r) (hier [µ] =
Masse/Länge) werde durch ein Kurvenstück C, d.h. durch r = r(λ) beschrieben.
Man erhält die Masse M des Drahts durch Berechnung von
ZλB
M= µ(r(λ)) |ṙ(λ)| dλ ,
λA
1. Wenn sich die Kurve C von r A nach r C zusammensetzt aus den Kurven C1 von
r A nach r B und C2 von r B nach r C , dann
2. Aus (7.7.10) folgt: Wenn eine Kurve C von r A nach r B rückwärts, d.h. von r B
nach r A durhlaufen wird, dann ist
ZrB ZrA
F (r) · dr = − F (r) · dr (7.7.11)
r A ,C r B ,C
Beispiel: Wir betrachten wieder das Vektorfeld A aus (7.7.8) und berechnen das
Kurvenintegral von r A = (0, 0, 0) → r B = (1, 1, 1) – aber diesmal nicht längs der
Geraden C1 , sondern längs des folgenden Parabelbogens C2 :
t
C2 : r(t) = t2 , 0≤t≤1
4
t
1
dr dr
⇒ = 2t ⇒ A(r(t)) · = 5t2 − 18t7 + 32t12
dt 3 dt
4t
r
Z B Z1
dr 293
⇒ IC2 = A · dt = (5t2 − 18t7 + 32t12 )dt = 6 IC1 .
=
dt 156
r A ,C2 0
Frage: Wann ist das Kurvenintegral (7.7.3) für ein gegebenes Vektorfeld A(r) un-
abhängig von der Form des Weges C von r A nach r B ?
Antwort: Wenn das Vektorfeld A(r) ein Gradientenfeld ist, d.h. wenn ein skalares
Feld φ(r) existiert, so dass
Beweis:
ZrB ZrB ZrB X3
(7.7.12) ∂φ
A · dr = (∇φ) · dr = dxi
i=1
∂x i
r A ,C r A ,C r A ,C
(7.7.13)
ZrB r B
(7.2.12)
= dφ = φ(r) = φ(r B ) − φ(r A ).
rA
r A ,C
Hinweis: Gl. (7.7.13) ist das Analogon zu folgendem wohlbekannten Ergebnis für
Funktionen einer Variablen: Wenn der Integrand die Ableitung einer Funktion f (x)
ist, dann ist f (x) + c die Stammfunktion, d.h.
ZxB ZxB
df xB
dx = df = f (x) = f (xB ) − f (xA ).
dx xA
xA xA
Wir definieren nun mit Hilfe des Kurvenintegrals (7.7.3) eine Funktion φC (r). Die
Koordinaten des Anfangspunktes r A = r 0 werden festhalten und die des Endpunktes
r B = r seien variabel:
C3
Zr ~r
φC (r) ≡ A(r 0 ) · dr 0 . C2 (7.7.14)
r 0 ,C
~r0
C1
Im Allgemeinen wird für ein gegebenes A(r) die Funktion φC (r) vom Weg C abhängen
– deswegen der Index C an φ. Wir bekommen für verschiedene Wege C i.A. verschie-
dene Funktionen φC . Wir zeigen nun die Umkehrung von (7.7.13):
Wenn (7.7.14) nur vom Anfangs- und Endpunkt r 0 und r, aber nicht vom Weg C
abhängt, dann ist A(r) als Gradientenfeld darstellbar.
Rechte Seite von (7.7.15): Nach dem Mittelwertsatz der Integralrechnung gibt es
einen Punkt r 00 zwischen r und r + ∆r, so dass das Integral auf der rechten Seite
von 7.7.15 durch A(r 00 ) · ∆r gegeben ist.
Linke Seite von (7.7.15): Die Taylorentwicklung von φ(r + ∆r) um r ergibt
φ(r + ∆r) − φ(r) = (∇φ) · ∆r + O((∆r)2 ).
Setzen wir beide Ergebnisse in (7.7.15) ein und bilden den Limes ∆r → 0, dann
grad φ(r) = A(r),
was zu beweisen war.
In (7.7.13) zeigten wir die Umkehrung dieser Aussage, nämlich: Wenn A von der
Form A = ∇φ, dann ist das Kurvenintegral wegunabhängig.
Somit gilt der folgende wichtige
Satz 1: Kurvenintegrale über ein Vektorfeld A sind dann und nur dann unabhängig
von der Form des Weges C, wenn A von der Form A = ∇φ ist. Das skalare Feld
φ(r) ist durch A nur bis auf eine additive Konstante festgelegt; denn offensichtlich
liefern φ(r) und φ(r) + C dasselbe A(r) = ∇φ(r).
Ein Vektorfeld A(x), das von der Form A(x) = ∇φ(x) ist, nennt man ein konser-
vatives Feld. Man bezeichnet φ oft pauschal als das Potential von A.
Insbesondere nennt man eine Kraft F (x), die in der Form
F (x) = −∇φ(x) (7.7.16)
darstellbar ist, eine konservative Kraft. Dieser Begriff wurde bereits in Abschnitt 7.4.1
eingeführt.
Hinweise:
1) Die Vorzeichenkonvention wurde bereits in Abschnittt 7.4.1 erklärt.
2) Wenn φ explizit von der Zeit abhängt, dann nennt man, wie ebenfalls bereits in
Abschnitt 7.4.1 erwähnt wurde, F (x, t) = −∇φ(x, t) eine Potentialkraft.
3) Wenn das Vektorfeld A eine z.B. auf ein Teilchen wirkende Kraft F beschreibt,
d.h. [F ] = N, dann hat φ die Dimension einer Energie, [φ] = Nm. Die Funktion φ(x)
ist die potentielle Energie des Teilchens am Punkt x. Energien können nicht abso-
lut, sondern nur in Bezug auf eine Referenzenergie gemessen werden. Diese Tatsache
spiegelt sich hier in dem Sachverhalt wieder, dass φ durch eine gegebene Kraft nur
bis auf eine additive Konstante festgelegt wird.
I Zr2 Zr1
A · dr = A · dr + A · dr C2
C r 1 ,C1 r 2 ,C2
Zr2 Zr2 ~r2
(7.7.11)
= A · dr − A · dr C
r 1 ,C1 r 1 ,C2
Zr2 Zr2 ~r1
= dφ − dφ = 0. C1
r1 r1
Ein einfach zusammenhängendes Gebiet G ist ein Gebiet, in dem sich jede geschlosse-
ne Kurve, die ganz in G liegt, auf einen Punkt in G zusammenziehen lässt. Beispiele
im R2 sind in Abbildung 7.15 gezeigt; Beispiele im R3 werden in der Legende dieser
Abbildung erläutert.
Aus Zeitgründen können wir den soeben zitierten Satz nicht beweisen. (Siehe
dazu die Vorlesung Höhere Mathematik III oder beispielsweise das Buch von Groß-
mann, S. 181ff). Wir machen uns aber anhand eines Beispiels im R2 klar, warum
7.7 Kurvenintegrale 201
Abbildung 7.15: Beispiele für einfach zusammenhängende Gebiete (a,b) und nicht
einfach zusammenhängende Gebiete (c,d) im R2 . Beispiele im R3 : Wir denken uns
die gezeigten Gebiete aus der Zeichenebene heraus ins Dreidimensionale (3D) fortge-
setzt. Die so erzeugten 3D-Gebiete a,b sind ebenfalls einfach zusammenhängend. Aus
den Löchern in den 2D-Gebieten c,d werden in 3D beispielsweise Kugeln, Schläuche
oder krumme Würste. Wenn diese Gebilde ganz innerhalb des jeweiligen 3D-Gebiets
G liegen oder die Randfläche von G nur einmal berühren oder durchstoßen, dann ist
G einfach zusammenhängend; denn jede geschlossene Kurve in G kann dann immer
auf einen Punkt in G zusammengezogen werden. Falls diese Objekte die Randfläche
von G mindestens zweimal berühren oder durchstoßen, dann ist G nicht einfach
zusammenhängend.
die Eigenschaft einfach zusammenhängend wichtig ist. Wir zeigten in (7.4.23), dass
die Rotation des zweidimensionalen Vektorfeldes (7.4.22),
1 −y
B(x) = 2 (7.7.20)
x + y2 x
Am Ursprung wird rot B singulär. Die punktierte Ebene R2 \ {(0, 0)} ist aber of-
fensichtlich nicht einfach zusammenhängend.
H Somit kann man aufgrund des obigen
Satzes nicht erwarten, dass C B · dr = 0, wenn C eine geschlossene Kurve ist, die
den Nullpunkt umschließt. Sei C o.B.d.A. der Kreis um den Nullpunkt mit Radius
R. In der Tat findet man, dass
I
B · dr = 2π ,
C
wenn C den Nullpunkt einmal umkreist. Wir zeigen das als Hausaufgabe. Zur Be-
rechnung des KreisintegralsR benutzt man bequemerweise ebene Polarkoordinaten.
r
Konsequenz: Das Integral r0 B(r 0 ) · dr 0 ist wegabhängig; denn wenn von r 0 → r
zum einen auf einem Weg oberhalb und zum anderen auf einem Weg unterhalb des
Ursprungs integriert wird, ist die Differenz der beiden Wegintegrale 2π. Demzufol-
ge kann man keine eindeutige Funktion φ bestimmen, so dass B = ∇φ(r) in der
202 Einführung in die Theoretische Physik
punktierten Ebene.
Hinweise:
1) Wenn man (7.7.20) in einem einfach zusammenhängenden HGebiet G des R2 be-
trachtet, das den Ursprung nicht enthält, dann rot B = 0 und C B · dr = 0 für alle
geschlossenen Kurven in G. D.h. lokal lässt sich B durchaus als der Gradient eines
Potentials darstellen. Diese lokalen Potentiale lassen sich aber nicht widerspruchsfrei
zu einem Potential auf R2 \ {(0, 0)} zusammensetzen.
3) Wir betrachten die von einem sich bei r 0 = 0 befindenden Massenpunkt ver-
ursachte Gravitationskraft, bzw. die von einer sich bei r 0 = 0 befindenden Punkt-
ladung verursachten Coulombkraft (auf einen anderen Massenpunkt bzw. Punktla-
dung) an der Stelle r im dreidimensionalen Raum. Beide Kräfte sind von der Form
γ r
F (r) = , r ∈ G = R3 \ {(0, 0, 0)} ,
r2 r
wobei r = |r|. Im Ursprung wird F singulär; in G Hist rot F = 0 – nachrechnen! Das
Gebiet G ist einfach
R r zusammenhängend! Somit ist C F · dr = 0 für jede geschlossene
0 0
Kurve in G, d.h. r0 F (r ) · dr ist wegunabhängig. Demzufolge ist F in G darstellbar
als F = −grad φ, wobei φ = γ/r. Die Gravitationskraft und Coulombkraft sind in
der Tat Gradientenfelder.
Fazit: Das folgende Kriterium ist hinreichend dafür, dass A ein Gradientenfeld
ist:
Wenn rot A = 0 in einem einfach
⇒ Es existiert ein φ(r) mit A = ∇φ.
zusammenhängenden Gebiet
∂
φ = A1 (x, y, z) ,
∂x
∂
φ = A2 (x, y, z) , (7.7.22)
∂y
∂
φ = A3 (x, y, z)
∂z
Zr
φ(r) = A(r 0 ) · dr 0 . (7.7.23)
r0
Zur Berechnung von (7.7.23) längs eines solchen Weges kann man Methode 2 auf Sei-
te 194 benutzen. Die Funktion φ(r) ist, wie gesagt, durch A nur bis auf eine additive
Konstante festgelegt. Dies entspricht in (7.7.23) dem willkürlichen Anfangspunkt r 0 .
Durch Vorgabe von φ(r 0 ) ist φ(r) als Funktion eindeutig festgelegt.
Beispiele:
2. Sei
3x
A(r) = −y 2 .
0
Dieses Feld ist offensichtlich in ganz R3 definiert und
rot A = 0 ∀r ∈ R3 .
∂x φ = 3x , (1)
∂y φ = −y 2 , (2)
∂z φ = 0 . (3)
∂y f (y, z) = −y 2
y3
Z
⇒ f (y, z) = − y 2 dy = − + g(z) . (5)
3
Einsetzen in (3) und Integration liefert
∂g(z)
= 0 ⇒ g(z) = const. (6)
∂z
Aus (4), (5) und (6) folgt schließlich
3 y3
φ(x, y, z) = x2 − + const.
2 3
Man kann φ(r) auch mit Methode 2, d.h. durch Berechnung des Integrals
(7.7.23) bestimmen – Hausaufgabe!
xi , yi
∆Fi
wobei F ⊆ R2 ein Gebiet im R2 und f (x, y) eine integrierbare Funktion (siehe un-
ten) ist. Das Integral (7.8.1) ist ein Beispiel für ein zweidimensionales Integral, auch
Doppelintegral oder Flächenintegral genannt. Der Begriff Flächenintegral ist miss-
verständlich, denn
• nur wenn das Produkt der Integrationsvariablen x, y die Dimension einer Fläche
hat und f (x, y) = 1, dann liefert das Doppelintegral (7.8.1) die Fläche des zweidi-
mensionalen Gebiets F im geometrischen Sinn.
• Wenn f 6= 1, sollte man präziser von einem Integral über die ,,Fläche” F sprechen.
Die Dimension von I ist durch die Dimension von f und der Integrationsvariablen
bestimmt.
Zur Definition von (7.8.1): Man überzieht die Fläche F mit einem beliebigen
Koordinatennetz (das nicht kartesisch sein muss), siehe Abbildung 7.16. Das Gebiet
F wird dadurch auf beliebige Weise in N Teilflächenstücke ∆Fi zerlegt. Innerhalb
eines Teilflächenstücks wertet man die Funktion f (x, y) an einem beliebigen Punkt
(xi , yi ) ∈ ∆Fi aus und bildet die Riemann-Summe
N
X
f (xi , yi )∆Fi . (7.8.2)
i=1
Das Doppelintegral (7.8.1) ist definiert als der Limes der Riemann-Summe
ZZ N
X
f (x, y) dx dy = lim f (xi , yi )∆Fi , (7.8.3)
N →∞
F ∆Fi →0 i=1
falls dieser Limes für beliebige Zerlegungen existiert. Die Funktion f (x, y) heißt dann
integrierbar im Gebiet F – die Reihenfoge der Integration kann vertauscht werden.
Bei einer kartesischen Zerlegung ist ∆Fi = ∆xi ∆yi . Beachten Sie, dass mit ∆Fi → 0
206 Einführung in die Theoretische Physik
y y
y = g2 (x)
d
F x = h1 (y) F
x = h2 (y)
c
y = g1 (x)
x x
a b
(a) (b)
gemeint ist, dass sowohl die Länge als auch die Breite des Flächenelements gegen
Null gehen muss: ∆xi → 0 und ∆yi → 0.
Mit der Riemann-Summe (7.8.3) kann man das Doppelintegral näherungsweise
(numerisch) berechnen. Man wählt N 1 und ∆Fi 1 (in adäquaten Einheiten)
und wertet die endliche Summe auf der linken Seite von (7.8.3) aus.
Wie kann man das Doppelintegral analytisch berechnen? Notwendigerweise muss
der Rand der Fläche F durch Funktionen y = y(x) oder x = x(y) in der xy-Ebene
analytisch darstellbar sein.
Die Abbildungen in 7.17 zeigen dasselbe Gebiet F , dessen Rand – der die Inte-
grationsgrenzen bestimmt – auf zwei verschiedene Weisen parametrisiert ist. Man
kann das Integral (7.8.1) für Gebiete dieses Typs demzufolge auf zweifache Weise
berechnen.
ZZ
I= f (x, y) dx dy
F
Zb gZ2 (x)
Gleichung (7.8.4) entspricht der Abbildung 7.17(a). Hier integriert man zunächst
7.8 Zweidimensionale Integrale 207
y
g1 (x)
g2 (x)
g3 (x)
g4 (x)
x
a b c d
Abbildung 7.18: Eine Fläche mit einem komplizierteren Rand als der in Abb. 7.17.
für festgehaltenes x über die Variable y, also längs der gestrichelten Linien parallel
zur y-Achse, von der unteren Grenze y1 = g1 (x) zur oberen Grenze y2 = g2 (x). Das
Ergebnis ist eine Funktion f1 (x), die man dann über die Variable x im Intervall
a ≤ x ≤ b integriert.
Alternativ kann I mit Gleichung (7.8.5) berechnet werden, d.h. es wird erst über
x und dann über y integriert – siehe Abbildung 7.17(b).
Es gibt natürlich auch Gebiete mit komplizierteren Rändern – dergestalt, dass
ein solcher Rand nicht zusammensetzbar ist aus einem jeweils durch eine Funktion
beschreibbaren oberen und unteren (bzw. linken und rechten) Randteil. Ein Beispiel
für ein solches Gebiet ist in Abbildung 7.18 gezeigt. Der linke Rand dieses Gebietes
kann nicht durch eine einzige Funktion beschrieben werden. Man muss in diesem
Fall das Doppelintegral I in eine Summe von Beiträgen zerlegen. Wir benutzen
(7.8.4) und beschreiben den linken Rand in den folgenden x-Intervallen durch die
Funktionen g1 - g4 :
c ≤ x ≤ d : y1 = g4 (x), y2 = g1 (x),
b ≤ x ≤ c : y1 = g4 (x), y2 = g3 (x),
a ≤ x ≤ c : y1 = g2 (x), y2 = g1 (x).
Dann
Zd Zc Zc
I= . . . dx + . . . dx + . . . dx .
c b a
208 Einführung in die Theoretische Physik
Beispiel:
y y = x2
y = x2 und y = 2x
y √
bzw. x = 2 und x = + y .
x
c=0
a=0 b=2
Benutze die Formel (7.8.4):
Zb=2 Z2x
I= xy 2 dy dx
a=0 x2
| {z }
f1 (x)
y=2x
xy 3 8x4 x7
f1 (x) = = −
3 y=x2 3 3
Z2 4
x7
8x 32
⇒ I= − dx = .
3 3 5
0
pfiehlt es sich bei Integration über eine Kreisfläche, anstelle von kartesischen Koor-
dinaten x, y ebene Polarkoordinaten ρ, φ zu benutzen:
p
x = ρ cos φ ρ = x2 + y 2 , 0 ≤ ρ < ∞,
−→ y (7.8.7)
y = ρ sin φ φ = arctan , 0 ≤ φ < 2π.
x
Allgemein: x, y → u, v:
x = x(u, v) u = u(x, y)
und Umkehrung (7.8.8)
y = y(u, v) v = v(x, y).
Zb Zu(b) Zβ
dx dx
f (x)dx = f (x(u)) du = f (x(u)) du. (7.8.9)
du du
a u(a) α
Man beachte die Betragsstriche auf der rechten Seite, die aus folgendem Grund auf-
treten. Bei der im betrachteten Intervall umkehrbaren Transformation u = u(x) ist
entweder du/dx > 0 oder du/dx < 0. Wenn du/dx = 1/(dx/du) < 0, dann ist
u(a) = β und u(b) = α, wobei nach Vereinbarung β > α. Der Vorzeichenwechsel,
der beim Vertauschen der Integrationsgrenzen entsteht, wird durch die Ersetzung
dx/du → |dx/du| kompensiert.
Mit (7.8.11) kann man für jedes Zahlenpaar ∆x, ∆y eindeutig ein Zahlenpaar ∆u,
∆v ausrechnen. Für ∆x, ∆y → 0 erhalten wir
∆u ∂x u ∂y u ∆x
= · . (7.8.12)
∆v ∂x v ∂y v ∆y
| {z }
≡D(x,y)
Die Matrix D(x, y) heißt Funktionalmatrix der Transformation (7.8.8). Damit man
umgekehrt jedem ∆u, ∆v eindeutig ein ∆x, ∆y zuordnen kann, muss die inverse
Matrix D−1 existieren. Wie wir in Abschnitt 6.5.3 lernten, ist das der Fall, wenn die
Determinante det D 6= 0.
Dies ist das gesuchte Kriterium: Die Transformation (7.8.8) ist in der Umgebung
eines Punktes x, y genau dann umkehrbar eindeutig, wenn
∂x u ∂y u ∂(u, v)
det D(x, y) ≡ ≡ 6= 0. (7.8.13)
∂x v ∂y v ∂(x, y)
Wenn (7.8.13) von Null verschieden ist, kann vermutet werden, dass auch (7.8.14)
existiert. Tatsächlich gilt die wichtige Formel
∂(x, y) 1
= ∂(u,v)
. (7.8.15)
∂(u, v)
∂(x,y)
Beweis: Wir zeigen diese Formel für den allgemeinen Fall einer Transformation
von n Variablen. Sei xi = xi (u1 , u2 , ..., un ) und ui = ui (z1 , ..., zn ), i = 1, ..., n. Die
Kettenregel besagt, dass
n
∂xi X ∂xi ∂uk
= ⇔ Matrix D1 = D2 D3 .
∂zj ∂uk ∂zj
k=1 | {z }
|{z}
D1 D2 D3
Daraus folgt
det D1 = det D2 det D3 . (7.8.16)
Setze nun zi = xi . Dann ist D1 = δij die Einheitsmatrix, d.h. det D1 = 1. Damit
erhalten wir aus (7.8.16) die Formel (7.8.15).
7.8 Zweidimensionale Integrale 211
y
v-Linien
∂~r(u, v)
dv
∂v
dF dy dF
∂~r(u, v)
dx du
∂u
x
u-Linien
(a) Kartesische Koordinaten x, y. (b) Allgemeine Koordinaten u, v.
Abbildung 7.19: Das Flächenelement dF in der xy- und der uv-Ebene. Zur Bezeich-
nung ,,u, v-Linien”, siehe Abschnitt 7.5.3.
Das Flächenelement dF :
In kartesischen Koordinaten x, y ist das zweidimensionale Flächenelement gegeben
durch dF = dxdy, siehe Abbildung 7.19(a). Wir führen nun eine Variablentransfor-
mation x, y 7→ u, v durch und berechnen dF in den neuen Koordinaten u, v. Diese
sind i.A. krummlinige Koordinaten. Man beachte, dass wir hier Flächen in der Ebene
R2 behandeln. (Den allgemeineren Fall von Flächen im R3 besprechen wir im nächs-
ten Abschnitt.) Die Punkte in der Ebene R2 , insbesondere die einer Teilfläche werden
analytisch beschrieben durch die Parameterform (wir benutzen hier der Einfachheit
halber eine kartesische Basis):
r(u, v) = x(u, v)e1 + y(u, v)e2 . (7.8.17)
Durch x, y 7→ u, v wird die xy-Ebene (≡ R2 ) auf die uv-Ebene (≡ R2 ) abgebildet.
Wir berechnen nun die Tangentenvektoren an die u- und v-Koordinatenlinie im
Punkt (u, v):
∂r ∂r
tu ≡ du , tv ≡ dv, (7.8.18)
∂u ∂v
siehe Abbildung 7.19(b). Beachte, dass es sich um nichtnormierte13 Vektoren han-
delt.
Das Flächenelement dF ist die Fläche des Parallelogramms, das von diesen Tangen-
tenvektoren aufgespannt wird. Diese Fläche ist (vgl. Abbildung 5.5, Seite 106)
∂r ∂r
dF = |tu × tv | =
× du dv. (7.8.19)
∂u ∂v
13
Die Differentiale du und dv in (7.8.18) sind notwendig. Als Beispiel wenden wir (7.8.18) auf
ein kartesisches Koordinatennetz an, d.h. r = xe1 + ye2 . Man erhält
∂r ∂r
dx = e1 dx , dy = e2 dy.
∂x ∂y
Einsetzen in (7.8.19) ergibt dF = dxdy, also das erwartete Ergebnis!
212 Einführung in die Theoretische Physik
y y
√
y2 = R 2 − x2
b
R x a a x
0 0
b
√
y 1 = − R 2 − x2
(a) Kreisfläche. (b) 2. Fläche einer Ellipse.
Somit ist
∂(x, y)
dF = |∂u x ∂v y − ∂v x ∂u y|du dv =
du dv. (7.8.20)
∂(u, v)
Mit diesem Ergebnis ist die Transformationsformel für zweidimensionale Integrale:
ZZ ZZ
∂(x, y)
f (x, y)dx dy = f (x(u, v), y(u, v)) du dv . (7.8.21)
∂(u, v)
F F0
Beispiele:
ZR Zy2
I= x2 y 2 dy dx .
−R y1
x = r cos φ , y = r sin φ
Das Integral von f (x, y) = x2 y 2 über den Kreis aus Fig. 7.20(a) ist dann14
Z2π ZR Z2π
5 2 R6
I= r (cos φ sin φ) dr dφ = (cos φ sin φ)2 dφ
6
0 0 0
6
2π
R6 π
R φ sin(4φ)
= − = .
6 8 32
0 24
x2 y 2
2
F = (x, y) ∈ R : 2 + 2 ≤ 1 ,
a b
deren Rand durch
x2 y 2
+ 2 =1 (7.8.22)
a2 b
beschrieben wird. Zur Berechnung der Fläche der Ellipse müssen wir die Funk-
tion
f (x, y) = 1
14
Der Sachverhalt, dass x, y ↔ ρ, φ am Ursprung nicht definiert ist, d.h. die Jacobi-Determinante
∂(x, y)/∂(u, v) dort Null wird, ist für zweidimensionale Integrale unschädlich, siehe HöMa-
Vorlesung.
214 Einführung in die Theoretische Physik
x, y → r, φ
mit
x = ar cos φ , y = br sin φ (7.8.23)
an. (Das sind sogenannte verallgemeinerte Polarkoordinaten.) Mit diesen Ko-
ordinaten lässt sich die Ellipsenfläche folgendermaßen beschreiben:
F = (r, φ) ∈ R2 : 0 ≤ φ ≤ 2π, 0 ≤ r ≤ 1 .
ZZ Z2π Z1 Z2π
1
FI = dx dy = abr dr dφ = ab dφ = abπ .
2
F 0 0 0
y = x2 → v = −u2 ,
0 ≤ u ≤ 2. (7.8.24)
y = 2x → v = −2u ,
7.8 Zweidimensionale Integrale 215
In diesem Intervall ist −u2 ≥ −2u. Somit beschreibt v = −u2 den oberen Rand der
Fläche, während der untere Rand durch v = −2u gegeben ist.
• Bei Anwendung der Transformationsformel (7.8.21) muss zum einen
∂(x, y)
∂(u, v) = +1
und zum anderen die unterhalb Gleichung (7.8.21) angegebene Vorschrift verwendet
werden. D.h. als untere Grenze des Integrals bezüglich v muss die Gleichung für den
unteren Rand, also v1 = −2u, verwendet werden. Mit Formel (7.8.21) erhält man
für f (x, y) = xy 2 = uv 2 :
Z−u2
uZ2 =2
32
I= uv 2 (+1)dv du = .
5
u1 =0 −2u
| {z }
7 4
− u3 + 8u3
ist folgendermaßen anzuwenden: Auf der rechten Seite benutzt man als untere und
obere Integrationsgrenzen genau diejenigen, die sich aus der Transformation der
ursprünglichen unteren und oberen Grenzen ergeben. Für das obige Beispiel (Spie-
gelung) sind das die Gleichungen auf der rechten Seite von (7.8.24). Dann ist das
Integral gemäß Formel (7.8.25):
xZ2 =2
2x uZ2 =2
−2u
Z Z
32
I= xy 2 dy dx = uv 2 (−1)dv du = .
5
x1 =0 x2 u1 =0 −u2
u1 ≤ u ≤ u2 ,
r(u, v) = x(u, v)e1 + y(u, v)e2 + z(u, v)e3 , (7.8.26)
v1 ≤ v ≤ v2 .
15
Das eindimensionale Analogon dieser Formel ist die mittlere Formel in (7.8.9).
216 Einführung in die Theoretische Physik
v-Linie
dF~ u-Linie
~tv
·· ~tu
~r(u, v)
Diese Form liefert den Ortsvektor eines jeden Punktes P ∈ F . Natürlich kann r(u, v),
je nach Zweckmäßigkeit, auch bezüglich einer krummlinigen Basis dargestellt wer-
den.
Man definiert nun an jedem Punkt r ∈ F ein vektorielles Flächenelement dF , in
dem auch die Lage der Fläche im R3 in der infinitesimalen Umgebung von r kodiert
ist. Man definiert den infinitesimalen Vektor
(7.8.19) ∂r ∂r
dF = n dF = n |tu × tv | = n × du dv , (7.8.27)
∂u ∂v
wobei n = n(r) der Einheitsvektor ist, der senkrecht zur der durch die Tangenten-
vektoren tu und tv aufgespannten Tangentialebene an F am Punkt r ist:
tu × tv
n=± . (7.8.28)
|tu × tv |
Die Vereinbarung ,,n ⊥ tu , tv ” legt n offensichtlich nur bis auf ein Vorzeichen fest16 .
An dieser Stelle vereinbaren wir, was man bei einer berandeten, orientierten17 Fläche
und bei einer geschlossenen Fläche unter ,,Ober- und Unterseite” bzw. ,,Außen- und
Innenseite” versteht.
16
Anders gesagt: Das Vorzeichen von tu × tv hängt von der gewählten Parametrisierung r(u, v)
ab.
17
Nicht alle berandeten Flächen haben zwei Seiten und sind orientierbar. Ein bekanntes Gegen-
beispiel ist das sog. Möbius-Band.
7.8 Zweidimensionale Integrale 217
• Welche Seite einer geschlossenen Fläche, z.B. der Oberfläche eines Quaders oder
einer Kugel, die Außenseite ist, ist anschaulich klar. Bei einer geschlossenen Fläche
wird per Konvention das Vorzeichen auf der rechten Seite von (7.8.28) so gewählt,
dass dF = n dF nach außen, also nicht in das umschlossene Volumen hinein zeigt.
• Bei einer orientierbaren, berandeten Fläche soll n per Konvention immer nach
,,oben” zeigen. Die obere Seite einer solchen Fläche definiert man wie folgt: Wenn
der Rand der Fläche im mathematisch positiven, also im Gegenuhrzeigersinn durch-
laufen wird, ist ,,oben” durch die Rechtsschraubenregel (Daumen der rechten Hand)
definiert. Wenn die Parametrisierung r = r(u, v) so ist, dass für u → u + du,
v → v + dv die Änderung r → r 0 am Rand der Fläche im Gegenuhrzeigersinn er-
folgt, dann ist demzufolge n ∝ tu ×tv ; andernfalls muss das Minuszeichen in (7.8.28)
gewählt werden.
Der Vektor n = n(r) hat per Definition den Betrag |n| = 1, ändert aber bei
einer gekrümmten Fläche seine Richtung in Abhängigkeit von r ∈ F . Wenn die
Fläche in der xy-Ebene bzw. in einer dazu parallelen Ebene liegt, dann
n = ±e3 . (7.8.29)
Das Ergebnis ist offensichtlich ein Skalar. Weitere Typen von Flächenintegralen sind
ZZ
A(r) × dF , (7.8.31)
F
ZZ
φ(r)dF . (7.8.32)
F
Die Integrale (7.8.31) und (7.8.32) liefern als Resultat jeweils einen Vektor.
Integrale des Typs (7.8.30) - (7.8.32) werden in der Regel erst in der Vorlesung
Theoretische Physik II: Elektrodynamik benötigt. Deswegen gehen wir hier nicht
weiter darauf ein.
218 Einführung in die Theoretische Physik
wobei V ⊆ R3 ein Gebiet im Raum ist. Die Funktion f (r) soll integrierbar in V
sein, wobei integrierbar analog zu (7.8.3) definiert ist. Für eine beliebige Zerlegung
von V in kleine Volumina ∆Vi muss der Limes
N
X
lim f (r i )∆Vi = I (7.9.2)
N →∞
∆Vi →0 i=1
existieren. Integrale der Form (7.9.1) nennt man gelegentlich auch Volumenintegrale,
wobei diese Namensgebung – wie die Bezeichnung Flächenintegral für (7.8.1) – miss-
verständlich ist. Wenn die Dimension [dxdydz] = (Länge)3 liefert (7.9.1) für f = 1
den Volumeninhalt von V im strikten geometrischen Sinn.
Integrale der Form (7.9.1) berechnet man völlig analog zu den Flächenintegralen
(7.8.1). Um (7.9.1) tatsächlich auf analytische Weise zu berechnen zu können, müssen
notwendigerweise für eine gegebene Funktion f (x, y, z) und gegebenes Gebiet V die
Randflächen von V analytisch darstellbar sein.
V x1 y1 (x) z1 (x,y)
Für integrierbare Funktionen f hängt das Integral nicht von der Reihenfolge der
Integrationen bezüglich x, y, z ab. Bei einem konkreten Problem wird die Reihenfolge
der Integration durch die Darstellung der Oberfläche von V diktiert.
Das Volumen V des Gebietes erhält man durch Integration der Funktion f (x, y, z) =
1, d.h. durch Aufsummation der Volumenelemente ∆Vi .
ZZZ
V = dx dy dz. (7.9.4)
V
7.9 Dreidimensionale Integrale 219
V = {0 ≤ x ≤ 1, − 1 ≤ y ≤ 2, − 2 ≤ z ≤ 0}.
2 0
ZZZ Z1 Z Z
I= f (x, y, z) dx dy dz = dx dy dz (x2 + y 2 ) = 8 .
V 0 −1 −2
Prüfen Sie nach, dass I in der Tat unabhängig von der Reihenfolge der Integrationen
ist.
Das Volumen dieses Quaders ist
Z1 Z2 Z0
V = dx dy dz = 6.
0 −1 −2
Für die Determinante der Umkehrtransformation gilt (siehe die Formel (7.8.15), die
allgemein für n Variable bewiesen wurde):
∂(u, v, w) 1
= ∂(x,y,z)
. (7.9.7)
∂(x, y, z)
∂(u,v,w)
wobei V 0 das Bild von V im (u, v, w)-Raum ist. Hinsichtlich der oberen und unteren
Integrationsgrenzen auf der rechten Seite von (7.9.8) ist die Bemerkung unterhalb
220 Einführung in die Theoretische Physik
von (7.8.21) zu beachten. Oft ist folgende Merkregel hilfreich: Wähle die unteren
und oberen Integrationsgrenzen auf der rechten Seite von (7.9.8) so, dass auch das
Integral bezüglich der transformierten Variablen das Volumen V mit dem richtigen
Vorzeichen liefert:
ZZZ ZZZ
∂(x, y, z)
V = dx dy dz = ∂(u, v, w) du dv dw.
(7.9.9)
V V0
Analog zu (7.8.25) findet man in der Literatur auch für Dreifach-Integrale die Trans-
formationsformel (7.9.8) ohne Betragsstriche an der Jacobi-Determinanten. Bei An-
wendung dieser Formel werden die unteren und oberen Integrationsgrenzen analog
zum zweidimensionalen Fall auf Seite 215 bestimmt.
Beispiele:
1. Kartesische Koordinaten ↔ Zylinderkoordinaten: x, y, z ↔ ρ, φ, z,
x = ρ cos φ, y = ρ sin φ, z = z.
dx dy dz = ρ dρ dφ dz. (7.9.10)
Der Sachverhalt, dass die Transformationen 1) und 2) für Punkte auf der z-Achse
nicht umkehrbar sind, d.h. die obigen Jacobi-Determinanten dort Null werden, ist
für dreidimensionale Integrale unschädlich, siehe HöMa-Vorlesung.
ZZZ Z2π Zπ ZR
(7.9.11) 4
VK = dx dy dz = dφ sin θ dθ r2 dr = πR3 .
3
0
K
|0 {z }0
R1
−1 d cos θ
Zum Schluss noch ein Hinweis zur Notation: Es ist unbequem, bei Mehr-
fachintegralen das Integralsymbol mehrfach hinzuschreiben; deswegen benutzt man
oft nur ein Integralzeichen – die Vielfachheit der jeweiligen Integration ist aus dem
Integrationsmaß, d.h. dem Linien-, Flächen- oder Volumenelement ersichtlich. Für
Flächen- und Volumenelemente in kartesischen Koordinaten sind die Abkürzungen
üblich. Somit
Z Z ZZ
2
d x≡ dx1 dx2 ≡ dx1 dx2 ,
Z Z ZZZ
3
d x≡ dx1 dx2 dx3 ≡ dx1 dx2 dx3 .