Montag, 29. April 2013

Panorama 29. 4. 2013

Für die letzte Proposition habe ich in der Vorlesung keinen Beweis angegeben. Vielleicht war das ganz gut, da ich annehme, dass es für die meisten schon genug Formales in dieser Vorlesung war.  Ich werde wahrscheinlich in der nächsten Woche nur kurz etwas dazu sagen und gebe hier einen Beweis für die Interessierten.

Mächtigkeiten von Mengen


Wir definieren eine zweistellige Relation auf Mengen, die wir für zwei Mengen $A$, $B$ als $|A|=|B|$ schreiben wollen, vorerst ohne dem Ausdruck $|A|$ alleine eine Bedeutung zuzuweisen.

Definition. Wir schreiben $|A|=|B|$, wenn eine Bijektion $h\colon A\to B$ existiert.

Proposition. Dies ist eine Äquivalenzrelation.

Cantor gibt in „Ueber eine elementare Frage der Mannigfaltigkeitslehre.“ (1891) den sehr einfachen Beweis der folgenden Aussage.  Der Beweis ist als Diagonalargument bekannt.

Satz. Ist $M$ eine Menge, so existiert keine surjektive Funktion $\phi\colon M\to\{0,1\}^M$.

Beweis.  Sei $\phi\colon M\to\{0,1\}^M$.  Wir definieren $g\colon M\to\{0,1\}$ durch $g(x):=1-\phi(x)(x)$. Dann gilt für beliebiges $x\in M$, dass $g(x)\ne\phi(x)(x)$, also $g\ne\phi(x)$.  Damit ist $g\notin\mathrm{Im}\,\phi$.

Bemerkung. $\{0,1\}^M\to\mathcal P(M)$, $f\mapsto \{x\colon f(x)=1\}$ ist eine Bijektion.

Definition. Wir schreiben $|A|\le|B|$, wenn eine injektive Funktion $f\colon A\to B$ existiert.

Proposition. Diese Relation ist transitiv.

Satz. (Cantor-Bernstein-Schröder) Sind $f\colon A\to B$ und $g\colon B\to A$ Injektionen, so existiert eine Bijektion $h\colon A\to B$.  (Ist $|A|\le |B|$ und $|B|\le |A|$, so ist $|A|=|B|$.)

Proposition. Es ist $|\mathbb R|$=$|\mathcal P(\mathbb N)|$.

Beweis. Dazu genügt es nun Injektionen $\{0,1\}^{\mathbb N}\to\mathbb R$ und $\mathbb R\to\{0,1\}^{\mathbb N}$ anzugeben. Ersteres geschieht durch $a\mapsto\sum_{k=0}^\infty 3^{-(k+1)}a_k$, letzteres dadurch, dass wir eine reelle Zahl $x$ auf eine Folge $a$ mit $x=\sum_{k=0}^\infty 2^k a_{2k+1}+\sum_{k=0}^\infty 2^{-(k+1)}a_{2k}$ abbilden. Beides wurde in der Vorlesungen mit Darstellungen zur Basis $3$ beziehungsweise $2$ erläutert.

Wir haben damit erneut gesehen, dass $|\mathbb R|>|\mathbb N|$.

Auf die beiden folgenden Fragen werden wir zurückkommen.

Frage. Gilt für Mengen $A$ und $B$ immer $|A|\le |B|$ oder $|B|\le |A|$?

Frage. (Kontinuumshypothese, Cantor 1878) Gilt für Teilmengen $X$ von $\mathbb R$ immer $|X|\le |\mathbb N|$ oder $|X|=|\mathbb R|$?

Wohlordnungen


Etwas ausführlicher habe ich das Folgende im Kapitel 7 dieses Skriptes beschrieben.

Cantors ursprüngliches Interesse kam daher, dass er formalisieren wollte, was es heißt, eine Operation unendlich oft zu iterieren.  Dies führte ihn zum Begriff der Wohlordnung.

Definition. Eine Wolhlordnung auf einer Menge $M$ ist eine totale Ordnung, bezüglich derer jede nicht-leere Teilmenge von $M$ ein Minimum hat.

Beispiele.
  • Die natürliche Ordnung auf der Menge der natürlichen Zahlen ist eine Wohlordnung.
  • Die natürliche Ordnung auf der Menge der ganzen Zahlen ist keine Wohlordnung, die Menge selber hat ja kein Minimum.
  • Ersetzt man in einer Wohlordnung jedes Element durch eine wohlgeordnete Menge, so erhält man wieder eine Wohlordnung.  (Wie ist das zu formalisieren und zu beweisen?)
  • Eine Teilmenge einer wohlgeordneten Menge ist durch die Einschränkung der Wohlordnung wohlgeordnet.
Das Konzept einer Wohlordnung hängt eng mit dem Prinzip der vollständigen Induktion zusammen.  Das vollständige Induktion über natürliche Zahlen funktioniert liegt gerade daran, dass die Menge der natürlichen Zahlen wohlgeordnet ist:  Wollen wir zeigen, dass eine Aussage $A(n)$ für alle natürlichen Zahlen $n$ gilt, so genügt es, zu zeigen, dass $A(n)$ gilt, wann immer $A(m)$ für alle $m$ mit $m<n$ gilt. Das zeigt nämlich, dass die Menge aller $n$, für die $A(n)$ nicht gilt, kein kleinstes Element hat, also leer sein muss. Ebenso funktioniert Induktion für wohlgeordnete Mengen. Ein Beispiel ist der Beweis nach der nächsten Definition.

Definition. Eine Teilmenge $A$ einer wohlgeordneten Menge $M$ heißt Anfangsstück von $M$, wenn für alle $y\in A$ und $x\in M$ mit $x<y$ gilt, dass $x\in A$.

Proposition. Es seien $M$, $N$ wohlgeordnete Mengen und $f,g\colon M\to N$ Ordnungsisomorphismen auf Anfangsstücke von $N$ (d.h. ordnungserhaltende injektive Abbildungen, deren Bilder Anfangsstücke von $N$ sind). Dann gilt $f=g$.

Beweis. Für jedes $x\in M$ gilt \[f(x)=\min\left\{y\in N\colon y>f(\tilde x)\text{ für alle }\tilde x<x\right\},\]denn sonst wäre $f$ nicht ordnungserhaltend oder $f[M]$ hätte eine „Lücke“ bei  $\min\left\{y\colon y>f(\tilde x)\text{ f. a. }\tilde x<x\right\}$, wäre also kein Anfangsstück.  Entsprechendes gilt für $g$.  Wir sehen also:  Ist $x\in M$ und $f(\tilde x)=g(\tilde x)$ für alle $\tilde x<x$, so ist \begin{multline*}f(x)=\min\left\{y\in N\colon y>f(\tilde x)\text{ für alle }\tilde x<x\right\}=\\=\min\left\{y\in N\colon y>g(\tilde x)\text{ für alle }\tilde x<x\right\}=g(x).\end{multline*}  Damit hat $\{x\in M\colon f(x)\ne g(x)\}$ kein Minimum, muss also leer sein.

Diese Proposition ist ein Schritt im Beweis der folgenden.  Zusammen sagen sie, dass der Begriff der Wohlordnung starrer ist als man vielleicht zunächst erwartet hätte.

Propostion. Seien $M$ und $N$ wohlgeordnete Mengen, so existiert ein Ordnungsisomorphismus von $M$ auf ein Anfangsstück von $N$ oder ein Ordnungsisomorphismus von $N$ auf ein Anfangsstück von $M$.

Beweis. Für $x\in M$ setzen wir $M_{\le x}:=\{\tilde x\in M\colon \tilde x\le x\}$ und entsprechend $M_{\lt x}$. Zunächst stellen wir fest, dass, wenn für jedes $x\in M$ ein Ordnungsisomorphismus $f_x\colon M_x\to N$ von $M_x$ auf ein Anfangsstück von $N$ existiert, ein Ordnungsisomorphismus von $M$ auf ein Anfangsstück von $N$ existiert.  In diesem Falle gilt nämlich für $x_1<x_2$ aufgrund der Eindeutigkeit aus der letzten Proposition, dass $f_{x_2}|_{M_{x_1}}=f_{x_1}$.  Daraus schließt man leicht, dass $x\mapsto f_x(x)$ einen Ordnungsisomorphismus von $M$ auf ein Anfangsstück von $N$ definiert.
Sei dies nun also nicht der Fall.  Dann gibt es ein kleinstes $x\in M$, für das kein $f_x$ wie oben existiert.  Das obige Argument auf $M_{<x}$ angewandt liefert einen Ordnungsisomorphismus $f$ von $M_{<x}$ auf ein Anfangsstück von $N$.  Dieses Anfangsstück muss aber ganz $N$ sein.  Sonst existierte nämlich $y=\mathrm{min}(N\setminus f[M_{<x}])$ und wir könnten $f$ durch $f(x):=y$ zu einem Ordnungsisomorphismus von $M_{\le x}$ nach $f[M_{<x}]\cup\{y\}$ fortsetzen, im Gegensatz zu der Annahme, dass ein solcher nicht existiert.  Damit ist aber $f^{-1}$ ein Ordnungsisomorphismus von $N$ auf das Anfangsstück $M_{<x}$ von $M$.

Folgerung. Sind $A$ und $B$ Mengen, die sich wohlordnen lassen, so gilt $|A|\le |B|$ oder $|B|\le |A|$.

Freitag, 26. April 2013

Panorama 26. 4. 2013


Noch einmal Fundamentalsatz der Algebra


Wir haben uns noch den Beweis von Argand in «Essai sur une manière de représenter les quantités imaginaires dans les constructions géométriques» (1874), Abschnitt 31 (S. 58-59), angesehen. Wir kannten ihn schon aus einer modernen Darstellung im Königsberger, Analysis I.  Im Vergleich fiel auf:
  • Argand zeigt, dass ein nicht konstantes Polynom in keiner komplexen Zahl, bei der es nicht verschwindet, ein Betragsminimum haben kann.  Das aber überhaupt das Betragsminimum angenommen wird, wird nicht problematisiert.
  • Argand setzt noch Variablen auf unendlich kleine Werte.
  • Argand betrachtet explizit nur den Fall, dass der lineare Term der Entwicklung des Polynoms in dem betrachteten Punkt nicht verschwindet, und schreibt, ansonsten gehe es durch Betrachten des nächsten nicht verschwindenden Terms ebenso, obwohl man argumentieren kann, dass letzter Fall gerade der Interessante ist.


Zwischenspiel zum Unendlichen


Als Beispiel für das Unendliche in der Mathematik haben wir uns den Satz von Euklid, dass es unendlich viele Primzahlen gibt, mit dem üblichen Beweis angesehen.  Es ist zu beachten, dass man dabei gar nicht von unendlichen Mengen reden muss, es wird gezeigt, dass es zu endlichen vielen Primzahlen immer noch eine weitere gibt.

Mengenlehre


Während wir gewohnt sind, beispielsweise Kurven in der Ebene als Punktmengen aufzufassen, scheint diese Vorstellung bei Gauß noch nicht vorhanden gewesen zu sein. Die Mengenlehre wie wir sie kennen wurde von Georg Cantor (1845-1918) ab 1872 begründet. Ich habe seine Arbeit „Ueber eine Eigenschaft des Inbegriffs aller reellen algebraischen Zahlen“ mit nur leicht modifiziertem Beweis präsentiert.  Er gibt dort einen neuen Beweis für den Satz, dass es in jedem Intervall reeller Zahlen eine transzendente Zahl gibt.  Dazu zeigt er:
  1. Es gibt eine Folge $(a_n)_n$ algebraischer Zahlen, in der jede algebraische Zahl vorkommt.
  2. Ist $(a_n)_n$ eine Folge reeller Zahlen und $(l,r)$ ein Intervall in $\mathbb R$, $l<r$, so existiert ein $x\in(l,r)$, so dass $x\ne a_j$ für alle $j$.
Er zeigt also, in heutigen Begriffen, die Cantor eben dort zu entwickeln begann, dass die Menge der algebraischen Zahlen abzählbar ist, ein Intervall reeller Zahlen aber nicht.  Der Beweis des zweiten Aussage benutzt wesentlich die Vollständigkeit der reellen Zahlen. (Es ist nicht das bekannte Diagonalargument, an das wir in der nächsten Sitzung noch einmal erinnern werden.)


Montag, 22. April 2013

Panorama 22. 4. 2013

Der Übungszettel zu diesem Abschnitt.


Der Fundamentalsatz der Algebra


Der Fundamentalsatz der Algebra besagt, dass jedes komplexe Polynom von positivem Grad eine Nullstelle hat.  Wir haben gesehen, dass daraus folgt, dass jedes solche Polynom in Linearfaktoren zerfällt, und auch, dass jedes reelle Polynom sich in (reelle) lineare und quadratische Faktoren zerlegen lässt.  Da aus letzterem auch folgt, dass jedes reelle Polynom ungeraden Grades eine reelle Nullstelle hat, und dies eng mit der Vollständigkeit von $\mathbb R$ zusammenhängt, sollten wir nicht verwundert sein, wenn Beweise des Fundamentalsatzes der Algebra nicht rein algebraisch sind.  Einen Beweis haben wir bereits in der Übung kennengelernt:  Königsberger gibt in seinem Analysis-Lehrbuch einen recht elementaren an, den er Argand zuschreibt, dazu später mehr.

Auch um noch ein wenig über komplexe Zahlen zu reden, haben wir eine andere Art des Beweises des Satzes besprochen.  Sei dazu \[p(z)=z^n+a_{n-1}z^{n-1}+\cdots+a_1z+a_0\]ein komplexes Polynom, $n>0$. Für $r\ge0$ definieren wir nun die geschlossene Kurve\begin{align*}\gamma_r\colon[0,2\pi]&\to\mathbb C\\\phi&\mapsto p(r(\mathrm{cos}\phi+i\,\mathrm{sin}\phi)).\end{align*}Für großes $r$ verhält sie sich in etwa wie\[\phi\mapsto(r(\mathrm{cos}\phi+i\,\mathrm{sin}\phi))^n=r^n(\mathrm{cos}\, n\phi+i\,\mathrm{sin}\,n\phi),\]läuft also $n$ mal um die $0$ herum.  Andererseits ist $\gamma_0$ eine konstante Kurve, die in $a_0$ verweilt.  Lassen wir nun $r$ von einem großen Wert nach $0$ laufen, so ändert sich $\gamma_r$ stetig mit $r$.  Dass dabei eine Kurve, die mehrfach um die Null läuft, in eine konstante übergeht, ist nur denkbar, wenn es ein $r$ gibt, für das $\gamma_r$ die Null trifft, wenn also $p$ eine Nullstelle hat.  Dies ist sicher kein strikter Beweis, aber mit Hilfe des Begriffs der Umlaufzahl kann man einen daraus machen. Außerdem ist das Argument hoffentlich anschaulich.

Wir haben dann den Beweis aus der 1799 eingereichten Dissertation von Gauß angesehen (s.a. auch diese Übersetzung). Zunächst ein modernisierter Überblick über den Beweis. Zu unserem gegebenen Polynom definieren wir zwei Teilmengen der komplexen Zahlen,\begin{align*}L_1&=\left\{z\colon \mathrm{Im}\,(p(z))=0\right\},&L_2&=\left\{z\colon \mathrm{Re}\,(p(z))=0\right\}.\end{align*}Es ist zu zeigen, dass diese einen gemeinsamen Punkt haben. Beide Mengen sind in kartesischen Koordinaten $z=x+iy$ als Nullstellenmengen von Polynomen in $x$ und $y$ gegeben, also algebraische Kurven, die im allgemeinen aus mehreren Komponenten bestehen. Wieder betrachten wir zunächst die Struktur weit draußen. Ein Kreis ausreichend großen Radius' schneidet $L_1$ und $L_2$ in je $2n$ sich abwechselnden Punkten.  Daraus schließt Gauß, dass sich im Inneren eines solchen Kreises die Kurven $L_1$ und $L_2$ schneiden müssen.

Im Gegensatz zu dieser Darstellung vermeidet Gauß die Benutzung komplexer Zahlen im Beweis.  Die Formulierung des Satzes, die er benutzt, ist die Zerlegbarkeit eines reellen Polynoms in lineare und quadratische Faktoren.  Wo wir oben beispielsweise von der Teilmenge $L_1$ der komplexen Zahlen geredet haben, führt er zunächst in der Ebene Polarkoordinaten $r$ und $\phi$ ein und definiert die Linie als Schnitt des Funktionsgraphen der Funktion \[r^n\mathrm{sin}\,n\phi+a_{n-1}r^{n-1}\mathrm{sin}\,(n-1)\phi+\cdots+r\,\mathrm{sin}\,\phi\](dies ist, da die Koeffizienten bei ihm reell sind gleich dem Imaginärteil von $p(r(\mathrm{cos}\,\phi+i\,\mathrm{sin}\,\phi))$, ich habe unsere Bezeichnungen der Variablen beibehalten) mit der Ebene. Dies geschieht in den Abschnitten 16 und 17, die wir uns gemeinsam angesehen haben.

Wir haben uns Abbildung 4 angesehen, die das Beispiel $x^4-2x^2+3x+10$ zeigt, siehe die Fußnote in Abschnitt 18.

Freitag, 19. April 2013

Panorama 19. 4. 2013

Die Erklärung der Galoisgruppe war hoffentlich in der Vorlesung etwas anschaulicher als hier, das ich hier auf das tabellarische Aufführen der Permutationen verzichtet habe.
Denen, die etwas Algebrakenntnisse haben, empfehle ich, sich die Begriffe der Galoisgruppe und der Auflösbarkeit einer Gruppe zusätzlich anderswo anzusehen, da ich hier bemüht war, Begriffe aus der Algebra zu vermeiden.
Was wir in den letzten zehn Minuten zum Fundamentalsatz der Algebra gesagt haben, habe ich hier nicht wiedergegeben.


Lösbarkeit algebraischer Gleichungen durch Radikale


Nachdem Lagrange das Lösen algebraischer Gleichungen durch Radikale, also das Finden von Lösungen, die sich unter Verwendung von nur Wurzeln und den Körperoperationen schreiben lassen, systematisiert hatte und man dennoch keine allgemeinen Lösungen für Gleichungen höheren als vierten Grades gefunden hatte, konnte man annehmen, dass diese vielleicht gar nicht existierten.  Die Nichtexistenz dieser Lösungen wurde von Abel nach einem früheren lückenhaften Versuch von Ruffini 1823(?) bewiesen.

Heute beweist man dieses Ergebnis meist mit Hilfe der Galois-Theorie.  Diese basiert auf Ideen von Galois, der 1832 genauer die Frage beantwortete, welche algebraischen Gleichungen durch Radikale lösbar sind.

Galois-Theorie


Wir betrachten als Beispiel die Gleichung \[x^4-6x^2+2=0.\]  Diese ist offensichtlich leichter lösbar als eine allgemeine Gleichung vierten Grades, denn wir können $y=x^2$ substituieren, und erhalten $y=3\pm\sqrt7$ und damit \begin{align*}x_1&=\sqrt{3+\sqrt7},&x_2&=\sqrt{3-\sqrt7},\\ x_3&=-\sqrt{3+\sqrt7},& x_4&=-\sqrt{3-\sqrt7}.\end{align*}Nun sind „von $\mathbb Q$ aus gesehen“ alle diese Nullstellen gleich gut, denn keine von ihnen hat eine algebraische Eigenschaft, die nicht daraus folgte, Nullstelle von $x^4-6x^2+2$ zu sein. (Offenbar müsste man dies präzisieren, wenn man sich das Thema ernsthaft mathematisch erschließen wollte.) Es sind aber nicht alle möglichen Reihenfolgen der vier Nullstellen ununterscheidbar, denn bei der oben gewählten gilt $x_1+x_3=0$, nicht aber $x_1+x_2=0$.  Überlegen wir uns nun (im Vertrauen darauf, dass alle weiteren algebraischen Relationen zwischen den Nullstellen hieraus bereits folgen), welche weiteren Reihenfolgen der Nullstellen diese Gleichung erfüllen, so erhalten wir insgesamt acht: Die Wahl von $x_1$ ist frei und bestimmt $x_3$, danach gibt es noch zwei Möglichkeiten, die restlichen beiden Nullstellen auf $x_2$ und $x_4$ zu verteilen. Mehr Struktur sieht man, wenn man diese acht Reihenfolgen als Permutationen der vier Nullstellen ansieht, sie bilden dann eine Untergruppe der Gruppe aller Permutationen der vier Nullstellen.  Diese heißt die Galoisgruppe der Gleichung, wir bezeichnen sie hier mit $\mathrm{Gal}(x^4-6x^2+2)$.  Sie ist in diesem Fall isomorph Symmetriegruppe eines Vierecks (der Diedergruppe mit $8$ Elementen, bei mir $D_8$, in der Wikipedia $D_4$ genannt).  Dies ist eine nicht kommutative Gruppe.

Den Zusammenhang der Struktur der Gruppe mit den bei der Lösung der Gleichung gemachten Wahlen können wir noch weiter verdeutlichen.  Wir können fragen, was die verschieden Elemente der Galoisgruppe mit der Zahl $\sqrt7$ machen.  Dies ist möglich, weil sich $\sqrt7$ als algebraischer Ausdruck in $x_1,\ldots,x_4$ schrieben lässt.  In der Vorlesung haben wir den schönen Ausdruck $\frac12(x_2x_4-x_1x_3)$ gefunden.  Jede zur Galoisgruppe gehörende Permutation bildet diesen Ausdruck nun auf sich selbst oder auf sein Negatives ab.  Dies beschreibt einen Gruppenhomomorphismus von $\mathrm{Gal}(x^4-6x^2+2)$ in eine zweielementige Gruppe.  Der Kern dieser Abbildung ist auch abelsch.  Er entspricht den Vorzeichenwahlen bei den äußeren Wurzeln.

Wir kommen nun zu einer weiteren wesentlichen
Definition. Es sei $G$ eine endliche Gruppe.  Dann heißt $G$ auflösbar, wenn ein $n\in\mathbb N$, Untergruppen $G=G_0\supset G_1\supset\cdots\supset G_n=\{1\}$, abelsche Gruppen $A_0,\dots,A_{n-1}$ und Gruppenhomomorphismen $\phi_j\colon G_j\to A_j$ mit $\mathrm{ker} \,\phi_j=G_{j+1}$ existieren.

Damit können wir Galois' Ergebnis formulieren.
Satz. Es sei $f$ ein irreduzibles Polynom.  Dann sind äquivalent:
  • Die Gleichung $f=0$ ist durch Radikale lösbar.
  • Die Galoisgruppe von $f$ ist auflösbar.

Die Idee ist dabei, dass einerseits eine Lösung der Gleichung wie in unserem Beispiel (in dem wir einiges unterschlagen haben) angedeutet zu den Homomorphismen $\phi_j$ führt, und dass andererseits die Untergruppen, die zeigen, dass die Galoisgruppe auflösbar ist, zu einer Anleitung führt, wie die Gleichung mit Hilfe von sukzessiven Lagrangeresolventen zu lösen ist.

Weiteres:
  • Galois beschreibt eine Methode, wie man zumindest prinzipiell die Galoisgruppe eines Polynoms berechen kann.
  • Für jedes $n$ gibt es Polynome $n$-ten Grades, deren Galoisgruppe die Gruppe aller Permutationen der $n$ Nullstellen ist, also die symmetrische Gruppe $S_n$.  In der Tat ist das in gewisser Weise der Normalfall.  Ein einfaches Beispiel für ein Polynom fünften Grades mit voller Galoisgruppe ist $x^5-x-1$.
  • Die symmetrische Gruppe $S_n$ ist genau dann auflösbar, wenn $n\le 4$. Zusammen mit dem vorhergehenden Punkt beweist das den Satz von Abel-Ruffini.
Galois' Arbeit war auch der Beginn der Gruppentheorie.  Alle bei ihm auftauchenden Gruppen sind Untergruppen von Permutationsgruppen, der abstrakte Begriff einer Gruppe wie wir ihn heute kennen, war noch unbekannt.  Das ist aber ohnehin keine Einschränkung der Allgemeinheit, denn es ist ohnehin jede Gruppe isomorph zu einer Untergruppe einer symmetrischen Gruppe.

Montag, 15. April 2013

Panorama 15. 4. 2013

Mir ist bewusst, dass ich in der Vorlesung etwas zuviel versucht habe.  Sie sollten den ersten Teil aber noch völlig verstehen können und ebenso den zweiten Absatz des zweiten Teils (ohne dass Sie (\ref{disc}) nachrechnen müssten).  Wenn Sie von dem Rest eine Idee mitnehmen, genügt dies.

Mehr zur Cardanischen Formel


Wir untersuchen zunächst, wann die Bedingung \(D>0\) aus der Formel erfüllt ist.

Proposition. Es seien \(p,q\in\mathbb R\), \(D:=\left(\frac q2\right)^2+\left(\frac p3\right)^3\). Dann hat das Polynom \(f(x)=x^3+px+q\)
  • genau eine reelle Nullstelle, und diese ist einfach, wenn D>0,
  • eine reelle Nullstelle mindestens zweiter Ordnung, wenn D=0,
  • drei verschiedene reelle Nullstellen, wenn D<0.

Beweisskizze.  Der interessante Fall ist \(p<0\).  Dann hat \(f\) ein lokales Maximum bei \(x_a:=-\sqrt{-\frac p3}\) und ein lokales Minimum bei \(x_b:=\sqrt{-\frac p3}\).  Man errechnet, dass \(f(x_a)f(x_b)=4D\).  Also ist für \(D=0\) eines der lokalen Extrema eine doppelte Nullstelle, für \(D>0\) hat \(f\) an beiden lokalen Extrema gleiches Vorzeichen, also keine Nullstelle dazwischen und damit genau eine, für \(D<0\) hat \(f\) an beiden lokalen Extrema verschiedenen Vorzeichen, also eine Nullstelle dazwischen und insgesamt drei Nullstellen.


Im Falle dreier reeller Nullstellen ist die Formel also zuächst einmal nicht anwendbar. Bombelli beschreibt 1572, dass man die Nullstelle \(4\) des Polynoms \(x^3-15x-4\) aus Cardanos Formel dennoch erhalten kann, indem man
\begin{align*}x&=\sqrt[3]{2+\sqrt{-121}}+\sqrt[3]{2-\sqrt{-121}}\\
&=\sqrt[3]{2+11\sqrt{-1}}+\sqrt[3]{2-11\sqrt{-1}} \\&=\left(2+\sqrt{-1}\right)+
\left(2-\sqrt{-1}\right)=4\end{align*}rechnet.

Natürlich erkennen wir das heute als Rechnen mit komplexen Zahlen.  Wir halten fest:  Hier ist ein mit reellen Zahlen gestelltes Problem, dessen reelle Lösung wir erhalten, indem wir mit komplexen Zwischenergebnissen rechnen.  Dies war eine Motivation, komplexe Zahlen zu studieren.  Es sollte erwähnt werden, dass auch bei Cardano schon im Ansatz Quadratwurzeln aus negativen Zahlen vorkommen.

Man sieht oben, dass, wenn wir \(2+\sqrt{-1}\) als dritte Wurzel aus \(2+11\sqrt{-1}\) wählen (es gibt derer ja drei), wir die „passende“ Wurzel aus \(2-11\sqrt{-1}\) wählen müssen, um als Summe eine der reellen Nullstellen zu erhalten.  Wir formulieren dies aus moderner Sicht, also von Anfang an komplexe Zahlen zulassend.

Vorbemerkung. Ist $u\in\mathbb C$ mit $u^3=a\ne0$ und $\tilde u$ eine andere dritte Wurzel aus $a$, also $\tilde u^3=a$, so ist $(\tilde u/u)^3=1$, die beiden unterscheiden sich also durch eine komplexe Zahl, deren dritte Potenz $1$ ist, eine dritte Einheitswurzel. Diese lassen sich einerseits leicht in Polarkoordinaten angeben, es handelt sich um $\mathrm{exp}\left(k\cdot\frac{2\pi i}3\right)=\mathrm{cos}\left(k\cdot\frac{2\pi}3\right)+i\mathrm{sin}\left(k\cdot\frac{2\pi}3\right)$ mit $k=0,1,2$.  Eine andere Art, sie zu beschreiben ist als Nullstellen von $z^3-1=(z-1)(z^2+z+1)$.  Neben der $1$ sind es also die beiden Nullstellen von $z^2+z+1$.  Ist $\zeta$ eine solche, so ist $\zeta^2$ die andere, denn dann ist $(z-\zeta)(z-\zeta^2)=z^2-(\zeta+\zeta^2)z+\zeta^3=z^2+z+1$.  Für ein solches $\zeta$ sind also $1$, $\zeta$, $\zeta^2$ die drei dritten Einheitswurzeln. Aus der Darstellung in Polarkoordinaten oder aus $\zeta^2+\zeta+1=0$ sieht man, dass die beiden dritten Einheitswurzeln außer der $1$ sich als $-\frac12\pm\frac12\sqrt3 i$ schreiben lassen.

Proposition. Es seien \(p,q\in\mathbb C\), \(D:=\left(\frac q2\right)^2+\left(\frac p3\right )^3\) und \(u,v\in\mathbb C\) mit \(u^3 = -\frac q2+\sqrt D\), \(v^3 = -\frac q2-\sqrt D\) (mit der selben Wahl für die Quadratwurzel) und \(uv=-\frac p3\), und ist außerdem \(\zeta^2+\zeta+1=0\), so sind\begin{align}\label{x123}x_1&=u+v,&x_2&=\zeta u+\zeta^2 v,&x_3&=\zeta^2u+\zeta v\end{align} die drei Nullstellen des Polynoms \(x^3+px+q\).

Um dies unabhängig von unserer Herleitung zu verifizieren, genügt es wegen \begin{multline*}(x-x_1)(x-x_2)(x-x_3)=\\=x^3-(x_1+x_2+x_3)x^2+(x_2x_3+x_1x_3+x_1x_2)x-x_1x_2x_3\end{multline*} zu überprüfen, dass
\begin{equation}\label{sigmapq}\begin{aligned}
\sigma_1:=&x_1+x_2+x_3&&=0,\\
\sigma_2:=&x_2x_3+x_1x_3+x_1x_2&&=p,\\
\sigma_3:=&x_1x_2x_3&&=-q.
\end{aligned}\end{equation}Dies ist leicht getan.

An dieser Stelle sollten wir darauf hinweisen, dass Cardano auch Lösungsformeln für quartische Gleichungen, also Nullstellen von Polynomen vierten Grades, angegeben hat. Diese hat er seinem Schüler Ferrari zugeschrieben.

Der Beitrag Lagranges

Nun wissen wir zwar eigentlich alles über Cardanos Formel, das es zu wissen gibt, aber um eine bessere Vorstellung von dem, was folgt, erlangen zu können, wollen wir noch eine weitere Sichtweise betrachten.  Dazu machen wir einen Zeitsprung zu einem weiteren italienischen Mathematiker, der allerdings auch in Berlin und Paris gewirkt hat, Lagrange.  Zu algebraischen Gleichungen hat er 1770 und 1771 Arbeiten verfasst.

Ausgangspunkt sind die Gleichungen (\ref{sigmapq}).  Die dort vorkommenden Polynome in den Variablen $x_1$, $x_2$, $x_3$, die wir $\sigma_1$, $\sigma_2$, $\sigma_3$ genannt haben, sind symmetrisch, das heißt, vertauscht man in ihnen zwei der Variablen, so ändern sie sich nicht.  In der Tat ist es so, dass sich jedes symmetrische Polynom in $x_1$, $x_2$, $x_3$ als Polynom in den Ausdrücken $\sigma_1$, $\sigma_2$, $\sigma_3$ schreiben lässt, daher heißen letztere die elementarsymmetrischen Polynome.  Dieses Umschreiben lässt sich sogar ganz systematisch tun, aber damit wollen wir uns hier nicht beschäftigen.  Wir betrachten aber das an sich interessante Beispiel \[(x_1-x_2)(x_1-x_3)(x_2-x_1)(x_2-x_3)(x_3-x_1)(x_3-x_2).\]Da hier jeder Term $(x_i-x_j)$ mit $i\ne j$ genau einmal vorkommt, ist dieses Polynom symmetrisch, muss sich also mit Hilfe von $\sigma_1$, $\sigma_2$, $\sigma_3$ schreiben lassen, und in der Tat findet man \begin{multline}\label{disc}(x_1-x_2)(x_1-x_3)(x_2-x_1)(x_2-x_3)(x_3-x_1)(x_3-x_2)=\\=-\sigma_1^2\sigma_2^2+4\sigma_1^3\sigma_3+4\sigma_2^3+27\sigma_3^2-18\sigma_1\sigma_2\sigma_3,\end{multline}was nachrechnen kann, wer an so etwas Spaß hat. Setzen wir nun die Werte aus (\ref{sigmapq}) ein und unsere alte Definition von $D$, so erhalten wir \begin{multline*}(x_1-x_2)(x_1-x_3)(x_2-x_1)(x_2-x_3)(x_3-x_1)(x_3-x_2)=\\=4p^3+27q^2=108D.\end{multline*}Wir sehen also erneut und völlig unabhängig von obigem, dass $D$ genau dann Null ist, wenn zwei der Nullstellen gleich sind, das Polynom also eine mehrfache Nullstelle hat!  Weiterhin beobachten wir, dass in diesem Ausdruck jeder Term zweimal mit verschiedenem Vorzeichen vorkommt.  Setzen wir \[t:=(x_1-x_2)(x_1-x_3)(x_2-x_3),\] so haben wir also \[t^2=-108D.\]Wir erkennen hier etwas, das wir oben bereits überprüft haben, nämlich, dass, wenn alle Nullstellen reell sind, $D\le0$ sein muss, denn dann ist ja $t^2\ge0$.

Wir haben damit noch etwas anderes erreicht.  Das Polynom $t$ ist nicht symmetrisch, es ändert das Vorzeichen, wenn wir zwei der Variablen vertauschen.  Es lässt sich also nicht durch die elementarsymmetrischen Polynome und dadurch durch $p$ und $q$ ausdrücken.  Fügen wir also zu $p$ und $q$ noch $t$, dass wir ja als $t=\sqrt{-108D}$ definiert denken können, so können wir mehr Polynome in $x_1$, $x_2$, $x_3$ ausdrücken als vorher. Das ist gut, denn wir wollen ja schließlich $x_1$ ausdrücken, und erlauben uns dabei, Wurzeln zu benutzen.

Noch etwas Notation.  Wir bezeichnen mit $\tau$ die Permutation, die $x_2$ und $x_3$ vertauscht und schreiben beispielsweise \begin{align*}\tau\cdot\sigma_2&=\tau\cdot(x_1x_2x_3)=x_1x_3x_2=\sigma_2,\\\tau\cdot t&=\tau\cdot((x_1-x_2)(x_1-x_3)(x_2-x_3))=(x_1-x_3)(x_1-x_2)(x_3-x_3)=-t.\end{align*}Ebenso bezeichnen wir mit $\sigma$ (eine schlechte Wahl, da diese Permutation nichts mit den $\sigma_i$ zu tun hat, aber da ich sie in der Vorlesung gewählt habe, bleibe ich dabei) die zyklische Permutation, die $x_1$ durch $x_2$ ersetzt, $x_2$ durch $x_3$ und $x_3$ durch $x_1$.  Wir haben damit\[\sigma\cdot t=(x_2-x_3)(x_2-x_1)(x_3-x_1)=t,\]diese Permutation lässt $t$ also unverändert.

Nun endlich zu dem Ansatz von Lagrange, der Lagrange-Resolvente.  Er definiert, wieder mit unserer dritten Einheitswurzel $\zeta$, die $\zeta^2+\zeta+1=0$ erfüllt,\begin{align*}s_1&=x_1+x_2+x_3,\\s_2&=x_1+\zeta x_2+\zeta^2 x_3,\\s_3&=x_1+\zeta^2x_2+\zeta x_3.\end{align*}Gelingt es uns nun, Formeln für $s_1$, $s_2$, $s_3$ zu finden, so haben wir damit auch welche für $x_1$, $x_2$, $x_3$, denn\begin{align}\label{lri}3x_1&=s_1+s_2+s_3,\\3x_2&=s_1+\zeta^2 x_2+\zeta x_3,\\3x_3&=s_1+\zeta s_2+\zeta^2x_3.\end{align}Von den drei neuen Ausdrücken ist nur $s_1$ symmetrisch.  In der Tat haben wir $s_1=\sigma_1=0$.  Wir sehen sofort\begin{align*}\tau\cdot s_2&=s_3,&\tau\cdot s_3&=s_2.\end{align*}Außerdem\[\sigma\cdot s_2=x_2+\zeta x_3+\zeta^2 x_1=\zeta^{-1}s_2.\]Daraus folgt aber\[\sigma\cdot s_2^3=\zeta^{-3}s_2^3=s_2^3,\]$s_2^3$ hat also eine Symmetrie, die $s_2$ nicht hat (wie oben $t^2$ im Vergleich zu $t$), was hilfreich ist.  Denn wir haben ebenso $\sigma\cdot s_3^3=s_3^3$ und damit\begin{align*}\sigma\cdot(s_2^3+s_3^3)&s_2^3+s_3^3,&\tau\cdot(s_2^3+s_3^3)=s_3^3+s_2^3=s_2^3+s_3^3.\end{align*}Da aber jede Permutation der drei Variablen $x_1$, $x_2$, $x_3$ sich durch mehrfache Anwendung von $\sigma$ und $\tau$ ergibt, ist $s_2^3+s_3^3$ symmetrisch und lässt sich daher als Polynom in den elementarsymmetrischen Polynomen und damit in $p$ und $q$ schreiben.  Ähnlich haben wir\begin{align*}\sigma\cdot(s_2^3-s_3^3)&=s_2^3-s_3^3,&\tau\cdot(s_2^3-s_3^3)&=-(s_2^3-s_3^3),\end{align*}$s_2^3-s_3^3$ ist also nicht symmetrisch, aber $(s_2^3-s_3^3)t$ ist es.  Damit können wir für $s_2^3-s_3^3$ einen Ausdruck in $p$, $q$ und $t$ erhalten.  Damit haben wir dann für $s_2^3=\frac12\left((s_2^3+s_3^3)+(s_2^3-s_3^3)\right)$ einen Ausdruck in $p$, $q$ und $t$, also
\[s_2=\sqrt[3]{\text{ein Ausdruck in $p$, $q$, $t$}},\]
was mit $s_1=0$ und $s_3=\tau\cdot s_2$ in (\ref{lri}) eingesetzt Formeln für $x_1$, $x_2$, $x_3$ liefert.

Nachtrag: Da es mir ums Prinzip und um die Rolle von Permutationen in der Rechnung ging, habe ich in der Vorlesung keine konkreten Formeln angegeben.  In der Tat ergibt sich aber leicht (mit weniger Aufwand als für $t^2=-108D$ oben), dass \begin{align*}s_2^3+s_3^3&=2\sigma_1^3-9\sigma_1\sigma_2+27\sigma_3=-27q,\\s_2^3-s_3^3&=3(\zeta-\zeta^2)t.\end{align*}Mit $\zeta-\zeta^2=\sqrt{-3}$, ergibt sich also\begin{align*}s_2^3&=\frac12\left(-27q+3\sqrt{-3}t\right),\\s_3^3&=\frac12\left(-27q-3\sqrt{-3}t\right),\\\end{align*}und schließlich mit $3x_1=s_2+s_3$\[x_1=\sqrt[3]{-\frac q2+\frac{\sqrt{-3}}{18}\sqrt{-4p^3-27q^2}}+\sqrt[3]{-\frac q2-\frac{\sqrt{-3}}{18}\sqrt{-4p^3-27q^2}},\]worin man wieder die Cardanische Formel erkennt.  Dabei haben wir nur das Detail unterschlagen, wie man sieht, wie die beiden Kubikwurzeln passend zueinander gewählt werden müssen.




Freitag, 12. April 2013

Panorama 12. 4. 2013

Vorweg:  Ich habe das Buch, das ich gezeigt habe, um zu demonstrieren, dass Lehrbücher 1930 nicht viel anders als heute waren, nur unvollständig genannt.  Es war Van der Waerdens „Algebra I“.  Allerdings sehe ich nun, dass ich ausgerechnet eine Seite aus einem Kapitel, dass in der ersten Auflage gar nicht vorhanden war, genommen habe.  Wer 1970 getippt hatte, lag also sehr gut.

Die Vorlesung war heute zweigeteilt.  Zuerst habe ich ein wenig über Fachzeitschriften und Mathematik im Internet geredet.  Ich habe diese Folien benutzt.

Dies sind die Links daraus:

Im zweiten Teil haben wir uns kurz mit quadratischen, dann vor allem mit kubischen Gleichungen beschäftigt.  Für letzteres war für mich Kapitel 1 von Bewersdorff, Algebra für Einsteiger, 3. Aufl. eine wesentliche Vorlage.
Das Hauptergebnis war die von Cardano publizierte (s.a. Tartaglia) Herleitung einer Lösungsformel für kubische Gleichungen. Ich gebe sie hier noch einmal in Kurzform an.  Ausgehend von \[
(u+v)^3 - 3uv(u+v) - (u^3 +v^3) = 0,
\]was sich auch geometrisch deuten lässt, sieht man, dass \(x=u+v\) eine Lösung ist, wenn \(uv = - \frac p3\) und \(u^3+v^3 = -q\).  Ersteres ist äquivalent zu \( u^3v^3 = -\left(\frac p3\right)^3\).  Diese beiden Gleichungen sind nun aber genau dann erfüllt, wenn \(u^3\) und \(v^3\) die beiden Lösungen der quadratischen Gleichung \(w^2 + q w -\left(\frac p3\right)^3 \) sind. (Diesen Punkt hätte ich in der Vorlesung mehr betonen sollen.)  Damit erhält man schon den folgenden
Satz. Seien \(p,q\in\mathbb R\), \(D:=\left(\frac q2\right)^2+\left(\frac p3\right)^3\ge0\). Dann ist\[
x=\sqrt[3]{-\frac q2 + \sqrt D} + \sqrt[3]{-\frac q2 - \sqrt D}
\]eine Lösung der Gleichung
\[ x^3+px+q=0.
\]Dabei ist für \(r<0\) der Ausdruck \(\sqrt[3]r\) als \(-\sqrt[3]{-r}\) zu verstehen.



Dienstag, 9. April 2013

Panorama 8. 4. 2013

Inhaltlich ist in der ersten Sitzung nichts passiert, aber wir haben die folgenden Mathematiker erwähnt.

Geometer, die auch schon wussten, dass die Wurzel aus zwei irrational ist:
Der Mathematiker, der unter anderem die arabischen Ziffern nach Europa brachte:
Die Begründer der Differential- und Integralrechnung:
Zur Fundierung selbiger wie wir sie heute kennen:
Zum Begriff des metrischen Raumes:
Der Mathematiker, mit dessen Namen \(e^{\pi i}=-1\) verbunden ist:
Unser erster mathematischer Ausflug wird sich mit Nullstellen von Polynomen beschäftigen:
Der zweite mit Mengenlehre und Logik:
Der dritte mit Topologie, er wird nach Euler und Gauß die folgenden beinhalten:
Als ein weiteres Beispiel eines vor nicht allzu langer Zeit gelösten Problems habe ich die Fermatsche Vermutung genannt:

Panorama der Mathematik im Sommersemester 2013

Für Kommentare und kurze Zusammenfassungen zu der Vorlesung Panorama der Mathematik möchte ich diesen Blog benutzen, um den Hörerinnen und Hörern der Vorlesung (und auch anderen) auf einfache Art Kommentare zu ermöglichen.  Ich möchte aber bitten, diesen Blog nicht für rein organisatorische Fragen zu benutzen.

Mathematik kann hier übrigens mit MathJax gesetzt werden, allerdings kann man bei Kommentaren leider nicht das Ergebnis vor der Veröffentlichung überprüfen.

Alle Einträge anzeigen.