Montag, 15. April 2013

Panorama 15. 4. 2013

Mir ist bewusst, dass ich in der Vorlesung etwas zuviel versucht habe.  Sie sollten den ersten Teil aber noch völlig verstehen können und ebenso den zweiten Absatz des zweiten Teils (ohne dass Sie (\ref{disc}) nachrechnen müssten).  Wenn Sie von dem Rest eine Idee mitnehmen, genügt dies.

Mehr zur Cardanischen Formel


Wir untersuchen zunächst, wann die Bedingung \(D>0\) aus der Formel erfüllt ist.

Proposition. Es seien \(p,q\in\mathbb R\), \(D:=\left(\frac q2\right)^2+\left(\frac p3\right)^3\). Dann hat das Polynom \(f(x)=x^3+px+q\)
  • genau eine reelle Nullstelle, und diese ist einfach, wenn D>0,
  • eine reelle Nullstelle mindestens zweiter Ordnung, wenn D=0,
  • drei verschiedene reelle Nullstellen, wenn D<0.

Beweisskizze.  Der interessante Fall ist \(p<0\).  Dann hat \(f\) ein lokales Maximum bei \(x_a:=-\sqrt{-\frac p3}\) und ein lokales Minimum bei \(x_b:=\sqrt{-\frac p3}\).  Man errechnet, dass \(f(x_a)f(x_b)=4D\).  Also ist für \(D=0\) eines der lokalen Extrema eine doppelte Nullstelle, für \(D>0\) hat \(f\) an beiden lokalen Extrema gleiches Vorzeichen, also keine Nullstelle dazwischen und damit genau eine, für \(D<0\) hat \(f\) an beiden lokalen Extrema verschiedenen Vorzeichen, also eine Nullstelle dazwischen und insgesamt drei Nullstellen.


Im Falle dreier reeller Nullstellen ist die Formel also zuächst einmal nicht anwendbar. Bombelli beschreibt 1572, dass man die Nullstelle \(4\) des Polynoms \(x^3-15x-4\) aus Cardanos Formel dennoch erhalten kann, indem man
\begin{align*}x&=\sqrt[3]{2+\sqrt{-121}}+\sqrt[3]{2-\sqrt{-121}}\\
&=\sqrt[3]{2+11\sqrt{-1}}+\sqrt[3]{2-11\sqrt{-1}} \\&=\left(2+\sqrt{-1}\right)+
\left(2-\sqrt{-1}\right)=4\end{align*}rechnet.

Natürlich erkennen wir das heute als Rechnen mit komplexen Zahlen.  Wir halten fest:  Hier ist ein mit reellen Zahlen gestelltes Problem, dessen reelle Lösung wir erhalten, indem wir mit komplexen Zwischenergebnissen rechnen.  Dies war eine Motivation, komplexe Zahlen zu studieren.  Es sollte erwähnt werden, dass auch bei Cardano schon im Ansatz Quadratwurzeln aus negativen Zahlen vorkommen.

Man sieht oben, dass, wenn wir \(2+\sqrt{-1}\) als dritte Wurzel aus \(2+11\sqrt{-1}\) wählen (es gibt derer ja drei), wir die „passende“ Wurzel aus \(2-11\sqrt{-1}\) wählen müssen, um als Summe eine der reellen Nullstellen zu erhalten.  Wir formulieren dies aus moderner Sicht, also von Anfang an komplexe Zahlen zulassend.

Vorbemerkung. Ist $u\in\mathbb C$ mit $u^3=a\ne0$ und $\tilde u$ eine andere dritte Wurzel aus $a$, also $\tilde u^3=a$, so ist $(\tilde u/u)^3=1$, die beiden unterscheiden sich also durch eine komplexe Zahl, deren dritte Potenz $1$ ist, eine dritte Einheitswurzel. Diese lassen sich einerseits leicht in Polarkoordinaten angeben, es handelt sich um $\mathrm{exp}\left(k\cdot\frac{2\pi i}3\right)=\mathrm{cos}\left(k\cdot\frac{2\pi}3\right)+i\mathrm{sin}\left(k\cdot\frac{2\pi}3\right)$ mit $k=0,1,2$.  Eine andere Art, sie zu beschreiben ist als Nullstellen von $z^3-1=(z-1)(z^2+z+1)$.  Neben der $1$ sind es also die beiden Nullstellen von $z^2+z+1$.  Ist $\zeta$ eine solche, so ist $\zeta^2$ die andere, denn dann ist $(z-\zeta)(z-\zeta^2)=z^2-(\zeta+\zeta^2)z+\zeta^3=z^2+z+1$.  Für ein solches $\zeta$ sind also $1$, $\zeta$, $\zeta^2$ die drei dritten Einheitswurzeln. Aus der Darstellung in Polarkoordinaten oder aus $\zeta^2+\zeta+1=0$ sieht man, dass die beiden dritten Einheitswurzeln außer der $1$ sich als $-\frac12\pm\frac12\sqrt3 i$ schreiben lassen.

Proposition. Es seien \(p,q\in\mathbb C\), \(D:=\left(\frac q2\right)^2+\left(\frac p3\right )^3\) und \(u,v\in\mathbb C\) mit \(u^3 = -\frac q2+\sqrt D\), \(v^3 = -\frac q2-\sqrt D\) (mit der selben Wahl für die Quadratwurzel) und \(uv=-\frac p3\), und ist außerdem \(\zeta^2+\zeta+1=0\), so sind\begin{align}\label{x123}x_1&=u+v,&x_2&=\zeta u+\zeta^2 v,&x_3&=\zeta^2u+\zeta v\end{align} die drei Nullstellen des Polynoms \(x^3+px+q\).

Um dies unabhängig von unserer Herleitung zu verifizieren, genügt es wegen \begin{multline*}(x-x_1)(x-x_2)(x-x_3)=\\=x^3-(x_1+x_2+x_3)x^2+(x_2x_3+x_1x_3+x_1x_2)x-x_1x_2x_3\end{multline*} zu überprüfen, dass
\begin{equation}\label{sigmapq}\begin{aligned}
\sigma_1:=&x_1+x_2+x_3&&=0,\\
\sigma_2:=&x_2x_3+x_1x_3+x_1x_2&&=p,\\
\sigma_3:=&x_1x_2x_3&&=-q.
\end{aligned}\end{equation}Dies ist leicht getan.

An dieser Stelle sollten wir darauf hinweisen, dass Cardano auch Lösungsformeln für quartische Gleichungen, also Nullstellen von Polynomen vierten Grades, angegeben hat. Diese hat er seinem Schüler Ferrari zugeschrieben.

Der Beitrag Lagranges

Nun wissen wir zwar eigentlich alles über Cardanos Formel, das es zu wissen gibt, aber um eine bessere Vorstellung von dem, was folgt, erlangen zu können, wollen wir noch eine weitere Sichtweise betrachten.  Dazu machen wir einen Zeitsprung zu einem weiteren italienischen Mathematiker, der allerdings auch in Berlin und Paris gewirkt hat, Lagrange.  Zu algebraischen Gleichungen hat er 1770 und 1771 Arbeiten verfasst.

Ausgangspunkt sind die Gleichungen (\ref{sigmapq}).  Die dort vorkommenden Polynome in den Variablen $x_1$, $x_2$, $x_3$, die wir $\sigma_1$, $\sigma_2$, $\sigma_3$ genannt haben, sind symmetrisch, das heißt, vertauscht man in ihnen zwei der Variablen, so ändern sie sich nicht.  In der Tat ist es so, dass sich jedes symmetrische Polynom in $x_1$, $x_2$, $x_3$ als Polynom in den Ausdrücken $\sigma_1$, $\sigma_2$, $\sigma_3$ schreiben lässt, daher heißen letztere die elementarsymmetrischen Polynome.  Dieses Umschreiben lässt sich sogar ganz systematisch tun, aber damit wollen wir uns hier nicht beschäftigen.  Wir betrachten aber das an sich interessante Beispiel \[(x_1-x_2)(x_1-x_3)(x_2-x_1)(x_2-x_3)(x_3-x_1)(x_3-x_2).\]Da hier jeder Term $(x_i-x_j)$ mit $i\ne j$ genau einmal vorkommt, ist dieses Polynom symmetrisch, muss sich also mit Hilfe von $\sigma_1$, $\sigma_2$, $\sigma_3$ schreiben lassen, und in der Tat findet man \begin{multline}\label{disc}(x_1-x_2)(x_1-x_3)(x_2-x_1)(x_2-x_3)(x_3-x_1)(x_3-x_2)=\\=-\sigma_1^2\sigma_2^2+4\sigma_1^3\sigma_3+4\sigma_2^3+27\sigma_3^2-18\sigma_1\sigma_2\sigma_3,\end{multline}was nachrechnen kann, wer an so etwas Spaß hat. Setzen wir nun die Werte aus (\ref{sigmapq}) ein und unsere alte Definition von $D$, so erhalten wir \begin{multline*}(x_1-x_2)(x_1-x_3)(x_2-x_1)(x_2-x_3)(x_3-x_1)(x_3-x_2)=\\=4p^3+27q^2=108D.\end{multline*}Wir sehen also erneut und völlig unabhängig von obigem, dass $D$ genau dann Null ist, wenn zwei der Nullstellen gleich sind, das Polynom also eine mehrfache Nullstelle hat!  Weiterhin beobachten wir, dass in diesem Ausdruck jeder Term zweimal mit verschiedenem Vorzeichen vorkommt.  Setzen wir \[t:=(x_1-x_2)(x_1-x_3)(x_2-x_3),\] so haben wir also \[t^2=-108D.\]Wir erkennen hier etwas, das wir oben bereits überprüft haben, nämlich, dass, wenn alle Nullstellen reell sind, $D\le0$ sein muss, denn dann ist ja $t^2\ge0$.

Wir haben damit noch etwas anderes erreicht.  Das Polynom $t$ ist nicht symmetrisch, es ändert das Vorzeichen, wenn wir zwei der Variablen vertauschen.  Es lässt sich also nicht durch die elementarsymmetrischen Polynome und dadurch durch $p$ und $q$ ausdrücken.  Fügen wir also zu $p$ und $q$ noch $t$, dass wir ja als $t=\sqrt{-108D}$ definiert denken können, so können wir mehr Polynome in $x_1$, $x_2$, $x_3$ ausdrücken als vorher. Das ist gut, denn wir wollen ja schließlich $x_1$ ausdrücken, und erlauben uns dabei, Wurzeln zu benutzen.

Noch etwas Notation.  Wir bezeichnen mit $\tau$ die Permutation, die $x_2$ und $x_3$ vertauscht und schreiben beispielsweise \begin{align*}\tau\cdot\sigma_2&=\tau\cdot(x_1x_2x_3)=x_1x_3x_2=\sigma_2,\\\tau\cdot t&=\tau\cdot((x_1-x_2)(x_1-x_3)(x_2-x_3))=(x_1-x_3)(x_1-x_2)(x_3-x_3)=-t.\end{align*}Ebenso bezeichnen wir mit $\sigma$ (eine schlechte Wahl, da diese Permutation nichts mit den $\sigma_i$ zu tun hat, aber da ich sie in der Vorlesung gewählt habe, bleibe ich dabei) die zyklische Permutation, die $x_1$ durch $x_2$ ersetzt, $x_2$ durch $x_3$ und $x_3$ durch $x_1$.  Wir haben damit\[\sigma\cdot t=(x_2-x_3)(x_2-x_1)(x_3-x_1)=t,\]diese Permutation lässt $t$ also unverändert.

Nun endlich zu dem Ansatz von Lagrange, der Lagrange-Resolvente.  Er definiert, wieder mit unserer dritten Einheitswurzel $\zeta$, die $\zeta^2+\zeta+1=0$ erfüllt,\begin{align*}s_1&=x_1+x_2+x_3,\\s_2&=x_1+\zeta x_2+\zeta^2 x_3,\\s_3&=x_1+\zeta^2x_2+\zeta x_3.\end{align*}Gelingt es uns nun, Formeln für $s_1$, $s_2$, $s_3$ zu finden, so haben wir damit auch welche für $x_1$, $x_2$, $x_3$, denn\begin{align}\label{lri}3x_1&=s_1+s_2+s_3,\\3x_2&=s_1+\zeta^2 x_2+\zeta x_3,\\3x_3&=s_1+\zeta s_2+\zeta^2x_3.\end{align}Von den drei neuen Ausdrücken ist nur $s_1$ symmetrisch.  In der Tat haben wir $s_1=\sigma_1=0$.  Wir sehen sofort\begin{align*}\tau\cdot s_2&=s_3,&\tau\cdot s_3&=s_2.\end{align*}Außerdem\[\sigma\cdot s_2=x_2+\zeta x_3+\zeta^2 x_1=\zeta^{-1}s_2.\]Daraus folgt aber\[\sigma\cdot s_2^3=\zeta^{-3}s_2^3=s_2^3,\]$s_2^3$ hat also eine Symmetrie, die $s_2$ nicht hat (wie oben $t^2$ im Vergleich zu $t$), was hilfreich ist.  Denn wir haben ebenso $\sigma\cdot s_3^3=s_3^3$ und damit\begin{align*}\sigma\cdot(s_2^3+s_3^3)&s_2^3+s_3^3,&\tau\cdot(s_2^3+s_3^3)=s_3^3+s_2^3=s_2^3+s_3^3.\end{align*}Da aber jede Permutation der drei Variablen $x_1$, $x_2$, $x_3$ sich durch mehrfache Anwendung von $\sigma$ und $\tau$ ergibt, ist $s_2^3+s_3^3$ symmetrisch und lässt sich daher als Polynom in den elementarsymmetrischen Polynomen und damit in $p$ und $q$ schreiben.  Ähnlich haben wir\begin{align*}\sigma\cdot(s_2^3-s_3^3)&=s_2^3-s_3^3,&\tau\cdot(s_2^3-s_3^3)&=-(s_2^3-s_3^3),\end{align*}$s_2^3-s_3^3$ ist also nicht symmetrisch, aber $(s_2^3-s_3^3)t$ ist es.  Damit können wir für $s_2^3-s_3^3$ einen Ausdruck in $p$, $q$ und $t$ erhalten.  Damit haben wir dann für $s_2^3=\frac12\left((s_2^3+s_3^3)+(s_2^3-s_3^3)\right)$ einen Ausdruck in $p$, $q$ und $t$, also
\[s_2=\sqrt[3]{\text{ein Ausdruck in $p$, $q$, $t$}},\]
was mit $s_1=0$ und $s_3=\tau\cdot s_2$ in (\ref{lri}) eingesetzt Formeln für $x_1$, $x_2$, $x_3$ liefert.

Nachtrag: Da es mir ums Prinzip und um die Rolle von Permutationen in der Rechnung ging, habe ich in der Vorlesung keine konkreten Formeln angegeben.  In der Tat ergibt sich aber leicht (mit weniger Aufwand als für $t^2=-108D$ oben), dass \begin{align*}s_2^3+s_3^3&=2\sigma_1^3-9\sigma_1\sigma_2+27\sigma_3=-27q,\\s_2^3-s_3^3&=3(\zeta-\zeta^2)t.\end{align*}Mit $\zeta-\zeta^2=\sqrt{-3}$, ergibt sich also\begin{align*}s_2^3&=\frac12\left(-27q+3\sqrt{-3}t\right),\\s_3^3&=\frac12\left(-27q-3\sqrt{-3}t\right),\\\end{align*}und schließlich mit $3x_1=s_2+s_3$\[x_1=\sqrt[3]{-\frac q2+\frac{\sqrt{-3}}{18}\sqrt{-4p^3-27q^2}}+\sqrt[3]{-\frac q2-\frac{\sqrt{-3}}{18}\sqrt{-4p^3-27q^2}},\]worin man wieder die Cardanische Formel erkennt.  Dabei haben wir nur das Detail unterschlagen, wie man sieht, wie die beiden Kubikwurzeln passend zueinander gewählt werden müssen.




Kommentare:

  1. Ich habe einen Fehler in (\ref{disc}) korrigiert.

    AntwortenLöschen
  2. Hallo,

    in der letzten Zeile der Vorbemerkung zur Formel von Cardano fehlt ein Minus bei 1/2. (dritte Einheitswurzel)

    Gruß SP

    AntwortenLöschen