Die Notation In Principia Mathematica

Inhaltsverzeichnis:

Die Notation In Principia Mathematica
Die Notation In Principia Mathematica

Video: Die Notation In Principia Mathematica

Video: Die Notation In Principia Mathematica
Video: Translating Russell and Whitehead’s Principia Mathematica Notation into Natural Language Notation 2023, November
Anonim

Eintragsnavigation

  • Eintragsinhalt
  • Literaturverzeichnis
  • Akademische Werkzeuge
  • Freunde PDF Vorschau
  • Autor und Zitierinfo
  • Zurück nach oben

Die Notation in Principia Mathematica

Erstveröffentlichung Do 19. August 2004; inhaltliche Überarbeitung So 17.07.2016

Principia Mathematica [PM] von AN Whitehead und Bertrand Russell, veröffentlicht 1910–1913 in drei Bänden von Cambridge University Press, enthält eine Ableitung großer Teile der Mathematik unter Verwendung von Begriffen und Prinzipien der symbolischen Logik. Die Notation in dieser Arbeit wird durch die nachfolgende Entwicklung der Logik während des 20 abgelöst worden thJahrhundert, in dem Maße, wie der Anfänger überhaupt Probleme beim Lesen von PM hat. Dieser Artikel bietet eine Einführung in die Symbolik von PM und zeigt, wie diese Symbolik in eine zeitgemäßere Notation übersetzt werden kann, die jedem bekannt sein sollte, der einen ersten Kurs in symbolischer Logik absolviert hat. Diese Übersetzung wird als Hilfe zum Erlernen der ursprünglichen Notation angeboten, die selbst Gegenstand wissenschaftlicher Auseinandersetzungen ist und inhaltliche logische Lehren enthält, so dass sie nicht einfach durch zeitgenössische Symbolik ersetzt werden kann. Das Erlernen der Notation ist also ein erster Schritt zum Erlernen der charakteristischen logischen Lehren von Principia Mathematica.

  • 1. Warum die Symbolik in Principia Mathematica lernen?
  • 2. Primitive Symbole
  • 3. Die Verwendung von Punkten zur Interpunktion

    • 3.1 Einige grundlegende Beispiele
    • 3.2 Die Kraft der Verbindungen
    • 3.3 Weitere Beispiele
  • 4. Satzfunktionen
  • 5. Die fehlende Notation für Typen und Bestellungen

    • 5.1 Einfache Typen
    • 5.2 Verzweigte Typen
  • 6. Variablen
  • 7. Prädikative Funktionen und Identität
  • 8. Bestimmte Beschreibungen
  • 9. Klassen
  • 10. Prolegomena zur Kardinalarithmetik
  • Literaturverzeichnis
  • Akademische Werkzeuge
  • Andere Internetquellen
  • Verwandte Einträge

1. Warum die Symbolik in Principia Mathematica lernen?

Principia Mathematica [PM] wurde über mehrere Jahre von Alfred North Whitehead und Bertrand Russell gemeinsam verfasst und in drei Bänden veröffentlicht, die zwischen 1910 und 1913 erschienen. Sie präsentiert ein System symbolischer Logik und wendet sich dann den Grundlagen der Mathematik zu das logistische Projekt, mathematische Begriffe als logische Begriffe zu definieren und die grundlegenden Axiome der Mathematik als Theoreme der Logik zu beweisen. Während die Arbeit für die Entwicklung der Logik, der Philosophie der Mathematik und allgemein der „frühen analytischen Philosophie“von enormer Bedeutung ist, wird sie für diese Themen nicht mehr untersucht. Infolgedessen ist die Notation des Werks den zeitgenössischen Logikstudenten fremd geworden, und dies ist zu einem Hindernis für das Studium der Principia Mathematica geworden.

Dieser Eintrag soll den PM-Studenten beim Lesen des symbolischen Teils der Arbeit unterstützen. Was folgt, ist eine teilweise Übersetzung der Symbolik in eine zeitgemäßere Notation, die aus anderen Artikeln dieser Enzyklopädie bekannt sein sollte und in zeitgenössischen Lehrbüchern der symbolischen Logik durchaus Standard ist. Es wird kein vollständiger Algorithmus geliefert, sondern verschiedene Vorschläge sollen dem Leser helfen, die Symbolik von PM zu lernen. Viele Interpretationsprobleme würden dadurch beeinträchtigt, dass nur die zeitgenössische Notation verwendet wird, und viele Details, die nur für PM gelten, hängen von dieser Notation ab. Im Folgenden wird mit einigen der umstritteneren Aspekte der Notation gezeigt, dass in die Notation von PM inhaltliche Lehren eingebaut sind. Das Ersetzen der Notation durch eine modernere Symbolik würde den Inhalt des Buches drastisch verändern.

2. Primitive Symbole

Im Folgenden findet der Leser in der Reihenfolge, in der sie in PM eingeführt werden, die folgenden Symbole, die kurz beschrieben werden. Weitere Einzelheiten finden Sie im Folgenden:

ausgesprochen "Stern"; gibt eine Zahl oder ein Kapitel wie in ∗ 1 oder ∗ 20 an.
· · ein zentrierter Punkt (ein alter britischer Dezimalpunkt); gibt einen nummerierten Satz in der Reihenfolge der ersten Ziffer (alle Nullen vor allen Einsen usw.), dann der zweiten Ziffer usw. an. Die ersten Definitionen und Sätze von ∗ 1 veranschaulichen diese „lexikografische“Reihenfolge: 1 · 01, 1 · 1, 1 · 11, 1 · 2, 1 · 3, 1 · 4, 1 · 5, 1 · 6, 1 · 7 1 · 71, 1 · 72.
(vdash) das Assertionszeichen; gibt eine Behauptung an, entweder ein Axiom (dh einen primitiven Satz, der auch mit "(Pp)" bezeichnet wird) oder einen Satz.
(Df) das Definitionszeichen; folgt einer Definition.
(.), \(:), \(:.), \(::), etc. sind Punkte, die zur Abgrenzung der Interpunktion verwendet werden; In der zeitgenössischen Logik verwenden wir (), , ({ }) usw.
(p, q, r) usw. sind Aussagenvariablen.
(lor), (supset), (osim), (equiv), (sdot) sind die bekannten sententialen Konnektiva, die "oder", "wenn-dann", "nicht", "wenn und nur wenn" bzw. "und" entsprechen. [In der zweiten Ausgabe von PM, 1925–27, ist der Sheffer-Strich „(mid)“der einzige primitive Bindeglied. Es bedeutet "nicht beides … und _".]
(x, y, z) usw. sind einzelne Variablen, die mit „typischer Mehrdeutigkeit“zu lesen sind, dh deren logische Typen auszufüllen sind (siehe unten).
(a, b, c) usw. sind einzelne Konstanten und stehen für Individuen (vom niedrigsten Typ). Diese treten nur in der Einführung in PM und nicht im offiziellen System auf.
(xRy, aRb, R (x)) usw. sind atomare Prädikationen, bei denen die durch die Variablen oder Konstanten benannten Objekte in der Beziehung (R) stehen oder die Eigenschaft (R) haben. Diese kommen nur in der Einleitung vor. "(A)" und "(b)" treten nur in der zweiten Ausgabe als Konstanten auf. Die Prädikationen (R (x), R (x, y)) usw. werden nur in der zweiten Ausgabe verwendet.

(phi), (psi), (chi) usw.

und (f, g) usw.

sind Variablen, die sich über Aussagenfunktionen erstrecken, unabhängig davon, ob diese Funktionen einfach oder komplex sind.
(phi x), (psi x), (phi (x, y)) usw. offene Atomformeln, in denen sowohl "(x)" als auch "(phi)" frei sind. [Eine alternative Interpretation besteht darin, "(phi x)" als schematischen Buchstaben anzusehen, der für eine Formel steht, in der die Variable "(x)" frei ist.]
(hat { phantom {x}}) der Zirkumflex; Wenn es in einer offenen Formel über einer Variablen platziert wird (wie in „(phi / hat {x})“), ergibt sich ein Begriff für eine Funktion. [Diese Angelegenheit ist umstritten. Siehe Landini 1998.] Wenn die umgelenkte Variable einer komplexen Variablen vorausgeht, gibt das Ergebnis eine Klasse an, wie in (hat {x} phi x).
(phi / hat {x}, / psi / hat {x}, / phi (hat {x}, / hat {z}),) usw. Begriffe für Satzfunktionen. Hier sind Beispiele für solche Begriffe, die Konstanten sind: "(hat {x}) ist glücklich", "(hat {x}) ist kahl und (hat {x}) ist glücklich", "(4 / lt / hat {x} lt 6)" usw. Wenn wir zum Beispiel anwenden, ist die Funktion "(hat {x}) kahl und (hat {x}) ist glücklich “für das jeweilige Individuum (b), das Ergebnis ist der Satz„ (b) ist kahl und (b) ist glücklich “.
(existiert) und ()

sind die Quantifizierer "es gibt" bzw. "für alle" ("alle"). Wenn beispielsweise (phi x) eine einfache oder komplexe offene Formel ist,

((existiert x) phi x) behauptet "Es gibt ein (x), so dass (phi x)"
((existiert / phi) phi x) behauptet "Es gibt eine Satzfunktion (phi), so dass (phi x)"
((x) phi x) behauptet "Jedes (x) ist so, dass (phi x)"
((phi) phi x) behauptet "Jede Satzfunktion (phi) ist so, dass (phi x)"

[Diese wurden von Peano verwendet. In jüngerer Zeit wurde (forall) zur Symmetrie mit (existent) hinzugefügt. Einige Wissenschaftler betrachten die Quantifizierer ((phi)) und ((existiert / phi)) als substituierend.]

(phi x / supset_x / psi x)

(phi x / equiv_x / psi x)

Diese Notation wird verwendet, um universell quantifizierte Variablen abzukürzen. In der modernen Notation werden diese zu (forall x (phi x / supset / psi x)) bzw. (forall x (phi x / equiv / psi x)). Siehe die Definitionen für diese Notation am Ende von Abschnitt 3.2 unten.
(Knall) ausgesprochen "Schrei"; gibt an, dass eine Funktion prädikativ ist, wie in (phi / bang x) oder (phi / bang / hat {x}). Siehe Abschnitt 7.
= das Identitätssymbol; drückt Identität aus, was ein definierter Begriff in PM ist, nicht primitiv wie in der zeitgenössischen Logik.
(atoi) als "das" lesen; ist der invertierte iota- oder Beschreibungsoperator und wird in Ausdrücken für bestimmte Beschreibungen verwendet, wie z. B. ((atoi x) phi x) (gelesen: das (x), so dass (phi x)).
) ((atoi x) phi x)] eine eindeutige Beschreibung in Klammern; Dies ist ein Bereichsindikator für eindeutige Beschreibungen.
(E / bang) wird bei ∗ 14 · 02 im Kontext (E / bang (atoi x) phi x) definiert, um zu bedeuten, dass die Beschreibung ((atoi x) phi x) richtig ist, dh dort ist genau eins (phi).
(existiert / bang) wird bei ∗ 24 · 03 im Kontext (existiert / bang / alpha) definiert, um zu bedeuten, dass die Klasse (alpha) nicht leer ist, dh ein Mitglied hat.

3. Die Verwendung von Punkten zur Interpunktion

Ein unmittelbares Hindernis für das Lesen von PM ist die ungewohnte Verwendung von Punkten zur Interpunktion anstelle der häufigeren Klammern und Klammern. Das System ist präzise und kann mit ein wenig Übung erlernt werden. Die Verwendung von Punkten zur Interpunktion gilt nicht nur für PM. Ursprünglich aus Peano stammend, wurde es später in Werken der Alonzo Church, von WVO Quine und anderen verwendet, ist aber inzwischen weitgehend verschwunden. (Die Verwendung von Punkten von historischem Interesse, als Alan Turing 1942 die Verwendung von Punkten unter rechnerischen Gesichtspunkten untersuchte, vermutlich in seiner Freizeit nach einem Arbeitstag im Bletchley Park, der die Codes der Enigma-Maschine brach.) Der beste Weg, um zu lernen, wie man es benutzt, besteht darin, sich einige Beispiele anzusehen, die in Klammern in Formeln übersetzt werden, um so ein Gefühl dafür zu bekommen. Was folgt, ist eine Erklärung, wie in PM, Seiten 9–10, dargestellt.gefolgt von einer Reihe von Beispielen, die jede ihrer Klauseln veranschaulichen:

Die Verwendung von Punkten. Punkte in der Zeile der Symbole haben zwei Verwendungszwecke, einen zum Klammern von Sätzen und einen zum Anzeigen des logischen Produkts zweier Sätze. Punkte unmittelbar vor oder nach "(lor)" oder "(supset)" oder "(equiv)" oder "(vdash)" oder "((x)").)”,“((X, y))”,“((x, y, z))”… oder“((existiert x))”,“((existiert x), y))”,“((existiert x, y, z))”… oder“([(atoi x) (phi x)])”oder“([R'y])”Oder analoge Ausdrücke dienen dazu, einen Satz abzuklammern; Andernfalls auftretende Punkte dienen dazu, ein logisches Produkt zu markieren. Das allgemeine Prinzip ist, dass eine größere Anzahl von Punkten eine äußere Klammer anzeigt, eine kleinere Anzahl eine innere Klammer anzeigt. Die genaue Regel bezüglich des Umfangs der durch Punkte angegebenen Klammer ergibt sich aus der Aufteilung des Auftretens von Punkten in drei Gruppen, die wir I, II und III nennen werden. Gruppe I besteht aus Punkten, die an ein Zeichen der Implikation ((supset)) oder Äquivalenz ((equiv)) oder der Disjunktion (lor)) oder der Gleichheit per Definition ((= / Df) angrenzen.). Gruppe II besteht aus Punkten in Klammern, die auf eine scheinbare Variable hinweisen, wie z. B. ((x)) oder ((x, y)) oder ((existiert x)) oder ((existiert x,) y)) oder ([(atoi x) (phi x)]) oder analoge Ausdrücke. Gruppe III besteht aus Punkten, die zwischen Sätzen stehen, um ein logisches Produkt anzuzeigen. Gruppe I ist stärker als Gruppe II und Gruppe II als Gruppe III. Der Umfang der Klammer, der durch eine Sammlung von Punkten angezeigt wird, erstreckt sich vorwärts oder rückwärts über eine kleinere Anzahl von Punkten oder eine gleiche Anzahl aus einer Gruppe mit weniger Kraft hinaus.bis wir entweder das Ende des behaupteten Satzes oder eine größere Anzahl von Punkten oder eine gleiche Anzahl erreichen, die zu einer Gruppe gleicher oder überlegener Kraft gehört. Punkte, die ein logisches Produkt anzeigen, haben einen Bereich, der sowohl vorwärts als auch rückwärts funktioniert. andere Punkte wirken nur vom benachbarten Zeichen der Disjunktion, Implikation oder Äquivalenz weg oder vorwärts vom benachbarten Symbol einer der anderen in Gruppe II aufgezählten Arten. Einige Beispiele sollen die Verwendung von Punkten veranschaulichen. (PM, 9–10)

3.1 Einige grundlegende Beispiele

Betrachten Sie die folgende Reihe erweiterter Beispiele, in denen wir Sätze in PM untersuchen und dann diskutieren, wie sie Schritt für Schritt in die moderne Notation übersetzt werden können. (Die folgenden Symbole werden manchmal als Namen für sich selbst verwendet, wodurch ansonsten benötigte Anführungszeichen vermieden werden. Russell wird häufig vorgeworfen, die Verwendung und Erwähnung zu verwechseln, sodass in dieser Praxis möglicherweise eine gewisse Gefahr besteht.)

Beispiel 1

) tag * {∗ 1 · 2} { vdash} Doppelpunkt p / lor p / ldot { supset} ldot p / quad / Pp)

Dies ist die zweite Behauptung von "Stern" 1. Es handelt sich tatsächlich um ein Axiom oder einen "primitiven Satz", wie durch "(Pp)" angegeben. Dass dies eine Behauptung (Axiom oder Theorem) und keine Definition ist, wird durch die Verwendung von "(vdash)" angezeigt. (Im Gegensatz dazu würde eine Definition das Assertionszeichen weglassen, aber mit einem "(Df)" - Zeichen abschließen.) Der erste Schritt bei der Übersetzung von ∗ 1 · 2 in die moderne Notation besteht darin, den Doppelpunkt zu notieren. Aus der oben zitierten Passage geht hervor, dass „eine größere Anzahl von Punkten eine äußere Klammer anzeigt, eine kleinere Anzahl eine innere Klammer“. Somit repräsentiert der Doppelpunkt hier (der aus einer größeren Anzahl von Punkten besteht als die einzelnen Punkte, die auf der Linie in ∗ 1 · 2 vorkommen) eine äußere Klammer. Der erste Schritt besteht also darin, ∗ 1 · 2 zu übersetzen in:

) vdash [p / lor p / ldot { supset} ldot p])

Die Klammern „[“und „]“stehen also für den Doppelpunkt in ∗ 1 · 2. Der Umfang des Doppelpunkts erstreckt sich somit über eine kleinere Anzahl von Punkten (dh einen Punkt) bis zum Ende der Formel. Da Formeln von links nach rechts gelesen werden, bedeutet der Ausdruck "Vergangenheit" "rechts von".

Als nächstes werden die Punkte um das "(supset)" in der modernen Notation durch die Klammer um das Antezedenz und die Konsequenz dargestellt. Wir erinnern uns, dass wir in der obigen Passage feststellen, dass „… Punkte nur vom angrenzenden Zeichen der Disjunktion, Implikation oder Äquivalenz entfernt sind…“. Daher besteht der nächste Schritt im Übersetzungsprozess darin, zur Formel zu wechseln:) vdash [(p / lor p) supset (p)])

Schließlich erlauben uns moderne Standardkonventionen, die äußeren Klammern und die Klammern um einzelne Buchstaben zu löschen, was Folgendes ergibt:

) vdash (p / lor p) supset p)

Unser nächstes Beispiel beinhaltet eine Konjunktion, die durch einfaches Nebeneinander von Atomsätzen angezeigt wird, oder mit einem Punkt, wenn eine Substitutionsinstanz in Betracht gezogen werden könnte, wie in der Definition der Konjunktion im Folgenden:

Beispiel 2

) tag * {∗ 3 · 01} p / sdot q / ldot {=} ldot / osim (osim p / lor / osim q) quad / Df)

Hier haben wir einen Fall, in dem Punkte auftreten, die sowohl ein „logisches Produkt“(dh eine Konjunktion) als auch begrenzende Klammern anzeigen. Als ersten Schritt bei der Übersetzung von ∗ 3 · 01 in die moderne Notation ersetzen wir den ersten Punkt durch ein kaufmännisches Und (und die entsprechenden Bereichsbegrenzer) und ersetzen "(ldot {=} ldot)" durch "(= _" {df})”, um zu ergeben:

[(p / amp q) = _ {df}) osim (osim p / lor / osim q)])

Der obige Schritt zeigt deutlich, wie ein „Punkt, der ein logisches Produkt angibt, einen Bereich hat, der sowohl vorwärts als auch rückwärts funktioniert“. Beachten Sie, dass der erste Punkt in ∗ 3 · 01, dh zwischen (p) und (q), angesichts des obigen Zitats von PM wirklich optional ist. Da wir jedoch manchmal (p) und (q) durch ganze Formeln ersetzen möchten, gibt der Punkt den Umfang der ersetzten Formeln an. Daher könnten wir als Substitutionsinstanz Folgendes haben: (r / lor s / sdot q / supset s) (in PM-Notation) oder ((r / lor s) amp (q / supset s)) (in zeitgenössischen Symbolen).

Schließlich erlauben uns unsere modernen Konventionen, die äußeren Klammern aus dem Definiendum und die Klammern "[" und "]" aus den Definiens zu entfernen, was ergibt:

[p / amp q = _ {df} osim (osim p / lor / osim q))

Beachten Sie, dass der Umfang des Negationszeichens „(osim)“in ∗ 3 · 01 auch im PM-System nicht mit Punkten gekennzeichnet ist, sondern Klammern erfordert.

Beispiel 3

) tag * {∗ 9 · 01} osim {(x) sdot / phi x } ldot {=} ldot (existiert x) sdot / osim / phi x / quad / Df)

Wenn wir die Regel anwenden, „arbeiten Punkte nur weg vom benachbarten Zeichen der Disjunktion, Implikation oder Äquivalenz oder vorwärts vom benachbarten Symbol einer der anderen in Gruppe II aufgezählten Arten“(wobei Gruppe II „((existiert)) enthält x))”), dann wäre das moderne Äquivalent:) osim (x) phi x = _ {df} (existiert x) osim / phi x) oder) osim / forall x / phi x = _ {df} existiert x / osim / phi x)

3.2 Die Kraft der Verbindungen

Die Rangfolge von Konnektiven in Bezug auf die relative „Kraft“oder den Umfang ist eine Standardkonvention in der zeitgenössischen Logik. Wenn keine expliziten Klammern vorhanden sind, die den Umfang eines Konnektivs angeben, wird davon ausgegangen, dass diejenigen, die im Ranking Vorrang haben, der Hauptkonnektiv sind, und so weiter für Unterformeln. Formulieren Sie stattdessen das folgende DeMorgan-Gesetz als umständlich:

[(osim p) lor (osim q)] equiv) osim (p / amp q)])

wir schreiben es heutzutage als:

) osim p / lor / osim q / equiv / osim (p / amp q))

Diese einfachere Formulierung ist natürlich, da (equiv) Vorrang vor (hat einen größeren "Umfang" als) (lor) und & hat und letztere Vorrang vor (osim) haben. In der Tat werden Klammern um (equiv) oft nicht benötigt, da eine weitere Konvention vorliegt, bei der (equiv) Vorrang vor (supset) hat. Somit wird die Formel (p / supset q / equiv / osim p / lor q) eindeutig. Wir könnten diese Konventionen darstellen, indem wir die Konnektiva in Gruppen mit denen mit dem größten Umfang oben auflisten:

) begin {array} {c} equiv \\ / supset \\ / amp, / lor \\ / osim / end {array})

Für Whitehead und Russell sind die Symbole (supset), (equiv), (lor) und (ldots = / ldots / Df) in Gruppe I jedoch gleich stark. Gruppe II besteht aus den variablen Bindungsausdrücken, Quantifizierern und Bereichsindikatoren für bestimmte Beschreibungen, und Gruppe III besteht aus Konjunktionen. Die Negation liegt unter all diesen. Das Ranking in PM wäre also:

) begin {array} {c} supset, / equiv, / lor / text {und} ldots = / ldots / quad / Df \(x), (x, y) ldots (existiert x), (existiert x, y) ldots [(atoi x) phi x] / p / sdot q / quad / text {(Konjunktion)} / \ osim / end {array})

Dies scheinen Whitehead und Russell zu bedeuten, wenn sie sagen: "Gruppe I ist stärker als Gruppe II und Gruppe II als Gruppe III." Folgendes berücksichtigen:

Beispiel 4

) tag * {∗ 3 · 12} { vdash} Doppelpunkt / osim p / ldot { lor} ldot / osim q / ldot { lor} ldot p / sdot q)

Dieser Satz zeigt, wie mehrere Verwendungen derselben Anzahl von Punkten innerhalb einer Formel gelesen werden. Gruppieren von "Assoziierten nach links" sowohl für Punkte als auch für eine Reihe von Disjunktionen gemäß der Konvention des Lesens von links nach rechts und der Definition:

) tag * {∗ 2 · 33} p / vee q / vee r / ldot {=} ldot (p / vee q) vee r / quad / Df)

In ∗ 3 · 12 „arbeiten“die ersten beiden Punkte um das (lor) einfach vom Konnektiv weg. Der zweite "verlängert" sich, bis er auf den nächsten der gleichen Nummer (den dritten einzelnen Punkt) trifft. Dieser dritte Punkt und die vierte "Arbeit weg" vom zweiten (lor) und der letzte Punkt zeigen eine Konjunktion mit engstem Umfang an. Das Ergebnis, formuliert mit allen möglichen Satzzeichen für maximale Aussagekraft, ist:

) {[(osim p) lor (osim q)] lor (p / amp q) })

Wenn wir alle Standardkonventionen zum Löschen von Klammern verwenden, wird dies zu:

[(osim p / lor / osim q) lor (p / amp q))

Dies veranschaulicht die Passage im obigen Zitat, in der es heißt: „Der Umfang der Klammer, der durch eine Sammlung von Punkten angezeigt wird, erstreckt sich vorwärts oder rückwärts über eine kleinere Anzahl von Punkten oder eine gleiche Anzahl von einer Gruppe mit weniger Kraft hinaus, bis wir entweder das Ende erreichen des behaupteten Satzes oder einer größeren Anzahl von Punkten oder einer gleichen Anzahl, die zu einer Gruppe gleicher oder überlegener Kraft gehört. “

Bevor wir uns ein breiteres Spektrum von Beispielen ansehen, wird sich ein detailliertes Beispiel mit quantifizierten Variablen als aufschlussreich erweisen. Whitehead und Russell folgen Peanos Praxis, universell quantifizierte Bedingungen (wie "Alle (phi) sind (psi) s") auszudrücken, wobei die gebundene Variable unter dem bedingten Vorzeichen steht. Ähnlich verhält es sich mit universell quantifizierten Biconditionals ("Alle und nur (phi) s sind (psi) s"). Das heißt, die Ausdrücke "(phi x / supset_x / psi x)" und "(phi x / equiv_x / psi x)" sind wie folgt definiert:

) tag * {∗ 10 · 02} phi x / supset_x / psi x / ldot {=} ldot (x) ldot / phi x / supset / psi x / quad / Df)) tag * {∗ 10 · 03} phi x / equiv_x / psi x / ldot {=} ldot (x) ldot / phi x / equiv / psi x / quad / Df)

und entsprechen den folgenden moderneren Formeln:

) forall x (phi x / supset / psi x))) forall x (phi x / equiv / psi x))

Als Übung könnte der Leser geneigt sein, einen strengen Algorithmus zur Umwandlung von PM in eine bestimmte zeitgenössische Symbolik (mit Konventionen zum Löschen von Klammern) zu formulieren. Der beste Weg, das System zu lernen, besteht jedoch darin, einige weitere Beispiele für Übersetzungen zu betrachten und dann Beginnen Sie einfach, Formeln direkt zu lesen.

3.3 Weitere Beispiele

In den folgenden Beispielen folgt auf jede Formelnummer zuerst die Principia-Notation und dann ihre moderne Übersetzung. Beachten Sie, dass in ∗ 1 · 5 zusätzlich zu Punkten Klammern für die Interpunktion verwendet werden. (Primitive Sätze ∗ 1 · 2, ∗ 1 · 3, ∗ 1 · 4, ∗ 1 · 5 und ∗ 1 · 6 bilden zusammen die Axiome für die Aussagenlogik in PM.) Satz ∗ 1 · 5 erwies sich als redundant durch Paul Bernays im Jahr 1926. Es kann aus geeigneten Instanzen der anderen und der Regel des Modus Ponens abgeleitet werden.

∗ 1 · 3

({ vdash} Doppelpunkt q / ldot { supset} ldot p / lor q / quad / Pp)

(q / supset p / lor q)

∗ 1 · 4

({ vdash} Doppelpunkt p / lor q / ldot { supset} ldot q / lor p / quad / Pp)

(p / lor q / supset q / lor p)

∗ 1 · 5

({ vdash} Doppelpunkt p / lor (q / lor r) ldot { supset} ldot q / lor (p / lor r) quad / Pp)

(p / lor (q / lor r)) supset q / lor (p / lor r))

∗ 1 · 6

({ vdash} colondot q / supset r / ldot { supset} Doppelpunkt p / lor q / ldot { supset} ldot p / lor r / quad / Pp)

((q / supset r)) supset (p / lor q / supset p / lor r))

∗ 2 · 03

({ vdash} Doppelpunkt p / supset / osim q / ldot { supset} ldot q / supset / osim p)

((p / supset / osim q) supset (q / supset / osim p))

∗ 3 · 3

({ vdash} colondot p / sdot q / ldot { supset} ldot r / Doppelpunkt { supset} Doppelpunkt p / ldot { supset} ldot q / supset r)

([(p / amp q) supset r] supset [p / supset (q / supset r)])

∗ 4 · 15

({ vdash} colondot p / sdot q / ldot { supset} ldot / osim r / Doppelpunkt { equiv} Doppelpunkt q / sdot r / ldot { supset} ldot / osim p)

(p / amp q / supset / osim r / äquiv q / amp r / supset / osim p)

∗ 5 · 71

({ vdash} colondot q / supset / osim r / ldot { supset} Doppelpunkt p / lor q / sdot r / ldot { equiv} ldot p / sdot r)

((q / supset) osim r) supset [(p / lor q) amp r / äquiv p / amp r])

∗ 9 · 04

(p / ldot { lor} ldot (x) ldot / phi x / Doppelpunkt {=} ldot (x) ldot / phi x / lor p / quad / Df)

(p / lor / forall x / phi x = _ {df} forall x (phi x / lor p))

∗ 9 · 521 ({ vdash} Doppelpunkte (existiert x) ldot / phi x / ldot { supset} ldot q / Doppelpunkt { supset} colondot (existiert x) ldot / phi x / ldot { lor } ldot r / Doppelpunkt { supset} ldot q / lor r)) ((existiert x / phi x) supset q] supset [((existiert x / phi x) lor r) supset (q / lor r))]
∗ 10 · 55

({ vdash} colondot (existiert x) ldot / phi x / sdot / psi x / Doppelpunkt / phi x / supset_x / psi x / Doppelpunkt { equiv} Doppelpunkt (existiert x) ldot / phi x / Doppelpunkt / phi x / supset_x / psi x)

(existiert x (phi x / amp / psi x) amp / forall x (phi x / supset / psi x) äquiv / existiert x / phi x / amp / forall x (phi x / supset / psi x))

4. Satzfunktionen

Es gibt zwei Arten von Funktionen in PM. Aussagenfunktionen wie "(hat {x}) ist eine natürliche Zahl" sind von den bekannteren mathematischen Funktionen zu unterscheiden, die als "beschreibende Funktionen" bezeichnet werden (PM, 31). Beschreibende Funktionen werden unter Verwendung von Beziehungen und bestimmten Beschreibungen definiert. Beispiele für beschreibende Funktionen sind (x + y) und "der Nachfolger von (n)".

Whitehead und Russell konzentrieren sich auf Aussagenfunktionen und unterscheiden zwischen Ausdrücken mit einer freien Variablen (wie "(x) ist verletzt") und Namen von Funktionen (wie "(hat {x}) ist verletzt") (PM, 14-15). Die Sätze, die sich aus der Formel ergeben, indem der freien Variablen "x" zulässige Werte zugewiesen werden, werden als "mehrdeutige Werte" der Funktion bezeichnet. Ausdrücke, die die Zirkumflexnotation verwenden, wie (phi / hat {x}), kommen nur im Einführungsmaterial in den technischen Abschnitten von PM und nicht in den technischen Abschnitten selbst vor (mit Ausnahme der Abschnitte zur Klassentheorie)), was einige Wissenschaftler dazu veranlasst, zu sagen, dass solche Ausdrücke im formalen System von PM nicht wirklich vorkommen. Dieses Problem unterscheidet sich von dem, das die Interpretation solcher Symbole betrifft. Handelt es sich um „termbildende Operatoren“, die eine offene Formel in einen Namen für eine Funktion verwandeln, oder einfach um ein syntaktisches Gerät, einen Platzhalter, um die Variable anzugeben, für die eine Substitution in einer offenen Formel vorgenommen werden kann? Wenn sie als termbildende Operatoren behandelt werden sollen, wäre die moderne Notation für (phi / hat {x}) "(lambda x / phi x)". Die (lambda) - Notation hat den Vorteil, dass deutlich wird, dass die Variable (x) an den termbildenden Operator (lambda) gebunden ist, der ein Prädikat (phi) nimmt und ergibt ein Begriff (lambda x / phi x) (der in einigen Logiken ein singulärer Begriff ist, der an der Subjektposition eines Satzes vorkommen kann, während in anderen Logiken ein komplexer prädikativer Ausdruck ist). Im Gegensatz zur (lambda) - Notation kann die PM-Notation, die den Zirkumflex verwendet, keinen Gültigkeitsbereich angeben. Der Funktionsausdruck „(phi (hat {x},\ hat {z})) “ist ohne weitere Konvention zwischen„ (lambda x / lambda y / phi xy) “und„ (lambda y / lambda x / phi xy) “nicht eindeutig. In der Tat spezifizierten Whitehead und Russell diese Konvention für Beziehungen in Erweiterung (auf S. 200 im Einführungsmaterial von ∗ 21 in Bezug auf die Reihenfolge der Variablen), aber die Mehrdeutigkeit, die sie am deutlichsten durch die Verwendung von (lambda) hervorrief) Notation: Die erste bezeichnet die Beziehung, ein (x) und (y) zu sein, so dass (phi xy), und die zweite bezeichnet die umgekehrte Beziehung, ein (y) und (x zu sein) so dass (phi xy).aber die Mehrdeutigkeit, die es am deutlichsten durch die Verwendung der Notation (lambda) hervorhob: Die erste bezeichnet die Beziehung zwischen (x) und (y), so dass (phi xy) und die zweite bezeichnet die umgekehrte Beziehung von a (y) und (x), so dass (phi xy).aber die Mehrdeutigkeit, die es am deutlichsten durch die Verwendung der Notation (lambda) hervorhob: Die erste bezeichnet die Beziehung zwischen (x) und (y), so dass (phi xy) und die zweite bezeichnet die umgekehrte Beziehung von a (y) und (x), so dass (phi xy).

5. Die fehlende Notation für Typen und Bestellungen

In diesem Abschnitt wird die Notation erläutert, die nicht in Principia Mathematica enthalten ist. Abgesehen von einigen Notationen für „relative“Typen in Band II gibt es in Principia Mathematica bekanntlich keine Symbole für Typen! Sätze sind im Allgemeinen als „typisch mehrdeutig“zu verstehen und stehen daher für Ausdrücke einer ganzen Reihe von Typen. So wie es keine Einzel- oder Prädikatenkonstanten gibt, gibt es auch keine bestimmten Funktionen eines bestimmten Typs. Man sieht also nicht nur nicht, wie man das Argument symbolisiert:

Alle Menschen sind sterblich

Sokrates ist ein Mann

Deshalb ist Sokrates sterblich

Es gibt aber auch keinen Hinweis auf den logischen Typ der Funktion "(hat {x}) ist sterblich". Das Projekt von PM besteht darin, Mathematik auf Logik zu reduzieren, und ein Teil der Sichtweise der Logik hinter diesem Projekt ist, dass logische Wahrheiten alle vollständig allgemein sind. Die Ableitung von Wahrheiten der Mathematik aus Definitionen und Wahrheiten der Logik beinhaltet daher keine anderen bestimmten Konstanten als die, die per Definition aus rein logischen Begriffen eingeführt werden. Infolgedessen ist in PM keine Notation zur Beschreibung dieser Typen enthalten. Diejenigen von uns, die PM als eine Logik betrachten möchten, die angewendet werden kann, müssen es mit einigen Typenangaben ergänzen.

Leser sollten beachten, dass die unten beschriebene Erklärung der Typen nicht den Aussagen über Typen im PM-Text entspricht. Alonzo Church [1976] entwickelte eine einfache, rationale Rekonstruktion der Notation sowohl für die einfache als auch für die verzweigte Typentheorie, wie sie im Text von PM impliziert ist. (Es gibt alternative, äquivalente Notationen für die Typentheorie.) Die vollständige Theorie kann als Entwicklung der einfachen Typentheorie angesehen werden.

5.1 Einfache Typen

Eine Definition der einfachen Typen kann wie folgt gegeben werden:

  • (iota) (griechisches iota) ist der Typ für eine Person.
  • Wo (tau_1, / ldots, / tau_n) beliebige Typen sind, ist (ulcorner (tau_1, / ldots, / tau_n) urcorner) der Typ einer Satzfunktion, deren Argumente vom Typ (tau_1, / ldots, / tau_n).
  • (ulcorner) () (urcorner) ist die Art der Sätze.

Hier sind einige intuitive Möglichkeiten, um die Definition des Typs zu verstehen. Angenommen, „Sokrates“nennt eine Person. (Wir ignorieren hier Russells überlegte Meinung, dass solche gewöhnlichen Individuen tatsächlich Klassen von Klassen von Sinnesdaten und damit von einem viel höheren Typ sind.) Dann wäre die individuelle Konstante "Sokrates" vom Typ (iota). Eine monadische Satzfunktion, die Individuen als Argumente verwendet, ist vom Typ ((iota)). Angenommen, "ist sterblich" ist ein Prädikat, das eine solche Funktion ausdrückt. Die Funktion "(hat {x}) ist sterblich" ist ebenfalls vom Typ ((iota)). Eine Zwei-Stellen- oder Binärbeziehung zwischen Individuen ist vom Typ ((iota, / iota)). Daher ist ein Beziehungsausdruck wie "Eltern von" und die Funktion "(hat {x}) ist ein Elternteil von (hat {z})" vom Typ ((iota, / iota)).).

Aussagenfunktionen vom Typ ((iota)) werden oft als "erste Ordnung" bezeichnet; daher der Name "Logik erster Ordnung" für die bekannte Logik, bei der sich die Variablen nur über Argumente von Funktionen erster Ordnung erstrecken. Eine monadische Funktion von Argumenten vom Typ (tau) ist vom Typ ((tau)), und daher sind Funktionen solcher Funktionen vom Typ (((tau))). "Logik zweiter Ordnung" enthält Variablen für die Argumente solcher Funktionen (sowie Variablen für Einzelpersonen). Binäre Beziehungen zwischen Funktionen vom Typ (tau) sind vom Typ ((tau, / tau)) usw. für Beziehungen mit mehr als 2 Argumenten. Gemischte Typen werden durch die obigen definiert. Eine Beziehung zwischen einem Individuum und einem Satz (wie "(hat {x}) glaubt, dass (hat {P})") vom Typ ((iota), ()) sein wird.

5.2 Verzweigte Typen

Um eine Notation für die vollständig verzweigte Theorie der PM-Typen zu erstellen, muss eine weitere Information in den Symbolen codiert werden. Die Kirche nennt das resultierende System einen der R-Typen. Die Schlüsselidee verzweigter Typen besteht darin, dass jede Funktion, die durch Quantifizierung über Funktionen eines bestimmten Typs definiert wird, eine höhere „Ordnung“haben muss als diese Funktionen. So verwenden Sie Russells Beispiel:

(hat {x}) hat alle Eigenschaften, die große Generäle haben

ist eine Funktion, die für Personen (dh Individuen) gilt, und unter dem Gesichtspunkt der einfachen Typentheorie hat sie den gleichen einfachen logischen Typ wie bestimmte Eigenschaften von Individuen (wie Tapferkeit und Entschlossenheit). In der Theorie des verzweigten Typs wird die obige Funktion jedoch von höherer Ordnung sein als diese besonderen Eigenschaften von Individuen, da sie im Gegensatz zu diesen besonderen Eigenschaften eine Quantifizierung über diese Eigenschaften beinhaltet. Während der Ausdruck "(hat {x}) mutig ist" eine Funktion vom r-Typ ((iota) / 1) bezeichnet, hat der Ausdruck "(hat {x}) alles Die Eigenschaften, die große Generäle haben, haben den Typ r ((iota) / 2). Bei diesen R-Typen gibt die Zahl nach dem „/“den Funktionspegel an. Die Reihenfolge der Funktionen wird anhand der folgenden Definitionen definiert und berechnet.

Church definiert die R-Typen wie folgt:

  • (iota) (griechisches iota) ist der r-Typ für eine Person.
  • Wo (tau_1, / ldots, / tau_m) beliebige r-Typen sind, ist (ulcorner (tau_1, / ldots, / tau_m) / n / urcorner) ein r-Typ; Dies ist der r-Typ einer (m) - Satzfunktion der Ebene (n), die Argumente von r-Typen (tau_1, / ldots, / tau_m) enthält.

Die Reihenfolge einer Entität ist wie folgt definiert (hier folgen wir nicht mehr der Kirche, da er Ordnungen für Variablen, dh Ausdrücke, anstelle von Ordnungen für die Dinge definiert, über die sich die Variablen erstrecken):

  • die Reihenfolge einer Person (vom r-Typ (iota)) ist 0,
  • Die Reihenfolge einer Funktion vom r-Typ ((tau_1, / ldots, / tau_m) / n) ist (n + N), wobei (N) die größte der Reihenfolge der Argumente / ist (tau_1, / ldots, / tau_m).

Diese beiden Definitionen werden durch ein Prinzip ergänzt, das die Ebenen bestimmter definierter Funktionen identifiziert, nämlich dass die Ebene einer definierten Funktion eins höher sein sollte als die Entität höchster Ordnung mit einem Namen oder einer Variablen, die in der Definition dieser Funktion enthalten ist.

Um zu sehen, wie diese Definitionen und Prinzipien verwendet werden können, um die Reihenfolge der Funktion "(hat {x}) hat alle Eigenschaften, die große Generäle haben", zu berechnen, beachten Sie, dass die Funktion wie folgt dargestellt werden kann, wobei "" (x, y)”sind Variablen, die sich über Individuen vom r-Typ (iota) erstrecken (Ordnung 0).“GreatGeneral ((y))”ist ein Prädikat, das eine Satzfunktion vom r-Typ ((iota) / 1) (und so von Ordnung 1), und "(phi)" ist eine Variable, die sich über Aussagenfunktionen vom r-Typ ((iota) / 1) (und so weiter) erstreckt Ordnung 1) wie großer General, Tapferkeit, Führung, Geschicklichkeit, Weitsicht usw.:

[(phi) {[(y) (textrm {GreatGeneral} (y) supset / phi (y)] supset / phi / hat {x} })

Wir stellen zunächst fest, dass angesichts des obigen Prinzips der r-Typ dieser Funktion ((iota) / 2) ist; Die Ebene ist 2, da die Ebene des r-Typs dieser Funktion um eins höher sein muss als die höchste Ordnung einer in der Definition genannten Entität (oder im Bereich einer verwendeten Variablen). In diesem Fall liegt die Bezeichnung von GreatGeneral und der Bereich der Variablen "(phi)" in der Ordnung 1 und keine anderen Ausdrucksnamen oder -bereiche über einer Entität höherer Ordnung. Somit ist die Ebene der oben genannten Funktion als 2 definiert. Schließlich berechnen wir die Reihenfolge der oben angegebenen Funktion so, wie sie definiert wurde: die Summe der Ebene plus der größten der Ordnungen der Argumente der obigen Funktion. Da die einzigen Argumente in der obigen Funktion Individuen (der Ordnung 0) sind, ist die Ordnung unserer Funktion nur 2.

Die Quantifizierung über Funktionen des r-Typs ((tau) / n) der Ordnung (k) in einer Definition einer neuen Funktion ergibt eine Funktion des r-Typs ((tau) / n + 1). und damit eine Funktion der Ordnung eins höher, (k + 1). Zwei Arten von Funktionen können also von zweiter Ordnung sein: (1) Funktionen von Funktionen erster Ordnung von Individuen, von Funktionen vom r-Typ (((iota) / 1) / 1) und (2) vom r-Typ ((iota) / 2), wie unser Beispiel "(hat {x}) hat alle Eigenschaften, die große Generäle haben". Letzteres wird eine Funktion sein, die für Individuen wie Napoleon gilt, aber von höherer Ordnung ist als einfache Funktionen wie "(hat {x}) ist mutig", die vom r-Typ ((iota) / sind. 1).

Logiker verwenden heute einen anderen Begriff von „Ordnung“. Logik erster Ordnung ist heute eine Logik mit nur Variablen für Einzelpersonen. Logik zweiter Ordnung ist eine Logik mit Variablen sowohl für Individuen als auch für Eigenschaften von Individuen. Logik dritter Ordnung ist eine Logik mit Variablen für Individuen, Eigenschaften von Individuen und Eigenschaften von Eigenschaften von Individuen. Und so weiter. Im Gegensatz dazu würde Church diese Logik jeweils die Logik der Funktionen der Typen ((iota) / 1) und ((iota, / ldots, / iota) / 1) die Logik der Funktionen nennen der Typen (((iota) / 1) / 1) und (((iota, / ldots, / iota) / 1, / ldots, (iota, / ldots, / iota) / 1) / 1) und die Logik der Funktionen der Typen ((((iota) / 1) / 1) / 1) usw. (dh die Funktionen der Ebene eins der Funktionen des vorhergehenden Typs). In Anbetracht der Definitionen der Kirche sind dies Logiken von Funktionen erster, zweiter und dritter Ordnung. Dies entspricht der modernen Terminologie von „(n)th -Auftrag logisch“.

6. Variablen

Wie bereits erwähnt, gibt es im formalen PM-System keine Einzel- oder Prädikatkonstanten, sondern nur Variablen. In der Einleitung wird jedoch das Beispiel "(a) in der Beziehung (R) zu (b)" in einer Diskussion atomarer Tatsachen verwendet (PM, 43). Obwohl "(R)" später als Variable verwendet wird, die sich über Relationen in Erweiterung erstreckt, und "(a, b, c, / ldots)" einzelne Variablen sind, lassen Sie uns sie vorübergehend als Prädikat zum System hinzufügen bzw. einzelne Konstanten, um die Verwendung von Variablen in PM zu diskutieren.

PM nutzt insbesondere die Unterscheidung zwischen „realen“oder freien Variablen und „scheinbaren“oder gebundenen Variablen. Da "(x)" eine Variable ist, ist "(xRy)" eine Atomformel in unserer erweiterten Sprache mit realen Variablen "(x)" und "(y)". Wenn solche Formeln mit den Satzverbindungen (osim), (lor) usw. kombiniert werden, ist das Ergebnis eine Matrix. Zum Beispiel wäre "(aRx / ldot { lor} ldot xRy)" eine Matrix.

Wie wir zuvor gesehen haben, gibt es auch Variablen, die sich über Funktionen erstrecken: "(phi), (psi), (ldots, f, g)" usw. Der Ausdruck "(phi x)”enthält also zwei Variablen und steht für einen Satz, insbesondere das Ergebnis der Anwendung der Funktion (phi) auf das Individuum (x).

Theoreme werden mit reellen Variablen angegeben, was ihnen eine besondere Bedeutung für die Theorie gibt. Beispielsweise,) tag * {∗ 10 · 1} vdash / Doppelpunkt (x) ldot / phi x / ldot { supset} ldot / phi y / quad / Pp)

ist ein grundlegendes Axiom der Quantifizierungstheorie von PM. In diesem primitiven Satz sind die Variablen "(phi)" und "(y)" real (frei), und das "(x)" ist offensichtlich (gebunden). Da das System keine Konstanten enthält, kommt PM einer Regel der universellen Instanziierung am nächsten.

Whitehead und Russell interpretieren "((x) sdot / phi x)" als "den Satz, der alle Werte für (phi / hat {x}) bestätigt" (PM 41). Die Verwendung des Wortes „alle“hat innerhalb der Typentheorie eine besondere Bedeutung. Sie präsentieren das „Teufelskreisprinzip“, das der Typentheorie zugrunde liegt, als Behauptung

… Wenn eine Menge von Objekten so angenommen wird, dass sie, wenn wir annehmen, dass die Menge eine Summe hat, im Allgemeinen Mitglieder enthält, die diese Summe voraussetzen, dann kann eine solche Menge keine Summe haben. Mit der Aussage, dass die Menge „keine Summe“hat, meinen wir in erster Linie, dass keine signifikante Aussage über „alle ihre Mitglieder“gemacht werden kann. (PM, 37)

Insbesondere muss ein quantifizierter Ausdruck, da er von „allen“Mitgliedern einer Gesamtheit spricht, über einen bestimmten logischen Typ reichen, um das Teufelskreisprinzip zu beachten. Wenn wir also eine gebundene Variable interpretieren, müssen wir davon ausgehen, dass sie sich über einen bestimmten Entitätstyp erstreckt, und daher müssen Typen den anderen Entitäten zugewiesen werden, die durch Ausdrücke in der Formel dargestellt werden, unter Beachtung der Typentheorie.

Eine Frage stellt sich jedoch, sobald man erkennt, dass die Aussagen primitiver Sätze und Theoreme in PM wie ∗ 10 · 1 als „typisch mehrdeutig“(dh in Bezug auf den Typ mehrdeutig) angesehen werden. Diese Aussagen sind tatsächlich schematisch und stellen alle möglichen spezifischen Aussagen dar, die aus ihnen abgeleitet werden können, indem Typen entsprechend interpretiert werden. Aber wenn Anweisungen wie ∗ 10 · 1 Schemata sind und dennoch gebundene Variablen haben, wie weisen wir den Entitäten, über die sich die gebundenen Variablen erstrecken, Typen zu? Die Antwort ist, zuerst zu entscheiden, über welche Art von Dingen die freien Variablen in der Anweisung reichen. Angenommen, die Variable (y) in ∗ 10 · 1 erstreckt sich über Individuen (vom Typ (iota)), dann muss sich die Variable (phi) über Funktionen vom Typ (() erstrecken iota) / n) für einige (n). Dann erstreckt sich die gebundene Variable (x) auch über Einzelpersonen. Wenn wir jedoch annehmen, dass die Variable (y) in ∗ 10 · 1 über Funktionen vom Typ ((iota) / 1) reicht, muss sich die Variable (phi) über Funktionen vom Typ erstrecken (((iota) / 1) / m), für einige (m). In diesem Fall erstreckt sich die gebundene Variable (x) über Funktionen vom Typ ((iota) / 1).

Daher werden (y) und (phi) in ∗ 10 · 1 als "echte" Variablen bezeichnet, nicht nur, weil sie frei sind, sondern auch, weil sie sich über einen beliebigen Typ erstrecken können. Whitehead und Russell sagen häufig, dass reale Variablen mehrdeutig "jede" ihrer Instanzen bezeichnen, während gebundene Variablen (die auch mehrdeutig bezeichnen) sich über "alle" ihrer Instanzen erstrecken (innerhalb einer legitimen Gesamtheit, dh eines Typs).

7. Prädikative Funktionen und Identität

Das Ausrufezeichen "!" Folgen einer Variablen für eine Funktion und vor dem Argument, wie in "(f / bang / hat {x})", "(phi / bang x)", "(phi / bang / hat {" x})”gibt an, dass die Funktion prädikativ ist, dh von der niedrigsten Ordnung, die für ihre Argumente gelten kann. In der Notation der Kirche bedeutet dies, dass alle prädikativen Funktionen der ersten Ebene mit Typen der Form ((ldots) / 1) angehören. Infolgedessen sind prädikative Funktionen um eins höher als die höchste Ordnung eines ihrer Argumente. Diese Analyse basiert auf Zitaten wie den folgenden in der Einführung zu PM:

Wir werden eine Funktion einer Variablen als Prädikativ definieren, wenn sie in der nächsten Ordnung über der ihres Arguments liegt, dh in der niedrigsten Ordnung, die mit ihrem Argument kompatibel ist. (PM, 53)

Leider finden wir in der Zusammenfassung von ∗ 12 „Eine prädikative Funktion ist eine, die keine offensichtlichen Variablen enthält, dh eine Matrix ist“[PM, 167]. Diese Aussage mit dieser Definition in der Einleitung in Einklang zu bringen, ist ein Problem für Wissenschaftler.

Berücksichtigen Sie die folgende Definition der Identität, um die Schrei-Notation in Aktion zu sehen:

) tag * {∗ 13 · 01} x = y / ldot {=} Doppelpunkt (phi) Doppelpunkt / phi / bang x / ldot { supset} ldot / phi / bang y / quad / Df]

Das heißt, (x) ist genau dann mit (y) identisch, wenn (y) jede prädikative Funktion (phi) hat, die (x) besitzt. (Natürlich gibt das zweite Vorkommen von "=" eine Definition an und hat keine unabhängige Bedeutung. Es ist das erste Vorkommen, das Individuen (x) und (y) in Beziehung setzt.)

Um zu sehen, wie sich diese Definition auf die bekanntere Definition der Identität reduziert (bei der Objekte identisch sind, wenn sie dieselben Eigenschaften haben), benötigen wir das Axiom der Reduzierbarkeit. Das Axiom der Reduzierbarkeit besagt, dass es für jede Funktion eine äquivalente Funktion gibt (dh eine, die für alle gleichen Argumente gilt), die aussagekräftig ist:

Axiom der Reduzierbarkeit:) tag * {∗ 12 · 1} vdash / Doppelpunkt (existiert f) Doppelpunkt / phi x / ldot { equiv_x} ldot f / bang x / quad / Pp)

Um zu sehen, wie dieses Axiom die bekanntere Definition von Identität impliziert, beachten Sie, dass die bekanntere Definition von Identität lautet:

[x = y / ldot {=} Doppelpunkt (phi) Doppelpunkt / phi x / ldot { supset} ldot / phi y / quad / Df)

für (phi) vom Typ "any". (Beachten Sie, dass sich dies von ∗ 13 · 01 dadurch unterscheidet, dass der Schrei nicht mehr auftritt.) Um dies zu beweisen, nehmen Sie sowohl ∗ 13 · 01 als auch das Axiom der Reduzierbarkeit an und nehmen Sie zum Beweis durch Reduktion an, dass (x = y) und (phi x) und nicht (phi y) für eine Funktion (phi) beliebigen Typs. Dann garantiert das Axiom der Reduzierbarkeit ∗ 12 · 1, dass es eine prädikative Funktion (psi / bang) gibt, die mit (phi) koextensiv ist, so dass (psi / bang x), aber nicht (psi / bang y), was ∗ 13 · 01 widerspricht.

8. Bestimmte Beschreibungen

Der umgekehrte griechische Buchstabe iota "(atoi)" wird in PM verwendet, gefolgt von einer Variablen, um eine bestimmte Beschreibung zu beginnen. ((atoi x) phi x) wird als "das (x), so dass (x) (phi) ist" oder einfacher als "das (phi " gelesen))”. Solche Ausdrücke können in der Subjektposition auftreten, wie in (psi (atoi x) phi x), gelesen als "das (phi) ist (psi)". Der formale Teil von Russells berühmter "Theorie bestimmter Beschreibungen" besteht aus einer Definition aller Formeln "… (psi (atoi x) phi x) …", in denen eine Beschreibung vorkommt. Um den Teil (psi) vom Rest eines größeren Satzes (angezeigt durch die obigen Ellipsen) zu unterscheiden, in dem der Ausdruck (psi (atoi x) phi x) vorkommt, ist der Umfang der Beschreibung angezeigt durch Wiederholen der definitiven Beschreibung in Klammern:

[(atoi x) phi x] sdot / psi (atoi x) phi x)

Der Begriff des Geltungsbereichs soll eine Unterscheidung erklären, die Russell in „On Denoting“(1905) bekanntermaßen diskutiert. Russell sagt, dass der Satz „Der gegenwärtige König von Frankreich hat keine Glatze“zwischen zwei Lesungen nicht eindeutig ist: (1) die Lesung, in der vom gegenwärtigen König von Frankreich gesagt wird, dass er keine Glatze hat, und (2) die Lesung, die leugnet dass der gegenwärtige König von Frankreich kahl ist. Die erste Lesart erfordert, dass es einen einzigartigen König von Frankreich auf der Liste der Dinge gibt, die nicht kahl sind, während die zweite einfach sagt, dass es keinen einzigartigen König von Frankreich gibt, der auf der Liste der kahlen Dinge erscheint. Russell sagt, dass Letzteres, aber nicht Ersteres, unter Umständen zutreffen kann, unter denen es keinen König von Frankreich gibt. Russell analysiert diesen Unterschied im Hinblick auf den Umfang der endgültigen Beschreibung, obwohl, wie wir sehen werden,Einige moderne Logiker neigen dazu, diese Situation als eine Frage des Umfangs des Negationszeichens zu betrachten. Daher führt Russell eine Methode ein, um den Umfang der endgültigen Beschreibung anzugeben.

Um zu sehen, wie Russells Scope-Methode für diesen Fall funktioniert, müssen wir die Definition verstehen, die bestimmte Beschreibungen einführt (dh den invertierten Iota-Operator). Whitehead und Russell definieren:

) tag * {∗ 14 · 01} [(atoi x) phi x] sdot / psi (atoi x) phi x / ldot {=} Doppelpunkt (existiert b) Doppelpunkt / phi x / ldot { equiv_x} ldot x = b / Doppelpunkt / psi b / quad / Df)

Diese Art der Definition wird als Kontextdefinition bezeichnet, die expliziten Definitionen gegenübergestellt werden muss. Eine explizite Definition der Definitionsbeschreibung müsste ungefähr so aussehen:

[(atoi x) (phi x) = / Doppelpunkt / ldots / quad / Df)

Dies würde es ermöglichen, die definitive Beschreibung in jedem Kontext durch den definierenden Ausdruck zu ersetzen, der die Auslassungspunkte ausfüllt. Im Gegensatz dazu zeigt ∗ 14 · 01, wie ein Satz, in dem eine Beschreibung ((atoi x) (phi x)) in einem Kontext (psi) vorkommt, durch einen anderen ersetzt werden kann Satz (mit (phi) und (psi)), der äquivalent ist. Beginnen Sie mit dem folgenden Beispiel, um eine Instanz dieser Definition zu entwickeln:

Beispiel.

Der gegenwärtige König von Frankreich ist kahl.

Wenn Whitehead und Russell (PKFx) verwenden, um die Satzfunktion eines gegenwärtigen Königs von Frankreich darzustellen, und (B), um die Satzfunktion einer Glatze darzustellen, würden sie die obige Behauptung wie folgt darstellen:

[(atoi x) (PKFx)] sdot B (atoi x) (PKFx))

was mit ∗ 14 · 01 bedeutet:

[(existiert b) Doppelpunkt PKFx / ldot { equiv_x} ldot x = b / Doppelpunkt Bb)

In Worten, es gibt nur einen (b), der ein gegenwärtiger König von Frankreich ist und der eine Glatze hat. In modernen Symbolen wird Folgendes verwendet, wenn (b) nicht standardmäßig als Variable verwendet wird:

[(existiert b)) für alle x (PKFx / äquiv x = b) amp Bb])

Nun kehren wir zu dem Beispiel zurück, das zeigt, wie der Umfang der Beschreibung einen Unterschied macht:

Beispiel.

Der gegenwärtige König von Frankreich ist nicht kahl.

Es gibt zwei Möglichkeiten, diesen Satz darzustellen.

[(atoi x) (Kx)] sdot / osim B (atoi x) (Kx))

und

) osim [(atoi x) (Kx)] sdot B (atoi x) (Kx))

Im ersten Fall hat die Beschreibung einen „weiten“Geltungsbereich, und im zweiten Fall hat die Beschreibung einen „engen“Geltungsbereich. Russell sagt, dass die Beschreibung im ersteren "primäres Vorkommen" und im letzteren "sekundäres Vorkommen" hat. In Anbetracht der Definition ∗ 14 · 01 werden die beiden unmittelbar darüber liegenden PM-Formeln in primitive Notation erweitert als:

) begin {align} (existiert b) Doppelpunkt PKFx / equiv_x x = b / Doppelpunkt / osim Bb \\ / osim (existiert b) Doppelpunkt PKFx / equiv_x x = b / Doppelpunkt Bb / end {align})

In der modernen Notation werden diese:

) begin {align} existiert x) für alle y (PKFy / äquiv y = x) amp / osim Bx] / \ osim / existiert x) für alle y (PKFy / äquiv y = x) amp Bx] end {align})

Ersteres sagt, dass es nur ein Objekt gibt, das ein gegenwärtiger König von Frankreich ist und das nicht kahl ist; dh es gibt genau einen anwesenden König von Frankreich und er ist nicht kahl. Diese Lesart ist falsch, da es keinen gegenwärtigen König von Frankreich gibt. Letzterer sagt, es sei nicht der Fall, dass es genau einen anwesenden König von Frankreich gibt, der eine Glatze hat. Diese Lesart ist wahr.

Obwohl Whitehead und Russell die Beschreibungen in diesen Beispielen als Ausdrücke betrachten, die Geltungsbereich haben, legen die obigen Lesarten sowohl in der erweiterten PM-Notation als auch in der modernen Notation nahe, warum einige moderne Logiker den Unterschied in den Lesarten hier als eine Frage des Umfangs der betrachten Negationszeichen.

9. Klassen

Der Zirkumflex "ˆ" über einer Variablen vor einer Formel wird verwendet, um eine Klasse anzugeben, daher ist (hat {x} psi x) die Klasse von Dingen (x), die so sind, dass (psi x). In der modernen Notation stellen wir diese Klasse als ({x / mid / psi x }) dar, was gelesen wird: die Klasse von (x), die so sind, dass (x) (psi / hat)). Denken Sie daran, dass "(phi / hat {x})" mit dem Zirkumflex über einer Variablen nach der Prädikatvariablen die Satzfunktion eines (x) ausdrückt, so dass (phi x). In der Typentheorie von PM hat die Klasse (hat {x} phi x) den gleichen logischen Typ wie die Funktion (phi / hat {x}). Dies macht es angebracht, die folgende Kontextdefinition zu verwenden, die es ermöglicht, den Klassenbegriff (hat {x} psi x) aus Vorkommen im Kontext (f) zu entfernen:) tag * {∗ 20 · 01} f { hat {z} (psi z) } ldot {=} Doppelpunkt (existiert / phi) Doppelpunkt / phi / bang x / ldot { equiv_x} ldot / psi x / Doppelpunkt f { phi / bang / hat {z} } quad / Df) oder in moderner Notation: [f {z / mid / psi z } = _ { df} existiert / phi) für alle x (phi x / äquiv / psi x) amp f (lambda x / phi x)]) wobei (phi) eine prädikative Funktion von (x / ist))

Beachten Sie, dass (f) als Funktion höherer Ordnung interpretiert werden muss, die auf der Funktion (phi / bang / hat {z}) basiert. In der oben verwendeten modernen Notation muss die Sprache eine typisierte Sprache sein, in der (lambda) -Ausdrücke in Argumentposition zulässig sind. Wie später ausgeführt wurde (Chwistek 1924, Gödel 1944 und Carnap 1947), sollte es ebenso wie für eindeutige Beschreibungen Bereichsindikatoren für Klassenausdrücke geben. Chwistek schlug zum Beispiel vor, die Notation für bestimmte Beschreibungen zu kopieren und so ∗ 20 · 01 durch Folgendes zu ersetzen:

[) hat {z} (psi z)] sdot f { hat {z} (psi z) } ldot {=} Doppelpunkt (existiert / phi) Doppelpunkt / phi / bang x / ldot { equiv_x} ldot / psi x / Doppelpunkt f { phi / bang / hat {z} })

Zeitgenössische Formalisierungen der Mengenlehre verwenden so etwas wie diese kontextuellen Definitionen, wenn sie einen Existenzsatz der Form (existiert x / für alle y (y / in x / äquiv / ldots y / ldots)) erfordern um die Einführung eines singulären Begriffs zu rechtfertigen ({y / mid / ldots y / ldots }). (Angesichts des Gesetzes der Extensionalität folgt aus (existiert x / für alle y (y / in x / äquiv / ldots y / ldots)), dass es eine eindeutige solche Menge gibt.) Das Verhältnis der Zugehörigkeit zu Klassen (in) wird in PM definiert, indem zunächst eine ähnliche Beziehung zwischen Objekten und Satzfunktionen definiert wird:) tag * {∗ 20 · 02} x / in (phi / bang / hat {z}) ldot {=} ldot / phi / bang x / quad / Df) oder in moderner Notation: [x / in / lambda z / phi z = _ {df} phi x)

∗ 20 · 01 und ∗ 20 · 02 werden dann zusammen verwendet, um den bekannteren Begriff der Zugehörigkeit zu einer Klasse zu definieren. Der formale Ausdruck "(y / in { hat {z} (phi z) })" kann nun als Kontext angesehen werden, in dem der Klassenbegriff vorkommt. es wird dann durch die Kontextdefinition ∗ 20 · 01 eliminiert. (Übung)

PM hat auch griechische Buchstaben für Klassen: (alpha, / beta, / gamma) usw. Diese erscheinen als gebundene (reale) Variablen, scheinbare (freie) Variablen und in Abstracts für Aussagenfunktionen, die für Klassen zutreffen, wie in (phi / hat { alpha}). Im Textkörper werden nur Definitionen der gebundenen griechischen Variablen angezeigt, die anderen werden in der Einleitung informell definiert:) tag * {∗ 20 · 07} (alpha) sdot f / alpha / ldot {=} ldot (phi) sdot f { hat {z} (phi / bang z) } quad / Df) oder in moderner Notation) forall / alpha \, f / alpha = _ { df} forall / phi f {z / mid / phi z }) wobei (phi) eine prädikative Funktion ist.

Somit werden universell quantifizierte Klassenvariablen als Quantifizierer definiert, die sich über prädikative Funktionen erstrecken. Ebenso für die existenzielle Quantifizierung:) tag * {∗ 20 · 071} (existiert / alpha) sdot f / alpha / ldot {=} ldot (existiert / phi) sdot f { hat {z} (phi / bang z) } quad / Df) oder in der modernen Notation) existiert / alpha \, f / alpha = _ {df} existiert / phi f {z / mid / phi z }) wobei (phi) eine prädikative Funktion ist.

Ausdrücke mit einer griechischen Variablen links von (in) sind definiert:) tag * {∗ 20 · 081} alpha / in / psi / bang / hat { alpha} ldot {=} ldot / psi / bang / alpha / quad / Df)

Diese Definitionen decken nicht alle möglichen Vorkommen griechischer Variablen ab. In der Einführung zu PM werden weitere Definitionen von (f / alpha) und (f / hat { alpha}) vorgeschlagen, es wird jedoch angemerkt, dass die Definitionen in irgendeiner Weise eigenartig sind und nicht in der Körper der Arbeit. Die Definition für (f / hat { alpha}) lautet:

[f / hat { alpha} ldot {=} ldot (existiert / psi) sdot / hat { phi} bang x / equiv_x / psi / bang x / sdot f { psi / bang / hat {z} })

oder in moderner Notation

) lambda / alpha \, f / alpha = _ {df} lambda / phi f {x / mid / phi x })

Das heißt, (f / hat { alpha}) ist ein Ausdruck, der die Funktion benennt, die eine Funktion (phi) zu einem Satz führt, der (f) der Klasse von (phi) behauptet. s. (Die moderne Notation zeigt, dass wir in der vorgeschlagenen Definition von (f / hat { alpha}) in der PM-Notation (alpha) in den Definitionen nicht erwarten sollten, da es sich tatsächlich um eine gebundene Variable in / handelt (f / hat { alpha}); in ähnlicher Weise sollten wir im definiendum nicht (phi) erwarten, da es sich um eine gebundene Variable in den definiens handelt.) Man könnte auch Definitionen wie ∗ 20 · 07 und ∗ erwarten 20 · 071 für Fälle, in denen der römische Buchstabe „(z)“durch einen griechischen Buchstaben ersetzt wird. Die Definitionen in PM sind daher nicht vollständig, aber es ist möglich zu erraten, wie sie auf alle Vorkommen griechischer Buchstaben ausgedehnt würden. Dies würde das Projekt der Klassentheorie „keine Klassen“vervollständigen, indem gezeigt wird, wie alle Klassengespräche auf die Theorie der Satzfunktionen reduziert werden können.

10. Prolegomena zur Kardinalarithmetik

Obwohl Studierende der Philosophie in der Regel nicht weiter als ∗ 20 in PM lesen, ist dies tatsächlich der Punkt, an dem die „Konstruktion“der Mathematik wirklich beginnt. ∗ 21 stellt die „Allgemeine Theorie der Beziehungen“vor (die Theorie der Beziehungen in Erweiterung; in der zeitgenössischen Logik werden diese nach Wiener als Mengen geordneter Paare behandelt). (hat {x} hat {y} psi (x, y)) ist die Beziehung zwischen (x) und (y), die erhalten wird, wenn (psi (x, y)) ist wahr. In der modernen Notation stellen wir dies als die Menge der geordneten Paare ({ langle x, y / rangle / mid / psi (x, y) }) dar, die gelesen wird: die Menge der geordneten Paare (langle x, y / rangle), die so sind, dass (x) die Beziehung (psi) zu (y) trägt.

Die folgende Kontextdefinition (∗ 21 · 01) ermöglicht es, den Beziehungsterm (hat {x} hat {y} psi (x, y)) aus Vorkommen im Kontext (f) zu entfernen:

[f { hat {x} hat {y} psi (x, y) } ldot {=} colondot (existiert / phi) Doppelpunkt / phi / bang (x, y) ldot { equiv_ {x, y}} ldot / psi (x, x) Doppelpunkt f { phi / bang (hat {u}, / hat {v}) } quad / Df)

oder in moderner Notation:

[f { langle x, y / rangle / mid / psi (x, y) } = _ {df} existiert / phi) forall xy (phi (x, y) equiv / psi (x), y)) amp f (lambda u / lambda v / phi (u, v))])

Dabei ist (phi) eine prädikative Funktion von (u) und (v).

Principia analysiert Beziehungen (oder mathematische Funktionen) nicht in Form von Mengen geordneter Paare, sondern nimmt den Begriff der Satzfunktion als primitiv und definiert Beziehungen und Funktionen in Bezug auf diese. Die Großbuchstaben ({R}, {S}) und ({T}) usw. werden nach ∗ 21 verwendet, um für diese „Beziehungen in Erweiterung“zu stehen, und unterscheiden sich von Aussagenfunktionen durch Sein geschrieben zwischen den Argumenten. Somit ist es (psi (x, y)) mit Argumenten nach dem Satzfunktionssymbol, aber (xRy). Aus ∗ 21 verschwinden die Funktionen "(phi) und (psi)" usw. und nur die Beziehungen in der Erweiterung ({R}), ({S}) und ({T. }) usw. erscheinen auf den Seiten von Principia. Während Aussagenfunktionen für dieselben Objekte gelten können, jedoch nicht identisch sind, gelten für dieselben Objekte keine zwei erweiterten Beziehungen. Die Logik von Principia ist daher „erweiterend“von Seite 200 in Band I bis zum Ende in Band III.

∗ 22 über die „Klassenrechnung“stellt die Elementarmengen-Theorie von Schnittpunkten, Vereinigungen und der leeren Menge vor, die häufig die gesamte Mengenlehre ist, die in der Elementarmathematik anderer Art verwendet wird. Der Student, der nach der Mengenlehre von Principia sucht, um sie mit dem Zermelo-Fraenkel-System zu vergleichen, muss später im Text verschiedene Zahlen betrachten. Das Axiom der Wahl wird bei ∗ 88 als „multiplikatives Axiom“definiert, und eine Version des Axioms der Unendlichkeit erscheint bei ∗ 120 in Band II als „Infinaxt“. Die Mengenlehre von Principia kommt Zermelos Axiomen von 1908 unter den verschiedenen bekannten Axiomensystemen am nächsten, was bedeutet, dass ihr das Axiom der Grundlage und das Axiom des Ersetzens der jetzt üblichen Zermelo-Fraenkel-Axiome der Mengenlehre fehlen. Das System von Principia unterscheidet sich wesentlich von dem von Zermelo darin, dass es in der einfachen Typentheorie formuliert ist. Infolgedessen gibt es zum Beispiel keine Quantifizierer, die sich über alle Mengen erstrecken, und es gibt eine Menge aller Dinge (für jeden Typ).

∗ 30 zu „Beschreibende Funktionen“liefert Whitehead und Russells Analyse mathematischer Funktionen in Bezug auf Beziehungen und eindeutige Beschreibungen. Frege hatte den Funktionsbegriff im mathematischen Sinne als Grundbegriff in seinem logischen System verwendet. Ein fregeanisches „Konzept“ist also eine Funktion von Objekten als Argumente zu einem der beiden „Wahrheitswerte“als seinen Werten. Ein Konzept ergibt für jedes Objekt, für das das Konzept gilt, den Wert „True“und für alle anderen das Objekt „False“. Russell aus dem Jahr 1904 hatte es lange vor dem Schreiben von Principia vorgezogen, Funktionen im Hinblick auf die Beziehung zwischen jedem Argument und Wert und den Begriff der „Einzigartigkeit“zu analysieren. Mit der modernen Symbolik würde seine Ansicht wie folgt ausgedrückt. Für jede Funktion (lambda xf (x)) gibt es eine Beziehung (in Erweiterung) (R),so dass der Wert der Funktion für ein Argument (a), dh (f (a)), das eindeutige Individuum ist, das die Beziehung (R) zu (a) trägt. (Heutzutage reduzieren wir Funktionen auf eine binäre Beziehung zwischen dem Argument an erster Stelle und dem Wert an zweiter Stelle.) Das Ergebnis ist, dass es in Principia keine Funktionssymbole gibt. Wie Whitehead und Russell sagen, werden die bekannten mathematischen Ausdrücke wie "(sin / pi / 2)" mit einer Beziehung und einer eindeutigen Beschreibung als "beschreibende Funktion" analysiert. Die "beschreibende Funktion" (R'y) (das (R) von (y)) ist wie folgt definiert:) Das Ergebnis ist, dass es in Principia keine Funktionssymbole gibt. Wie Whitehead und Russell sagen, werden die bekannten mathematischen Ausdrücke wie "(sin / pi / 2)" mit einer Beziehung und einer eindeutigen Beschreibung als "beschreibende Funktion" analysiert. Die "beschreibende Funktion" (R'y) (das (R) von (y)) ist wie folgt definiert:) Das Ergebnis ist, dass es in Principia keine Funktionssymbole gibt. Wie Whitehead und Russell sagen, werden die bekannten mathematischen Ausdrücke wie "(sin / pi / 2)" mit einer Beziehung und einer eindeutigen Beschreibung als "beschreibende Funktion" analysiert. Die "beschreibende Funktion" (R'y) (das (R) von (y)) ist wie folgt definiert:

) tag * {∗ 30 · 01} R'y = (atoi x) xRy / quad / Df)

Wir schließen diesen Abschnitt mit einer Reihe prominenter Beispiele aus diesen späteren Zahlen mit ihrer intuitiven Bedeutung, Position in PM, Definition in PM und einem modernen Äquivalent. (Einige dieser Zahlen sind eher Theoreme als Definitionen.) Beachten Sie jedoch, dass sich das moderne Äquivalent manchmal logisch von der ursprünglichen Version in PM unterscheidet, z. B. indem Relationen als Mengen geordneter Paare usw. behandelt werden. In seiner Darstellung der Logik von Principia beanstandet WV Quine (1951) die Komplexität und sogar Redundanz eines Großteils dieser Symbolik. Diese Formeln können jedoch durch schrittweise Anwendung der Definitionen erarbeitet werden.

Für jede Formelnummer präsentieren wir die Informationen im folgenden Format:

PM-Symbol

(Intuitive Bedeutung) [Ort]

PM Definition

Modern Equivalent

(alpha / subset / beta)

((alpha) ist eine Teilmenge von (beta)) [∗ 22 · 01]

(x / in / alpha / ldot { supset_x} ldot x / in / beta)

(alpha / subseteq / beta)

(alpha / cap / beta)

(der Schnittpunkt von (alpha) und (beta)) [∗ 22 · 02]

(hat {x} (x / in / alpha / sdot x / in / beta))

(alpha / cap / beta)

(alpha / cup / beta)

(die Vereinigung von (alpha) und (beta)) [∗ 22 · 03]

(hat {x} (x / in / alpha / lor x / in / beta))

(alpha / cup / beta)

(-\Alpha)

(das Komplement von (alpha)) [∗ 22 · 04]

(hat {x} (x / osim / in / alpha)) [dh (hat {x} osim (x) in / alpha)) bis ∗ 20 · 06]

({x / mid x / not / in / alpha })

(Alpha Beta)

((alpha) minus (beta)) [∗ 22 · 05]

(alpha / cap - / beta)

({x / mid x / in / alpha / amp x / not / in / beta })

(mathrm {V})

(die universelle Klasse) [∗ 24 · 01]

(hat {x} (x) = (x))

(mathrm {V}) oder ({x / mid x = x })

(Lambda)

(die leere Klasse) [∗ 24 · 02]

(- / mathrm {V})

(varnothing)

(R'y)

(das (R) von (y)) (eine beschreibende Funktion) [∗ 30 · 01]

((atoi x) (xRy))

(f ^ {- 1} (y)), wobei (f = { langle x, y / rangle / mid Rxy })

(breve {R})

(die Umkehrung von (R)) [∗ 31 · 02]

(hat {x} hat {z} (zRx))

({ langle x, z / rangle / mid Rzx })

(overrightarrow {R} 'y)

(die R-Vorgänger von (y)) [∗ 32 · 01]

(hat {x} (xRy))

({x / mid Rxy })

(overleftarrow {R} 'x)

(die R-Nachfolger von (x)) [∗ 32 · 02]

(hat {z} (xRz))

({z / mid Rxz })

(DR)

(die Domäne von (R)) [∗ 33 · 11]

(hat {x} {(existiert y) sdot xRy })

({x / mid / existiert yRxy })

(backd'R)

(der Bereich von (R)) [∗ 33 · 111]

(hat {z} {(existiert x) sdot xR z })

({z / mid / existiert x Rxz })

(C'R)

(das Feld von (R)) [∗ 33 · 112]

(hat {x} {(existiert y): xRy / ldot { lor} ldot yRx })

({x / mid / existiert y (xRy / lor yRx) })

(R / mid S)

(das relative Produkt von (R) und (S)) [∗ 34 · 01]

(hat {x} hat {z} {(existiert y) sdot xRy / sdot ySz })

({ langle x, z / rangle / mid / existiert y (xRy / amp ySz) })

(R / Einschränkung / Beta)

(die Beschränkung von (R) auf (beta)) [∗ 35 · 02]

(hat {x} hat {z} [xRz / sdot z / in / beta])

({ langle x, z / rangle / mid z / in / beta / amp Rxz })

(alpha / uparrow / beta)

(das kartesische Produkt von (alpha) und (beta)) [∗ 35 · 04]

(hat {x} hat {z} [x / in / alpha / sdot z / in / beta)]

(alpha X / beta) oder ({ langle x, z / rangle / mid x / in / alpha / amp z / in / beta })

(R '' / beta)

(die Projektion von (beta) durch (R)) [∗ 37 · 01]

(hat {x} {(existiert y) sdot y / in / beta / sdot x Ry })

({x / mid / existiert y (y / in / beta / amp Rxy) })

(iota'x)

(Singleton von x) [∗ 51 · 11]

(hat {z} (z = x))

({x })

(mathbf {1})

(die Kardinalzahl 1) [∗ 52 · 01]

(hat { alpha} {(existiert x) sdot x = / iota'x })

({x / mid / existiert y \; (x = {y }) }) (die Klasse aller Singletons)

(mathbf {2})

(die Kardinalzahl 2) [∗ 54 · 02]

(hat { alpha} {(existiert x, y) sdot x / neq y / sdot / alpha = / iota'x / cup / iota'y })

({x / mid / existiert y / existiert z (y / neq z / amp x = {y } cup {z }) }) (die Klasse aller Paare)

(x / downarrow y)

(das Ordnungspaar von (x) und (y)) [∗ 55 · 01]

(iota'x / uparrow / iota'y)

(langle x, y / rangle) (the geordnetes Paar (langle x, y / rangle))

Hinweis: Die gekürzte Taschenbuchausgabe von PM auf ∗ 56 geht nur so weit, sodass die verbleibenden Definitionen nur für diejenigen verfügbar waren, die Zugriff auf die gesamten drei PM-Bände haben.
(alpha / rightarrow / beta)

[∗ 70 · 01]

(hat {R} (overrightarrow {R} "\ backd 'R / subset / alpha / sdot / overleftarrow {R}" D'R / subset / beta)

(f: / alpha / rightarrow / beta) (die Funktionen (f) von (alpha) bis (beta))

(alpha / mathbin { overline { mathrm {sm}}} beta)

(Die Klasse der Ähnlichkeitsrelationen zwischen (alpha) und (beta)) [∗ 73 · 01]

(1 / rightarrow 1 / cap / overleftarrow {D} '\ alpha / cap / overleftarrow { backd } '\ beta)

({f / mid f: / alpha / stackrel {1-1} { longrightarrow} beta })

(mathrm {sm})

(das Ähnlichkeitsverhältnis) [∗ 73 · 02]

(hat { alpha} hat { beta} (existiert! / alpha / mathbin { overline { mathrm {sm}}} beta))

(alpha / approx / beta)

(R _ *)

(der Vorfahr von (R)) [∗ 90 · 01]

(hat {x} hat {y} {x / in C 'R / Doppelpunkt / breve {R} “\ mu / subset / mu / sdot x / in / mu / ldot { supset _ { mu}} ldot y / in / mu })

Nun geschrieben (R ^ *) folgt dies Freges Definition: (y) ist insgesamt Die (R) - Erbklassen (x) sind in.

11. Arithmetik in Band II

Band II der Principia Mathematica beginnt mit Teil III „Kardinalarithmetik“. Die Begriffe der Kardinalzahlen werden allgemein entwickelt und erstrecken sich auf unendliche Kardinäle. Folglich wird die Theorie der natürlichen Zahlen, die in PM als „induktive Kardinäle“bezeichnet werden, mit einer Reihe von Definitionen von Sonderfällen von Begriffen eingeführt, die zuerst in einer allgemeinen Form eingeführt werden, die für beliebige Zahlen oder Klassen gilt. Zum Beispiel wird die Addition natürlicher Zahlen, wie im berühmten Beweis, dass 1 + 1 = 2 in ∗ 110 · 04 ist, für den Sonderfall der Addition von Klassen, die für Kardinalzahlen gelten, '(+ _ c)' bewiesen.. Diese Definitionen, die mit dem Erscheinen des Axioms der Unendlichkeit bei ∗ 120 · 03 abschließen, schließen diese Einführung in die Symbolik der Principia Mathematica ab.

(mathrm {N_c})

(die Kardinalzahlen) [∗ 100 · 01]

(overrightarrow { mathrm {sm}})

Dies ist eigentlich die Beziehung zwischen einer Klasse und ihrer Kardinalzahl.

({x / mid / forall y (y / in x / leftrightarrow / forall z / forall wz, w / in y / leftrightarrow z / ungefähr w)) })

Kardinalzahlen sind Klassen von äquinumerischen (ähnlichen) Klassen.

(mathbf {0})

(die Kardinalzahl 0) [∗ 101 · 01]

(0 = / mathrm {N_c} '\ Lambda)

({ varnothing })

Die Klasse aller Klassen, die der leeren Menge gleichwertig sind, ist nur der Singleton mit dem leeren Satz.

(alpha + / beta)

(die arithmetische Summe von (alpha) und (beta)) [∗ 110 · 01]

(downarrow (Lambda / cap / beta) "\ iota" / alpha / cup (Lambda / cap / alpha) downarrow “\ iota“\ beta))

Dies ist die Vereinigung von (alpha) und (beta), nachdem sie durch Paarung jedes Elements von (beta) mit / getrennt wurden ({ alpha }) und jedes Element von (alpha) mit ({ beta }). Die Klassen (alpha) und (beta) werden mit der leeren Klasse (Lambda) geschnitten, um den Typ der Elemente der Summe anzupassen.

((beta / times { alpha }) cup (alpha / times { beta }))

(mu + _c / nu)

(die Hauptsumme von (mu) und (nu)) [∗ 110 · 02]

(hat { xi} {(existiert / alpha, / beta) sdot / mu = / mathrm {N_0 c} '\ alpha / sdot / nu = / mathrm {N_0 c}' / beta / sdot / xi \, / mathrm {sm} (alpha + / beta) }) Die

Kardinaladdition ist die arithmetische Summe von "homogenen Kardinälen", Kardinälen eines einheitlichen Typs, zu denen (alpha) und (beta) durch (mathrm {N_0 c}) verwandt sind (selbst definiert [∗ 103 · 01]).

({x / mid x / approx (beta / times { alpha }) cup (alpha / times { beta }) })

Der Leser kann nun verstehen, warum dieser Elementarsatz erst auf Seite 83 von Band II von PM bewiesen wird:

) tag * {∗ 110 · 643} 1 + _c 1 = 2)

Whitehead und Russell bemerken: „Der obige Satz ist gelegentlich nützlich. Es wird mindestens dreimal verwendet, in…”. Dieser Witz erinnert uns daran, dass die Theorie der natürlichen Zahlen, die für Freges Arbeiten so zentral ist, in PM nur als Sonderfall einer allgemeinen Theorie der Kardinal- und Ordinalzahlen und noch allgemeinerer Klassen isomorpher Strukturen erscheint.

Diese Übersicht über die Notation in PM schließt mit der Definition der natürlichen Zahlen und einer Aussage des Axioms der Unendlichkeit, die den Beweis der anderen Axiome der Peano-Arithmetik als wiederum Sonderfälle allgemeinerer Begriffe ermöglichen.

NC induzieren

(die induktiven Kardinäle) [∗ 120 · 01]

(hat { alpha} { alpha ({+ _ c} 1) _ * 0 })

({x / mid 0 S ^ * x })

Die induktiven Kardinäle sind die "natürlichen Zahlen", sind 0 und alle Kardinalzahlen, die durch den Vorfahren der "Nachfolgerbeziehung" (S) mit 0 in Beziehung stehen, wobei (xSy) nur für den Fall (y = x +1).

Infin Axe

(das Axiom der Unendlichkeit) [∗ 120 · 03]

(alpha / in / text {NC induct} sdot / supset _ { alpha} sdot / existiert! / alpha)

(forall y ({x / mid 0S ^ * x } supset y / neq / varnothing))

Das Axiom der Unendlichkeit behauptet, dass alle induktiven Kardinäle nicht leer sind. (Denken Sie daran, dass 0 = ({ varnothing }) und somit 0 nicht leer ist.) Das Axiom der Unendlichkeit ist kein „primitiver Satz“, sondern soll, wo verwendet, als „Hypothese“aufgeführt werden als Vorläufer einer Bedingung, wobei gesagt wird, dass die Konsequenz vom Axiom abhängt. Technisch gesehen ist es kein Axiom von PM, da [∗ 120 · 03] eine Definition ist, also ist dies nur eine weitere Notation in PM!

12. Schlussfolgerung

Die Definitionen bis ∗ 120 · 03 machen nur etwa die Hälfte der Definitionen in PM aus. Die letzten acht Seiten (667–674) von Band I der zweiten Ausgabe (1925) bestehen aus einer vollständigen „Liste der Definitionen“aus allen drei Bänden. Die Korrespondenz im Bertrand Russell-Archiv legt nahe, dass diese Liste möglicherweise von Dorothy Wrinch zusammengestellt wurde. Die Liste kann verwendet werden, um jeden der definierten Ausdrücke von PM bis zu der in diesem Eintrag beschriebenen Notation zurückzuverfolgen.

Literaturverzeichnis

  • Carnap, R., 1947, Bedeutung und Notwendigkeit, Chicago: University of Chicago Press.
  • Church, A., 1976, „Vergleich von Russells Auflösung der semantischen Antinomien mit der von Tarski“, Journal of Symbolic Logic, 41: 747–60.
  • Chwistek, L., 1924, „Theorie der konstruktiven Typen“, Annales de la Société Polonaise de Mathématique (Rocznik Polskiego Towarzystwa Matematycznego), II: 9–48.
  • Feys, R. und Fitch, FB, 1969, Wörterbuch der Symbole der mathematischen Logik, Amsterdam: Nordholland.
  • Gödel, K., 1944, „Russells mathematische Logik“, in PA Schilpp, Hrsg., The Philosophy of Bertrand Russell, LaSalle: Open Court, 125–153.
  • Landini, G., 1998, Russells versteckte Substitutionstheorie, New York und Oxford: Oxford University Press.
  • Linsky, B., 1999, Russells metaphysische Logik, Stanford: CSLI Publications.
  • –––, 2009, „Von beschreibenden Funktionen zu Sätzen geordneter Paare“, in Reduktion - Abstraktion - Analyse, A. Hieke und H. Leitgeb (Hrsg.), Ontos: München, 259–272.
  • –––, 2011, Die Entwicklung der Principia Mathematica: Bertrand Russells Manuskripte und Notizen für die zweite Ausgabe, Cambridge: Cambridge University Press.
  • Quine, WVO, 1951, "Whitehead und der Aufstieg der modernen Logik", Die Philosophie von Alfred North Whitehead, hrsg. PA Schilpp, 2. Auflage, New York: Tudor Publishing, 127–163.
  • Russell, B., 1905, „On Denoting“, Mind (NS), 14: 530–538.
  • Turing, AM, 1942, „Die Verwendung von Punkten als Klammern im System der Kirche“, Journal of Symbolic Logic, 7: 146–156.
  • Whitehead, AN und B. Russell, [PM], Principia Mathematica, Cambridge: Cambridge University Press, 1910–13, 2. Auflage, 1925–27.
  • Whitehead, AN und B. Russell, 1927, Principia Mathematica bis 56, Cambridge: Cambridge University Press.

Akademische Werkzeuge

Sep Mann Symbol
Sep Mann Symbol
Wie man diesen Eintrag zitiert.
Sep Mann Symbol
Sep Mann Symbol
Vorschau der PDF-Version dieses Eintrags bei den Freunden der SEP-Gesellschaft.
Inpho-Symbol
Inpho-Symbol
Schlagen Sie dieses Eintragsthema im Internet Philosophy Ontology Project (InPhO) nach.
Phil Papers Ikone
Phil Papers Ikone
Erweiterte Bibliographie für diesen Eintrag bei PhilPapers mit Links zu seiner Datenbank.

Andere Internetquellen

  • Principia Mathematica, reproduziert in der Historical Math Collection der University of Michigan.
  • Russells "On Denoting" aus dem Nachdruck in Logic and Knowledge (R. Marsh, Hrsg., 1956) des Originalartikels in Mind 1905, der von Cosma Shalizi (Zentrum für das Studium komplexer Systeme, U. Michigan) in HTML getippt wurde.

Empfohlen: