Wahrscheinlichkeitsrechnung mit dem Satz von Bayes nicht nur für Versicherungen und Medizin

Der Satz von Bayes ist ein grundlegendes Theorem in der Wahrscheinlichkeitsrechnung, das den Zusammenhang zwischen bedingten Wahrscheinlichkeiten beschreibt.

Der Satz von Bayes ist ein spannendes Werkzeug aus der Welt der Mathematik, das uns hilft, Wahrscheinlichkeiten zu verstehen und zu berechnen. Er wird in vielen Bereichen angewendet, von der Medizin über Künstliche Intelligenz bis hin zu Alltagssituationen. Aber was genau besagt dieser Satz, und warum ist er so nützlich?

Was ist der Satz von Bayes? „Wahrscheinlichkeitsrechnung mit dem Satz von Bayes nicht nur für Versicherungen und Medizin“ weiterlesen

Der Brier-Score (Brier-Wert) nicht nur für Prognostiker

Der Brier-Wert ist ein effizientes und einfaches Maß zur Bewertung der Genauigkeit probabilistischer Vorhersagen. Durch die Kombination aus einfacher Berechnung und aussagekräftiger Analyse ist er ein weit verbreitetes Werkzeug in der Statistik und im maschinellen Lernen.

In der Praxis hilft er, die Qualität von Vorhersagen quantitativ zu bewerten und kann zur Verbesserung von Modellen und Algorithmen beitragen. Die Bezeichnung „Brier-Wert“ stammt von dem amerikanischen Meteorologen Glenn W. Brier, der das Maß (1950 – VERIFICATION OF FORECASTS EXPRESSED IN TERMS OF PROBABILITY) entwickelte und damit die Grundlage legte.

Der Brier-Wert wird häufig in Bereichen wie Meteorologie, Medizin, Finanzwesen, Wahlprognosen und maschinellem Lernen verwendet, um die Genauigkeit von Prognosen zu bewerten. Er ist besonders nützlich bei binären Klassifikationsproblemen, bei denen das Modell Wahrscheinlichkeiten für die Zugehörigkeit zu einer von zwei Klassen liefert (z. B. Regenwahrscheinlichkeit).

Wir erstellen zur Verdeutlichung mal ein JSon Datei mit ein paar Daten von der Reserve Bank of Australia, die bei ihren monatlichen Sitzungen Zinssätze beschließt. Die RBA lässt die Zinssätze im Allgemeinen unverändert, erhöht sie jedoch manchmal und senkt sie manchmal, je nach wirtschaftlicher Lage. Die Daten stammen aus diesem Artikel und wurden von mir in das JSon-Format überführt. „Der Brier-Score (Brier-Wert) nicht nur für Prognostiker“ weiterlesen

Java Programm zur Goldbachsche Vermutung mit Heap Analyse

Die Goldbachsche Vermutung ist eine der ältesten ungelösten Probleme in der Mathematik, die der Mathematiker Christian Goldbach 1742 in einem Brief an Leonhard Euler formulierte. Sie besagt:

Jede gerade Zahl größer als 2 lässt sich als Summe zweier Primzahlen darstellen.

Diese Vermutung ist in zwei Formen bekannt: „Java Programm zur Goldbachsche Vermutung mit Heap Analyse“ weiterlesen

ANOVA (Analysis of Variance, auf Deutsch Varianzanalyse) mit PSPP (Teil 13)

Die ANOVA (Analysis of Variance, auf Deutsch Varianzanalyse) ist eine statistische Methode zur Untersuchung, ob die Mittelwerte mehrerer Gruppen signifikant voneinander abweichen.

Sie wird verwendet, um herauszufinden, ob es Unterschiede in den Mittelwerten von verschiedenen Gruppen gibt, die nicht nur durch Zufall entstanden sind. „ANOVA (Analysis of Variance, auf Deutsch Varianzanalyse) mit PSPP (Teil 13)“ weiterlesen

Neue PSPP 2.0.1 veröffentlicht (Teil 12)

Vor ein paar Wochen wurde die neue Version 2.0.1 von PSPP veröffentlicht. Was gibt es da Neues? Hier die Projektseite.

PSPP ist ja eine freie Software zur statistischen Analyse von Daten. Sie wurde als Open-Source-Alternative zu SPSS entwickelt, einem kommerziellen Programm, das vor allem in den Sozialwissenschaften, der Psychologie und der Wirtschaftsforschung weit verbreitet ist. „Neue PSPP 2.0.1 veröffentlicht (Teil 12)“ weiterlesen

PSPP (Teil 8): Häufigkeitsverteilung in der deskriptiven Statistik am Beispiel der Flughöhe

In der Statistik ist die deskriptive Analyse ein wichtiger Bestandteil, der es ermöglicht, Daten auf eine Weise zu interpretieren und zu verstehen, die aussagekräftige Muster und Trends offenbart. Eine zentrale Komponente der deskriptiven Statistik ist die Häufigkeitsverteilung, die uns erlaubt, die Häufigkeit von Werten oder Kategorien in einem Datensatz zu analysieren.


„PSPP (Teil 8): Häufigkeitsverteilung in der deskriptiven Statistik am Beispiel der Flughöhe“ weiterlesen

Interquartilsabstand (IQR oder IQA) mit PSPP berechnen (Teil 6)

Der Interquartilsabstand (IQR) ist ein Streuungsmaß in der deskriptiven Statistik. Der IQR ist eine robuste Maßzahl, die in der Lage ist, Ausreißer in Datensätzen zu identifizieren und Informationen über die Streuung der Daten zu liefern. Der Interquartilsabstand, oft abgekürzt als IQR, ist ein Maß für die Streuung oder die Verbreitung von Daten in einem Datensatz. Er basiert auf den Quartilen, die die Daten in vier gleich große Teile aufteilen.

Die Quartile sind: „Interquartilsabstand (IQR oder IQA) mit PSPP berechnen (Teil 6)“ weiterlesen

PSPP Ausgabe aller Grafiken (Plots: BOXPLOT, NPPLOT, HISTOGRAM, SPREADLEVEL)(Teil 5)

In PSPP können wir einfach mal alle Grafiken erzeugen, um Ergebnisse zu prüfen und auch um zu sehen, welches Diagramm sich am besten eignen.

Diagramme in der Statistik sollen dazu beitragen, Daten visuell darzustellen und die Interpretation von statistischen Informationen zu erleichtern. Um diese Ziele möglichst effektiv zu erreichen, sollten Diagramme bestimmte Kriterien erfüllen, hier eine Checkliste:

„PSPP Ausgabe aller Grafiken (Plots: BOXPLOT, NPPLOT, HISTOGRAM, SPREADLEVEL)(Teil 5)“ weiterlesen

PSPP Cochrans Q-Test und deskriptiven Statistiken mit Häufigkeit auf dem Raspberry Pi 4 (Teil 4)

Der Cochrans Q-Test ist ein statistischer Test, der in der deskriptiven Statistik und in der medizinischen Forschung verwendet wird, um festzustellen, ob es signifikante Unterschiede zwischen mehr als zwei abhängigen Gruppen oder Bedingungen gibt. Dieser Test wird oft in Verbindung mit wiederholten Messungen oder wiederholten Stichproben (auch als within-subjects oder repeated measures bezeichnet) angewendet, bei denen dieselben Personen oder Elemente in verschiedenen Gruppen oder zu verschiedenen Zeitpunkten gemessen werden.

pspp

Der Cochrans Q-Test ist ein nichtparametrischer Test und basiert auf der Anzahl der Abweichungen in den verschiedenen Gruppen. Im Wesentlichen vergleicht der Test die Unterschiede zwischen den Gruppen mit den erwarteten Unterschieden, die zufällig auftreten würden. Wenn die beobachteten Unterschiede zwischen den Gruppen signifikant größer sind als die zufällig erwarteten Unterschiede, weist dies auf signifikante Unterschiede zwischen den Gruppen hin.

Die Hypothesen, die mit dem Cochrans Q-Test getestet werden, sind normalerweise wie folgt: „PSPP Cochrans Q-Test und deskriptiven Statistiken mit Häufigkeit auf dem Raspberry Pi 4 (Teil 4)“ weiterlesen