Wahrscheinlichkeit, Standardabweichung, Varianz und Erwartungswert mit Java und Python Baumdiagramm

Wir wollen mal den Erwartungswert die Varianz und die Standardabweichung bei diesen Werten 10 Euro mit 0,25 und -5 Euro mit 0,75 berechnen und mit einem Baumdiagramm darstellen. Die Berechnung soll auch in einem Java Programm mit einfacher GUI enden.

Also los, gegeben ist: „Wahrscheinlichkeit, Standardabweichung, Varianz und Erwartungswert mit Java und Python Baumdiagramm“ weiterlesen

Wahrscheinlichkeitsrechnung mit dem Satz von Bayes nicht nur für Versicherungen und Medizin

Der Satz von Bayes ist ein grundlegendes Theorem in der Wahrscheinlichkeitsrechnung, das den Zusammenhang zwischen bedingten Wahrscheinlichkeiten beschreibt.

Der Satz von Bayes ist ein spannendes Werkzeug aus der Welt der Mathematik, das uns hilft, Wahrscheinlichkeiten zu verstehen und zu berechnen. Er wird in vielen Bereichen angewendet, von der Medizin über Künstliche Intelligenz bis hin zu Alltagssituationen. Aber was genau besagt dieser Satz, und warum ist er so nützlich?

Was ist der Satz von Bayes? „Wahrscheinlichkeitsrechnung mit dem Satz von Bayes nicht nur für Versicherungen und Medizin“ weiterlesen

Der Brier-Score (Brier-Wert) nicht nur für Prognostiker

Der Brier-Wert ist ein effizientes und einfaches Maß zur Bewertung der Genauigkeit probabilistischer Vorhersagen. Durch die Kombination aus einfacher Berechnung und aussagekräftiger Analyse ist er ein weit verbreitetes Werkzeug in der Statistik und im maschinellen Lernen.

In der Praxis hilft er, die Qualität von Vorhersagen quantitativ zu bewerten und kann zur Verbesserung von Modellen und Algorithmen beitragen. Die Bezeichnung „Brier-Wert“ stammt von dem amerikanischen Meteorologen Glenn W. Brier, der das Maß (1950 – VERIFICATION OF FORECASTS EXPRESSED IN TERMS OF PROBABILITY) entwickelte und damit die Grundlage legte.

Der Brier-Wert wird häufig in Bereichen wie Meteorologie, Medizin, Finanzwesen, Wahlprognosen und maschinellem Lernen verwendet, um die Genauigkeit von Prognosen zu bewerten. Er ist besonders nützlich bei binären Klassifikationsproblemen, bei denen das Modell Wahrscheinlichkeiten für die Zugehörigkeit zu einer von zwei Klassen liefert (z. B. Regenwahrscheinlichkeit).

Wir erstellen zur Verdeutlichung mal ein JSon Datei mit ein paar Daten von der Reserve Bank of Australia, die bei ihren monatlichen Sitzungen Zinssätze beschließt. Die RBA lässt die Zinssätze im Allgemeinen unverändert, erhöht sie jedoch manchmal und senkt sie manchmal, je nach wirtschaftlicher Lage. Die Daten stammen aus diesem Artikel und wurden von mir in das JSon-Format überführt. „Der Brier-Score (Brier-Wert) nicht nur für Prognostiker“ weiterlesen

Java Programm zur Goldbachsche Vermutung mit Heap Analyse

Die Goldbachsche Vermutung ist eine der ältesten ungelösten Probleme in der Mathematik, die der Mathematiker Christian Goldbach 1742 in einem Brief an Leonhard Euler formulierte. Sie besagt:

Jede gerade Zahl größer als 2 lässt sich als Summe zweier Primzahlen darstellen.

Diese Vermutung ist in zwei Formen bekannt: „Java Programm zur Goldbachsche Vermutung mit Heap Analyse“ weiterlesen

ANOVA (Analysis of Variance, auf Deutsch Varianzanalyse) mit PSPP (Teil 13)

Die ANOVA (Analysis of Variance, auf Deutsch Varianzanalyse) ist eine statistische Methode zur Untersuchung, ob die Mittelwerte mehrerer Gruppen signifikant voneinander abweichen.

Sie wird verwendet, um herauszufinden, ob es Unterschiede in den Mittelwerten von verschiedenen Gruppen gibt, die nicht nur durch Zufall entstanden sind. „ANOVA (Analysis of Variance, auf Deutsch Varianzanalyse) mit PSPP (Teil 13)“ weiterlesen

Neue PSPP 2.0.1 veröffentlicht (Teil 12)

Vor ein paar Wochen wurde die neue Version 2.0.1 von PSPP veröffentlicht. Was gibt es da Neues? Hier die Projektseite.

PSPP ist ja eine freie Software zur statistischen Analyse von Daten. Sie wurde als Open-Source-Alternative zu SPSS entwickelt, einem kommerziellen Programm, das vor allem in den Sozialwissenschaften, der Psychologie und der Wirtschaftsforschung weit verbreitet ist. „Neue PSPP 2.0.1 veröffentlicht (Teil 12)“ weiterlesen

In 2023 jeden Monat mehr als 1 Millionen Hits auf diese Webseite – Dank an alle Besucher

In Bezug auf Webseitenstatistiken bezieht sich der Begriff „Hits“ auf die Gesamtanzahl der Anfragen, die an einen Webserver gesendet werden. Hits können verschiedene Arten von Serveranfragen darstellen, und es ist wichtig zu beachten, dass sie nicht unbedingt die Anzahl der Besucher oder Seitenaufrufe widerspiegeln. Hier mal die Auswertung des Jahres 2023:


„In 2023 jeden Monat mehr als 1 Millionen Hits auf diese Webseite – Dank an alle Besucher“ weiterlesen

PSPP (Teil 11) Auswertung der in 2023 gelesenen Bücher

Heute mal ein Praxisbeispiel für PSPP. Für jedes Buch das ich in 2023 gelesen habe, vergebe ich immer eine Schulnote (1-6).
Wird ein Buch abgebrochen, weil ich meine das es sich nicht mehr lohnt weiterzulesen, vergebe ich eine 6, das ist im letzten Jahr 2 mal vorgekommen. Insgesamt habe ich 29 Bücher im Jahr 2023 gelesen. Nun will ich das mal mit PSPP auswerten wie z.B.:

Das geht über das Menü: „PSPP (Teil 11) Auswertung der in 2023 gelesenen Bücher“ weiterlesen

PSPP (Teil 9) Zufallsstichprobe

Stichproben in der Statistik sind ein wesentliches Werkzeug, um Informationen über eine größere Population zu gewinnen, indem man nur einen Teil dieser Population untersucht.

Eine Zufallsstichprobe ist eine Auswahl von Elementen aus einer Gesamtpopulation, bei der jedes Element in der Population eine gleichberechtigte Chance hat, in die Stichprobe aufgenommen zu werden. Das bedeutet, dass jedes Element unabhängig und zufällig ausgewählt wird, ohne dass bestimmte Merkmale oder Eigenschaften bevorzugt werden.

Zufallsstichprobe können auch mit PSPP gezogen werden. Hier ist eine Anleitung dazu: „PSPP (Teil 9) Zufallsstichprobe“ weiterlesen

PSPP (Teil 8): Häufigkeitsverteilung in der deskriptiven Statistik am Beispiel der Flughöhe

In der Statistik ist die deskriptive Analyse ein wichtiger Bestandteil, der es ermöglicht, Daten auf eine Weise zu interpretieren und zu verstehen, die aussagekräftige Muster und Trends offenbart. Eine zentrale Komponente der deskriptiven Statistik ist die Häufigkeitsverteilung, die uns erlaubt, die Häufigkeit von Werten oder Kategorien in einem Datensatz zu analysieren.


„PSPP (Teil 8): Häufigkeitsverteilung in der deskriptiven Statistik am Beispiel der Flughöhe“ weiterlesen

Interquartilsabstand (IQR oder IQA) mit PSPP berechnen (Teil 6)

Der Interquartilsabstand (IQR) ist ein Streuungsmaß in der deskriptiven Statistik. Der IQR ist eine robuste Maßzahl, die in der Lage ist, Ausreißer in Datensätzen zu identifizieren und Informationen über die Streuung der Daten zu liefern. Der Interquartilsabstand, oft abgekürzt als IQR, ist ein Maß für die Streuung oder die Verbreitung von Daten in einem Datensatz. Er basiert auf den Quartilen, die die Daten in vier gleich große Teile aufteilen.

Die Quartile sind: „Interquartilsabstand (IQR oder IQA) mit PSPP berechnen (Teil 6)“ weiterlesen

Planespotter Statistik der letzten 30 Tage mit einem Raspberry Pi Zero W

Zahlen und Daten, Flugstatistiken so klar,
Der Spotter notiert, jede Maschine, fürwahr.
Ein Ballett der Maschinen, hoch überm Land,
Ein Atlas aus Stahl, im Himmel bekannt.

Die Antenne gerichtet, der Himmel ein Buch,
ADS-B enthüllt, jeder Flug, ein Stück.
Aircrafts, die tanzen im elektronischen Licht,
Der Spotter verfolgt, was die Technik verspricht.

Datenströme fließen, wie ein Lied in der Nacht,
Der Planespotter lauscht, dem Funkkontakt.
Flugstatistiken weben, ein Muster im Raum,
Aircrafts auf dem Bildschirm, wie Träume im Traum.

-Thomas Wenzlaff

PSPP Ausgabe aller Grafiken (Plots: BOXPLOT, NPPLOT, HISTOGRAM, SPREADLEVEL)(Teil 5)

In PSPP können wir einfach mal alle Grafiken erzeugen, um Ergebnisse zu prüfen und auch um zu sehen, welches Diagramm sich am besten eignen.

Diagramme in der Statistik sollen dazu beitragen, Daten visuell darzustellen und die Interpretation von statistischen Informationen zu erleichtern. Um diese Ziele möglichst effektiv zu erreichen, sollten Diagramme bestimmte Kriterien erfüllen, hier eine Checkliste:

„PSPP Ausgabe aller Grafiken (Plots: BOXPLOT, NPPLOT, HISTOGRAM, SPREADLEVEL)(Teil 5)“ weiterlesen

PSPP Cochrans Q-Test und deskriptiven Statistiken mit Häufigkeit auf dem Raspberry Pi 4 (Teil 4)

Der Cochrans Q-Test ist ein statistischer Test, der in der deskriptiven Statistik und in der medizinischen Forschung verwendet wird, um festzustellen, ob es signifikante Unterschiede zwischen mehr als zwei abhängigen Gruppen oder Bedingungen gibt. Dieser Test wird oft in Verbindung mit wiederholten Messungen oder wiederholten Stichproben (auch als within-subjects oder repeated measures bezeichnet) angewendet, bei denen dieselben Personen oder Elemente in verschiedenen Gruppen oder zu verschiedenen Zeitpunkten gemessen werden.

pspp

Der Cochrans Q-Test ist ein nichtparametrischer Test und basiert auf der Anzahl der Abweichungen in den verschiedenen Gruppen. Im Wesentlichen vergleicht der Test die Unterschiede zwischen den Gruppen mit den erwarteten Unterschieden, die zufällig auftreten würden. Wenn die beobachteten Unterschiede zwischen den Gruppen signifikant größer sind als die zufällig erwarteten Unterschiede, weist dies auf signifikante Unterschiede zwischen den Gruppen hin.

Die Hypothesen, die mit dem Cochrans Q-Test getestet werden, sind normalerweise wie folgt: „PSPP Cochrans Q-Test und deskriptiven Statistiken mit Häufigkeit auf dem Raspberry Pi 4 (Teil 4)“ weiterlesen

PSPP import von Daten aus Textdatei am Beispiel von Transfusionsdaten (Teil 3)

In diesen Beitrag hatten wir die Daten im PSPP Script untergebracht. Für umfangreiche Daten oder auch unterschiedliche Datensätze ist diese inline Form nicht so optimal. Wie können wir das Script umbauen, so das die Daten in das Script importiert werden?

Wir kopieren die Transfusions Daten einfach in eine eigene Text-Datei im gleichen Verzeichnis wie das Scrpt, z.B. transfusion-eigenblut-daten.dat mit Inhalt: „PSPP import von Daten aus Textdatei am Beispiel von Transfusionsdaten (Teil 3)“ weiterlesen