Wahrscheinlichkeitsrechnung mit dem Satz von Bayes nicht nur für Versicherungen und Medizin

Der Satz von Bayes ist ein grundlegendes Theorem in der Wahrscheinlichkeitsrechnung, das den Zusammenhang zwischen bedingten Wahrscheinlichkeiten beschreibt.

Der Satz von Bayes ist ein spannendes Werkzeug aus der Welt der Mathematik, das uns hilft, Wahrscheinlichkeiten zu verstehen und zu berechnen. Er wird in vielen Bereichen angewendet, von der Medizin über Künstliche Intelligenz bis hin zu Alltagssituationen. Aber was genau besagt dieser Satz, und warum ist er so nützlich?

Was ist der Satz von Bayes? „Wahrscheinlichkeitsrechnung mit dem Satz von Bayes nicht nur für Versicherungen und Medizin“ weiterlesen

Der Brier-Score (Brier-Wert) nicht nur für Prognostiker

Der Brier-Wert ist ein effizientes und einfaches Maß zur Bewertung der Genauigkeit probabilistischer Vorhersagen. Durch die Kombination aus einfacher Berechnung und aussagekräftiger Analyse ist er ein weit verbreitetes Werkzeug in der Statistik und im maschinellen Lernen.

In der Praxis hilft er, die Qualität von Vorhersagen quantitativ zu bewerten und kann zur Verbesserung von Modellen und Algorithmen beitragen. Die Bezeichnung „Brier-Wert“ stammt von dem amerikanischen Meteorologen Glenn W. Brier, der das Maß (1950 – VERIFICATION OF FORECASTS EXPRESSED IN TERMS OF PROBABILITY) entwickelte und damit die Grundlage legte.

Der Brier-Wert wird häufig in Bereichen wie Meteorologie, Medizin, Finanzwesen, Wahlprognosen und maschinellem Lernen verwendet, um die Genauigkeit von Prognosen zu bewerten. Er ist besonders nützlich bei binären Klassifikationsproblemen, bei denen das Modell Wahrscheinlichkeiten für die Zugehörigkeit zu einer von zwei Klassen liefert (z. B. Regenwahrscheinlichkeit).

Wir erstellen zur Verdeutlichung mal ein JSon Datei mit ein paar Daten von der Reserve Bank of Australia, die bei ihren monatlichen Sitzungen Zinssätze beschließt. Die RBA lässt die Zinssätze im Allgemeinen unverändert, erhöht sie jedoch manchmal und senkt sie manchmal, je nach wirtschaftlicher Lage. Die Daten stammen aus diesem Artikel und wurden von mir in das JSon-Format überführt. „Der Brier-Score (Brier-Wert) nicht nur für Prognostiker“ weiterlesen

Java Programm zur Goldbachsche Vermutung mit Heap Analyse

Die Goldbachsche Vermutung ist eine der ältesten ungelösten Probleme in der Mathematik, die der Mathematiker Christian Goldbach 1742 in einem Brief an Leonhard Euler formulierte. Sie besagt:

Jede gerade Zahl größer als 2 lässt sich als Summe zweier Primzahlen darstellen.

Diese Vermutung ist in zwei Formen bekannt: „Java Programm zur Goldbachsche Vermutung mit Heap Analyse“ weiterlesen

ANOVA (Analysis of Variance, auf Deutsch Varianzanalyse) mit PSPP (Teil 13)

Die ANOVA (Analysis of Variance, auf Deutsch Varianzanalyse) ist eine statistische Methode zur Untersuchung, ob die Mittelwerte mehrerer Gruppen signifikant voneinander abweichen.

Sie wird verwendet, um herauszufinden, ob es Unterschiede in den Mittelwerten von verschiedenen Gruppen gibt, die nicht nur durch Zufall entstanden sind. „ANOVA (Analysis of Variance, auf Deutsch Varianzanalyse) mit PSPP (Teil 13)“ weiterlesen

Neue PSPP 2.0.1 veröffentlicht (Teil 12)

Vor ein paar Wochen wurde die neue Version 2.0.1 von PSPP veröffentlicht. Was gibt es da Neues? Hier die Projektseite.

PSPP ist ja eine freie Software zur statistischen Analyse von Daten. Sie wurde als Open-Source-Alternative zu SPSS entwickelt, einem kommerziellen Programm, das vor allem in den Sozialwissenschaften, der Psychologie und der Wirtschaftsforschung weit verbreitet ist. „Neue PSPP 2.0.1 veröffentlicht (Teil 12)“ weiterlesen

In 2023 jeden Monat mehr als 1 Millionen Hits auf diese Webseite – Dank an alle Besucher

In Bezug auf Webseitenstatistiken bezieht sich der Begriff „Hits“ auf die Gesamtanzahl der Anfragen, die an einen Webserver gesendet werden. Hits können verschiedene Arten von Serveranfragen darstellen, und es ist wichtig zu beachten, dass sie nicht unbedingt die Anzahl der Besucher oder Seitenaufrufe widerspiegeln. Hier mal die Auswertung des Jahres 2023:


„In 2023 jeden Monat mehr als 1 Millionen Hits auf diese Webseite – Dank an alle Besucher“ weiterlesen

PSPP (Teil 11) Auswertung der in 2023 gelesenen Bücher

Heute mal ein Praxisbeispiel für PSPP. Für jedes Buch das ich in 2023 gelesen habe, vergebe ich immer eine Schulnote (1-6).
Wird ein Buch abgebrochen, weil ich meine das es sich nicht mehr lohnt weiterzulesen, vergebe ich eine 6, das ist im letzten Jahr 2 mal vorgekommen. Insgesamt habe ich 29 Bücher im Jahr 2023 gelesen. Nun will ich das mal mit PSPP auswerten wie z.B.:

Das geht über das Menü: „PSPP (Teil 11) Auswertung der in 2023 gelesenen Bücher“ weiterlesen

PSPP (Teil 10): Daten Export als CSV für Excel import am Beispiel der Flughöhe

Wie können wir aus PSPP die Daten in ein CSV-File exportieren um sie dann in Excel zu importieren. Wir verwenden wieder unsere Flughöhen aus den vorhergehenden Beispielen.

Wir gehen, wenn wir die Daten geladen haben auf das Menü: Datei – Neu – Syntax. In dem Syntax Editor geben wir ein: „PSPP (Teil 10): Daten Export als CSV für Excel import am Beispiel der Flughöhe“ weiterlesen

PSPP (Teil 9) Zufallsstichprobe

Stichproben in der Statistik sind ein wesentliches Werkzeug, um Informationen über eine größere Population zu gewinnen, indem man nur einen Teil dieser Population untersucht.

Eine Zufallsstichprobe ist eine Auswahl von Elementen aus einer Gesamtpopulation, bei der jedes Element in der Population eine gleichberechtigte Chance hat, in die Stichprobe aufgenommen zu werden. Das bedeutet, dass jedes Element unabhängig und zufällig ausgewählt wird, ohne dass bestimmte Merkmale oder Eigenschaften bevorzugt werden.

Zufallsstichprobe können auch mit PSPP gezogen werden. Hier ist eine Anleitung dazu: „PSPP (Teil 9) Zufallsstichprobe“ weiterlesen

Interquartilsabstand (IQR oder IQA) mit PSPP berechnen (Teil 6)

Der Interquartilsabstand (IQR) ist ein Streuungsmaß in der deskriptiven Statistik. Der IQR ist eine robuste Maßzahl, die in der Lage ist, Ausreißer in Datensätzen zu identifizieren und Informationen über die Streuung der Daten zu liefern. Der Interquartilsabstand, oft abgekürzt als IQR, ist ein Maß für die Streuung oder die Verbreitung von Daten in einem Datensatz. Er basiert auf den Quartilen, die die Daten in vier gleich große Teile aufteilen.

Die Quartile sind: „Interquartilsabstand (IQR oder IQA) mit PSPP berechnen (Teil 6)“ weiterlesen

Planespotter Statistik der letzten 30 Tage mit einem Raspberry Pi Zero W

Zahlen und Daten, Flugstatistiken so klar,
Der Spotter notiert, jede Maschine, fürwahr.
Ein Ballett der Maschinen, hoch überm Land,
Ein Atlas aus Stahl, im Himmel bekannt.

Die Antenne gerichtet, der Himmel ein Buch,
ADS-B enthüllt, jeder Flug, ein Stück.
Aircrafts, die tanzen im elektronischen Licht,
Der Spotter verfolgt, was die Technik verspricht.

Datenströme fließen, wie ein Lied in der Nacht,
Der Planespotter lauscht, dem Funkkontakt.
Flugstatistiken weben, ein Muster im Raum,
Aircrafts auf dem Bildschirm, wie Träume im Traum.

-Thomas Wenzlaff

PSPP Ausgabe aller Grafiken (Plots: BOXPLOT, NPPLOT, HISTOGRAM, SPREADLEVEL)(Teil 5)

In PSPP können wir einfach mal alle Grafiken erzeugen, um Ergebnisse zu prüfen und auch um zu sehen, welches Diagramm sich am besten eignen.

Diagramme in der Statistik sollen dazu beitragen, Daten visuell darzustellen und die Interpretation von statistischen Informationen zu erleichtern. Um diese Ziele möglichst effektiv zu erreichen, sollten Diagramme bestimmte Kriterien erfüllen, hier eine Checkliste:

„PSPP Ausgabe aller Grafiken (Plots: BOXPLOT, NPPLOT, HISTOGRAM, SPREADLEVEL)(Teil 5)“ weiterlesen

PSPP Cochrans Q-Test und deskriptiven Statistiken mit Häufigkeit auf dem Raspberry Pi 4 (Teil 4)

Der Cochrans Q-Test ist ein statistischer Test, der in der deskriptiven Statistik und in der medizinischen Forschung verwendet wird, um festzustellen, ob es signifikante Unterschiede zwischen mehr als zwei abhängigen Gruppen oder Bedingungen gibt. Dieser Test wird oft in Verbindung mit wiederholten Messungen oder wiederholten Stichproben (auch als within-subjects oder repeated measures bezeichnet) angewendet, bei denen dieselben Personen oder Elemente in verschiedenen Gruppen oder zu verschiedenen Zeitpunkten gemessen werden.

pspp

Der Cochrans Q-Test ist ein nichtparametrischer Test und basiert auf der Anzahl der Abweichungen in den verschiedenen Gruppen. Im Wesentlichen vergleicht der Test die Unterschiede zwischen den Gruppen mit den erwarteten Unterschieden, die zufällig auftreten würden. Wenn die beobachteten Unterschiede zwischen den Gruppen signifikant größer sind als die zufällig erwarteten Unterschiede, weist dies auf signifikante Unterschiede zwischen den Gruppen hin.

Die Hypothesen, die mit dem Cochrans Q-Test getestet werden, sind normalerweise wie folgt: „PSPP Cochrans Q-Test und deskriptiven Statistiken mit Häufigkeit auf dem Raspberry Pi 4 (Teil 4)“ weiterlesen

PSPP import von Daten aus Textdatei am Beispiel von Transfusionsdaten (Teil 3)

In diesen Beitrag hatten wir die Daten im PSPP Script untergebracht. Für umfangreiche Daten oder auch unterschiedliche Datensätze ist diese inline Form nicht so optimal. Wie können wir das Script umbauen, so das die Daten in das Script importiert werden?

Wir kopieren die Transfusions Daten einfach in eine eigene Text-Datei im gleichen Verzeichnis wie das Scrpt, z.B. transfusion-eigenblut-daten.dat mit Inhalt: „PSPP import von Daten aus Textdatei am Beispiel von Transfusionsdaten (Teil 3)“ weiterlesen

PSPP ohne GUI von der Kommandozeile auf einem Raspberry Pi Zero Headless am Beispiel von Bluttransfusion und Flughöhen (Teil 2)

Für PSPP braucht man nicht unbedingt eine GUI (siehe Blog Beitrag). Man kann PSPP auch Headless auf der Kommandozeil ausführen.
Die Kommandozeile in PSPP funktioniert ähnlich wie die in anderen Statistikprogrammen wie SPSS. Sie ermöglicht es Ihnen, SPSS-Syntaxbefehle direkt einzugeben und auszuführen, um Datenverarbeitung und -analyse durchzuführen.

Hier zeige ich an zwei Beispielen (Flughöhe und Bluttransfusionen/Eigenblutspende) wie die Kommandozeile in PSPP verwendet wird

Wir brauchen nur mit

sudo apt install pspp

das Programm installieren und können Testen ob es läuft mit „PSPP ohne GUI von der Kommandozeile auf einem Raspberry Pi Zero Headless am Beispiel von Bluttransfusion und Flughöhen (Teil 2)“ weiterlesen

PSPP: Ein leistungsstarkes Werkzeug für statistische Analysen auch auf dem Raspberry Pi (Teil 1)

Die Welt der statistischen Analyse und Datenverarbeitung ist vielfältig und ständig im Wandel. In diesem Artikel werden wir uns PSPP ansehen, eine Open-Source-Alternative zu kommerziellen Statistikprogrammen wie SPSS.

PSPP bietet eine breite Palette von Funktionen für die statistische Analyse und Datenaufbereitung und hat den Vorteil, dass es kostenlos und quelloffen ist. Es läuft sogar auf einem Raspberry Pi mit Grafik. Und ist mit diesen Befehlen auf der Kommandozeile schnell installiert: „PSPP: Ein leistungsstarkes Werkzeug für statistische Analysen auch auf dem Raspberry Pi (Teil 1)“ weiterlesen

Flightradar 24 Rank 17135 weltweit und in Deutschland auf 2046

Was ist der Flightradar 24 Rank?

Flightradar24 Rank ist ein System zur Bewertung von Flugzeugspuren auf der Flugverfolgungsplattform Flightradar24. Es basiert auf der Anzahl der monatlichen Flugzeugspuren, die von einem bestimmten Benutzer gemeldet werden, und dient dazu, die Aktivität und Qualität dieser Benutzer im Vergleich zu anderen Benutzern zu bewerten. Der Flightradar24 Rank kann als Anreiz dienen, um Benutzer dazu zu motivieren, häufiger Flugzeugspuren zu melden und damit die Datenqualität auf der Plattform zu verbessern (Quelle: ChatGPT ;-).

… wenn das kein Fortschritt im Ranking ist …

Und hier die letzte Auslieferung der 747, nicht von mir getrackt …

Auswertung des S920 Feed nach Flightradar24 aus HAJ bzw. EDDV

Wie auf dem S920 ein Flightradar24 sender erstellt wir, hatte ich ja hier schon beschrieben. Hier mal die Auswertung der Anzahl der Flugzeuge die empfangen werden. Die Antenne ist aber in der Wohnung, das ist suboptimal. Aber hier das Ergebnis der letzten Woche, und der Samstag ist ja noch nicht zu ende. Es werden von mir also in Langenhagen ca. 700 Flugzeuge pro Tag empfangen.

Planespotting übrigens ein Hobby, bei dem Menschen Flugzeuge beobachten und identifizieren. Es ist eine beliebte Freizeitbeschäftigung für Menschen jeden Alters und hat eine lange Geschichte.

Die Wurzeln des Planespotting gehen zurück auf den Beginn des 20. Jahrhunderts, als der Luftverkehr begann, sich zu entwickeln. Menschen waren von den Flugzeugen fasziniert und begannen, sie von verschiedenen Orten aus zu beobachten. Im Laufe der Zeit entwickelte sich dieses Hobby weiter und wurde immer beliebter.

Heutzutage gibt es viele Menschen, die sich dem Planespotting verschrieben haben. Sie treffen sich an Flughäfen, Flugzeugwerften und anderen Orten, an denen Flugzeuge zu sehen sind, um ihre Beobachtungen aufzunehmen und zu teilen. Es gibt sogar spezielle Clubs und Organisationen, die sich dem Planespotting verschrieben haben.

Einige der populärsten Orte zum Planespotting sind Flughäfen. Hier können die Beobachter verschiedene Arten von Flugzeugen sehen, von kleinen Privatflugzeugen bis hin zu großen Passagierflugzeugen. Einige Flughäfen haben sogar spezielle Bereiche, die für das Planespotting reserviert sind.

Ein weiterer beliebter Ort zum Planespotting sind Flugzeugwerften. Hier können die Beobachter die Entstehung von Flugzeugen aus nächster Nähe verfolgen und die verschiedenen Schritte des Bauprozesses beobachten.

Das Planespotting ist nicht nur ein Hobby, sondern auch eine Leidenschaft für viele Menschen. Es ermöglicht es ihnen, die Schönheit und Technologie der Flugzeuge zu genießen und ihr Wissen über verschiedene Arten von Flugzeugen zu erweitern. Es gibt auch viele Websites, Foren und soziale Mediengruppen, die sich dem Planespotting widmen und die Beobachter die Möglichkeit bieten, ihre Beobachtungen und Fotos mit anderen zu teilen.

Insgesamt ist Planespotting ein faszinierendes und unterhaltsames Hobby, das Menschen auf der ganzen Welt begeistert. Es bietet die Möglichkeit, die Welt aus einer anderen Perspektive zu sehen und die Schönheit und Technologie der Flugzeuge zu bewundern.

Auch der empfang der Flugzeugtransponder mit Dump1090 fällt in diese Richtung. „Auswertung des S920 Feed nach Flightradar24 aus HAJ bzw. EDDV“ weiterlesen

Air Mauritius 14:38 Uhr – Zwei A350 ziehen eng aneinander vorbei oder wie hoch fliegen Flugzeuge?

Zwei A350 von Air Mauritius ziehen eng aneinander vorbei, wie hier berichtet. Deshalb mal hier ein aktueller Dump:

CO2-Ampel Auswertung

Hier mal die Auswertung zur CO2-Ampel die auf einem Raspberry Pi läuf. Von fast einem halben Jahr Dauerlauf (23.1.-5.6.2021) im Arbeitszimmer mit max. 2 Personen mit 374374 Messwerten (jede Minute). Der Mittelwert beträg 693 ppm. Da hätte ich jetzt weniger erwartet, da ich immer rechtzeitig gelüftet habe, wenn ich einen zu hohen Wert gesehen haben.

Max. 2515 ppm und min wie nicht anders zu erwarten 400 ppm.

Carbon dioxide, heute das 1. Mal die Warnung per Alexa (Selbstversuch)

Heute zum 1. Mal die Warnung per Alexa von NodeRed. Und das bei nur zwei Personen und defekter Heizung.

Übrigens: Bei 1000 ppm empfinden rund 20 % der Personen die Raumluft als unbefriedigend. Diese Konzentration entspricht der Pettenkofer-Zahl, die von dem Hygieniker Max von Pettenkofer (1858) als Richtwert für die maximale CO2- Konzentration in Wohn- und Aufenthaltsräumen mit 0,1 Vol% CO2 (1000 ppm) definiert wurde.

Wo es viel CO2 gibt, werden auch besonders viele Keime gefunden. Die amerikanischen Wissenschaftler Rudnick und Milton zum Beispiel untersuchten 2003, wie hoch das Grippe Ansteckungsrisiko in einem Klassenraum ist. 30 Personen waren vier Stunden lang im Klassenraum, eine Person hatte akut Grippe. Das Ergebnis: Bei 1.000 ppm CO2 steckten sich fünf Personen an, bei 2.000 ppm waren es zwölf und bei 3.000 ppm sogar 15.

MAK-Werte Deutschland für CO2: 9100 mg/m3 Warum ist das so hoch?

Nach dem Querlüften sind die Wert aber schnell wieder auf Normal, wie man im Trend sehen kann. „Carbon dioxide, heute das 1. Mal die Warnung per Alexa (Selbstversuch)“ weiterlesen

Gibt es mehr Zugriffe auf wenzlaff.de durch covid-19 bzw. SARS-CoV-2?

Gibt es mehr Zugriffe auf wenzlaff.de durch covid-19? Das hat mich mal interessiert. Also mal die Logs dieser Domain ausgewertet. Normal gibt es so ca. 60000 Zugriffe (hits) pro Tag. Mal abgesehen von den paar Tagen im Januar, wo es ca. 100000 gab:

Ein Anstieg ist tatsächlich zu beobachten. Siehe roten Kasten. Aber nicht so groß wie ich erwartet habe. Mal sehen was noch kommt. Bleibt Gesund! Haltet Abstand! Und nutzt den Raspberry Pi und fast hätte ich es vergessen „Freut Euch immer“.

Java Webclient des Statistischen Bundesamtes für GENESIS Online DB starten auf Mac OS X und Raspberry Pi bzw. Linux

Das Statistische Bundesamt bietet für registrierten Nutzern 3 Werkzeuge kostenlos zum Download an. Unter anderem ein Java-Web-Client. Es heißt:“

Durch den „GENESIS-Webservice“ werden bestimmte Funktionen von GENESIS-Online auch für die automatisierte Verarbeitung zugänglich gemacht, wie z. B. Abruf und Download von Daten. Über unser Dienstangebot (WSDL) können registrierte GENESIS-Online-Nutzer die entsprechenden Schnittstellen in ihre eigenen Applikationen integrieren und programmgesteuert die angebotenen Dienste nutzen.“

Ok, dann wollen wir mal testen. Wir wollen auf den Mac OS X und dann auf einem Raspberry Pi die autom. Abfragen stellen. Als Beispiel sollen mal die Daten abfrage der Transfusion von Vollblut und Erythrozytenkonzentrat (EK) u.Ä. in Deutschland verwendet werden. Die Anzahl ist rückläufig, wenn auch in Deutschland immer noch fast eine Millionen Einheiten (a mind. ca. 200 Euro) verkauft werden.

Datenquelle: Statistisches Bundesamt (Destatis), Genesis-Online,
Abrufdatum 22.06.2019; Datenlizenz by-2-0; eigene Berechnung/eigene Darstellung

Welche Schritte sind nötig? „Java Webclient des Statistischen Bundesamtes für GENESIS Online DB starten auf Mac OS X und Raspberry Pi bzw. Linux“ weiterlesen

Raspberry Pi: Um welche Uhrzeit wird immer der letzte Kaffee am Tag gekocht?

Vor ein paar Tagen hatte ich die Auswertung zum Kaffeeverbrauch gepostet. Die Daten werden ja online von einem meiner Raspberry Pi erfasst. Gestern der Beitrag zu der Frage: Wann der 1. Kaffee des Tages gekocht wird.

Heute habe ich mal gefragt, um welche Uhrzeit wird bei uns eigentlich der letzte Kaffee am Abend gekocht? Man soll ja vor dem zu Bett gehen nicht noch viel Kaffee trinken.
Die Antwort im Durchschnitt um 15:14 Uhr. Der gemessene Zeitraum ist fast 2 Jahre mit über 500 Messwerte. Hier dazu die Grafik mit der Uhrzeit als Y Wert. X ist die Anzahl der Messungen (Tage). Die rote Linie der Mittelwert.


Und weil ich Diagramme liebe, noch mal eins mit Punkten … „Raspberry Pi: Um welche Uhrzeit wird immer der letzte Kaffee am Tag gekocht?“ weiterlesen