Modul 45

Literatur
Die Module

Benford's Law

Places of interest near Benford`s Law

../beil2.gif



In großen Mengen von Dezimalzahlen, die gleichartige natürliche oder soziale Systeme, Objekte, Situationen,... beschreiben,

z.B. Oberflächen von Seen in einem Land,
Halbwertszeiten der -Umwandlung radioaktiver Isotope,
jährliche Stromrechnungen in einer Großstadt,
mathematische, physikalische und statistische Tabellen,

gilt sehr oft (vgl. [6,8,10,19,20,21] in Näherung für die relative Häufigkeit (→ Wahrscheinlichkeit) pk, dass in einer solchen Zahl die linksseitig erste Ziffer ist:

Dieser zunächst empirische Befund [27,28] ist in der Literatur mit unterschiedlichstem Material gut belegt [1,2,6,8,11,14]. Eine umfassende mathematische Fundierung (Erklärung, Herleitung, Gültigkeitsbereich,..) existiert bisher nicht (vgl. [7], aber auch [6,8,10,19,20,21,33-37]). In [29] ist gezeigt, dass Benford`s Law skalierungsinvariant ist (also bei Wechsel der Maßeinheit bzw. Multiplikation aller Zahlen der betreffenden Zahlenmenge mit einem konstanten Faktor ebenfalls gilt). Die nachstehenden Beispiele zeigen, dass Benford`s Law überraschenderweise auch für (dimensionslose) Zahlenmengen Gültigkeit besitzt, die durch bestimmte rein mathematische „Generatoren“ erzeugt werden.

Beispiel 1
Berechnet man für im Intervall [0,2π] zufällig ausgewählte x-Werte,

aus dem Ausdruck

die zugehörigen y-Werte, so sind deren linksseitig erste Ziffern Benford-verteilt [5]. Bild 1 und Bild 2 zeigen experimentell erhaltene Verläufe der pk(n).

Schon für n = 105 stimmen die experimentell erhalten pk(n) -Werte sehr gut mit Gl. (1) überein!

17.1.

Untersuchen Sie in der gleichen Weise die Generatoren

sowie weitere von Ihnen ausgewählte Generatoren. Diskutieren Sie die erhaltenen Ergebnisse.

17.2.

Zeigen Sie wie in Beispiel 1 experimentell, dass auch für

die linksseitig ersten Ziffern der erhaltenen y-Werte Benford-verteilt sind – Skalierungsinvarianz.

Beispiel 2
Das m-stellige Ternärwort w über dem Alphabet {0,1,2}, dessen Zeichen 2x2-Matrizen sind

werde als Matrizenprodukt über dem Körper der reellen Zahlen interpretiert. w transformiert dann den Vektor in den Vektor

Beispiel:

Berechnet man für m = 0,1,2,3,4,5.. jeweils alle 3m möglichen Ternärwörter w und die zugehörigen Vektoren , so kann man für jedes m die Anzahl a(m,k) der Zahlen u und v bestimmen, deren erste Ziffer von links eine 1, 2, .., 9 ist.
Für die relative Häufigkeit (→ Auftrittswahrscheinlichkeit) der linksseitigen ersten Ziffer in u und v

erhält man dann nachstehende Wertetabelle:

Die zugehörigen Mittelwerte sind

diese liegen erstaunlich nahe bei

17.3.

Vervollständigen Sie die p(m,k) Wertetabelle und vergleichen Sie die erhaltenen Werte bzw. Mittelwerte mit Gl. (1).
Diskutieren Sie das erhaltene Ergebnis. Offensichtlich liegt hier im Gegensatz zu Beispiel 1 ein Generator ohne stochastischen Input vor.

Beispiel 3
Für die ersten 100 Glieder der Fibonacci-Folge mit

findet man die nachstehenden relativen Häufigkeiten pk(100) der linksseitig ersten Ziffer [12]:

und damit eine gute Übereinstimmung mit Benford`s Law.

17.4.

Untersuchen Sie für die Beispiele 1, 2 und 3 analog zur Häufigkeitsverteilung für die linksseitig erste Ziffer pk = pk,1; die Häufigkeitsverteilungen für die linksseitig zweite pk,2, dritte pk,3,.. Ziffer. Diskutieren Sie die erhaltenen Ergebnisse und vergleichen Sie sie mit [6,8,14,19,20]. Formulieren Sie nun für die Häufigkeitsverteilungen ein einfaches mathematisches Modell.

Lösungshinweis

17.5.

Untersuchen Sie weitere „Benford-Kandidaten“ im Bereich der Mathematik (insbesondere Primzahlen (wie in Beispiel 3, vgl. [13]), störungsfreie Kodes, Kryptodes) und der Physik.

17.6.

Stellen Sie in der Literatur [8,10,11,15,16,17,18,19,21,23,24] beschriebene Anwendungen von Benford`s Law in den Bereichen

zusammen.

17.7.

In [22] wird der Versuch beschrieben, aus dem bisher bei Ultraschalluntersuchungen von Werkstoffen als störender Signaluntergrund betrachteten Phononen-Rauschen Informationen über den inneren Aufbau des Werkstoffes zu gewinnen:

Noise generated in an ultrasonic receiver consisting of transducer and amplifier is usually ignored, or treated as a nuisance. Here it is argued that acoustic thermal fluctuations, with displacement amplitudes of 3 fm, contain substantial ultrasonic information. It is shown that the noise autocorrelation function is the waveform that would be obtained in a direct pulse/echo measurement. That thesis is demonstrated in experiments in which direct measurements are compared to correlation functions. The thermal nature of the elastodynamic noise that generates these correlations is confirmed by an absolute measurement of their strength, essentially a measurement of the sample temperature.

Diese Idee und ihre erfolgreiche Realisierung legt nahe, „Schwankungen“ um pk (vgl. Beispiel 1, Bild 1 und Bild 2; [13]) ebenfalls als ein informationstragendes Rauschen zu betrachten und entsprechend auszuwerten. Untersuchen Sie diesen Ansatz experimentell.

17.8.

Der Cusanus-Algorithmus (A1)

Das Abarbeitungsprotokoll von (A1) zeigt für Gl. (17) bei der Rechnung mit 16 Nachkommastellen folgenden Werteverlauf von x(t) und y(t).

In dieser Tabelle ist der jeweils linksseitig erste Ziffernänderungsbetrag von x(t) auf x(t+1) und von y(t) auf y(t+1) eingetragen. Für die Ziffernänderungsbeträge erhält man dann folgende Häufigkeitsverteilung

die die Ziffer 1 deutlich priorisiert.
Die entsprechende Rechnung mit 100 Nachkommastellen liefert folgendes Bild:

Man erkennt im Rahmen der erwartbaren Schwankungsbreite eine eindeutige Rangfolge der Ziffernhäufigkeit mit derselben Tendenz wie gemäß Benford`s Law aber offensichtlich mit anderen Häufigkeitswerten.

Beispiel


Für m = 300 und erhält man

17.9.

Ein ähnlich überraschendes Ergebnis wie in 17.8. findet man bei der Analyse der Ziffernfolge von mathematischen Konstanten unterschiedlichster Art (vgl. [32]). Bildet man z.B. für die (gleichverteilte) Ziffernfolge von p wie nachstehend den 1., 2., 3., .. Differenzbetrag aufeinanderfolgender Ziffern

so ergibt sich für te = 10.000 die folgende Ziffernhäufigkeitsverteilung

Ganz ähnliche Werte erhält man für e, = 0,557216.. (Euler-Mascheroni-Konstante), G = 0,915966.. (Catalansche Konstante), ,.. So ist für die 1. und 2. Differenz bei te = 100.000:

PS: Gibt es vielleicht doch Unterschiede, z. B. in den Rauschspektren der pk (D1..), vgl. 17.7.

17.10.

Auch die durch 17.9. induzierte Analyse bestimmter Ziffernhäufigkeiten in der Primzahlfolge liefert „Places of interest near Benford`s Law“. Hierfür sollen zwei Beispiele stehen.

Beispiel 1
In der Primzahlfolge =

werden die Differenzbeträge der letzten Ziffern aufeinanderfolgender Primzahlen gebildet. Die dabei erhaltenen Ziffern 0, 2, 4, 6 und 8 zeigen folgendes, stark von der Gleichverteilung abweichendes Häufigkeitsspektrum.

Beispiel 2
In der Primzahlfolge werden die Differenzen pr(t+1)-pr(t) gebildet. Deren letzte Ziffern besitzen dann nachstehende Häufigkeitsverteilung.





E. P. Stoschek
unter Mitarbeit von D. Schönfeld
07.03.2002



Literatur
Die Module