Je gaat waarschijnlijk ervan uit dat de cijfers 1 tot en met 9 om de beurt vooraan in echte getallen zouden moeten staan. Dat is niet zo. In veel natuurlijke datasets verschijnt cijfer 1 ongeveer 30 procent van de tijd als eerste, terwijl 9 minder dan 5 procent verschijnt.[1]

Die vreemde scheefheid heet de wet van Benford, en zodra je het opmerkt, lijkt de wereld een beetje gemanipuleerd. Elektriciteitsrekeningen, rivierlengtes, aandelenkoersen, factuurtotalen en bevolkingscijfers neigen vaak sterk naar kleinere leidende cijfers.[1][2] Als cijfers gelijkmatig verdeeld zouden zijn, zou elk ongeveer 11,1 procent van de tijd als eerste verschijnen. Het echte leven doet echter, tot frustratie, iets anders.[1]

Het verhaal begint met een heerlijk ouderwetse aanwijzing: vieze boekpagina's. In 1881 merkte astronoom Simon Newcomb op dat de eerste pagina's van logaritmetabellen meer versleten waren dan de latere, wat betekende dat mensen veel vaker cijfers opzochten die met 1 begonnen dan cijfers die met 8 of 9 begonnen.[2] Vervolgens testte in 1938 natuurkundige Frank Benford het idee met meer dan 20.000 getallen uit 20 verschillende categorieën, waaronder rivieren, bevolkingen, natuurconstanten en sterftecijfers, en vond hetzelfde patroon opnieuw.[1][2]

Waarom gebeurt dit? Omdat veel reële grootheden zich vermenigvuldigend over schalen verspreiden, niet netjes. Op een logaritmische schaal is de afstand van 1 tot 2 veel groter dan die van 9 tot 10, waardoor waarden eerder in het “begint met 1” gebied vallen dan in het “begint met 9” gebied.[1][2] Het voelt onjuist totdat je je iets voorstelt dat in de tijd groeit. De omzet van een bedrijf kan lange tijd gaan van $1 miljoen naar $2 miljoen, maar veel minder tijd van $9 miljoen naar $10 miljoen.[3]

Hier stopt het feit met schattig te zijn en wordt het nuttig. accountants en auditors gebruiken Benford-analyse om enorme stapels financiële gegevens te scannen op anomalieën, omdat verzonnen cijfers vaak het slechte instinct van de mens voor nep-willekeur verraden.[3][4] Mensen die “natuurlijk uitziende” cijfers proberen te verzinnen, neigen ertoe de cijfers te gelijkmatig te verdelen of te clusteren rond drempels zoals $4.999 of $99.000, waardoor verdachte patronen opvallen.[4]

Maar de wet van Benford is geen leugendetector, en dat is de wending die de meeste mensen missen. Het werkt het beste op datasets die meerdere grootheidsordes beslaan en niet kunstmatig toegewezen, begrensd of beperkt zijn. Postcodes, factuurnummers en prijzen die door beleid zijn vastgesteld zijn slechte kandidaten, en zelfs eerlijke gegevens kunnen er vreemd uitzien om volkomen alledaagse redenen.[2][3][4] Een auditor die door Case IQ werd geïnterviewd, vond een schooldistrict met veel te veel cijfers die met 2 beginnen, alleen om te ontdekken dat elke docent een klasvergoeding van $250 kreeg.[4]

Dat is waarom dit belangrijk is. De wet van Benford is eigenlijk een herinnering dat de werkelijkheid textuur heeft die je intuïtie mist. De cijfers om je heen zijn niet alleen tellingen, ze zijn vingerafdrukken. En soms is de snelste manier om een menselijke leugen te ontdekken dat je merkt dat de natuur meestal begint met 1.[1][2][3]


Bronnen

  1. Benford's Law, Wolfram MathWorld
  2. Benford's law, Wikipedia
  3. Ik heb je nummer, Journal of Accountancy
  4. Benford's Law gebruiken in fraude-onderzoeken, Case IQ