Co je Benfordův zákon

 - Matematický zákon v roce 1938 popsal fyzik Frank Benford.
- Říká, že v mnoha souborech přirozených dat čísla mnohem častěji začínají číslicí 1 než jinými číslicemi. Čím vyšší je počáteční číslice, tím nepravděpodobněji se na začátku čísel objevuje.
- Zákon platí pro data z přírodního světa nebo i pro sociálně či ekonomicky významné údaje.
- Pro dostatečnou platnost zákona stačí mít výsledky v rozsahu alespoň tří řádů.

Zdroj: Ekonom

Kdo má v EU nejhorší statistiky

 (podle Benfordova zákona)

1. Rumunsko
2. Řecko
3. Lotyšsko
4. Belgie
5. Rakousko
6. Estonsko
7. Bulharsko
8. Dánsko
9. Irsko
10. Finsko
11. Litva
12. Slovensko
13. Německo
14. Itálie
15. Kypr
16. Slovinsko
17. Španělsko
18. Francie
19. Švédsko
20. Malta
21. Velká Británie
22. Česká republika
23. Lucembursko
24. Portugalsko
25. Maďarsko
26. Polsko
27. Nizozemsko

Zdroj: German Economic Review

Kouzlení s čísly, statistikami a ekonomickými daty je poměrně populární disciplína. Kupříkladu Řecko se jen díky ní mohlo stát členem eurozóny. Podobně lze ale falšovat kdeco - finanční výkazy, údaje v daňovém přiznání, volební výsledky či nejrůznější makroekonomické statistiky.

Méně se už ví, že kreativně upravené údaje je poměrně snadné odhalit. Stačí k tomu v zásadě jen dvě věci: Znalost matematického Benfordova zákona a běžný počítač.

Čtveřice německých profesorů, Bernhard Rauch, Max Göttsche, Garnot Brähler a Stefan Engel, se takto vybavila a zkontrolovala ekonomické statistiky všech členských zemí Evropské unie za posledních 10 let.

Závěr je jednoznačný a potvrzuje to, co už ostatně vyšlo najevo - mezi zeměmi eurozóny předvádějí největší triky s čísly Řekové. Jenže jejich ekonomická data zdaleka nejsou jediná, která vyvolávají pochybnosti. Ještě podivnější statistiky vykazují Rumuni. Třetí v řadě podezřelých je země ze samého srdce Evropské unie - Belgie.

"Nejpodezřelejší země eurozóny jsou Řecko a Belgie. Řecko už ostatně bylo z manipulace se svými makroekonomickými údaji usvědčeno. Belgie má vysoký státní dluh, což může být podnětem pro jistou úpravu dat. Ze států mimo eurozónu vykazuje nejvyšší odchylky od Benfordova zákona Rumunsko. To ale možná doplácí zejména na špatně fungující státní aparát," řekl týdeníku Ekonom jeden z autorů studie Garnot Brähler z Technické univerzity v německé Ilmenavě.

Naopak nejvěrohodnější ekonomické statistiky mají podle studie Nizozemci a Poláci. Test potvrdil i relativní spolehlivost českých statistik.

Jenže i zdánlivě bezproblémové země mají podle všeho škraloup. Výsledky studie dokazují, že když to evropské země potřebují, dokážou své statistiky hbitě přizpůsobit unií požadovaným výsledkům. Patrné je to zejména v období, kdy se blížil vstup do eurozóny či do Evropské unie.

Řeky, hory, peníze

Co přesně Benfordův zákon říká? Čísla v souborech dat začínají nejčastěji číslicí 1, a to zhruba ve 30 procentech případů, šestkrát častěji než číslicí 9. Jinými slovy, čím vyšší je počáteční číslice, tím méně se na začátku čísel objevuje. Tedy - z tisíce čísel ve stejném souboru dat jich bude přibližně 300 začínat jedničkou, 176 dvojkou, ale jen 46 bude mít na prvním místě devítku.

"Nejde o žádný matematický trik, ale o skutečný přírodní zákon, jímž se řídí soubory jakýchkoli přirozených dat bez ohledu na jejich podstatu nebo fyzikální jednotky. Jedinou podmínkou je, že data musejí být v minimálním rozsahu tří desítkových řádů," popsal zákon ve svém článku pro časopis Vesmír fyzik Pavel Kantorek, profesor fyzikálních věd na Ryersonově univerzitě v Torontu.

Jenže když lidé vědomě falšují data a čísla si vymýšlejí, či zpětně poupravují, přijde jim věrohodnější, pokud používají na začátku všechny číslice zhruba stejně často. A právě na nadměrném, či naopak méně častém výskytu počátečních čísel, která by podle Benfordova zákona takové zastoupení mít neměla, se dá se značnou mírou pravděpodobnosti vytipovat podezřelá statistika. Zákon platí prakticky pro všechny oblasti, ať jde o výpisy z účtů, čísla popisná, daňová přiznání či třeba výšku hor či délku řek. Aplikace Benfordova zákona je díky tomu dalekosáhlá. "Máme-li větší soubor jakýchkoli dat, můžeme poměrně jednoduchým statistickým rozborem lehce zjistit, jsou-li skutečná, nebo podezřelá," píše Kantorek.

Podezřelí jsou všichni

Čtveřice německých profesorů se takto rozhodla ověřit relevanci makroekonomických dat, které členské státy EU dodávají Eurostatu. Výsledky jsou pozoruhodné.

"V Evropské unii je patrný tlak na to, aby data byla co možná nejvíce v souladu s požadavky Paktu růstu a stability. A proto se vlády, podobně jako firmy, mohou snažit o to, aby jejich ekonomická situace vypadala lépe, než jaká je ve skutečnosti," říkají v úvodu své práce autoři, kteří výsledky publikovali v odborném měsíčníku German Economic Review.

Závěry jim dávají za pravdu. Studie naznačuje evidentní snahu jednotlivých zemí vyhovět před vstupem do eurozóny Maastrichtským kritériím. Například v letech 1999 až 2001, tedy v době před zavedením eura, náhlé a často výrazné odchylky od toho, co předpokládá Benfordův zákon, vykázalo kromě Řecka zejména Rakousko a Portugalsko, dále Lucembursko, Finsko a Francie. Po zavedení eura se už statistiky většiny zemí vrátily do normálu, respektive do souladu s očekáváním Benfordova zákona.

Obdobný trend lze sledovat i u dalších zemí mířících do eurozóny. Slovensko jednotnou měnu přijalo v lednu 2009 a makroekonomické statistiky z let 2007 a 2008 naznačují, že oficiální údaje mohly být upravené. V tomto období Slovensko muselo svoji měnu udržet v přesně vymezeném kurzovém pásu vůči euru. Kdyby však z trhů začaly chodit špatné zprávy (anebo naopak velmi dobré), byl by to prakticky neřešitelný problém a země by na euro muselo zapomenout. Podobné to bylo i v případě Malty. Zde se eurem začalo platit v roce 2008 a dvě předcházející léta mohou též zpětně vyvolat podezření z manipulace s daty. Rovněž před vstupem do Evropské unie v roce 2004 Benfordův test odhalil možné nesrovnalosti v datech Polska a Maďarska. S čistým štítem ovšem Benfordovým testem neprošly ani české statistiky z roku 2002, kdy se země také chystala na vstup do unie.

Jde mimochodem o stejný rok, kdy Český statistický úřad zaznamenal asi největší skandál s nevěrohodnými či chybnými statistikami, jakkoli šlo spíše o chybu lidského faktoru než o úmysl.

V lednu 2003 čeští statistici přiznali, že půl roku chybně do dat o zahraničním obchodu počítali i reexportované zboží. Kvůli tomu se deficit obchodní bilance zvýšil o 40 miliard korun a snížil se růst HDP. Poté, co ČSÚ na chybu přišlo a revidovalo údaje, ukázalo se, jak velký dopad to mělo. Údaj o HDP po přepočtu vyskočil téměř o polovinu, z 1,5 procenta na 2,7 procenta.

Poté, co české pochybení potvrdil i Eurostat, tehdejší předsedkyně ČSÚ Marie Bohatá na svoji funkci rezignovala. Aktuální české statistiky odcházející do centrály Eurostatu v Bruselu Benfordovým testem prošly bez potíží.


INFOGRAFIKA: Řecko kouzlí se statistikami

Výskyt počátečních čísel podle Benfordova zákona

banner 2

 

 

Více se dočtete v novém vydání týdeníku Ekonom, který vyšel ve čtvrtek 13. října.

Související