Statistika

vědní obor zabývající se sběrem, organizací, analýzou, interpretací a prezentací dat

Statistika je vědní obor, který se zabývá sběrem, organizací, analýzou, interpretací a prezentací empirických dat za účelem prohloubení znalostí určité oblasti, obvykle hromadného jevu.[1][2][3] Při aplikaci statistiky na vědecký, technický nebo společenský problém je třeba definovat výběrovou populaci a statistický model. Populace mohou být různé skupiny lidí nebo objektů, např. „všichni lidé žijící v určité zemi“ nebo „všechny atomy tvořící určitý krystal“. Protože často nelze zkoumat celé populace, odhadují se jejich vlastnosti na základě výběrů, což je náplní inferenční statistiky, která modeluje náhodnost výběrů a neurčitost dat pomocí teorie pravděpodobnosti. Statistika se zabývá všemi aspekty práce s daty, včetně plánování jejich sběru v podobě průzkumů a experimentů.[4] Cílem statistiky je získat „nejlepší“ informace z dostupných dat, proto ji někteří autoři označují jako součást teorie rozhodování.

Statistické metody

editovat

Popisná (deskriptivní) statistika

editovat
Podrobnější informace naleznete v článku Popisná statistika.

Zabývá se popisem stavu nebo vývoje hromadných jevů, které vykazují vliv náhody. Nejprve vymezí soubor entit, na nichž se bude uvažovaný jev zkoumat. Pak se všechny entity vyšetří z hlediska studovaného jevu. Výsledky šetření – kvalitativní i kvantitativní, vyjádřeny především číselným popisem – tvoří obraz studovaného hromadného jevu vzhledem k vyšetřovanému souboru.[5]

Inferenční statistika

editovat

Zatímco popisná statistika zkoumá soubory entit přímo, inferenční statistika je zkoumá prostřednictvím výběrů s využitím teorie pravděpodobnosti. Na získané údaje se pohlíží jako na výsledky určitého náhodného pokusu, který mohl dát i jiné výsledky. Všechny závěry inferenční statistiky tak mají pravděpodobnostní charakter.[6]

Statistické postupy lze zhruba rozdělit na metody konfirmační analýzy (např. intervaly spolehlivosti, regresní analýza ap.) a explorační analýzy, jako jsou např. shluková analýza, explorační faktorová analýza, metoda hlavních komponent (PCA), metoda GUHA (kombinační analýza dat), explorační analýza dat aj.

Základní rozdíl těchto dvou přístupů lze charakterizovat takto:

  1. V KA formulujeme hypotézu a metody KA použijeme k tomu, abychom ji potvrdili či vyvrátili.
  2. V EA máme k dispozici množství dat a od EA požadujeme, aby nám z nich vygenerovala nějaké hypotézy.

V matematické statistice se termínem „statistika“ označuje libovolná měřitelná funkce definovaná na výběrovém prostoru,[6] případně hodnoty nějaké takové funkce, které získáme provedením náhodného výběru.[7]

Historie

editovat
 
Karl Pearson, zakladatel matematické statistiky

První použití záznamů a jejich vývoje, a tedy i statistiky, můžeme nalézt v záznamech o hospodářekém a společenském životě starověkých kultur, které žily například v oblasti Mezopotámie, Sumeru, na Krétě, v Řecku, Egyptě a Číně. Ty úplně nejstarší zápisy, které vykazují známky sčítání lidu, pak nalezneme právě v Sumeru. Ve starověkém Egyptě se pak konal každé dva roky soupis dobytka[8].

První díla vztahovaná k pravděpodobnosti a statistikám se datují k arabským matematikům a kryptografům. Ti je vytvářeli v době Islámského zlatého věku. Al-Khalil (717–786) v tomto období napsal Knihu kryptografických myšlenek, která obsahuje první použití permutací a kombinací za cílem popsat co nejvíce arabských slov se samohláskami i bez nich.[9]

Ve středověku vznikaly takzvané Urbáře, což je obdoba novodobých statistických ročenek. Roku 1381 proběhlo první sčítáni lidu v Číně. Roku 1427 pak ve Florencii vznikl první soupis obyvatelstva.[10]

První evropskou publikací byla Natural and Political Observations upon the Bills of Mortality napsaná Johnem Grauntem v roce 1663.[11]

Matematické základy moderní statistiky položil rozvojem teorie pravděpodobnosti v 17. století, na které se podílel kupříkladu Gerolamo Cardano, Blaise Pascal či Pierre de Fermat.[12] Na přelomu 17. a 18. století byla vymyšlena metoda nejmenších čtverců. Její první použití v roce 1795 se připisuje Carlu Friedrichovi Gaussovi, i když k její publikaci došlo až v roce 1805 díky Adrienovi-Marie Legendremu.[13]

Zakladatelem matematické statistiky je Karl Pearson, který mimo jiné založil v roce 1911 na londýnské University College historicky první katedru statistiky.[14]

Použití moderních počítačů na konci 20. a začátku 21. století pomohlo vývoji statistické vědy. Statistika je i nadále oblastí výzkumu; příkladem toho je například problém s analýzou velkých dat.[15]

Reference

editovat

V tomto článku byl použit překlad textu z článku Statistics na anglické Wikipedii.

  1. Oxford Reference [online]. [cit. 2021-01-18]. Dostupné online. (anglicky) 
  2. ROMIJN, Jan-Willem. Stanford Encyclopedia of Philosophy [online]. 2014 [cit. 2021-01-18]. Kapitola Philosophy of statistics. Dostupné online. (anglicky) 
  3. Cambridge Dictionary [online]. [cit. 2021-01-18]. Dostupné online. (anglicky) 
  4. DODGE, Y. The Oxford Dictionary of Statistical Terms [online]. Oxford University Press, 2006. ISBN 0-19-920613-9. (anglicky) 
  5. HOMOLA, Vladimír. Úvod do statistiky [online]. [cit. 2020-02-15]. Dostupné online. 
  6. a b kolektiv autorů. Aplikovaná matematika. Praha: SNTL, 1978. 2386 s. (Oborové encyklopedie SNTL). S. 1899. 
  7. CLIL - Content and Language Integrated Learning, Statistika. www2.ef.jcu.cz [online]. [cit. 2020-02-14]. Dostupné v archivu pořízeném z originálu dne 2020-07-23. 
  8. KAČEROVÁ, Eva. Historie statistiky [online]. Praha: český statistický úřad, 28. dubna 2014 [cit. 2021-02-17]. Dostupné v archivu pořízeném dne 23-10-2020. 
  9. Natural and Political Observations upon the Bills of Mortality Dostupné online
  10. KAČEROVÁ, Eva. Historie statistiky [online]. Praha: ČSÚ, 2014, 28. duben [cit. 2021-02-17]. Dostupné v archivu pořízeném dne 23-10-2020. 
  11. WILLCOX, Walter (1938) "The Founder of Statistics".Dostupné online
  12. FRANKLIN, J. The Science of Conjecture: Evidence and Probability before Pascal, Johns Hopkins. [s.l.]: [s.n.], 2002. (anglicky) 
  13. STIGLER, Stephen. Gauss and the Invention of Least Squares. Annals of Statistics. 1981-05, roč. 9, čís. 3, s. 465–474. MR615423 Zbl: 0477.62001. Dostupné online [cit. 2020-05-14]. ISSN 0090-5364. DOI 10.1214/aos/1176345451. (anglicky) 
  14. Karl Pearson [online]. University of St Andrews, Scotland: School of Mathematics and Statistics University of St Andrews, Scotland [cit. 2020-05-15]. Dostupné online. (anglicky) 
  15. Science in a Complex World - Big Data: Opportunity or Threat? | Santa Fe Institute. www.santafe.edu [online]. [cit. 2020-05-14]. Dostupné v archivu pořízeném z originálu dne 2020-08-03. (anglicky) 

Související články

editovat

Externí odkazy

editovat
  NODES
Idea 1
idea 1
mac 3
os 39
text 2