Funzione di ripartizione empirica

In statistica e teoria della probabilità, la funzione di ripartizione empirica (o funzione cumulativa empirica o ECDF) è una funzione di variabile reale che rappresenta la funzione di ripartizione della misura empirica di un campione. La funzione di ripartizione empirica è una stima della vera funzione di ripartizione che ha generato il campione e grazie al teorema di Glivenko-Cantelli è possibile affermare che essa converge per con probabilità 1 alla distribuzione del campione[1].

La linea verde identifica la funzione di ripartizione di una variabile casuale normale. La linea blu è la funzione di ripartizione empirica calcolata a partire dal campione normale indicato in grigio sull'asse X

Definizione

modifica

Siano     variabili indipendenti e identicamente distribuite con la stessa funzione di ripartizione  . Allora, la funzione di ripartizione empirica può essere scritta come[2][3]:

 

dove   è la funzione indicatrice, uguale a 1 se   e uguale a 0 altrimenti. È possibile equivalentemente scriverla nella sua forma estesa come[4]:

 

Da cui segue che

 

Proprietà

modifica

La funzione di ripartizione empirica è uno stimatore corretto e consistente della funzione di ripartizione.

  1. ^ (EN) Azeem M. Shaikh, The Glivenko-Cantelli Theorem (PDF), su home.uchicago.edu, Università di Chicago.
  2. ^ Federico M. Stefanini, Frequenze relative e distribuzioni empiriche, su local.disia.unifi.it, Università di Firenze. URL consultato il 19 febbraio 2018 (archiviato dall'url originale il 18 marzo 2018).
  3. ^ (EN) van der Vaart, Asymptotic statistics, Cambridge University Press, 1998, p. 265, ISBN 0-521-78450-6.
  4. ^ Diego Zappa e Silvia Facchinetti, Appunti di statistica, 2013, p. 176, ISBN 9788867800506.

Altri progetti

modifica
  Portale Statistica: accedi alle voci di Wikipedia che trattano di statistica
  NODES
Note 2