teorinë dhe statistikat e probabilitetit, një shpërndarje probabiliteti është funksioni matematik që jep probabilitetet e shfaqjes së rezultateve të ndryshme të mundshme për një eksperiment . [1] [2] Është një përshkrim matematik i një dukurie të rastit për sa i përket hapësirës së rezultateve së tij dhe probabiliteteve të ngjarjeve ( nëngrupe të hapësirës së kampionit). [3]

Për shembull, nëse përdoret për të treguar rezultatin e një hedhje monedhe ("eksperimenti"), atëherë shpërndarja e probabilitetit të do të merrte vlerën 0,5 (1 në 2 ose 1/2) për , dhe 0,5 për (duke supozuar se monedha është e ndershme ). Më shpesh, shpërndarjet e probabilitetit përdoren për të krahasuar shfaqjen relative të shumë vlerave të ndryshme.

E ç'është shpërndarja e probabilitetit?

Redakto

Një shpërndarje probabiliteti është një përshkrim matematikor i probabiliteteve të ngjarjeve, nënbashkësi të hapësirës së rezultateve . Hapësira e rezultateve, shpesh e shënuar me  , është grupi i të gjitha rezultateve të mundshme të një dukurie të rastit që po vëzhgohet; mund të jetë çdo grup: një grup numrash realë, një grup vektorësh, një grup vlerash arbitrare jo-numerike, etj. Për shembull, hapësira e mostrës së një rrokullisjeje monedhe do të ishte Ω = {kokë, pil} .

Për të përcaktuar shpërndarjet e probabilitetit për rastin specifik të ndryshoreve të rastësishme (në mënyrë që hapësira e rezultateve të mund të shihet si një grup numerik), është e zakonshme të bëhet dallimi midis ndryshoreve të rastit diskrete dhe absolutisht të vazhdueshme . Në rastin diskret, mjafton të specifikohet një funksion i masës së probabilitetit   caktimi i një probabiliteti për çdo rezultat të mundshëm: për shembull, kur hedhim një zar të drejtë, secila nga gjashtë vlerat 1 deri në 6 ka probabilitetin 1/6. Probabiliteti i një ngjarje më pas përcaktohet të jetë shuma e probabiliteteve të rezultateve që plotësojnë ngjarjen; për shembull, probabiliteti i ngjarjes "vërtet rrokulliset një vlerë e barabartë" është Në të kundërt, kur një ndryshore e rastit merr vlera nga një vazhdimësi, atëherë zakonisht, çdo rezultat në vetvete ka probabilitet zero dhe vetëm ngjarjet që përfshijnë pafundësisht shumë rezultate, të tilla si intervalet, mund të kenë probabilitet pozitiv.

Për shembull, merrni parasysh matjen e peshës së një cope proshutë në supermarket dhe supozoni se peshorja ka shumë shifra saktësi. Probabiliteti që peshon saktësisht 500 g është zero, pasi ka shumë të ngjarë të ketë disa shifra dhjetore jo zero. Megjithatë, mund të kërkohet, në kontrollin e cilësisë, që një paketë prej "500 g" proshutë duhet të peshojë midis 490 g dhe 510 g me probabilitet të paktën 98%, dhe kjo kërkesë është më pak e ndjeshme ndaj saktësisë së instrumenteve matëse.

 
Grafiku i majtë tregon një funksion të dendësisë së probabilitetit. Grafiku i djathtë tregon funksionin mbledhës të shpërndarjes, për të cilin vlera në a është e barabartë me sipërfaqen nën kurbën e dendësisë së probabilitetit në të majtë të a .

Përkufizimi i përgjithshëm i probabilitetit

Redakto

Një shpërndarje probabiliteti mund të përshkruhet në forma të ndryshme, si nga një funksion masiv probabiliteti ose një funksion shpërndarje mbledhëse. Një nga përshkrimet më të përgjithshme, i cili zbatohet për ndryshoret absolutisht të vazhdueshme dhe diskrete, është me anë të një funksioni probabiliteti.   hapësira hyrëse e të cilit   është një σ-algjebër, dhe jep një probabilitet të numrit real si dalje të tij, veçanërisht, një numër në   .

Funksioni i mësipërm i probabilitetit karakterizon vetëm një shpërndarje probabiliteti nëse plotëson të gjitha aksiomat e Kolmogorov, domethënë:

  1.  , pra probabiliteti është jo negativ
  2.  , pra asnjë probabilitet nuk tejkalon  
  3.   për çdo familje të ndarë të numërueshme grupesh  

Koncepti i funksionit të probabilitetit bëhet më rigoroz duke e përcaktuar atë si elementin e një hapësire probabiliteti  , ku   është grupi i rezultateve të mundshme,   është bashkësia e të gjitha nënbashkësive   probabiliteti i së cilës mund të matet, dhe   është funksioni i probabilitetit, ose masa e probabilitetit, që i cakton një probabilitet secilës prej këtyre nëngrupeve të matshme   . [4]

Një shpërndarje probabiliteti, hapësira e rezultateve të së cilës është njëdimensionale (për shembull numrat realë ose numrat binarë) quhet univariate/njëndryshore, ndërsa një shpërndarje, hapësira e rezultateve së së cilës është një hapësirë vektoriale me dimension 2 ose më shumë quhet multivariate/shumëndryshore . Një shpërndarje e njëanshme jep probabilitetet e një ndryshoreje të vetme të rastit që merr vlera të ndryshme; një shpërndarje shumëndryshore (një shpërndarje e përbashkët probabiliteti ) jep probabilitetet e një vektori të rastit - një listë me dy ose më shumë ndryshore të rastit - duke marrë kombinime të ndryshme vlerash. Shpërndarjet e rëndësishme dhe të zakonshme të probabilitetit të njëanshëm përfshijnë shpërndarjen binomiale, shpërndarjen hipergjeometrike dhe shpërndarjen normale . Një shpërndarje shumëndryshore e hasur zakonisht është shpërndarja normale shumëndryshore .

 
Funksioni e dendësisë së probabilitetit (pdf) i shpërndarjes normale, i quajtur edhe gausian ose "lakorja këmbanë", shpërndarja më e rëndësishme absolutisht e vazhdueshme. Siç vërehet në figurë, probabilitetet e intervaleve të vlerave korrespondojnë me zonën nën kurbë.

Terminologjia

Redakto

Disa koncepte dhe terma kyç, të përdorur gjerësisht në literaturë mbi temën e shpërndarjeve të probabilitetit, janë renditur më poshtë. [1]

Termat thelbësorë

Redakto
  • Ndryshorja e rastit : merr vlera nga një hapësirë rezultatesh; probabilitetet përshkruajnë se cilat vlera dhe grup vlerash merren më shumë.
  • Ngjarje : grup vlerash (rezultatesh) të mundshme të një ndryshoreje të rastit që ndodh me një probabilitet të caktuar.
  • Funksioni i probabilitetit ose masa e probabilitetit : përshkruan probabilitetin   se ngjarja   ndodh. [5]
  • Funksioni mbledhës i shpërndarjes : funksioni që vlerëson probabilitetin  do të marrë një vlerë më të vogël ose të barabartë me   për një ndryshore të rastit (vetëm për ndryshore të rastit me vlera reale).
  • Funksioni kuantil : inversi i funksionit të shpërndarjes mbledhëse. Jep   të tillë që, me probabilitet  ,   nuk do të kalojë   .

Shpërndarjet diskrete të probabilitetit

Redakto
  • Shpërndarja diskrete e probabilitetit : për shumë ndryshore të rastit me shumë vlera të fundme ose pafundësisht të numërueshme.
  • Funksioni i masës së probabilitetit ( fmp ): funksion që jep probabilitetin që një ndryshore e rastit diskrete të jetë e barabartë me një vlerë.
  • Shpërndarja e frekuencës : një tabelë që shfaq frekuencën e rezultateve të ndryshme in a sample .
  • Shpërndarja relative e frekuencës : një shpërndarje frekuence ku secila vlerë është ndarë (normalizuar) me një numër rezultatesh në një popullim (p.sh. madhësia e kampionit).
  • Shpërndarja kategorike : për ndryshore të rastit diskrete me një grup vlerash të fundme.

Shpërndarjet absolutisht të vazhdueshme

Redakto
  • Shpërndarja absolutisht e vazhdueshme : për shumë ndryshore të rastit me shumë vlera të panumërta.
  • Funksioni i dendësisë së probabilitetit ( fdp ) ose dendësia e probabilitetit : funksion vlera e të cilit në çdo popullim të caktuar (ose pikë) në hapësirën e popullimit (bashkësia e vlerave të mundshme të marra nga ndryshorja e rastit) mund të interpretohet se ofron një gjasë relative që vlera e ndryshores së rastit do të ishte e barabartë me atë kampion.

Terma të ndërlidhura

Redakto
  • <i id="mw6Q">Bashkësia e përcaktimit</i> : grup vlerash që mund të supozohen me probabilitet jozero nga ndryshorja e rastit. Për një ndryshore të rastit  , ndonjëherë shënohet si   .
  • Bishtat : [6] rajonet afër kufijve të ndryshores së rastit, nëse fmp ose fdp janë relativisht të ulëta aty. Zakonisht ka formën  ,   ose një bashkim i tyre.
  • Koka : [6] rajoni ku fmp ose fdp është relativisht i lartë. Zakonisht ka formën   .
  • Pritja matematike : mesatarja e peshuar e vlerave të mundshme, duke përdorur probabilitetet e tyre si pesha.
  • Mediana : vlera e tillë që gjysma e të dhënave ndodhen mbi të dhe gjysma e të dhënave nën të.
  • Moda : për një ndryshore të rastit diskrete, vlera me probabilitetin më të lartë; për një ndryshore të rastit absolutisht të vazhdueshme, një vendndodhje në të cilën funksioni i dendësisë së probabilitetit ka një kulm vendor.
  • Kuantili : Q-kuantili është vlera   në mënyrë që   .
  • Varianca : momenti i dytë i fmp ose fdp rreth mesatares; një masë e rëndësishme e shpërndarjes së shpërndarjes.
  • Shmangia standarde : rrënja katrore e variancës, dhe si rrjedhim një masë tjetër e dispersionit.
  • <i id="mwARA">Simetria</i> : një veti e disa shpërndarjeve në të cilat pjesa e shpërndarjes në të majtë të një vlere specifike (zakonisht mediana) është një imazh pasqyrë i pjesës në të djathtë të saj.
  • Shtrirja/Anësia : një masë e animit në të cilën një fmp ose fdp "angjet" në njërën anë të mesatares së saj. Momenti i tretë i standardizuar i shpërndarjes.
  • Kurtoza : një masë e "dhjamosjes" së bishtave të një fdp ose fmp. Momenti i katërt i standardizuar i shpërndarjes.

Funksioni mbledhës i shpërndarjes

Redakto

Në rastin e veçantë të një ndryshoreje të rastit me vlera reale, shpërndarja e probabilitetit mund të përfaqësohet në mënyrë të njëvlershme nga një funksion mbledhës i shpërndarjes në vend të një mase probabiliteti. Funksioni mbledhës i shpërndarjes së një ndryshoreje rasti   në lidhje me një shpërndarje probabiliteti   përkufizohet si Funksioni mbledhës i shpërndarjes i çdo ndryshoreje të rastit me vlera reale ka vetitë:

  •   është jozbritës;
  •   është i vazhdueshëm nga e djathta ;
  •   ;
  •   dhe   ; dhe
  •   .

Në të kundërt, çdo funksion   që plotëson katër të parat nga vetitë e mësipërme është funksioni i shpërndarjes mbledhëse i ndonjë shpërndarje probabiliteti në numrat realë. [7]

Shpërndarja diskrete e probabilitetit

Redakto
 
Funksioni i masës së probabilitetit (fmp)   specifikon shpërndarjen e probabilitetit për shumën   të numërimeve nga dy zare . Për shembull, figura tregon se   . Fmp lejon llogaritjen e probabiliteteve të ngjarjeve si p.sh  , dhe të gjitha probabilitetet e tjera në shpërndarje.
 
Funksioni i masës së probabilitetit të një shpërndarje diskrete probabiliteti. Probabilitetet e njëtoneve {1}, {3} dhe {7} janë përkatësisht 0.2, 0.5, 0.3. Një grup që nuk përmban asnjë nga këto pika ka probabilitet zero.
 
FMSH i një shpërndarje diskrete probabiliteti, . . .
 
... i një shpërndarjeje të vazhdueshme probabiliteti, . . .
 
... i një shpërndarje e cila ka një pjesë të vazhdueshme dhe një pjesë diskrete

Një shpërndarje diskrete probabiliteti është shpërndarja e probabilitetit të një ndryshoreje të rastit që mund të marrë vetëm një numër të numërueshëm vlerash [8] ( pothuajse me siguri ) [9] që do të thotë se probabiliteti i çdo ngjarjeje   mund të shprehet si një shumë (e fundme ose e pafundme e numërueshme ): ku   është një bashkësi e numërueshme me   . Kështu, ndryshoret diskrete të rastit (dmth. ndryshoret e rastit, shpërndarjet e probabilitetit të së cilave janë diskrete) janë pikërisht ato me një funksion të masës së probabilitetit   . Në rastin kur gama e vlerave është pafundësisht e numërueshme, këto vlera duhet të zbresin në zero aq shpejt sa probabilitetet të mblidhen deri në 1. Për shembull, nëse   për  , shuma e probabiliteteve do të ishte   .

Shpërndarjet e njohura diskrete të probabilitetit të përdorura në modelimin statistikor përfshijnë shpërndarjen Poisson, shpërndarjen Bernoulli, shpërndarjen binomiale, shpërndarjen gjeometrike, shpërndarjen binomiale negative dhe shpërndarjen kategorike . [3]

Funksioni mbledhës i shpërndarjes

Redakto

Një ndryshore e rastit diskrete me vlera reale mund të përkufizohet në mënyrë të njëvlershme si një ndryshore e rastit funksioni i shpërndarjes mbledhëse të së cilës rritet vetëm nga ndërprerjet e kërcimit - domethënë, fmsh-ja e saj rritet vetëm aty ku "kërcen" në një vlerë më të lartë dhe është konstante në intervale pa kërcime. Pikat ku ndodhin kërcimet janë pikërisht vlerat që mund të marrë ndryshorja e rastit. Kështu funksioni i shpërndarjes mbledhëse ka formën 

Shpërndarja absolutisht e vazhdueshme

Redakto

Një shpërndarje probabiliteti absolutisht e vazhdueshme është një shpërndarje probabiliteti mbi numrat realë me shumë vlera të panumërta të mundshme, siç është një interval i plotë në vijën reale, dhe ku probabiliteti i çdo ngjarjeje mund të shprehet si një integral. [10] Më saktësisht, një ndryshore reale e rastit   ka një shpërndarje probabiliteti absolutisht të vazhdueshme nëse ka një funksion   të tillë që për çdo interval   probabiliteti i   i perket   jepet nga integrali i   gjatë   : [11] [12] Ky është përkufizimi i një funksioni të dendësisë së probabilitetit, kështu që shpërndarjet absolutisht të vazhdueshme të probabilitetit janë pikërisht ato me një funksion të dëndësisë së probabilitetit. Në veçanti, probabiliteti që   të marrë ndonjë vlerë të vetme   (kjo dmth,   ) është zero, sepse një integral me kufijtë e sipërm dhe të poshtëm që përputhen është gjithmonë i barabartë me zero. Nëse intervali   zëvendësohet me çdo grup të matshëm  , barazia përkatëse vazhdon ende: 

Funksioni mbledhës i shpërndarjes

Redakto

Shpërndarjet absolutisht të vazhdueshme të probabilitetit siç përcaktohen më sipër janë pikërisht ato me një funksion të shpërndarjes mbledhëse absolutisht të vazhdueshme . Në këtë rast, funksioni i shpërndarjes mbledhëse   ka formën ku   është një dëndësi e ndryshores së rastit   në lidhje me shpërndarjen   .

Shënim mbi terminologjinë: Shpërndarjet absolutisht të vazhdueshme duhet të dallohen nga shpërndarjet e vazhdueshme, të cilat janë ato që kanë një funksion të shpërndarjes mbledhëse i cili është i vazhdueshëm.

  1. ^ a b Everitt, Brian (2006). The Cambridge dictionary of statistics (bot. 3rd). Cambridge, UK: Cambridge University Press. ISBN 978-0-511-24688-3. OCLC 161828328. {{cite book}}: Mungon ose është bosh parametri |language= (Ndihmë!) Gabim referencash: Invalid <ref> tag; name ":02" defined multiple times with different content
  2. ^ Ash, Robert B. (2008). Basic probability theory (bot. Dover). Mineola, N.Y.: Dover Publications. fq. 66–69. ISBN 978-0-486-46628-6. OCLC 190785258. {{cite book}}: Mungon ose është bosh parametri |language= (Ndihmë!)
  3. ^ a b Evans, Michael; Rosenthal, Jeffrey S. (2010). Probability and statistics: the science of uncertainty (bot. 2nd). New York: W.H. Freeman and Co. fq. 38. ISBN 978-1-4292-2462-8. OCLC 473463742. {{cite book}}: Mungon ose është bosh parametri |language= (Ndihmë!) Gabim referencash: Invalid <ref> tag; name ":1" defined multiple times with different content
  4. ^ Billingsley, P. (1986). Probability and measure. Wiley. ISBN 9780471804789. {{cite book}}: Mungon ose është bosh parametri |language= (Ndihmë!)
  5. ^ Chapters 1 and 2 of Vapnik (1998)
  6. ^ a b More information and examples can be found in the articles Heavy-tailed distribution, Long-tailed distribution, fat-tailed distribution
  7. ^ Erhan, Çınlar (2011). Probability and stochastics. New York: Springer. fq. 57. ISBN 9780387878584. {{cite book}}: Mungon ose është bosh parametri |language= (Ndihmë!)
  8. ^ Erhan, Çınlar (2011). Probability and stochastics. New York: Springer. fq. 51. ISBN 9780387878591. OCLC 710149819. {{cite book}}: Mungon ose është bosh parametri |language= (Ndihmë!)
  9. ^ Cohn, Donald L. (1993). Measure theory. Birkhäuser. {{cite book}}: Mungon ose është bosh parametri |language= (Ndihmë!)
  10. ^ Jeffrey Seth Rosenthal (2000). A First Look at Rigorous Probability Theory. World Scientific. {{cite book}}: Mungon ose është bosh parametri |language= (Ndihmë!)
  11. ^ Chapter 3.2 of DeGroot & Schervish (2002)
  12. ^ Bourne, Murray. "11. Probability Distributions - Concepts". www.intmath.com (në anglishte amerikane). Marrë më 2020-09-10.
  NODES