התפלגות בינומית של פואסון
| מאפיינים | |
|---|---|
| פרמטרים |
– ההסתברות להצלחה לכל ניסוי i, n – מספר ניסויי ברנולי |
| תומך | k ∈ { 0, …, n } |
|
פונקציית הסתברות (pmf) | |
|
פונקציית ההסתברות המצטברת (cdf) | |
| תוחלת | |
| שונות | |
|
פונקציה יוצרת מומנטים (mgf) | |
| פונקציה אופיינית | |
| צידוד | |
| גבנוניות | |
בתורת ההסתברות, התפלגות בינומית של פואסון היא התפלגות בדידה של סכום משתנים מקריים בעלי התפלגות ברנולי, כאשר המשתנים המקריים לא בהכרח מתפלגים בהתפלגות זהה. ההתפלגות נקראת על שמו של סימאון דני פואסון שהציג אותה לראשונה במאמר בשנת 1837.[1]
ההתפלגות מתארת את מספר ההצלחות ב-n ניסויי ברנולי בלתי תלויים, עם תוצאה הצלחה או כישלון כאשר ההסתברות להצליח בניסוי ה-i היא , ואינו תלוי בניסויים אחרים. ההתפלגות הבינומית היא מקרה פרטי של התפלגות בינומית של פואסון, בו כל הסתברויות ההצלחה זהות בין הניסויים, כלומר .
תכונות
פונקציית ההסתברות
ההסתברות לקבל מספר הצלחות k מתוך n ניסוי ברנולי מתוארת על ידי הסכום [2]
כאשר היא קבוצת כל תתי הקבוצות בגודל k שניתן לבחור מתוך . כל קבוצה A כוללת בחירה של k ניסויים מתוך ה-n האפשריים. היא הקבוצה המשלימה ל-A וכוללת את כל הניסויים מתוך ה-n האפשריים שלא נבחרו לקבוצה A. הגודל של קבוצה זו הוא בהתאמה . הוא ההסתברות להצלחה בניסוי ה-i.
חישוב באמצעות רקורסיה
במקרים בהם מספר הניסויים גדול, היא קבוצה גדולה לחישוב ישיר של ההסתברות. דרך נוספת לחישובה, במקרה שאף אחת מההסתברויות להצלחה לא שווה ל-1 היא באמצעות נוסחת רקורסיה [3] [4]
כאשר
נוסחה זו אינה יציבה נומרית, ולא כדאי להשתמש בה עבור ערכי גדולים (ככלל אצבע אפשר להשתמש עד ).
חישוב באמצעות אלגוריתם הפרד ומשול
שיטת חישוב נוספת היא באמצעות אלגוריתם הפרד ומשול. בהנחה ש- עבור . בעזרת קונבולוציה נוכל לכתוב
כאשר היא ההתפלגות הבינומית של פואסון לניסויים i עד j עם הסתברויות להצלחה, . השיטה כוללת חישוב קונבולוציה של וקטורים עם הסתברות הצלחה וכישלון . שיטה זאת ניתנת ליישום באלגוריתם הקונבולוציה הישירה (direct convolution (DC) algorithm). האלגוריתם מחזיר את ההסתברות לכל ובהתאמה עבור k ספציפי ההסתברות מתקבלת ב-PMF[k].
# PMF and nextPMF begin at index 0
function DC(p₁, ..., pₙ) is
declare new PMF array of size 1
PMF[0] = [1]
for i = 1 to n do
declare new nextPMF array of size i + 1
nextPMF[0] = (1 - pᵢ) * PMF[0]
nextPMF[i] = pᵢ * PMF[i - 1]
for k = 1 to i - 1 do
nextPMF[k] = pᵢ * PMF[k - 1] + (1 - pᵢ) * PMF[k]
repeat
PMF = nextPMF
repeat
return PMF
end function
אלגוריתם זה הוא יעיל ומהיר גם ל-n גדול (עד בערך ) והוא יכול להיות מהיר גם ל-n גדול יותר כתלות ב-.[5]
חישוב באמצעות התמרת פורייה בדידה
דרך נוספת לחישוב ההסתברות היא באמצעות התמרת פורייה בדידה[6]
כאשר ו- .
פונקציית ההסתברות המצטברת
פונקציית ההסתברות המצטברת מחושבת על ידי
כאשר היא קבוצת כל תתי הקבוצות בגודל של ניסויים שניתן לבחור מתוך סך n הניסויים. מכיוון שפונקציית ההסתברות המצטברת ל-k היא סכום ההסתברויות לקבל ערכים שקטנים מ-k, ניתן להיעזר בשיטת החישוב עם אלגוריתם DC ולסכום את כל התוצאות מהאינדקס הראשון 0 ועד ל-k (כולל).
תוחלת ושונות
התוחלת של משתנה בינומי של פואסון הוא סכום התוחלות של כל משתני הברנולי המייצגים את n הניסויים. מכיוון שהניסויים בלתי תלויים והתוחלת ליניארית התוחלת של המשתנה תהיה סכום התוחלות של כל משתנה ברנולי עם הסתברות להצלחה .
באותו אופן גם השונות תהיה סכום השונויות של כל משתני הברנולי
אנטרופיה
אין נוסחה פשוטה לחישוב האנטרופיה אך מחקרים קודמים מצאו תכונות שיכולות לסייע במקרים מסומים.
האנטרופיה של התפלגות בינומית של פואסון חסומה התפלגות בינומית עם אותו מספר הפרמטרים (אותו מספר הניסויים) עם אותה התוחלת[7]
השערת הקעירות של שפ-אולקין (Shepp–Olkin concavity conjecture), שהוצגה על ידי לורנס שפ ואינגרם אולקין בשנת 1981, והוכחה על ידי ארוואן היליון ואוליבר ג'ונסון בשנת 2015[8], מראה כי האנטרופיה היא פונקציה קעורה של הסתברויות ההצלחה של כל אחד מהניסויים .[9]
השערה נוספת מאותו המאמר המכונה השערת המונוטוניות של שפ–אולקין (Shepp–Olkin monotonicity conjecture) מראה כי כאשר כל האנטרופיה היא פונקציה מונוטונית עולה ב-, גם השערה זאת הוכחה על ידי היליון וג׳ונסון בשנת 2019.[10]
דוגמה
נניח ניסוי שבו נערך מבחן בכיתה בה 30 תלמידים, כל תלמיד יכול לעבור את המבחן או להיכשל בו. במקרה שבו הכיתה זהה לגמרי כך שההסתברות להצלחה של כל תלמיד להצליח זהה ובלתי תלויה באחרים, נוכל לתאר את הניסוי על ידי התפלגות בינומית. במקרה בו ההסתברות של כל תלמיד להצליח במבחן שונה וגם אינה תלויה בתלמיד אחר, כלומר לכל תלמיד הסתברות הצלחה שונה, נתאר את הניסוי בעזרת התפלגות בינומית של פואסון. נניח שלתלמיד ה- יש הסתברות הצלחה של .
נחשב את התוחלת של ההתפלגות: . כלומר מספר התלמידים הצפוי לעבור את המבחן במקרה שנבצע את הניסוי מספר רב של פעמים הוא 27.
נשווה למקרה בו הכיתה הייתה מתפלגת בינומית, וההסתברות של כל תלמיד להצליח הוא ממוצע ההסתברויות מההתפלגות המקורית, כלומר . במקרה זה התוחלת של הניסוי הייתה . נשים לב כי קיבלנו תוחלת זהה להתפלגות הבינומית של פואסון, כלומר מספר העוברים (במקרה של ביצוע הניסוי מספר רב של פעמים) זהה בין ההתפלגויות ושווה לבערך 27. זה לא מקרי שכן אופן החישוב של תוחלת ההתפלגות הבינומית הוא מכפלת כמות התלמידים בהסתברות להצלחה. אך הסתברות זאת היא בדיוק סכום הסתברויות ההצלחה של ההתפלגות הבינומית של פואסון (שהוא התוחלת של התפלגות זאת) לחלק למספר הניסויים.
נחשב את השונות של ההתפלגות: . בנוסף נחשב במקרה של ההתפלגות הבינומית המתאימה . נשים לב כי השונות גבוהה יותר במקרה של ההתפלגות הבינומית הסטנדרטית. במקרה שתיארנו ככל שנבצע יותר ניסויים נתקרב למספר תלמידים שהצליחו כמו התוחלת שיצאה זהה בשני המקרים. אך בהתפלגות הבינומית של פואסון, שבמקרה זה נותנת להרבה תלמידים הסתברות גבוהה יותר להצליח לעומת ההסתברות להצליח במקרה הבינומי, נקבל שונות נמוכה יותר שמצביעה על פיזור נמוך יותר ביחס לתוחלת.
התפלגויות קשורות
הקשר להתפלגות בינומית
ההתפלגות הבינומית הסטנדרטית היא מקרה פרטי של ההתפלגות הבינומית של פואסון כאשר ההסתברות להצלחה בכל הניסויים זהה. כתוצאה מכך את ההתפלגות הבינומית של פואסון ניתן לשערך באמצעות התפלגות בינומית סטנדרטית כאשר ההסתברות להצלחה בכל הניסויים זהה ושווה לתוחלת של ההתפלגות הבינומית של פואסון, כלומר התוחלת של .
כמו כן, השונות של ההתפלגות הבינומית של פואסון ניתנת לחישוב על ידי השונות של ההתפלגות הבינומית הרגילה על ידי המרחק של כל הסתברות להצלחה מהתוחלת ובפרט
המקסימום של השונות מתקבל כאשר לכל i, ובפרט כאשר ההתפלגות זהה להתפלגות הבינומית.
הקשר בין השונויות מאפשר לשים חסם על מרחק השונות הכוללת של ההתפלגות הבינומית וההתפלגות הבינומית של פואסון מה שבעצם מאפשר לחסום את השגיאה בהערכת ההתפלגות הבינומית של פואסון בעזרת ההתפלגות הבינומית הסטנדרטית. נגדיר את כאשר היא התוחלת של כל ה- ואת להיות המרחק השונות הכוללת בין ההתפלגויות ואז
כאשר . מכאן שהמרחק שואף ל-0 אם ורק אם שואף ל-1.[11]
הקשר להתפלגות פואסון
ההתפלגות הבינומית של פואסון (נסמן ב-) ניתנת לשערוך באמצעות התפלגות פואסון עם תוחלת . ברבור והול הראו שניתן לחסום את המרחק שונות הכוללת בין התפלגויות אלו על ידי[12]
במקרה זה ניתן לראות שככל ש- קטנים יותר כך גם מרחק השונות הכוללת בין ההתפלגויות ובפרט השערוך של התפלגות פואוסן את ההתפלגות הבינומית של פואסון.
בנוסף, ניתן לחסום את השונות של ההתפלגות הבינומית של פואסון על ידי השונות של התפלגות פואסון. השונות של התפלגות פואסו היא והשונות של התפלגות בינומית של פואסון היא
ונשים לב כי אכן מתקיים .
ראו גם
לקריאה נוספת
Wang, Y. William (2020). A Survey of Poisson Binomial Distribution. Columbia University — מאמר סקירה עדכני על התפלגות פואסון בינומית, כולל תכונות, אלגוריתמים ושימושים.
הערות שוליים
- ↑ Poisson, S. D. (1837). Recherches sur la Probabilité des Jugements en Matière Criminelle et en Matière Civile. Bachelier.
- ↑ Wang, Y. H. (1993). "On the number of successes in independent trials" (PDF). Statistica Sinica. 3 (2): 295–312.
- ↑ Shah, B. K. (1994). "On the distribution of the sum of independent integer valued random variables". American Statistician. 27 (3): 123–124. JSTOR 2683639.
- ↑ Chen, X. H.; A. P. Dempster; J. S. Liu (1994). "Weighted finite population sampling to maximize entropy" (PDF). Biometrika. 81 (3): 457. doi:10.1093/biomet/81.3.457.
- ↑ Chen, S. X.; J. S. Liu (1997). "Statistical Applications of the Poisson–Binomial and conditional Bernoulli distributions". Statistica Sinica. 7: 875–892.
- ↑ Fernandez, M.; S. Williams (2010). "Closed-Form Expression for the Poisson-Binomial Probability Density Function". IEEE Transactions on Aerospace and Electronic Systems. 46 (2): 803–817. Bibcode:2010ITAES..46..803F. doi:10.1109/TAES.2010.5461658. S2CID 1456258.
- ↑ Harremoës, P. (2001). "Binomial and Poisson distributions as maximum entropy distributions" (PDF). IEEE Transactions on Information Theory. 47 (5): 2039–2041. doi:10.1109/18.930936.
- ↑ Hillion, Erwan; Johnson, Oliver (2015-03-05). "A proof of the Shepp–Olkin entropy concavity conjecture". Bernoulli. 23 (4B): 3638–3649. arXiv:1503.01570. doi:10.3150/16-BEJ860. S2CID 8358662.
- ↑ Shepp, Lawrence; Olkin, Ingram (1981). "Entropy of the sum of independent Bernoulli random variables and of the multinomial distribution". In Gani, J.; Rohatgi, V.K. (eds.). Contributions to probability: A collection of papers dedicated to Eugene Lukacs. New York: Academic Press. pp. 201–206. ISBN 0-12-274460-8. MR 0618689.
- ↑ Hillion, Erwan; Johnson, Oliver (2019-11-09). "A proof of the Shepp–Olkin entropy monotonicity conjecture". Electronic Journal of Probability. 24 (126): 1–14. arXiv:1810.09791. doi:10.1214/19-EJP380.
- ↑ Ehm, Werner (1991-01-01). "Binomial approximation to the Poisson binomial distribution". Statistics & Probability Letters. 11 (1): 7–16. doi:10.1016/0167-7152(91)90170-V. ISSN 0167-7152.
- ↑ Barbour, A. D.; Hall, Peter (1984). "On the Rate of Poisson Convergence" (PDF). Mathematical Proceedings of the Cambridge Philosophical Society. 95 (3): 473–480. doi:10.1017/S0305004100061806 (לא פעיל 24 בדצמבר 2024).
{{cite journal}}: (עזרה)תחזוקה - ציטוט: DOI inactive as of 2024 (link)
התפלגות בינומית של פואסון41806135Q3258231