‫מבוא להסתברות‪ :‬סיכום ודף נוסחאות‬ ‫ ‬ ‫‪n‬‬ ‫‪X‬‬ ‫‪n‬‬ ‫‪k‬‬ ‫‪= 2n−1 n‬‬ ‫‪k‬‬ ‫‪k=0‬‬ ‫‪n‬‬ ‫‪X n‬‬ ‫‪k2‬‬ ‫)‪= 2n−2 n (n + 1‬‬ ‫‪k‬‬ ‫גרסה ‪ ,1.1‬נובמבר ‪2010‬‬ ‫ברק שושני‬ ‫‪baraksh@gmail.com | http://baraksh.co.il/‬‬ ‫‪k=0‬‬ ‫‪1‬‬ ‫‪1.1‬‬ ‫סכום על האינדקס העליון‪:‬‬ ‫‬ ‫‬ ‫‬ ‫‬ ‫‪n‬‬ ‫‪X‬‬ ‫‪k‬‬ ‫‪n+1‬‬ ‫=‬ ‫‪m‬‬ ‫‪m+1‬‬ ‫קומבינטוריקה‬ ‫עקרון הספירה‬ ‫‪k=0‬‬ ‫אם בשלב הראשון של ניסוי כלשהו יש ‪ n‬תוצאות אפשריות‪,‬‬ ‫ולכל מספר זהויות שימושיות נוספות‪:‬‬ ‫יש‬ ‫אז‬ ‫אחת מתוצאות אלה יש ‪ m‬תוצאות אפשריות בשלב השני‪,‬‬ ‫ ‬ ‫ ‬ ‫‬ ‫בסה"כ ‪ nm‬תוצאות אפשריות לניסוי‪.‬‬ ‫‪n‬‬ ‫‪n−1‬‬ ‫‪n−1‬‬ ‫=‬ ‫‪+‬‬ ‫‪k‬‬ ‫‪k−1‬‬ ‫‪k‬‬ ‫‪ 1.2‬סידור ‪ n‬עצמים בשורה‪ :‬פרמוטציות‬ ‫‬ ‫‬ ‫ ‬ ‫‪n‬‬ ‫‪n n−1‬‬ ‫=‬ ‫‪k k−1‬‬ ‫‪k‬‬ ‫‪n! = n · (n − 1) · · · 3 · 2 · 1‬‬ ‫ ‬ ‫‬ ‫‪n‬‬ ‫‪k‬‬ ‫‪n‬‬ ‫‪n−m‬‬ ‫יש !‪ n‬דרכים שונות לסדר ‪ n‬עצמים בשורה‪ n :‬אפשרויות לעצם‬ ‫=‬ ‫הראשון‪ n − 1 ,‬אפשרויות לשני וכך הלאה עד שלעצם האחרון‬ ‫‪k‬‬ ‫‪m‬‬ ‫‪m k−m‬‬ ‫נשארת רק אפשרות אחת‪.‬‬ ‫ ‬ ‫‬ ‫ ‪n‬‬ ‫‪X‬‬ ‫‪m+k‬‬ ‫‪m+n+1‬‬ ‫יש !)‪ (n − 1‬דרכים לסדר ‪ n‬עצמים במעגל‪ :‬אם נסדר קודם את‬ ‫=‬ ‫העצמים בשורה ואז נצמיד את הראשון והאחרון נקבל מעגל‪ .‬אך‬ ‫‪k‬‬ ‫‪n‬‬ ‫‪k=0‬‬ ‫לאותו מעגל ניתן להגיע ב־‪ n‬צורות שונות )למשל עבור ‪:n = 3‬‬ ‫‪ 123, 231, 312‬כולם מייצגים את אותו המעגל( ולכן יש לחלק ב־‪ .n‬קיימים גם מקדמים מולטינומיים‪:‬‬ ‫לעצרת )קירוב סטירלינג( כאשר ∞ → ‪n‬‬ ‫ניתן לקבל קירוב טוב √ ‪n‬‬ ‫‬ ‫‬ ‫‪.n! ∼ ne‬‬ ‫באמצעות הנוסחה ‪2πn‬‬ ‫‪n‬‬ ‫!‪n‬‬ ‫=‬ ‫! ‪k1 ! · · · km‬‬ ‫‪k1 , . . . , k m‬‬ ‫‪ 1.3‬בחירת ‪ k‬עצמים מתוך ‪ n‬ללא החזרה ועם חשיבות‬ ‫‬ ‫‪n‬‬ ‫לסדר‬ ‫אם ‪ k1 + · · · + km = n‬אז יש ‪ k1 ,...,km‬חלוקות שונות של קבוצה‬ ‫בעלת ‪ n‬עצמים ל־‪ m‬קבוצות זרות בעלות ‪ k1 , . . . , km‬עצמים‪.‬‬ ‫!‪n‬‬ ‫= )‪nk = n · (n − 1) · · · (n − k + 1‬‬ ‫‪ 1.5‬בחירת ‪ k‬עצמים מתוך ‪ n‬עם החזרה ועם חשיבות‬ ‫!)‪(n − k‬‬ ‫לסדר‬ ‫יש ‪ nk‬דרכים שונות לבחור ‪ k‬עצמים מתוך קבוצה של ‪ n‬ולסדר‬ ‫אותם בשורה‪ n :‬אפשרויות לעצם הראשון‪ n − 1 ,‬אפשרויות לשני יש ‪ nk‬דרכים שונות לבחור ‪ k‬עצמים מתוך קבוצה בעלת ‪ n‬עצמים‬ ‫וכך הלאה עד שלעצם האחרון נשארות ‪ n − k + 1‬אפשרויות‪ .‬נשים עם החזרה‪ n :‬אפשרויות לעצם הראשון‪ n ,‬אפשרויות לשני וכך‬ ‫הלאה‪ .‬ניסוח אחר‪ :‬אם בכל שלב בניסוי יש ‪ n‬תוצאות אפשריות‪,‬‬ ‫לב כי !‪.nn = n‬‬ ‫אז לאחר ‪ k‬שלבים יש ‪ nk‬תוצאות אפשריות בסה"כ‪.‬‬ ‫‪ 1.4‬בחירת ‪ k‬עצמים מתוך ‪ n‬ללא החזרה וללא חשיבות‬ ‫לסדר‪ :‬מקדמים בינומיים‬ ‫ ‬ ‫‪n‬‬ ‫!‪n‬‬ ‫‪nk‬‬ ‫=‬ ‫=‬ ‫‪k‬‬ ‫!‪k‬‬ ‫!‪(n − k)!k‬‬ ‫‬ ‫יש ‪ nk‬דרכים שונות לבחור ‪ k‬עצמים מתוך ‪ n‬עצמים כאשר אין‬ ‫חשיבות לסדר‪ :‬ראשית נבחר את העצמים ב־ ‪ nk‬דרכים‪ .‬אך כל‬ ‫)כמספר הפרמוטציות שלה(‪,‬‬ ‫קבוצה של ‪ k‬עצמים מופיעה !‪ k‬פעמים‬ ‫‬ ‫לכן יש לחלק ב־!‪ .k‬כמו כן נשים לב כי יש ‪ nk‬תת־קבוצות שונות‬ ‫בגודל ‪ k‬של קבוצה בגודל ‪.n‬‬ ‫הבינום של ניוטון‪:‬‬ ‫ ‪n‬‬ ‫‪X‬‬ ‫‪n k n−k‬‬ ‫‪x y‬‬ ‫‪k‬‬ ‫‪n‬‬ ‫= )‪(x + y‬‬ ‫‪k=0‬‬ ‫תכונות של האינדקס התחתון‪:‬‬ ‫ ‬ ‫‬ ‫‪n‬‬ ‫‪n‬‬ ‫=‬ ‫‪k‬‬ ‫‪n−k‬‬ ‫‪= 2n‬‬ ‫‪k‬‬ ‫‪k=0‬‬ ‫‬ ‫ ‬ ‫ ‬ ‫ ‬ ‫‬ ‫‪n‬‬ ‫‪k+n−1‬‬ ‫‪k+n−1‬‬ ‫=‬ ‫=‬ ‫‪k‬‬ ‫‪k‬‬ ‫‪n−1‬‬ ‫הוכחה )בקטן כי היא ארוכה(‪ :‬לכל אחד מ־‪ n‬העצמים בקבוצה נשייך מספר בין ‪0‬‬ ‫ל־‪ k‬הקובע את מספר הפעמים שאותו עצם נבחר‪ ,‬כאשר סכום המספרים המשויכים‬ ‫חייב להסתכם ל־‪ .k‬צורה נוחה למצוא את מספר האפשרויות לעשות זאת היא‬ ‫לסדר ‪ k‬כוכבים בשורה ולהפריד ביניהם באמצעות ‪ n − 1‬חוצצים‪ ,‬כך שנוצרות‬ ‫‪ n‬קבוצות )רצפים של כוכבים( אשר עשויות להיות בגודל ‪ 0‬עד ‪ .k‬לדוגמה‪ ,‬עבור‬ ‫‪ k = 5‬ו־‪ ,n = 4‬מיקום אפשרי של חוצצים הוא‪:‬‬ ‫?| ? ? ? ||?‬ ‫משמעות הסידור‪ :‬ניקח את העצם הראשון בקבוצה פעם אחת‪ ,‬את העצם השני אפס‬ ‫פעמים‪ ,‬את העצם השלישי שלוש פעמים ואת העצם הרביעי פעם אחת ‪ -‬בסה"כ ‪5‬‬ ‫מיקום ל־‪ n − 1‬החוצצים מתוך‬ ‫עצמים‪ ,‬כנדרש‪ .‬כעת‪ ,‬מספר האפשרויות לבחור ‬ ‫‪. k+n−1‬‬ ‫‪ k + n − 1‬מיקומים אפשריים )כולל הקצוות( הוא‬ ‫‪n−1‬‬ ‫‪ 1.7‬סידור ‪ k‬עצמים ב־‪ n‬תאים כך שבכל תא יש לפחות‬ ‫עצם אחד‬ ‫ ‬ ‫‪n‬‬ ‫‪n‬‬ ‫=‬ ‫‪= 1,‬‬ ‫‪0‬‬ ‫‪n‬‬ ‫‬ ‫‬ ‫‪k−1‬‬ ‫‪n−1‬‬ ‫כמו בסעיף הקודם‪ ,‬נסדר ‪ k‬כוכבים בשורה ונפריד ביניהם באמצעות‬ ‫‪ n−1‬חוצצים‪ ,‬כאשר הפעם בין כל שני כוכבים יכול להיות רק חוצץ‬ ‫אחד וכל חוצץ חייב להיות בין שני כוכבים ‪ -‬בסה"כ ‪ k−1‬אפשרויות‬ ‫למיקום החוצצים‪.‬‬ ‫סכומים על האינדקס התחתון‪:‬‬ ‫ ‪n‬‬ ‫‪X‬‬ ‫‪n‬‬ ‫‪1.6‬‬ ‫לסדר‬ ‫בחירת ‪ k‬עצמים מתוך ‪ n‬עם החזרה וללא חשיבות‬ ‫ ‬ ‫‪n‬‬ ‫‪= 0,‬‬ ‫‪k‬‬ ‫‪k‬‬ ‫)‪(−1‬‬ ‫‪n‬‬ ‫‪X‬‬ ‫‪k=0‬‬ ‫‪1‬‬ ‫הסתברות‬ ‫‪2‬‬ ‫‪2.1‬‬ ‫‪2.4‬‬ ‫המאורעות ‪ A, B‬הם בלתי־תלויים אם ורק אם‪:‬‬ ‫אקסיומות ונוסחאות בסיסיות‬ ‫)‪P (A ∩ B) = P (A) P (B‬‬ ‫יהי ‪ S‬מרחב מדגם ויהי ‪ A ∈ S‬מאורע‪ ,‬אז‪:‬‬ ‫‬ ‫‪P (A) ∈ [0, 1] ,‬‬ ‫)‪P A = 1 − P (A‬‬ ‫‪P (S) = 1,‬‬ ‫או באופן שקול‪:‬‬ ‫כאשר ‪ A‬הוא המשלים של ‪ .A‬אם ‪ S‬מרחב סופי וסימטרי אז‪:‬‬ ‫|‪|A‬‬ ‫= )‪P (A‬‬ ‫|‪|S‬‬ ‫‪2.2‬‬ ‫)‪P (B|A) = P (B‬‬ ‫יהיו ‪ ,1 ≤ i ≤ m ,Ai ∈ S‬מאורעות זרים בזוגות‪ ,‬אז‪:‬‬ ‫!‬ ‫‪n‬‬ ‫‪n‬‬ ‫[‬ ‫‪X‬‬ ‫‪P‬‬ ‫= ‪Ai‬‬ ‫) ‪P (Ai‬‬ ‫‪i=1‬‬ ‫‪i=1‬‬ ‫‪i=1‬‬ ‫‪i=1‬‬ ‫אם ‪ Ai‬אינם זרים בזוגות אז )עקרון ההכלה וההפרדה(‪:‬‬ ‫!‬ ‫‪n‬‬ ‫‪X‬‬ ‫‪X‬‬ ‫‪Ai‬‬ ‫=‬ ‫‪P (Ai ) −‬‬ ‫‪P (Ai ∩ Aj ) + . . .‬‬ ‫‪i<j‬‬ ‫!‬ ‫‪P (A|B) = P (A) ,‬‬ ‫כלומר הידע ש־‪ B‬קרה לא משנה את ההסתברות ש־‪ A‬יקרה ולהפך‪.‬‬ ‫המאורעות ‪ ,1 ≤ i ≤ n ,Ai‬הם בלתי־תלויים אם ורק אם לכל תת־‬ ‫קבוצה ‪ Ai1 , . . . , Air‬שלהם מתקיים‪:‬‬ ‫!‬ ‫‪r‬‬ ‫‪r‬‬ ‫\‬ ‫‪Y‬‬ ‫‪P‬‬ ‫= ‪Ai‬‬ ‫) ‪P (Ai‬‬ ‫ההסתברות של איחוד מאורעות‬ ‫‪n‬‬ ‫\‬ ‫מאורעות בלתי־תלויים‬ ‫‪3‬‬ ‫‪n‬‬ ‫[‬ ‫הגדרה‪ :‬משתנה מקרי ‪ X : Ω → R‬הוא פונקציה ממרחב המדגם‬ ‫‪ Ω‬לשדה המספרים הממשיים ‪ .R‬מסמנים‪:‬‬ ‫‪P‬‬ ‫‪i=1‬‬ ‫‪i=1‬‬ ‫משתנה מקרי‬ ‫)}‪P (X = k) = P ({ω ∈ Ω|X (ω) = k‬‬ ‫‪n+1‬‬ ‫)‪· · · + (−1‬‬ ‫‪P‬‬ ‫‪Ai‬‬ ‫כלומר ההסתברות ש־‪ X‬מקבל ערך מסוים )או טווח של ערכים(‬ ‫‪i=1‬‬ ‫היא ההסתברות של קבוצת כל המאורעות ‪ ω‬במרחב המדגם כך‬ ‫כאשר |‪ |A‬מציין את מספר האיברים בקבוצה ‪ .A‬אי־שוויון בול ש־)‪ X (ω‬מקבל את הערך או טווח הערכים הנדרש‪.‬‬ ‫קובע כי‪:‬‬ ‫!‬ ‫‪n‬‬ ‫‪n‬‬ ‫‪X‬‬ ‫[‬ ‫‪ 3.1‬תוחלת‬ ‫) ‪P (Ai‬‬ ‫‪P‬‬ ‫≤ ‪Ai‬‬ ‫יהי ‪ X‬משתנה מקרי‪ .‬התוחלת של ‪ X‬היא‪:‬‬ ‫‪i=1‬‬ ‫‪i=1‬‬ ‫‪X‬‬ ‫= )‪E (X‬‬ ‫)‪x · P (X = x‬‬ ‫‪2.3‬‬ ‫הסתברות מותנית‬ ‫‪x‬‬ ‫יהיו ‪ A, B‬מאורעות‪ .‬אם ‪ P (B) > 0‬אז ההסתברות המותנית של‬ ‫‪ A‬בהינתן ‪ B‬היא‪:‬‬ ‫)‪P (A ∩ B‬‬ ‫)‪P (B‬‬ ‫= )‪P (A|B‬‬ ‫מכאן‪:‬‬ ‫כאשר הסכום הוא על כל הערכים האפשריים של ‪ .X‬מכאן‪,‬‬ ‫התוחלת היא למעשה ממוצע משוקלל של כל ערכי ‪ .X‬באופן‬ ‫כללי הביטוי ) ‪ E (X n‬נקרא "המומנט ה־‪ n‬של ‪ ;"X‬התוחלת היא‬ ‫המומנט הראשון‪ .‬לכל פונקציה ‪ f : R → R‬מתקיים‪:‬‬ ‫‪X‬‬ ‫= ))‪E (f (X‬‬ ‫)‪f (x) P (X = x‬‬ ‫)‪P (A ∩ B) = P (A|B) P (B‬‬ ‫‪x‬‬ ‫ובאופן כללי יותר‪:‬‬ ‫!‬ ‫· · · ) ‪P (A1 ) P (A2 |A1 ) P (A3 |A2 ∩ A1‬‬ ‫=‬ ‫‪Ai‬‬ ‫‪n‬‬ ‫\‬ ‫כאשר הסכימה היא על כל הערכיים האפשריים של ‪) X‬ולא של‬ ‫)‪ .(f (X‬התוחלת היא לינארית‪:‬‬ ‫‪P‬‬ ‫‪E (aX + b) = aE (X) + b‬‬ ‫‪i=1‬‬ ‫) ‪· · · P (An |An−1 ∩ · · · ∩ A1‬‬ ‫‪U‬‬ ‫נוסחת ההסתברות השלמה ‪ -‬אם ‪) B = i Bi‬איחוד זר( אז‪:‬‬ ‫) ‪P (A|Bi ) P (Bi‬‬ ‫‪n‬‬ ‫‪X‬‬ ‫אם מתקיים )‪ P (a ≤ X ≤ b‬אז בהכרח גם ‪.a ≤ E (X) ≤ b‬‬ ‫יתרה מזאת‪ ,‬אם ‪ X ≥ Y‬אז בהכרח ) ‪.E (X) ≥ E (Y‬‬ ‫= )‪P (A‬‬ ‫‪3.2‬‬ ‫‪i=1‬‬ ‫יהי ‪ X‬משתנה מקרי‪ .‬השונות של ‪ X‬היא‪:‬‬ ‫‬ ‫‬ ‫‬ ‫‪2‬‬ ‫‪2‬‬ ‫])‪Var (X) = E [X − E (X)] = E X 2 − [E (X‬‬ ‫נוסחת בייס‪:‬‬ ‫)‪P (B|A) P (A‬‬ ‫)‪P (B‬‬ ‫שונות‬ ‫= )‪P (A|B‬‬ ‫נוסחת בייס ‪ +‬נוסחת ההסתברות השלמה‪:‬‬ ‫)‪P (B|A) P (A‬‬ ‫ ‬ ‫‬ ‫= )‪P (A|B‬‬ ‫‪P (B|A) P (A) + P B A P A‬‬ ‫‪U‬‬ ‫או במקרה הכללי‪ ,‬אם ‪:A = i Ai‬‬ ‫השונות מעלה קבועים בריבוע‪ ,‬ואינה מושפעת מהזזות‪:‬‬ ‫)‪Var (aX + b) = a2 Var (X‬‬ ‫סטיית התקן מוגדרת להיות השורש של השונות‪:‬‬ ‫‪p‬‬ ‫)‪σX = Var (X‬‬ ‫) ‪P (B|Ai ) P (Ai‬‬ ‫‪P (Ai |B) = Pn‬‬ ‫) ‪j=1 P (B|Aj ) P (Aj‬‬ ‫‪2‬‬ ‫‪3.3‬‬ ‫פונקציה יוצרת מומנטים‬ ‫קל לראות כי‪:‬‬ ‫יהי ‪ X‬משתנה מקרי‪ .‬הפונקציה יוצרת המומנטים היא‪:‬‬ ‫‪ X tx‬‬ ‫= ‪MX (t) = E etX‬‬ ‫)‪e P (X = x‬‬ ‫)‪Cov (X, X) = Var (X‬‬ ‫‪Cov (X, a) = 0‬‬ ‫)‪Cov (X, Y ) = Cov (Y, X‬‬ ‫) ‪Cov (aX, bY ) = abCov (X, Y‬‬ ‫)‪Cov (X + Y, Z) = Cov (X, Z) + Cov (Y, Z‬‬ ‫‪‬‬ ‫‪‬‬ ‫‪n‬‬ ‫‪n‬‬ ‫‪n X‬‬ ‫‪n‬‬ ‫‪X‬‬ ‫‪X‬‬ ‫‪X‬‬ ‫‪Cov ‬‬ ‫‪Xi ,‬‬ ‫= ‪Yj ‬‬ ‫) ‪Cov (Xi , Yj‬‬ ‫‪x‬‬ ‫מתקיים‪:‬‬ ‫‬ ‫‪00‬‬ ‫‪MX‬‬ ‫‪(0) = E X 2‬‬ ‫‪0‬‬ ‫‪MX‬‬ ‫‪(0) = E (X) ,‬‬ ‫‪MX (0) = 1,‬‬ ‫וכך הלאה‪ ,‬כאשר הגזירה היא לפי ‪ .t‬לכן השונות היא‪:‬‬ ‫‪2‬‬ ‫‪i=1‬‬ ‫‪j=1‬‬ ‫‪i=1 j=1‬‬ ‫אם המשתנים ‪ X, Y‬הם בלתי־תלויים‪ ,‬אז‪:‬‬ ‫‪00‬‬ ‫‪0‬‬ ‫‪Var (X) = MX‬‬ ‫‪(0) − [MX‬‬ ‫])‪(0‬‬ ‫‪Cov (X, Y ) = 0‬‬ ‫אם ‪ X‬ו־ ‪ Y‬בלתי־תלויים אז‪:‬‬ ‫אבל ההפך אינו בהכרח נכון‪ .‬כמו כן מתקיים הקשר‪:‬‬ ‫)‪MX+Y (t) = MX (t) MY (t‬‬ ‫) ‪Var (X + Y ) = Var (X) + Var (Y ) + 2 Cov (X, Y‬‬ ‫הפונקציה יוצרת המומנטים קובעת את ההתפלגות באופן יחיד‪ ,‬לכן‬ ‫ניתן להשתמש בנוסחה זה למציאת ההתפלגות של סכום משתנים ובאופן כללי‪:‬‬ ‫מקריים‪ .‬דרך נוספת היא באמצעות נוסחת הקונבולוציה‪:‬‬ ‫!‬ ‫‪n‬‬ ‫‪n‬‬ ‫‪X‬‬ ‫‪X‬‬ ‫‪X‬‬ ‫‪X‬‬ ‫‪Var‬‬ ‫= ‪Xi‬‬ ‫‪Var (Xi ) + 2‬‬ ‫) ‪Cov (Xi , Xj‬‬ ‫= )‪P (X + Y = m‬‬ ‫)‪P (X = k) P (Y = m − k|X = k‬‬ ‫‪i<j‬‬ ‫‪k‬‬ ‫‪3.4‬‬ ‫שכיח‬ ‫‪i=1‬‬ ‫מספר משתנים מקריים‬ ‫) ‪E (Xi‬‬ ‫‪n‬‬ ‫‪X‬‬ ‫!‬ ‫=‬ ‫‪Xi‬‬ ‫‪i=1‬‬ ‫תוחלת מותנית‬ ‫יהיו ‪ X, Y‬משתנים מקריים‪ .‬התוחלת של ‪ X‬בהינתן ש־‪Y = y‬‬ ‫היא‪:‬‬ ‫‪X‬‬ ‫= )‪E (X|Y = y‬‬ ‫)‪x · P (X = x|Y = y‬‬ ‫מתקיים‪:‬‬ ‫‪n‬‬ ‫‪X‬‬ ‫= ‪ρX,Y‬‬ ‫מתקיים תמיד ‪ ,−1 ≤ ρX,Y ≤ 1‬כאשר ‪ 1‬משמעותו שמתקיים‬ ‫קשר לינארי חיובי בין המשתנים‪ −1 ,‬משמעותו שקיים קשר לינארי‬ ‫שלילי ו־‪ 0‬משמעותו שאין קשר לינארי‪.‬‬ ‫‪4.3‬‬ ‫תוחלת‬ ‫‪i=1‬‬ ‫מקדם המתאם של ‪ X, Y‬הוא‪:‬‬ ‫) ‪Cov (X, Y‬‬ ‫‪σX σY‬‬ ‫שני משתנים מקריים ‪ X‬ו־ ‪ Y‬הם בלתי־תלויים אם ורק אם לכל‬ ‫‪ a, b ∈ R‬המאורעות }‪ {X ≤ a‬ו־}‪ {Y ≤ b‬הם בלתי־תלויים‪ .‬אי־‬ ‫תלות של מספר משתנים מקריים מוגדרת בדומה לאי־תלות של‬ ‫מספר מאורעות‪.‬‬ ‫‪4.1‬‬ ‫‪i=1‬‬ ‫בפרט‪ ,‬אם המשתנים ‪ Xi‬בלתי־תלויים‪:‬‬ ‫!‬ ‫‪n‬‬ ‫‪n‬‬ ‫‪X‬‬ ‫‪X‬‬ ‫) ‪Var (Xi‬‬ ‫‪Var‬‬ ‫= ‪Xi‬‬ ‫השכיח הוא הערך הנפוץ ביותר בהתפלגות‪ ,‬כלומר הערך של‬ ‫המשתנה המקרי שמתקבל בהסתברות הגבוהה ביותר‪ .‬ערך זה‬ ‫אינו בהכרח יחיד )לדוגמה‪ :‬התפלגות אחידה(‪.‬‬ ‫‪4‬‬ ‫‪i=1‬‬ ‫‪E‬‬ ‫‪x‬‬ ‫‪i=1‬‬ ‫כאשר הסכום הוא על כל הערכים האפשריים של ‪ .X‬חשוב לשים‬ ‫לב כי )‪ E (X|Y = y‬הוא מספר‪ .‬ניתן גם להגדיר את הפונקציה‬ ‫לכל סט של משתנים מקריים )המוגדרים על‬ ‫אותו מרחב מדגם(‪ ,‬גם ) ‪ ,E (X|Y‬שהיא משתנה מקרי בפני עצמה‪ .‬זהות חשובה )נוסחת‬ ‫אם אינם בלתי־תלויים‪ .‬מכאן‪ ,‬אם ניתן לרשום‪:‬‬ ‫התוחלת השלמה( היא‪:‬‬ ‫‪Xi‬‬ ‫‪n‬‬ ‫‪X‬‬ ‫)) ‪E (X) = E (E (X|Y‬‬ ‫=‪X‬‬ ‫כלומר‪:‬‬ ‫‪i=1‬‬ ‫כאשר ‪ Xi‬הם אינדיקטורים שמקבלים את הערך ‪ 1‬בהסתברות ‪pi‬‬ ‫ו־‪ 0‬אחרת‪ ,‬אז נקבל‪:‬‬ ‫‪pi‬‬ ‫‪n‬‬ ‫‪X‬‬ ‫)‪E (X|Y = y) P (Y = y‬‬ ‫‪X‬‬ ‫= )‪E (X‬‬ ‫‪y‬‬ ‫כמו כן מתקיים‪:‬‬ ‫= )‪E (X‬‬ ‫)‪E (g (X) Y |X) = g (X) E (Y |X‬‬ ‫‪i=1‬‬ ‫מכאן עם ‪ g (X) = X‬ושימוש בנוסחת התוחלת השלמה נקבל‪:‬‬ ‫‪4.2‬‬ ‫))‪E (XY ) = E (X · E (Y |X‬‬ ‫שונות משותפת‬ ‫לכן אם ‪ X, Y‬בלתי־תלויים‪:‬‬ ‫יהיו ‪ X, Y‬משתנים מקריים‪ .‬אז השונות המשותפת שלהם היא‪:‬‬ ‫)]) ‪E ([X − E (X)] [Y − E (Y‬‬ ‫) ‪E (XY ) − E (X) E (Y‬‬ ‫=‬ ‫=‬ ‫) ‪E (XY ) = E (X) E (Y‬‬ ‫) ‪Cov (X, Y‬‬ ‫‪3‬‬ ‫‪4.4‬‬ ‫‪5.3‬‬ ‫שונות מותנית וסכום משתנים באורך מקרי‬ ‫יהיו ‪ X, Y‬משתנים מקריים‪ .‬השונות של ‪ X‬בהינתן ‪ Y‬היא‪:‬‬ ‫ ‬ ‫‬ ‫‪2‬‬ ‫‪Var (X|Y ) = E [X − E (X|Y )] Y‬‬ ‫ ‬ ‫‪2‬‬ ‫]) ‪= E X 2 Y − [E (X|Y‬‬ ‫התפלגות בינומית שלילית וגאומטרית‬ ‫התפלגות בינומית שלילית‪:‬‬ ‫‪ X‬הוא מספר הניסויים עד להצלחה ה־‪) n‬כולל(‪ ,‬כשהניסויים בלתי־‬ ‫תלויים והסיכוי להצלחה בכל אחד מהם הוא ‪.p‬‬ ‫)‪X ∼ NB (n, p‬‬ ‫נבחר ‪ n − 1‬מתוך ‪ k − 1‬הניסויים הראשונים‪ .‬ניסויים אלה הצליחו‪,‬‬ ‫מכאן )נוסחת השונות השלמה(‪:‬‬ ‫בהסתברות ‪ ,pn−1‬וה־‪ k − n‬הנותרים נכשלו‪ ,‬בהסתברות ‪.1 − p‬‬ ‫]) ‪Var (X) = E [Var (X|Y )] + Var [E (X|Y‬‬ ‫לאחר מכן עלינו להכפיל את התוצאה ב־‪ p‬משום שהניסוי האחרון‬ ‫יהי ‪ N‬משתנה מקרי המקבל ערכים שלמים אי־שליליים ויהיו ‪ Xi‬הצליח‪ .‬לכן ההתפלגות היא‪:‬‬ ‫‬ ‫‬ ‫משתנים מקריים בלתי־תלויים‪ ,‬שווי־התפלגות ובלתי־תלויים ב־ ‪,N‬‬ ‫‪k−1 n‬‬ ‫‪k−n‬‬ ‫אז מתקיים‪:‬‬ ‫= )‪P (X = k‬‬ ‫)‪p (1 − p‬‬ ‫!‬ ‫‪n−1‬‬ ‫‪N‬‬ ‫‪X‬‬ ‫‪E‬‬ ‫) ‪Xi = E (N ) E (Xi‬‬ ‫התוחלת והשונות הן‪:‬‬ ‫‪i=1‬‬ ‫!‬ ‫‪2‬‬ ‫) ‪= E (N ) Var (Xi ) + [E (Xi )] Var (N‬‬ ‫‪Xi‬‬ ‫‪N‬‬ ‫‪X‬‬ ‫‪1−p‬‬ ‫‪Var (X) = n 2‬‬ ‫‪p‬‬ ‫‪Var‬‬ ‫והפונקציה יוצרת המומנטים היא‪:‬‬ ‫‪n‬‬ ‫‪pet‬‬ ‫‪1 − (1 − p) et‬‬ ‫‪i=1‬‬ ‫‪5‬‬ ‫‪5.1‬‬ ‫התפלגויות‬ ‫‪n‬‬ ‫‪E (X) = ,‬‬ ‫‪p‬‬ ‫‬ ‫= )‪MX (t‬‬ ‫אם )‪ X ∼ NB (n, p‬ו־)‪ Y ∼ NB (m, p‬הם בלתי־תלויים‪ ,‬אז‬ ‫מתקיים‪:‬‬ ‫התפלגות אחידה‬ ‫‪ X‬הוא מספר שלם בין ‪ a‬ל־‪ b‬הנבחר באקראי‪.‬‬ ‫)‪X + Y ∼ NB (n + m, p‬‬ ‫)‪X ∼ Uni (a, . . . , b‬‬ ‫יש בסה"כ ‪ n = b−a+1‬אפשרויות וכל אחת בעלת הסתברות שווה‪ ,‬התפלגות גאומטרית‪:‬‬ ‫לכן ההתפלגות‪ ,‬התוחלת‪ ,‬השונות והפונקציה יוצרת המומנטים הן‪ :‬זהו מקרה פרטי של התפלגות בינומית שלילית כאשר ‪.n = 1‬‬ ‫)‪X ∼ Geo (p) ≡ NB (1, p‬‬ ‫‪1‬‬ ‫‪1‬‬ ‫=‬ ‫= )‪P (X = k‬‬ ‫‪b−a+1‬‬ ‫‪n‬‬ ‫ההתפלגות היא‪:‬‬ ‫‪a+b‬‬ ‫‪2‬‬ ‫‪k−1‬‬ ‫)‪P (X = k) = p (1 − p‬‬ ‫= )‪E (X‬‬ ‫‪2‬‬ ‫‪(b − a + 1) − 1‬‬ ‫‪n2 − 1‬‬ ‫=‬ ‫‪12‬‬ ‫‪12‬‬ ‫‪eat − e(b+1)t‬‬ ‫) ‪n (1 − et‬‬ ‫‪5.2‬‬ ‫‪k‬‬ ‫)‪P (X ≤ k) = 1 − (1 − p‬‬ ‫התוחלת והשונות הן‪:‬‬ ‫= )‪Var (X‬‬ ‫‪1−p‬‬ ‫= )‪Var (X‬‬ ‫‪p2‬‬ ‫= )‪MX (t‬‬ ‫‪1‬‬ ‫‪E (X) = ,‬‬ ‫‪p‬‬ ‫והשכיח הוא ‪ ,1‬כי ההסתברות יורדת ככל ש־‪ k‬עולה‪ .‬הפונקציה‬ ‫יוצרת המומנטים היא‪:‬‬ ‫התפלגות בינומית‬ ‫‪ X‬הוא מספר ההצלחות ב־‪ n‬ניסויים בלתי־תלויים אשר סיכוי‬ ‫ההצלחה בכל אחד מהם הוא ‪.p‬‬ ‫‪pet‬‬ ‫‪1 − (1 − p) et‬‬ ‫= )‪MX (t‬‬ ‫)‪X ∼ Bin (n, p‬‬ ‫נבחר ‪ k‬מתוך ‪ n‬הניסויים‪ .‬ניסויים אלה הצליחו‪ ,‬בהסתברות ‪ ,p‬ו־ אם )‪ Xi ∼ Geo (p‬עבור ‪ 1 ≤ i ≤ n‬הם בלתי־תלויים‪ ,‬אז מתקיים‪:‬‬ ‫‪ n − k‬הניסויים הנותרים נכשלו‪ ,‬בהסתברות ‪ .1 − p‬לכן ההתפלגות‬ ‫‪n‬‬ ‫‪X‬‬ ‫היא‪:‬‬ ‫)‪Xi ∼ NB (n, p‬‬ ‫ ‬ ‫‪n‬‬ ‫‪n−k‬‬ ‫‪i=1‬‬ ‫= )‪P (X = k‬‬ ‫)‪pk (1 − p‬‬ ‫‪k‬‬ ‫ההתפלגות הגאומטרית היא ההתפלגות הבדידה היחידה שהיא‬ ‫"חסרת זיכרון"‪ ,‬כלומר‪ ,‬בכל שלב בניסוי יש אותו סיכוי להצלחה‬ ‫התוחלת והשונות הן‪:‬‬ ‫ללא תלות בכמות או בתוצאות הניסויים הקודמים )למשל‪ ,‬למטבע‬ ‫‪E (X) = np,‬‬ ‫)‪Var (X) = np (1 − p‬‬ ‫שמוטל אין "זיכרון" של ההטלות הקודמות(‪ .‬ניתן לתאר תכונה זו‬ ‫באמצעות הנוסחה‪:‬‬ ‫השכיח הוא‪:‬‬ ‫‪Mode (X) = b(n + 1) pc or b(n + 1) pc − 1‬‬ ‫)‪P (X > m + n|X > m) = P (X > n‬‬ ‫והפונקציה יוצרת המומנטים היא‪:‬‬ ‫כלומר‪ ,‬לכל ‪ ,n, m ∈ N‬אם ידוע לנו שכבר נערכו ‪ m‬ניסויים‬ ‫‪n‬‬ ‫כושלים‪ ,‬ההסתברות ש־‪ n‬ניסויים נוספים ייכשלו שווה להסתברות‬ ‫‪MX (t) = 1 − p + pet‬‬ ‫ש־‪ n‬ניסויים ייכשלו אם נתחיל את התהליך מהתחלה‪ .‬מכאן‪ ,‬אם‬ ‫אם )‪ X ∼ Bin (n, p‬ו־)‪ Y ∼ Bin (m, p‬הם בלתי־תלויים‪ ,‬אז מצאנו התפלגות המקיימת‪:‬‬ ‫מתקיים‪:‬‬ ‫)‪P (X = k + 1) = cP (X = k‬‬ ‫)‪X + Y ∼ Bin (n + m, p‬‬ ‫כאשר ‪ c‬קבוע כלשהו‪ ,‬התפלגות זו בהכרח תהיה גאומטרית )הקבוע‬ ‫‪ c‬הוא פשוט ההסתברות לכישלון בניסוי(‪.‬‬ ‫‪4‬‬ ‫‪5.4‬‬ ‫התפלגות היפרגאומטרית‬ ‫או באופן שקול‪:‬‬ ‫‪1‬‬ ‫‪ X‬הוא מספר הפריטים "המיוחדים" שנמצאו בדגימה )ללא החזרה(‬ ‫בגודל ‪ n‬מתוך אוכלוסייה בגודל ‪ N‬הכוללת ‪ D‬פרטים מיוחדים‪.‬‬ ‫‪k2‬‬ ‫קיימת גם גרסה חד־צדדית של שוויון זה‪:‬‬ ‫)‪X ∼ HG (N, D, n‬‬ ‫≤ )‪P (|X − E (X)| ≥ kσ‬‬ ‫נבחר ‪ k‬פריטים מיוחדים מתוך ‪ D‬המיוחדים שבאוכלוסייה‪ ,‬ונבחר‬ ‫את ‪ n − k‬הפריטים הלא־מיוחדים שנשארו מתוך ‪ N − D‬הלא־‬ ‫מיוחדים באוכלוסייה‪ .‬נחלק את מספר האפשרויות בגודל מרחב‬ ‫המדגם‪ ,‬שהוא ‪ n‬פריטים כלשהם שנדגמו מאוכלוסייה בגודל ‪.N‬‬ ‫לכן ההתפלגות היא‪:‬‬ ‫‬ ‫‬ ‫‪D N −D‬‬ ‫‪k‬‬ ‫‪n−k‬‬ ‫‬ ‫‪N‬‬ ‫‪n‬‬ ‫= )‪P (X = k‬‬ ‫‪σ2‬‬ ‫‪σ2 + k2‬‬ ‫≤ )‪P (X − E (X) ≥ k‬‬ ‫או באופן שקול‪:‬‬ ‫‪1‬‬ ‫‪1 + k2‬‬ ‫≤ )‪P (X − E (X) ≥ kσ‬‬ ‫אבחנה חשובה ‪ -‬אם המשתנה המקרי הוא סימטרי סביב התוחלת‪,‬‬ ‫כלומר )‪ ,P (X − E (X)) = P (E (X) − X‬אז ניתן לרשום‪:‬‬ ‫‪1‬‬ ‫)‪P (|X − E (X)| ≥ k‬‬ ‫‪2‬‬ ‫התוחלת והשונות הן‪:‬‬ ‫‬ ‫‪D‬‬ ‫‪D N −n‬‬ ‫‪Var (X) = n‬‬ ‫‪1−‬‬ ‫‪N‬‬ ‫‪N N −1‬‬ ‫‪k‬‬ ‫‪j‬‬ ‫והשכיח הוא‬ ‫)‪. (n+1)(D+1‬‬ ‫‪N +2‬‬ ‫‬ ‫‪D‬‬ ‫‪,‬‬ ‫‪N‬‬ ‫‪E (X) = n‬‬ ‫‪6.3‬‬ ‫אי־שוויון צ'רנוף‬ ‫יהי ‪ X‬משתנה מקרי ותהי‪:‬‬ ‫‬ ‫‪tX‬‬ ‫‪5.5‬‬ ‫= )‪P (X − E (X) ≥ k‬‬ ‫התפלגות פואסונית‬ ‫‪ X‬הוא מספר ההצלחות בתהליך בינומי כאשר ‪,n → ∞ ,p → 0‬‬ ‫אך המכפלה ‪ λ = np‬קבועה‪ .‬לכן ההתפלגות משמשת לקירוב של‬ ‫תהליכים בהם יש הסתברות נמוכה להצלחה ומספר רב של ניסיונות‪,‬‬ ‫לדוגמה מספר טעויות ההדפסה בספר או מספר האנשים שמגיעים‬ ‫לגיל ‪ 100‬באוכלוסייה‪.‬‬ ‫)‪X ∼ Pois (λ‬‬ ‫‪MX (t) = E e‬‬ ‫הפונקציה יוצרת המומנטים שלו‪ .‬אז מתקיים‪:‬‬ ‫‪P (X ≥ a) ≤ e−ta MX (t) ,‬‬ ‫‪t>0‬‬ ‫‪P (X ≤ a) ≤ e−ta MX (t) ,‬‬ ‫‪t<0‬‬ ‫באמצעות מציאת ה־‪) t‬החיובי או השלילי לפי המקרה( שנותן את‬ ‫הערך הנמוך ביותר לפונקציה )‪ ,e−ta MX (t‬נוכל למצוא את החסם‬ ‫הטוב ביותר‪.‬‬ ‫ההתפלגות‪ ,‬התוחלת והשונות הן‪:‬‬ ‫‪E (X) = Var (X) = λ‬‬ ‫‪e−λ λk‬‬ ‫‪,‬‬ ‫!‪k‬‬ ‫‪6.4‬‬ ‫= )‪P (X = k‬‬ ‫‪00‬‬ ‫הגדרה‪ :‬פונקציה )‪ f (x‬נקראת קמורה אם ‪ f (x) ≥ 0‬לכל ‪,x‬‬ ‫וקעורה אם ‪ .f 00 (x) ≤ 0‬אם )‪ f (x‬קמורה אז מתקיים‪:‬‬ ‫והשכיח הוא ‪ ,bλc‬או ‪ λ−1‬אם ‪ .λ ∈ Z‬הפונקציה יוצרת המומנטים‬ ‫היא‪:‬‬ ‫)‪−1‬‬ ‫‪t‬‬ ‫אי־שוויון ינסן‬ ‫])‪E [f (X)] ≥ f [E (X‬‬ ‫‪MX (t) = eλ(e‬‬ ‫אם )‪ X ∼ Pois (λ‬ו־)‪ Y ∼ Pois (µ‬הם בלתי־תלויים‪ ,‬אז מתקיים‪:‬‬ ‫‪6.5‬‬ ‫קירוב לינארי‬ ‫יהיו ‪ X, Y‬משתנים מקריים‪ .‬התחזית הלינארית האופטימלית‪,Yˆ ,‬‬ ‫של ‪ Y‬לפי ‪ X‬ניתנת באמצעות הנוסחה‪:‬‬ ‫)‪X + Y ∼ Pois (λ + µ‬‬ ‫)‪X − E (X‬‬ ‫) ‪Yˆ − E (Y‬‬ ‫‪= ρX,Y‬‬ ‫‪σY‬‬ ‫‪σX‬‬ ‫‪6‬‬ ‫‪6.1‬‬ ‫אי־שוויונים‪ ,‬קירובים ומשפטי גבול‬ ‫כאשר‪:‬‬ ‫) ‪Cov (X, Y‬‬ ‫‪σX σY‬‬ ‫אי־שוויון מרקוב‬ ‫יהי ‪ X‬משתנה מקרי אי־שלילי‪ ,‬אז לכל ‪ a > 0‬מתקיים‪:‬‬ ‫)‪E (X‬‬ ‫‪a‬‬ ‫הוא מקדם המתאם )ע"ע(‪ .‬ביטוי מפורש ל־ ˆ‪ Y‬הוא‪:‬‬ ‫‪Yˆ = aX + b‬‬ ‫≤ )‪P (X ≥ a‬‬ ‫ניתן לבצע הזזה של המשתנה‪ ,‬כלומר )‪ ,P (X − b ≥ a − b‬כדי‬ ‫לשפר את החסם ‪ -‬כל עוד ‪ X − b‬אי־שלילי‪ .‬כמו כן‪ ,‬במקרה של‬ ‫מספרים שלמים )‪.P (X > a) = P (X ≥ a + 1‬‬ ‫‪6.2‬‬ ‫אי־שוויון צ'בישב‬ ‫‪2‬‬ ‫יהי ‪ X‬משתנה מקרי בעל שונות )‪ ,σ = Var (X‬אז לכל ‪k > 0‬‬ ‫מתקיים‪:‬‬ ‫‪σ2‬‬ ‫‪k2‬‬ ‫= ‪ρX,Y‬‬ ‫כאשר‪:‬‬ ‫) ‪Cov (X, Y‬‬ ‫)‪E (X‬‬ ‫)‪Var (X‬‬ ‫‪b = E (Y ) −‬‬ ‫) ‪Cov (X, Y‬‬ ‫‪,‬‬ ‫)‪Var (X‬‬ ‫=‪a‬‬ ‫השגיאה הריבועית הממוצעת )‪ (MSE‬של התחזית ˆ‪ Y‬היא‪:‬‬ ‫‬ ‫ ‬ ‫ ‪2‬‬ ‫‪MSE Yˆ = E Yˆ − Y‬‬ ‫מספקת מדד למידת הדיוק של הקירוב הלינארי‪.‬‬ ‫והיא ‬ ‫‪ MSE Yˆ = 0‬הקירוב הוא מדויק‪.‬‬ ‫≤ )‪P (|X − E (X)| ≥ k‬‬ ‫‪5‬‬ ‫אם‬ ‫עבור קירוב של משתנה מקרי בינומי שלילי‪ ,‬נציג אותו כסכום של‬ ‫‪ 6.6‬חוק המספרים הגדולים‬ ‫משתנים גאומטריים; עבור קירוב של משתנה מקרי פואסוני‪ ,‬נציג‬ ‫יהיו ‪X1 , X2 , . . .‬‬ ‫משתנים מקריים בלתי־תלויים ושווי־התפלגות אותו כסכום של משתנים פואסוניים עם ‪ ;λ = 1‬עבור קירוב של‬ ‫בעלי תוחלת ‪ µ‬ושונות ‪ .σ 2‬אז מתקיים‪:‬‬ ‫משתנה מקרי בינומי‪ ,‬נציג אותו כסכום של אינדיקטורים )משתנים‬ ‫בינומיים עם ‪ .(n = 1‬במקרה האחרון הקירוב נחשב טוב אם‬ ‫!‬ ‫‪n‬‬ ‫‪n‬‬ ‫‪ np (1 − p) ≥ 10‬בערך‪.‬‬ ‫‪1X‬‬ ‫‪1‬‬ ‫‪1X‬‬ ‫‪E‬‬ ‫= ‪Xi‬‬ ‫‪E (Xi ) = · nµ = µ‬‬ ‫כמו כן‪ ,‬אם המשתנה המקרי שלנו מקבל ערכים שלמים בלבד‬ ‫‪n‬‬ ‫‪n‬‬ ‫‪n‬‬ ‫)זה בדר"כ המצב(‪ ,‬ואנו רוצים לבדוק למשל מתי )‪ ,P (X > b‬אז‬ ‫‪i=1‬‬ ‫‪i=1‬‬ ‫ניתן להפוך את הקירוב לקצת יותר טוב אם משנים את ‪ b‬למספר‬ ‫!‬ ‫‪n‬‬ ‫‪n‬‬ ‫בתחום‪ ,‬למשל עבור‬ ‫הקרוב ביותר ל־‪ b‬כך ש־‪ b‬נכלל ‪P‬‬ ‫החצי־שלם ‪P‬‬ ‫‪1X‬‬ ‫‪1X‬‬ ‫‪1‬‬ ‫‪σ2‬‬ ‫)‪ P ( Xi ≥ 100‬אפשר לחשב )‪.P ( Xi ≥ 99.5‬‬ ‫‪Var‬‬ ‫= ‪Xi‬‬ ‫= ‪Var (Xi ) = 2 · nσ 2‬‬ ‫‪n i=1‬‬ ‫‪n i=1‬‬ ‫‪n‬‬ ‫‪n‬‬ ‫‪7‬‬ ‫לכן לכל ‪ ε > 0‬מתקיים‪ ,‬לפי אי־שוויון צ'בישב‪:‬‬ ‫‬ ‫‬ ‫!‬ ‫‪n‬‬ ‫‪1 X‬‬ ‫‬ ‫‪σ2‬‬ ‫‬ ‫‬ ‫‪Xi − µ ≥ ε ≤ 2‬‬ ‫‬ ‫‪n‬‬ ‫‬ ‫‪nε‬‬ ‫‪i=1‬‬ ‫ובגבול ∞ → ‪ n‬נקבל‪:‬‬ ‫‬ ‫‬ ‫!‬ ‫‪n‬‬ ‫‪1 X‬‬ ‫‬ ‫‬ ‫‬ ‫‪Xi − µ ≥ ε = 0‬‬ ‫‬ ‫‪n‬‬ ‫‬ ‫‪i=1‬‬ ‫‪7.1‬‬ ‫‪P‬‬ ‫סכומים נפוצים‬ ‫)‪n (n + 1‬‬ ‫‪2‬‬ ‫‪lim P‬‬ ‫‪Pn‬‬ ‫‪i=1‬‬ ‫‪1‬‬ ‫‪n‬‬ ‫של‬ ‫=‪k‬‬ ‫‪q m − q n+1‬‬ ‫‪1−q‬‬ ‫או‪:‬‬ ‫‪3‬‬ ‫‪lim P‬‬ ‫)‪(1 − q‬‬ ‫= ‪qk‬‬ ‫= ‪k2 qk‬‬ ‫‪n‬‬ ‫‪X‬‬ ‫‪k=m‬‬ ‫∞‬ ‫‪X‬‬ ‫‪k=0‬‬ ‫‪1 − q n+1‬‬ ‫‪,‬‬ ‫‪1−q‬‬ ‫‪2,‬‬ ‫‪q‬‬ ‫)‪(1 − q‬‬ ‫∞→‪n‬‬ ‫‪k · k! = (n + 1)! − 1‬‬ ‫כאשר‪:‬‬ ‫‪2‬‬ ‫‪1‬‬ ‫‪e− 2 x dx‬‬ ‫∞‪−‬‬ ‫‪k=0‬‬ ‫‬ ‫‪(n + 1 − m) 2n2 + 2m2 + 2nm + n − m‬‬ ‫= ‪k‬‬ ‫‪6‬‬ ‫‪ 1 Pn‬‬ ‫‪a‬‬ ‫‪n‬‬ ‫‪X‬‬ ‫‪2‬‬ ‫)‪q (1 + q‬‬ ‫ˆ‬ ‫‪n‬‬ ‫‪X‬‬ ‫‪k=m‬‬ ‫)‪n (n + 1) (2n + 1‬‬ ‫= ‪k‬‬ ‫‪6‬‬ ‫יהיו ‪ X1 , X2 , . . .‬משתנים מקריים בלתי־תלויים ושווי־התפלגות‬ ‫בעלי תוחלת ‪ µ‬ושונות ‪ .σ 2‬אז לכל ‪ a ∈ R‬מתקיים‪:‬‬ ‫‪ Pn‬‬ ‫‬ ‫‪i=1 Xi − nµ‬‬ ‫√‬ ‫‪lim P‬‬ ‫)‪≤ a = Φ (a‬‬ ‫∞→‪n‬‬ ‫‪σ n‬‬ ‫‪n‬‬ ‫‪k=0‬‬ ‫‪2‬‬ ‫משפט הגבול המרכזי‬ ‫‬ ‫‪i=1 Xi − µ‬‬ ‫√‬ ‫)‪≤ a = Φ (a‬‬ ‫‪σ/ n‬‬ ‫=‪k‬‬ ‫‪n‬‬ ‫‪X‬‬ ‫)‪(n + m) (n + 1 − m‬‬ ‫‪2‬‬ ‫∞→‪n‬‬ ‫מכאן‪ ,‬ככל שנגדיל את מספר הניסויים ‪ ,n‬הממוצע ‪Xi‬‬ ‫תוצאות הניסויים יתקרב לתוחלת ‪.µ‬‬ ‫‪6.7‬‬ ‫שונות‬ ‫= ‪qk‬‬ ‫= ‪kq k‬‬ ‫‪n‬‬ ‫‪X‬‬ ‫‪k=m‬‬ ‫‪n‬‬ ‫‪X‬‬ ‫‪k=0‬‬ ‫∞‬ ‫‪X‬‬ ‫‪k=0‬‬ ‫‪n‬‬ ‫‪X‬‬ ‫‪k=1‬‬ ‫‪1‬‬ ‫√ = )‪Φ (a‬‬ ‫‪2π‬‬ ‫‪7.2‬‬ ‫‪ P‬שהיא התפלגות רציפה‬ ‫היא ההתפלגות הנורמלית הסטנדרטית‪,‬‬ ‫‪n‬‬ ‫המקיימת ‪ .Φ (∞) = 1‬יהי ‪ An = n1 i=1 Xi‬הממוצע של‬ ‫תוצאות ‪ n‬הניסויים הראשונים‪ .‬קל לראות כי למשתנה המקרי‪:‬‬ ‫‪An − µ‬‬ ‫√‬ ‫‪σ/ n‬‬ ‫טיפים לפתרון בעיות‬ ‫• אם מצאנו הסתברויות של מאורעות שהאיחוד הזר שלהם הוא‬ ‫כל מרחב המדגם‪ ,‬כדאי לבדוק שסכום ההסתברויות הוא אכן‬ ‫‪.1‬‬ ‫• אם צריך למצוא את ההסתברות ש"לפחות איבר אחד מתוך‬ ‫קבוצה כלשהי מקיים תנאי כלשהו" אז לרוב עדיף למצוא את‬ ‫אחד מינוס ההסתברות המשלימה‪ ,‬כלומר ההסתברות "לא‬ ‫קיים אף איבר בקבוצה המקיים את התנאי"‪ .‬אחרת יש סכנה‬ ‫לספירות כפולות‪.‬‬ ‫= ‪Yn‬‬ ‫יש תוחלת ‪ 0‬ושונות ‪ ,1‬ומתקיים‪:‬‬ ‫)‪lim P (Yn ≤ a) = Φ (a‬‬ ‫∞→‪n‬‬ ‫• לפונקציה )‪ p (1 − p‬יש נקודת מקסימום ב־ ‪ ,p = 21‬וערכה שם‬ ‫הוא ‪. 41‬‬ ‫מכאן‪ ,‬ככל שנגדיל את מספר הניסויים ‪ ,n‬התפלגות הממוצע‬ ‫"המתוקנן" ‪ Yn‬תתקרב להתפלגות הנורמלית הסטנדרטית‪.‬‬ ‫אם ברשותנו טבלת התפלגות נורמלית בעלת ערכים חיוביים בלבד‪,‬‬ ‫נוכל להשתמש בנוסחה‪:‬‬ ‫• למציאת התוחלת של מכפלת משתנים מקריים ) ‪ E (XY‬ניתן‬ ‫להתנות באחד מהם ולהשתמש בנוסחת התוחלת השלמה‪.‬‬ ‫)‪Φ (−a) = 1 − Φ (a‬‬ ‫• אם קיבלנו התפלגות שהיא סימטרית סביב ערך ‪) c‬כלומר‬ ‫)‪ P (X = c + k) = P (X = c − k‬אז ‪.E (X) = c‬‬ ‫כמו כן נשים לב כי קיים קירוב גם לאי־שוויון בכיוון ההפוך‬ ‫)ההסתברות המשלימה(‪:‬‬ ‫• כדי להראות ששני משתנים מקריים ‪ X, Y‬הם תלויים מספיק‬ ‫למצוא ‪ k‬מסוים שעבורו )‪.P (X|Y = k) 6= P (X‬‬ ‫• אם צריך למצוא את היחס בין שני ערכים )למשל הסתברויות(‪,‬‬ ‫לפעמים חלק מהביטויים מצטמצמים ואין צורך לחשב אותם‪.‬‬ ‫לדוגמה‪ :‬בחישוב יחס בין הסתברויות מותנות המכנה עשוי‬ ‫להצטמצם‪.‬‬ ‫)‪lim P (Yn ≥ a) = 1 − Φ (a‬‬ ‫∞→‪n‬‬ ‫ולאי שוויון דו־צדדי )‪:(|Yn | ≤ a‬‬ ‫‪lim P (−a ≤ Yn ≤ a) = Φ (a) − Φ (−a) = 2Φ (a) − 1‬‬ ‫∞→‪n‬‬ ‫‪6‬‬