יסודות סטטיסטיקה תיאורית

‫יסודות סטטיסטיקה תיאורית‬
‫‪1‬‬
‫נושא ‪-‬קורס לסטטיסטיקה יישומית‬
‫יסודות סטטיסטיקה תיאורית‪:‬שני‬
‫מה לתאר ?‬
‫• אומדן מקום ("מרכז")‬
‫• אומדן פיזור‬
‫• צורת התפלגות סביב מרכז‬
‫‪2‬‬
‫נושא ‪-‬קורס לסטטיסטיקה יישומית‬
‫יסודות סטטיסטיקה תיאורית‪:‬שני‬
‫אומדני מיקום‬
‫•‬
‫•‬
‫•‬
‫•‬
‫‪3‬‬
‫ממוצע (‪)Mean‬‬
‫חציון (‪)Median‬‬
‫שכיח (‪)Mode‬‬
‫נקודת אמצע (‪)Midpoint‬‬
‫נושא ‪-‬קורס לסטטיסטיקה יישומית‬
‫יסודות סטטיסטיקה תיאורית‪:‬שני‬
‫משמעות המיצוע‬
‫סט של ‪ n‬נתונים שונים מתחלף‬
‫לסט של ‪ n‬נתונים שווים‪ ,‬אשר‬
‫יגרמו לאותה תוצאה סופית‪.‬‬
‫‪4‬‬
‫נושא ‪-‬קורס לסטטיסטיקה יישומית‬
‫יסודות סטטיסטיקה תיאורית‪:‬שני‬
‫ממוצע חשבוני ( דוגמה‪-‬משקל )‬
‫‪X‬‬
‫‪X n i‬‬
‫‪1‬‬
‫‪4‬‬
‫‪3‬‬
‫‪8‬‬
‫‪Formula:‬‬
‫‪2‬‬
‫‪Sample Mean = (2+8+3+4+1)/5 = 3.6‬‬
‫לא לעגל !‬
‫‪5‬‬
‫נושא ‪-‬קורס לסטטיסטיקה יישומית‬
‫יסודות סטטיסטיקה תיאורית‪:‬שני‬
‫תכונת הממוצע‬
‫סכום סטיות הנתונים יחסית לממוצע שווה אפס‬
‫ממוצע – ‪3.6‬‬
‫‪1‬‬
‫‪4‬‬
‫‪3‬‬
‫‪8‬‬
‫‪2‬‬
‫‪(-1.6) + (4.4) + (-0.6) + (0.4) + (-2.6) = 0‬‬
‫‪6‬‬
‫נושא ‪-‬קורס לסטטיסטיקה יישומית‬
‫יסודות סטטיסטיקה תיאורית‪:‬שני‬
‫ממוצע הנדסי (דוגמה – תנובה )‬
‫‪n X  X  ...  X‬‬
‫‪X‬‬
‫‪‬‬
‫‪geom.av.‬‬
‫‪1‬‬
‫‪2‬‬
‫‪n‬‬
‫‪Formula:‬‬
‫‪1‬‬
‫‪4‬‬
‫‪3‬‬
‫‪8‬‬
‫‪2‬‬
‫= ‪Geometrical Mean‬‬
‫‪X geom.av.  5 2  8  3  4 1  2.862‬‬
‫‪7‬‬
‫נושא ‪-‬קורס לסטטיסטיקה יישומית‬
‫יסודות סטטיסטיקה תיאורית‪:‬שני‬
‫ממוצע הרמוני ( דוגמה – התנגדות בחיבור מקבילי)‬
‫‪n‬‬
‫‪1‬‬
‫‪1‬‬
‫)‬
‫‪1‬‬
‫‪1‬‬
‫‪1‬‬
‫‪X‬‬
‫‪‬‬
‫‪X‬‬
‫‪‬‬
‫‪...‬‬
‫‪‬‬
‫‪X‬‬
‫‪1‬‬
‫‪1‬‬
‫‪2‬‬
‫‪n‬‬
‫‪‬‬
‫‪n‬‬
‫( )‬
‫‪1‬‬
‫‪ 2.264‬‬
‫‪8‬‬
‫‪1‬‬
‫)‬
‫‪4‬‬
‫‪i‬‬
‫‪X‬‬
‫‪i 1‬‬
‫‪n‬‬
‫‪3‬‬
‫(‬
‫‪Formula: X harm.av ‬‬
‫‪8‬‬
‫‪1 1 1 1 1‬‬
‫‪   ‬‬
‫‪ 2 8 3 4 1‬‬
‫‪5‬‬
‫‪2‬‬
‫( ‪Harmonic Mean‬‬
‫נושא ‪-‬קורס לסטטיסטיקה יישומית‬
‫יסודות סטטיסטיקה תיאורית‪:‬שני‬
‫היחס בין הממוצעים‬
‫‪X  X geom.av  X harm.av‬‬
‫‪3.6  2.862  2.264‬‬
‫‪9‬‬
‫נושא ‪-‬קורס לסטטיסטיקה יישומית‬
‫יסודות סטטיסטיקה תיאורית‪:‬שני‬
‫חציון ( ‪) 50/50‬‬
‫סדר נתונים מנמוך לגבוה !‬
‫‪ .1‬עבור מספר אי זוגי של נתונים כך נתון אמצעי‬
‫‪1‬‬
‫‪8‬‬
‫‪10‬‬
‫‪4‬‬
‫‪4‬‬
‫‪3‬‬
‫‪3‬‬
‫חציון‬
‫‪8‬‬
‫‪2‬‬
‫נושא ‪-‬קורס לסטטיסטיקה יישומית‬
‫יסודות סטטיסטיקה תיאורית‪:‬שני‬
‫‪2‬‬
‫‪Ordered Data: 1‬‬
‫חציון ‪ -‬המשך‬
‫‪ .2‬עבור מספר זוגי של נתונים כך נתון אמצעי כך ממוצע‬
‫של שני נתונים אמצעיים‬
‫‪2 8 3 4 1 8‬‬
‫‪8‬‬
‫‪8‬‬
‫‪4‬‬
‫‪3‬‬
‫‪2‬‬
‫‪Ordered Data: 1‬‬
‫‪Median = (3+4)/2 = 3.5‬‬
‫‪11‬‬
‫נושא ‪-‬קורס לסטטיסטיקה יישומית‬
‫יסודות סטטיסטיקה תיאורית‪:‬שני‬
‫תכונת החציון‬
‫סכום סטיות מוחלטות של הנתונים מהחציון‬
‫מינימאלי ביותר‬
‫‪12‬‬
‫נושא ‪-‬קורס לסטטיסטיקה יישומית‬
‫יסודות סטטיסטיקה תיאורית‪:‬שני‬
‫שכיח‬
‫• הנתון השכיח ביותר‬
‫• לאותו סט נתונים יתכן יותר משכיח אחד‬
‫• מתאים ביותר לנתונים קטגוריאליים‬
‫‪13‬‬
‫נושא ‪-‬קורס לסטטיסטיקה יישומית‬
‫יסודות סטטיסטיקה תיאורית‪:‬שני‬
‫נקודת אמצע‬
‫‪X min  X max‬‬
‫‪‬‬
‫‪2‬‬
‫‪14‬‬
‫נושא ‪-‬קורס לסטטיסטיקה יישומית‬
‫יסודות סטטיסטיקה תיאורית‪:‬שני‬
‫‪X midpoint‬‬
Consider 7 observations:
4.2, 4.3, 4.7, 4.8, 5.0, 5.1, 9.0.
Median = 4.8
Mean =5.3
Without extreme value-9.0
Without extreme value-9.0
Median = 4.75
Mean =4.7
Is affected by extreme
values that are not
representative of the rest
of the data, but easy to
update and use all the
information included in a
set.
Extreme values in data set
do not affect the median as
strongly as they do the
mean, but it is more
complicate to update it
and it doesn’t use all the
information included in a
set.
‫קורס לסטטיסטיקה יישומית‬- ‫נושא‬
‫שני‬:‫יסודות סטטיסטיקה תיאורית‬
15
‫אומדני פיזור‬
‫•‬
‫•‬
‫•‬
‫•‬
‫•‬
‫‪16‬‬
‫טווח (‪)R - Range‬‬
‫מרחק בין רבעוני ( ‪)Interquartile Range -IQR‬‬
‫סכום ריבועי סטיות (‪)SS - Sum of Squares‬‬
‫שונות (‪) Dispersion, Var – Variation‬‬
‫סטיית תקן (‪)SD - Standard Deviation‬‬
‫נושא ‪-‬קורס לסטטיסטיקה יישומית‬
‫יסודות סטטיסטיקה תיאורית‪:‬שני‬
‫טווח‬
‫‪R = X max - X min‬‬
‫טווח לא לוקח בחשבון כל מידע הכלוא בין ערכים‬
‫קיצוניים ומושפע חזק מהם‬
‫‪17‬‬
‫נושא ‪-‬קורס לסטטיסטיקה יישומית‬
‫יסודות סטטיסטיקה תיאורית‪:‬שני‬
‫מרחק בין רבעוני‬
‫‪IQR = Q3 - Q1‬‬
‫• ‪ - Q1‬רבעון ראשון ‪,‬ז‪.‬א‪ .‬חציון של‬
‫המחצית התחתונה‬
‫• ‪ - Q3‬רבעון שלישי ‪,‬ז‪.‬א‪ .‬חציון של‬
‫המחצית העליונה‬
‫‪18‬‬
‫נושא ‪-‬קורס לסטטיסטיקה יישומית‬
‫יסודות סטטיסטיקה תיאורית‪:‬שני‬
‫מרחק בין רבעוני ‪ -‬דוגמה‬
‫‪Data: 2, 3, 4, 5, 6, 6, 6, 7, 7, 8, 9‬‬
‫‪Upper quartile - 7‬‬
‫‪Lower quartile - 4‬‬
‫‪IQR = 7 - 4 = 3‬‬
‫‪19‬‬
‫נושא ‪-‬קורס לסטטיסטיקה יישומית‬
‫יסודות סטטיסטיקה תיאורית‪:‬שני‬
‫סכום ריבוי סטיות ופירוקו למרכיבים‬
‫‪2‬‬
‫‪ni‬‬
‫‪k‬‬
‫) ‪SST   ( X ij  X‬‬
‫‪i 1 j 1‬‬
‫‪2‬‬
‫‪ni‬‬
‫‪k‬‬
‫) ‪SSW   ( X ij  X i‬‬
‫‪i 1 j 1‬‬
‫‪k‬‬
‫‪2‬‬
‫) ‪SSB   ni ( X i  X‬‬
‫‪i 1‬‬
‫‪SST  SSB  SSW‬‬
‫‪20‬‬
‫נושא ‪-‬קורס לסטטיסטיקה יישומית‬
‫יסודות סטטיסטיקה תיאורית‪:‬שני‬
‫משמעות הסימנים‬
‫‪ – ni‬מספר נתונים בקבוצה ‪( i‬מתוך‬
‫סה''כ ‪ k‬קבוצות)‬
‫‪ - X i‬ממוצע קבוצתי‬
‫‪X‬‬
‫‪21‬‬
‫ ממוצע כולל‬‫נושא ‪-‬קורס לסטטיסטיקה יישומית‬
‫יסודות סטטיסטיקה תיאורית‪:‬שני‬
‫הגדרת השונות‬
‫‪2‬‬
‫)‪ X‬‬
‫‪N‬‬
‫‪i‬‬
‫‪(X‬‬
‫‪i 1‬‬
‫‪N‬‬
‫‪2‬‬
‫)‪ X‬‬
‫‪S‬‬
‫‪N‬‬
‫‪i‬‬
‫‪(X‬‬
‫‪N 1‬‬
‫‪22‬‬
‫‪‬‬
‫‪2‬‬
‫‪N‬‬
‫‪i 1‬‬
‫‪‬‬
‫נושא ‪-‬קורס לסטטיסטיקה יישומית‬
‫יסודות סטטיסטיקה תיאורית‪:‬שני‬
‫‪2‬‬
‫‪N 1‬‬
‫‪s‬‬
n ‫ קבוצות שווי גודל‬k ‫פירוק השונות עבור‬
http://www.psych.utah.edu/stat/introstats/anovaflash.html
N  k n
k
k
S
2
total
1
2
  si 
k i 1
(X
i 1
i
 X)
k
‫קורס לסטטיסטיקה יישומית‬- ‫נושא‬
‫שני‬:‫יסודות סטטיסטיקה תיאורית‬
2
S
2
within
S
2
between
23
‫תכונות השונות‪-‬שינוי קנה מידה‬
‫‪2‬‬
‫) ‪ X‬‬
‫) ‪   s (X‬‬
‫‪2‬‬
‫‪2‬‬
‫‪N‬‬
‫‪2‬‬
‫) ‪(X‬‬
‫‪24‬‬
‫‪2‬‬
‫‪N 1‬‬
‫‪ s‬‬
‫‪2‬‬
‫‪N‬‬
‫‪i‬‬
‫‪ (X‬‬
‫‪i 1‬‬
‫‪N‬‬
‫) ‪ X‬‬
‫‪s (X ) ‬‬
‫‪2‬‬
‫‪N‬‬
‫‪N‬‬
‫‪i‬‬
‫‪ (X‬‬
‫‪N‬‬
‫נושא ‪-‬קורס לסטטיסטיקה יישומית‬
‫יסודות סטטיסטיקה תיאורית‪:‬שני‬
‫‪i 1‬‬
‫‪(X ) ‬‬
‫‪2‬‬
‫‪N 1‬‬
‫‪s‬‬
‫תכונות השונות‪-‬שונות של סכום‬
‫) ‪ X )  (Yi  Y‬‬
‫‪N‬‬
‫‪i‬‬
‫‪(X‬‬
‫‪i 1‬‬
‫‪N‬‬
‫‪S ( X  Y )  S ( X )  S (Y )  2 ‬‬
‫‪2‬‬
‫‪N‬‬
‫‪2‬‬
‫‪N‬‬
‫נגדיר מקדם מתאם מדגמי‪:‬‬
‫‪1‬‬
‫) ‪ X )  (Yi  Y‬‬
‫‪N‬‬
‫‪i‬‬
‫‪(X‬‬
‫‪i 1‬‬
‫) ‪N  S N ( X )  S N (Y‬‬
‫‪ 1   XY ‬‬
‫) ‪S N2 ( X  Y )  S N2 ( X )  S N2 (Y )  2   XY  S ( X )  S (Y‬‬
‫‪25‬‬
‫נושא ‪-‬קורס לסטטיסטיקה יישומית‬
‫יסודות סטטיסטיקה תיאורית‪:‬שני‬
‫‪2‬‬
‫‪N‬‬
‫תכונות השונות‪-‬שונות של סכום (המשך)‬
‫חוק הצטברות השונות‬
‫רק כאשר ‪ X‬ו‪ Y-‬בלתי תלויים ‪ ‬שווה אפס‬
‫) ‪S ( X  Y )  S ( X )  S (Y‬‬
‫‪2‬‬
‫‪26‬‬
‫‪2‬‬
‫נושא ‪-‬קורס לסטטיסטיקה יישומית‬
‫יסודות סטטיסטיקה תיאורית‪:‬שני‬
‫‪2‬‬
‫תכונות השונות‪-‬שונות של ממוצע‬
‫‪2‬‬
‫‪2‬‬
‫‪X‬‬
‫‪‬‬
‫‪X‬‬
‫‪‬‬
‫‪...‬‬
‫‪‬‬
‫‪X‬‬
‫‪1‬‬
‫‪n‬‬
‫‪‬‬
‫‪S‬‬
‫‪S‬‬
‫‪2‬‬
‫‪n‬‬
‫‪S2(X )  S2( 1‬‬
‫‪)  2 S 2 ( X 1  X 2  ...  X n )  2 X  X‬‬
‫‪n‬‬
‫‪n‬‬
‫‪n‬‬
‫‪n‬‬
‫‪2‬‬
‫‪X‬‬
‫‪S‬‬
‫‪S (X ) ‬‬
‫‪n‬‬
‫‪27‬‬
‫‪2‬‬
‫נושא ‪-‬קורס לסטטיסטיקה יישומית‬
‫יסודות סטטיסטיקה תיאורית‪:‬שני‬
‫מדוע שונות היא אויב האיכות ?‬
‫–‬
‫–‬
‫–‬
‫–‬
‫–‬
‫–‬
‫–‬
‫‪28‬‬
‫נושא ‪-‬קורס לסטטיסטיקה יישומית‬
‫יסודות סטטיסטיקה תיאורית‪:‬שני‬
‫כיצד להתמודדות עם התפשטות השונות ?‬
‫‪ .1‬לנתח שונות ע''י פירוקה למרכיבים ‪ANOVA-‬‬
‫‪ .2‬לטפל בגורמי שונות דומיננטיים‬
‫גורמי שונות אפשריים‪:‬‬
‫• ח''ג‬
‫• ציוד‬
‫• מפעיל‬
‫• שיטת עבודה ‪...‬‬
‫‪29‬‬
‫נושא ‪-‬קורס לסטטיסטיקה יישומית‬
‫יסודות סטטיסטיקה תיאורית‪:‬שני‬
‫סטיית תקן‬
‫‪2‬‬
‫)‪ X‬‬
‫‪N‬‬
‫‪i‬‬
‫‪(X‬‬
‫‪sN ‬‬
‫‪i 1‬‬
‫‪N‬‬
‫‪2‬‬
‫)‪ X‬‬
‫‪N‬‬
‫‪i‬‬
‫‪(X‬‬
‫‪N 1‬‬
‫‪30‬‬
‫‪i 1‬‬
‫‪s N 1 ‬‬
‫נושא ‪-‬קורס לסטטיסטיקה יישומית‬
‫יסודות סטטיסטיקה תיאורית‪:‬שני‬
‫סטיית תקן של ממוצע‬
‫) ‪s( X‬‬
‫‪s( X ) ‬‬
‫‪n‬‬
‫‪31‬‬
‫נושא ‪-‬קורס לסטטיסטיקה יישומית‬
‫יסודות סטטיסטיקה תיאורית‪:‬שני‬
‫השוואה בין אומדני פיזור שונים‪ -‬יתרונות‬
‫וחסרונות של כל מדד‬
‫‪IQR‬‬
‫)‪Var (S2‬‬
‫)‪SD (S‬‬
‫יתרונות‬
‫פשוט לחישוב‬
‫• פחות‬
‫רגיש‬
‫לקיצוניות‪,‬‬
‫• יחסית‬
‫פשוט‬
‫לחישוב‬
‫• כוללני‪,‬‬
‫• כל בפירוק למרכיבים‬
‫קבוצתיים‪,‬‬
‫• פחות רגיש‬
‫לקיצוניות‪.‬‬
‫• כוללני‪,‬‬
‫• פחות רגיש‬
‫לקיצוניות‪,‬‬
‫• בעל מימד של‬
‫הנמדד‬
‫חסרונות‬
‫• רגיש לקיצוניות‪,‬‬
‫• מזלזל בכל מידע‬
‫• למעט קיצוניים‬
‫•לא‬
‫מתחשב‬
‫בכל‬
‫הנתונים‬
‫• דורש חישוב‪,‬‬
‫• לא בעל מימד של‬
‫הנמדד‪.‬‬
‫• דורש חישוב‪,‬‬
‫• לא ניתן‬
‫לפירוק‬
‫למרכיבים‬
‫‪R‬‬
‫‪32‬‬
‫נושא ‪-‬קורס לסטטיסטיקה יישומית‬
‫יסודות סטטיסטיקה תיאורית‪:‬שני‬
‫פונקצית התפלגות של משתנה מקרי בדיד‬
‫דוגמאות של משתנה בדיד‪ :‬כמות ילדים במשפחה‪,‬ציון במבחן‪,‬יום‬
‫בשבוע‪ ,‬וכד'‬
‫נסמן את הערכים האפשריים של מ''מ בדיד – ‪xi‬‬
‫…‪ x2=2,‬או …‪x1=Sunday, x2=Monday,‬‬
‫‪,‬למשל‬
‫‪x1=1,‬‬
‫ונגדיר )‪ P(i‬כי הסתברות לכך שמ''מ ‪ X‬יקבל את הערך‬
‫‪ . xi‬כמובן ‪ P  1 ,‬‬
‫‪i‬‬
‫‪i‬‬
‫ניתן להעריך את ההסתברות בעזרת שכיחות יחסית – ‪ f i‬בסדרה‬
‫ארוכה של ניסויים‪.‬‬
‫‪33‬‬
‫נושא ‪-‬קורס לסטטיסטיקה יישומית‬
‫יסודות סטטיסטיקה תיאורית‪:‬שני‬
‫פונקצית התפלגות של משתנה מקרי‬
‫בינומי‬
‫)‪(i  0,1,2,3....n‬‬
‫‪ pi (1 p)n  i‬‬
‫‪E( X / n)  p‬‬
‫)‪p(1 p‬‬
‫‪Var( X / n) ‬‬
‫‪n‬‬
‫‪34‬‬
‫‪n‬‬
‫‪  ‬‬
‫‪i‬‬
‫‪Xi  i‬‬
‫)‪P( X  i‬‬
‫‪E( X )  np‬‬
‫)‪Var( X )  np(1 p‬‬
‫נושא ‪-‬קורס לסטטיסטיקה יישומית‬
‫יסודות סטטיסטיקה תיאורית‪:‬שני‬
‫פונקצית התפלגות של משתנה מקרי‬
‫בינומי )‪( n=100,p=0.3‬‬
‫)‪P(i‬‬
‫‪150‬‬
‫‪35‬‬
‫‪100‬‬
‫‪50‬‬
‫נושא ‪-‬קורס לסטטיסטיקה יישומית‬
‫יסודות סטטיסטיקה תיאורית‪:‬שני‬
‫‪0.1‬‬
‫‪0.09‬‬
‫‪0.08‬‬
‫‪0.07‬‬
‫‪0.06‬‬
‫‪0.05‬‬
‫‪0.04‬‬
‫‪0.03‬‬
‫‪0.02‬‬
‫‪0.01‬‬
‫‪0‬‬
‫‪-0.01 0‬‬
‫)‪P(i‬‬
‫פונקצית התפלגות של משתנה מקרי‬
‫פואסוני (יכול להיות קירוב לבינומי ‪)np = λ‬‬
‫)‪Xi  i (i  0,1,2,3....n‬‬
‫‪i‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪P( X  i)  e‬‬
‫!‪i‬‬
‫‪E ( X / n)   n‬‬
‫‪‬‬
‫‪Var( X / n)  2‬‬
‫‪n‬‬
‫‪36‬‬
‫‪E( X )  ‬‬
‫‪Var( X )  ‬‬
‫נושא ‪-‬קורס לסטטיסטיקה יישומית‬
‫יסודות סטטיסטיקה תיאורית‪:‬שני‬
‫פונקצית התפלגות של משתנה מקרי‬
‫פואסוני )‪( λ=30‬‬
‫)‪P(i‬‬
‫‪0.08‬‬
‫‪0.07‬‬
‫‪0.06‬‬
‫‪0.05‬‬
‫‪0.04‬‬
‫‪0.03‬‬
‫‪0.02‬‬
‫‪0.01‬‬
‫‪0‬‬
‫‪150‬‬
‫‪37‬‬
‫‪100‬‬
‫‪50‬‬
‫נושא ‪-‬קורס לסטטיסטיקה יישומית‬
‫יסודות סטטיסטיקה תיאורית‪:‬שני‬
‫‪-0.01 0‬‬
‫)‪P(i‬‬
‫פונקצית התפלגות מצטברת של משתנה‬
‫מקרי בדיד‪cdf-‬‬
‫‪i‬‬
‫‪F ( X i )   Pj‬‬
‫‪j 0‬‬
‫) ‪Pi  F ( X i )  F ( X i 1‬‬
‫‪38‬‬
‫נושא ‪-‬קורס לסטטיסטיקה יישומית‬
‫יסודות סטטיסטיקה תיאורית‪:‬שני‬
‫פונקצית התפלגות מצטברת של משתנה‬
‫מקרי פואסוני )‪( λ=30‬‬
‫)‪F(i‬‬
‫‪1.2‬‬
‫‪1‬‬
‫‪0.8‬‬
‫‪0.6‬‬
‫‪0.4‬‬
‫‪0.2‬‬
‫‪0‬‬
‫‪150‬‬
‫‪39‬‬
‫‪100‬‬
‫‪50‬‬
‫נושא ‪-‬קורס לסטטיסטיקה יישומית‬
‫יסודות סטטיסטיקה תיאורית‪:‬שני‬
‫‪-0.2 0‬‬
‫)‪F(i‬‬
‫פונקצית התפלגות של משתנה מקרי רציף‬
‫נסמן את הערכים האפשריים של מ''מ רציף – ‪, x‬‬
‫ונגדיר ‪ f(x)Δx‬כי הסתברות לכך שמ''מ ‪ X‬יקבל את‬
‫הערך בטווח שבין ‪ x‬לבין ‪x+Δx‬‬
‫)‪ f(x‬מכונה – ‪ - pdf‬פונקצית צפיפות‬
‫הסתברות‪.‬כמובן‪:‬‬
‫‪ f ( x)dx  1‬‬
‫‪40‬‬
‫נושא ‪-‬קורס לסטטיסטיקה יישומית‬
‫יסודות סטטיסטיקה תיאורית‪:‬שני‬
‫פונקצית התפלגות אחידה‬
Probability Density Function
Cumulative Distribution Function
F ( x)   f ( x)dx
f ( x)  F 
x
x

‫קורס לסטטיסטיקה יישומית‬- ‫נושא‬
‫שני‬:‫יסודות סטטיסטיקה תיאורית‬
41
‫פונקצית התפלגות אחידה (המשך)‬
‫‪Mean:‬‬
‫‪Median:‬‬
‫]‪Mode: any value in [a,b‬‬
‫‪Variance:‬‬
‫‪42‬‬
‫נושא ‪-‬קורס לסטטיסטיקה יישומית‬
‫יסודות סטטיסטיקה תיאורית‪:‬שני‬
‫פונקצית התפלגות אחידה (המשך)‬
‫ע''י שינוי בקנה מידה מ''מ תמיד ניתן להביא לטווח [‪]0,1‬‬
‫אם‬
‫‪43‬‬
‫)‪X ~ Uniform(a, b‬‬
‫‪xa‬‬
‫‪z‬‬
‫אזי )‪~ Uniform(0,1‬‬
‫‪ba‬‬
‫נושא ‪-‬קורס לסטטיסטיקה יישומית‬
‫יסודות סטטיסטיקה תיאורית‪:‬שני‬
‫פונקצית התפלגות נורמלית‪pdf-‬‬
‫‪( x   )2‬‬
‫) ‪Probability Density Function f ( x)  2    exp { 2   2 }  N ( , ‬‬
‫‪1‬‬
‫‪( x   )2‬‬
‫) ‪}  N ( , ‬‬
‫‪2  2‬‬
‫‪44‬‬
‫נושא ‪-‬קורס לסטטיסטיקה יישומית‬
‫יסודות סטטיסטיקה תיאורית‪:‬שני‬
‫‪ exp {‬‬
‫‪1‬‬
‫‪2  ‬‬
‫‪f ( x) ‬‬
‫פונקצית התפלגות נורמלית‪cdf-‬‬
‫)‪Cumulative Distribution Function F(x‬‬
‫‪45‬‬
‫נושא ‪-‬קורס לסטטיסטיקה יישומית‬
‫יסודות סטטיסטיקה תיאורית‪:‬שני‬
‫פונקצית התפלגות נורמלית מתוקנת‬
‫ע''י שינוי בקנה מידה מ''מ תמיד ניתן להביא ל‪N(0,1) -‬‬
‫אם‪X ~ N (  ,  ) :‬‬
‫‪46‬‬
‫אזי ציון תקן‪~ N (0,1) :‬‬
‫נושא ‪-‬קורס לסטטיסטיקה יישומית‬
‫יסודות סטטיסטיקה תיאורית‪:‬שני‬
‫‪x‬‬
‫‪‬‬
‫‪z‬‬
‫פונקצית התפלגות נורמלית‬
‫‪μ‬‬
‫‪μ‬‬
‫‪Median:‬‬
‫‪μ‬‬
‫‪σ2‬‬
‫‪47‬‬
‫נושא ‪-‬קורס לסטטיסטיקה יישומית‬
‫יסודות סטטיסטיקה תיאורית‪:‬שני‬
‫‪Mean:‬‬
‫‪Mode:‬‬
‫‪Variance:‬‬
‫התפלגות נורמלית‬
‫מנקודת מבט של ‪Six sigma‬‬
‫‪48‬‬
‫נושא ‪-‬קורס לסטטיסטיקה יישומית‬
‫יסודות סטטיסטיקה תיאורית‪:‬שני‬