מבוא לחשיבה מחקרית התפלגות נורמאלית, מדגימה לאוכלוסיה

‫שיעור ‪ 8‬אומדן מיקום יחסי‬
‫ציוני תקן‬
‫אפשר להמיר כל ציון גולמי לציון תקן המתאר את מיקומה של התצפית‬
‫ביחס לממוצע‪ .‬ההמרה לציוני תקן מניבה ציון הנקרא ציון ‪.(Z score) Z‬‬
‫המרה זאת מתבצעת באמצעות הנוסחה הבאה‪:‬‬
‫‪x−x‬‬
‫‪σ‬‬
‫=‪Z‬‬
‫ציון התקן נותן את מיקומה היחסי של תצפית מסוימת ביחס לכלל‬
‫האוכלוסיה‪ .‬הציון מחושב כהפרש מהממוצע ביחידות של סטיות תקן‪.‬‬
‫לדוגמא‪:‬‬
‫תלמיד שציונו בסטטיסטיקה ‪ 89‬כשממוצע הכיתה הוא ‪ 77‬עם סטית תקן ‪.12‬‬
‫ציון התקן של התלמיד הוא סטית תקן אחת מעל ממוצע הכיתה )‪.(Z=1‬‬
‫ציון התלמיד במבוא הוא ‪ 93‬כשממוצע הכיתה הוא ‪ 88‬עם סטית תקן ‪.10‬‬
‫באיזה מקצוע התלמיד מצליח יותר יחסית לכיתתו?‬
‫ציון ‪ Z‬של התלמיד במבוא הוא ‪ 0.5‬כלומר הוא נמצא רק מחצית סטית תקן מעל‬
‫ממוצע הכיתה‪ .‬תלמיד זה מצליח בסטטיסטיקה יותר מאשר במבוא‪.‬‬
‫‪X-mean (X-mean)2‬‬
‫‪Zscore‬‬
‫‪-1.71‬‬
‫‪-1.33‬‬
‫‪-1.13‬‬
‫‪-1.13‬‬
‫‪-1.09‬‬
‫‪-0.99‬‬
‫‪-0.85‬‬
‫‪-0.75‬‬
‫‪-0.56‬‬
‫‪-0.56‬‬
‫‪-0.41‬‬
‫‪-0.27‬‬
‫‪-0.17‬‬
‫‪-0.12‬‬
‫‪-0.12‬‬
‫‪0.02‬‬
‫‪0.02‬‬
‫‪0.12‬‬
‫‪0.12‬‬
‫‪0.16‬‬
‫‪0.21‬‬
‫‪0.31‬‬
‫‪0.50‬‬
‫‪0.60‬‬
‫‪0.60‬‬
‫‪0.88‬‬
‫‪1.17‬‬
‫‪1.46‬‬
‫‪2.13‬‬
‫‪2.90‬‬
‫‪0‬‬
‫‪79.21‬‬
‫‪47.61‬‬
‫‪34.81‬‬
‫‪34.81‬‬
‫‪31.92‬‬
‫‪26.52‬‬
‫‪19.36‬‬
‫‪15.21‬‬
‫‪8.41‬‬
‫‪8.41‬‬
‫‪4.62‬‬
‫‪1.96‬‬
‫‪0.81‬‬
‫‪0.42‬‬
‫‪0.42‬‬
‫‪0.01‬‬
‫‪0.01‬‬
‫‪0.36‬‬
‫‪0.36‬‬
‫‪0.72‬‬
‫‪1.21‬‬
‫‪2.56‬‬
‫‪6.76‬‬
‫‪9.61‬‬
‫‪9.61‬‬
‫‪21.16‬‬
‫‪37.21‬‬
‫‪57.76‬‬
‫‪123.21‬‬
‫‪228.01‬‬
‫‪-8.9‬‬
‫‪-6.9‬‬
‫‪-5.9‬‬
‫‪-5.9‬‬
‫‪-5.65‬‬
‫‪-5.15‬‬
‫‪-4.4‬‬
‫‪-3.9‬‬
‫‪-2.9‬‬
‫‪-2.9‬‬
‫‪-2.15‬‬
‫‪-1.4‬‬
‫‪-0.9‬‬
‫‪-0.65‬‬
‫‪-0.65‬‬
‫‪0.1‬‬
‫‪0.1‬‬
‫‪0.6‬‬
‫‪0.6‬‬
‫‪0.85‬‬
‫‪1.1‬‬
‫‪1.6‬‬
‫‪2.6‬‬
‫‪3.1‬‬
‫‪3.1‬‬
‫‪4.6‬‬
‫‪6.1‬‬
‫‪7.6‬‬
‫‪11.1‬‬
‫‪15.1‬‬
‫העדרות מס' סידורי‬
‫של העובד‬
‫בימים‬
‫‪0‬‬
‫‪1‬‬
‫‪2‬‬
‫‪2‬‬
‫‪3‬‬
‫‪3‬‬
‫‪3‬‬
‫‪4‬‬
‫‪3.25‬‬
‫‪5‬‬
‫‪3.75‬‬
‫‪6‬‬
‫‪4.5‬‬
‫‪7‬‬
‫‪5‬‬
‫‪8‬‬
‫‪6‬‬
‫‪9‬‬
‫‪6‬‬
‫‪10‬‬
‫‪6.75‬‬
‫‪11‬‬
‫‪7.5‬‬
‫‪12‬‬
‫‪8‬‬
‫‪13‬‬
‫‪8.25‬‬
‫‪14‬‬
‫‪8.25‬‬
‫‪15‬‬
‫‪9‬‬
‫‪16‬‬
‫‪9‬‬
‫‪17‬‬
‫‪9.5‬‬
‫‪18‬‬
‫‪9.5‬‬
‫‪19‬‬
‫‪9.75‬‬
‫‪20‬‬
‫‪10‬‬
‫‪21‬‬
‫‪10.5‬‬
‫‪22‬‬
‫‪11.5‬‬
‫‪23‬‬
‫‪12‬‬
‫‪24‬‬
‫‪12‬‬
‫‪25‬‬
‫‪13.5‬‬
‫‪26‬‬
‫‪15‬‬
‫‪27‬‬
‫‪16.5‬‬
‫‪28‬‬
‫‪20‬‬
‫‪29‬‬
‫‪24‬‬
‫‪30‬‬
‫‪267 Σ(X-mean)2= 813.08‬‬
‫‪2‬‬
‫= ‪σ‬‬
‫‪30‬‬
‫‪27.10‬‬
‫=‪σ‬‬
‫‪8.9‬‬
‫‪5.21‬‬
‫=‪Σ‬‬
‫=‪n‬‬
‫=‪Mean‬‬
‫‪1‬‬
‫תכונות ציוני התקן‬
‫• לציוני תקן )‪ (Z‬ממוצע ‪ 0‬וסטית תקן ‪ .1‬זאת ללא‬
‫תלות ביחידות ובערכים של משתנה הנמדד‪ .‬לכן ציון‬
‫התקן נקרא ציון סטנדרטי‪.‬‬
‫• ציוני תקן הם מספרים טהורים )אינם תלויים ביחידות‬
‫המדידה(‪ .‬לכן באמצעות ציוני תקן אפשר להשוות‬
‫מיקום יחסי של תצפיות מסולמות מדידה שונים‬
‫למשל אפשר להשוות גובה יחסי למשקל יחסי‪.‬‬
‫תכונות ציוני תקן‬
‫לציוני תקן ממוצע ‪ 0‬כי‪:‬‬
‫‪σ = Σ( xi − x ) = 0 = 0‬‬
‫‪n ⋅σ‬‬
‫‪n ⋅σ‬‬
‫מכיוון ש‪:‬‬
‫) ‪Σ( xi − x‬‬
‫‪n‬‬
‫‪Σz‬‬
‫= ‪Z= i‬‬
‫‪n‬‬
‫‪Σ( xi − x ) = 0‬‬
‫‪2‬‬
‫תכונות ציוני תקן‬
‫לציוני תקן סטית תקן ‪ 1‬כי‪:‬‬
‫‪Σ( zi − z ) 2‬‬
‫‪Σzi2‬‬
‫‪Σzi2‬‬
‫=‬
‫= ‪−0‬‬
‫‪n‬‬
‫‪n‬‬
‫‪n‬‬
‫נציב בנוסחה את ‪:Zi‬‬
‫‪xi − x‬‬
‫‪σ‬‬
‫= ‪σZ‬‬
‫= ‪Zi‬‬
‫‪2‬‬
‫‪2‬‬
‫‪σ 2 = Σ( xi − x ) = σ = 1‬‬
‫‪n ⋅σ 2‬‬
‫‪σ2‬‬
‫‪Σ( xi − x ) 2‬‬
‫=‬
‫‪n‬‬
‫כמעט כל הסולמות הפסיכומטריים מבוססים על ציונים‬
‫סטנדרטיים‪ .‬כדי להמנע מערכים שליליים ממירים את סולם ציוני‬
‫התקן לסולם שתמיד יהיה חיובי‬
‫כך סולם ציוני המשכל )אינטליגנציה( הוא סולם ה‪ IQ-‬שבו הממוצע‬
‫הוא ‪ 100‬וסטית התקן היא ‪ .15‬תאורטית הסולם נע מ‪ 40-‬שזה ‪4‬‬
‫סטיות תקן מתחת לממוצע עד ‪ 4 160‬סטיות תקן מעל לממוצע‪.‬‬
‫ילד בעל ‪ IQ=130‬נמצא שתי סטיות תקן מעל הממוצע ונחשב‬
‫למכונן מאוד‪.‬‬
‫הסולם הפסיכומטרי עוד יותר פשוט‪ .‬הממוצע הוא ‪ 500‬וסטית‬
‫התקן היא ‪ 100‬כך שכל מי שהוציא מעל ‪ 700‬נמצא מעל ל‪2 -‬‬
‫סטיות תקן מהממוצע‪.‬‬
‫‪3‬‬
‫סיכום הנושאים בסטטיסטיקה תאורית‬
‫‪.1‬‬
‫‪.2‬‬
‫‪.3‬‬
‫‪.4‬‬
‫‪.5‬‬
‫‪.6‬‬
‫‪.7‬‬
‫‪.8‬‬
‫‪.9‬‬
‫מהי סטטיסטיקה ומתי נשתמש בה‪.‬‬
‫מהי סטטיסטיקה תאורית‪.‬‬
‫מושגי יסוד בסטטיסטיקה‪.‬‬
‫סולמות מדידה )שמי‪ ,‬סודר‪ ,‬רווח‪ ,‬מוחלט(‪.‬‬
‫מדדי מיקום מרכזי‪ :‬שכיח‪ ,‬חציון וממוצע‪.‬‬
‫‪ 3‬פונקציות הפסד‪.‬‬
‫מדדי מיקום מרכזי בהתפלגויות סימטריות ואסימטריות‪.‬‬
‫מדדי פיזור‪ :‬טווח‪ ,‬תחום בין רבעוני‪ ,‬ממוצע סטיות מוחלטות ושונות‪.‬‬
‫מדדי מיקום יחסי‪ :‬רבעונים‪ ,‬עשירונים‪ ,‬מאונים‪ ,‬וציוני תקן )‪.(Z‬‬
‫מדדים בסטטיסטיקה תאורית‬
‫אותם צריך לדעת לחשב‬
‫‪.1‬‬
‫‪.2‬‬
‫‪.3‬‬
‫‪.4‬‬
‫‪.5‬‬
‫להציג נתונים הטבלת שכיחויות‪ ,‬דיאגרמת מקלות‪ ,‬היסטוגרמה‪.‬‬
‫שכיח – במשתנה שמי‪ ,‬במשתנה בדיד ובמשתנה רציף מתוך היסטוגרמה‪.‬‬
‫חציון‪ ,‬רבעון‪ ,‬עשירון ומאון – ע"ס הנתונים הגולמיים‪.‬‬
‫ממוצע של נתונים גולמיים ונתונים מקובצים למחלקות‪.‬‬
‫טווח‪ ,‬תחום בין רבעוני‪ ,‬שונות )לציונים גולמיים ומקובצים(‪ ,‬סטית תקן‬
‫וציוני תקן‪.‬‬
‫נושאים כגון מעבר מהיסטוגרמה למצולע שכיחויות‪ ,‬חישובי שטח‬
‫וצפיפות מתחת לעקומה‪ ,‬חישוב פונקציות הפסד שונות‪ ,‬והוכחות‬
‫לטענות סטטיסטיות‪ ,‬לא צריך לדעת לבצע‪ ,‬צריך רק להבין את‬
‫העקרונות המנחים‪.‬‬
‫‪4‬‬
‫מבוא להסקה סטטיסטית‬
‫המטרה של הסקה סטטיסטית היא להגיע למסקנה מדעית מתוך‬
‫האומדנים הסטטיסטים של הנתונים‪.‬‬
‫ברוב המקרים לא ניתן למדוד את האוכלוסיה כולה ומסתפקים‬
‫בדגימה המיצגת את האוכלוסיה‪ .‬באמצעות הדגימה מסיקים לגבי‬
‫הפרמטרים של האוכלוסיה הרלבנטית‪ .‬לזיהוי גורמים משפיעים‬
‫)יוצרים הבדל( דרושה הסקה סטטיסטית גם כאשר כל נתוני‬
‫האוכלוסיה זמינים‪.‬‬
‫לתאור תהליך ההסקה יש להבחין בין הפרמטרים של האוכלוסיה‬
‫לבין הסטטיסטים של המדגם‪.‬‬
‫פרמטר – ערך המתאר את האוכלוסיה‪ :‬ממוצע = ‪ ,μ‬סטית התקן = ‪.σ‬‬
‫̄‪ ,x‬סטית תקן = ‪.s‬‬
‫=̄‬
‫̄̄‬
‫סטטיסט – ערך המחושב לפי המדגם‪ :‬ממוצע ̄‬
‫המדגם‬
‫כדי לאפשר הסקה סטטיסטית המדגם צריך ליצג את אוכלוסיית המחקר‪.‬‬
‫סוגי מדגמים‪:‬‬
‫‪ .1‬מדגם מקרי פשוט – לכל מקרה באוכלוסיה יש הסתברות שווה‬
‫להכלל במדגם‪ ,‬אין תלות או קשר בין המקרים‪.‬‬
‫‪ .2‬דגימת אשכולות – חלוקה של האוכלוסיה לאשכולות ודגימה‬
‫מקרית של חלק מהאשכולות‪.‬‬
‫‪ .3‬דגימת שכבות – דגימה מקרית ויחסית בתוך שכבות האוכלוסיה‪.‬‬
‫‪ .4‬דגימה שיטתית – בחירה מחזורית של מקרים לפי שיטה שאינה‬
‫קשורה למחזוריות כל שהיא באוכלוסיה‪.‬‬
‫‪5‬‬
‫התאוריה‬
‫ההסקה הסטטיסטית מתבססת על מתמטיקה והסתברות כתאוריה‪.‬‬
‫הכלים – תוצרים של חישובים המבוססים על הסתברות ומשמשים‬
‫לחישוב הסיכוי לטעות ואפשרות ההטיה במעבר ממדגם לאוכלוסיה‪.‬‬
‫כלי ראשון הוא ההתפלגות הנורמאלית‪:‬‬
‫• הרבה תופעות בטבע מתפלגות בצורה סימטרית דמוית פעמון‪.‬‬
‫• התפלגות סימטרית דמוית פעמון מכונה גם התפלגות נורמאלית או פעמון גאוס‪.‬‬
‫• בהתפלגות נורמאלית הממוצע זהה לחציון ולשכיח‪.‬‬
‫• להתפלגות הנורמאלית יכול להיות כל ממוצע וסטית תקן ידועים אך טווח הערכים אינו ידוע‪.‬‬
‫• כדי להשתמש בהתפלגות הנורמאלית צריך נוסחה מתמטית שתניב תאור מדויק העונה על התנאים הנ"ל‪.‬‬
‫• הנוסחה של התפלגות נורמאלית מקבלת כפרמטרים את הממוצע וסטית התקן של האוכלוסיה ומתארת‬
‫את התפלגותה בטווח ערכים שנע בין ∞ ל ∞‪.-‬‬
‫ההתפלגות הנורמאלית‬
‫הפונקציה המתארת התפלגות נורמאלית היא‪:‬‬
‫כאשר‪:‬‬
‫‪π = 3.14159‬‬
‫‪e = 2.71828‬‬
‫‪6‬‬
‫משפחה של התפלגויות נורמאליות‬
‫ההתפלגות הנורמאלית הסטנדרטית‬
‫פרמטרים‪µ = 0, σ = 1 :‬‬
‫‪7‬‬