Download as pdf or txt
Download as pdf or txt
You are on page 1of 15

S P2 

n1  1S 21n2  1S 22


n1  n2  2

16 16 16 


P X  6  1   0.300.716   0.310.715       0.360.710   1  0.825  0.175
 0  1 6 
‫כל הזכויות שמורות למחברים יוסי גודלניק‪ ,‬רגינה ישראלי‪ ,‬מיכל מימון יחיאלי‬

‫המידע ניתן ‪ .As is‬נעשו מאמצים כדי שהספר יהיה אמין ככל שניתן אך אין משתמעת‬
‫מכך כל אחריות שהיא‪ .‬המחברים והוצאת הוד‪-‬עמי אינם אחראים כלפי יחיד או ארגון‬
‫עבור כל אובדן או נזק אשר ייגרם‪ ,‬אם ייגרם‪ ,‬מהמידע שבספר זה‪.‬‬

‫אין להעתיק‪ ,‬לשכפל‪ ,‬לצלם‪ ,‬להקליט‪ ,‬לתרגם‪ ,‬לאחסן במאגר מידע או להפיץ ספר זה‬
‫או קטעים ממנו‪ ,‬בשום צורה ובשום אמצעי אלקטרוני‪ ,‬אופטי או מכני‪ ,‬בין אם לשימוש‬
‫פנימי ובין אם לשימוש מסחרי מבלי לקבל רשות מפורשת בכתב מבעלי הזכויות‪.‬‬

‫ספר זה כתוב בלשון זכר יחיד או רבים בלבד‪ .‬הספר מיועד לנשים ולגברים כאחד ואין‬
‫בכוונתנו להפלות או לפגוע בציבור המשתמשים‪/‬ות בספר‪.‬‬

‫המחברים מודים לרון רוזנברג‪ ,‬חתנו של יוסי גודלניק‪ ,‬על הגהתו את הספר‬

‫אנו מודים לך שקנית ספר זה‪ .‬נשמח לשמוע אם יש לך הערה‪ ,‬הארה או ביקורת‪ .‬נודה‬
‫אם תעביר את ההערות במייל ל‪ n_godelnik@yahoo.com -‬או ל‪.myehieli@walla.com -‬‬

‫הפצה‪:‬‬

‫הוצאת הוד‪-‬עמי‬

‫‪09-9564716‬‬

‫‪info@hod-ami.co.il‬‬ ‫‪www.hod-ami.co.il‬‬

‫הוצאה רביעית‪ ,‬יולי ‪2020‬‬

‫מסת"ב ‪ISBN 978-965-361-419-2‬‬

‫‪2‬‬
‫תוכן עניינים‬

‫פרק ‪ - 1‬הקדמה ‪7 .......................................... ................................ ................................‬‬


‫פרק ‪ - 2‬סטטיסטיקה תיאורית ‪9 .................. ................................ ................................‬‬
‫מבוא ‪9 ............ ................................ ................................ ................................‬‬ ‫‪2.1‬‬

‫המחקר ‪10 ...................................... ................................ ................................‬‬ ‫‪2.2‬‬

‫ארגון נתונים ‪12 ............................... ................................ ................................‬‬ ‫‪2.3‬‬

‫קיבוץ במחלקות ‪14 ........................... ................................ ................................‬‬ ‫‪2.4‬‬

‫הצגה גרפית של נתונים ‪18 ................ ................................ ................................‬‬ ‫‪2.5‬‬

‫מדדים לנטייה מרכזית ‪22 .................. ................................ ................................‬‬ ‫‪2.6‬‬

‫צורות שונות של התפלגות ‪33 ............ ................................ ................................‬‬ ‫‪2.7‬‬

‫מדדי פיזור ‪34 .................................. ................................ ................................‬‬ ‫‪2.8‬‬

‫מדדים למיקום יחסי ‪37 ..................... ................................ ................................‬‬ ‫‪2.9‬‬

‫העתקה [טרנספורמציה] ליניארית ‪43 .................................. ................................‬‬ ‫‪2.10‬‬

‫מדדים בגיליון אלקטרוני אקסל ‪44 ...................................... ................................‬‬ ‫‪2.11‬‬

‫פרק ‪ – 3‬הסתברות ‪46 ................................... ................................ ................................‬‬


‫הגדרות ומונחי יסוד ‪46 ..................... ................................ ................................‬‬ ‫‪3.1‬‬

‫פעולות בין מאורעות ‪47 ..................... ................................ ................................‬‬ ‫‪3.2‬‬

‫דיאגרמת וון [‪48 ..................... ................................ ................................ ]Venn‬‬ ‫‪3.3‬‬

‫כללי הפעולות במאורעות ‪50 .............. ................................ ................................‬‬ ‫‪3.4‬‬

‫הסתברות ‪51 ................................... ................................ ................................‬‬ ‫‪3.5‬‬

‫חוקים בסיסיים בהסתברות וסוגי מאורעות ‪52 ...................... ................................‬‬ ‫‪3.6‬‬

‫ההסתברות השלֵ מה ‪58 ..................... ................................ ................................‬‬ ‫‪3.7‬‬

‫פרק ‪ - 4‬משתנה מקרי בדיד ‪64 ..................... ................................ ................................‬‬


‫עקרונות ‪64 ..................................... ................................ ................................‬‬ ‫‪4.1‬‬

‫התפלגות בינומית ‪65 ........................ ................................ ................................‬‬ ‫‪4.2‬‬

‫התפלגות היפרגאומטרית ‪68 ............. ................................ ................................‬‬ ‫‪4.3‬‬

‫התפלגות גאומטרית ‪69 .................... ................................ ................................‬‬ ‫‪4.4‬‬

‫התפלגות פואסונית ‪70 ...................... ................................ ................................‬‬ ‫‪4.5‬‬

‫פרק ‪ - 5‬משתנה מקרי רציף ‪74 ..................... ................................ ................................‬‬


‫מושגים כלליים ‪74 ............................ ................................ ................................‬‬ ‫‪5.1‬‬

‫‪3‬‬
‫התפלגות נורמלית ‪74 ....................... ................................ ................................‬‬ ‫‪5.2‬‬

‫התפלגות נורמלית סטנדרטית [מתוקננת] ‪75 ....................... ................................‬‬ ‫‪5.3‬‬

‫סכום והפרש של שני משתנים נורמליים בלתי תלויים ‪81 ........................................‬‬ ‫‪5.4‬‬

‫משפט הגבול המרכזי ‪83 ................... ................................ ................................‬‬ ‫‪5.5‬‬

‫התפלגות סטודנט – התפלגות ‪85 .................................... ................................ t‬‬ ‫‪5.6‬‬

‫התפלגות נורמלית כקרוב להתפלגות הבינומית‪/‬הפואסונית ‪85 ...............................‬‬ ‫‪5.7‬‬

‫פרק ‪ - 6‬רגרסיה ‪88 ........................................ ................................ ................................‬‬


‫קשר בין משתנים ‪88 ......................... ................................ ................................‬‬ ‫‪6.1‬‬

‫מקדם המתאם ‪89 ............................. ................................ ................................‬‬ ‫‪6.2‬‬

‫מקדם המתאם של פירסון ‪90 ............. ................................ ................................‬‬ ‫‪6.3‬‬

‫רגרסיה לינארית בשיטת הריבועים הפחותים ‪92 ................... ................................‬‬ ‫‪6.4‬‬

‫מתאם ורגרסיה בגיליון אלקטרוני אקסל ‪93 .......................... ................................‬‬ ‫‪6.5‬‬

‫מקדם המתאם של ספירמן ‪96 ............ ................................ ................................‬‬ ‫‪6.5‬‬

‫פרק ‪ – 7‬משתנה מקרי בדיד דו ממדי ‪99 ...................................... ................................‬‬


‫מבוא ‪99 .......................................... ................................ ................................‬‬ ‫‪7.1‬‬

‫פונקצית התפלגות משותפת ‪99 ......................................... ................................‬‬ ‫‪7.2‬‬

‫פונקצית התפלגות שולית ‪102 ........... ................................ ................................‬‬ ‫‪7.3‬‬

‫אי תלות בין משתנים מקריים ‪103 ...................................... ................................‬‬ ‫‪7.4‬‬

‫משתנים מקריים בלתי מתואמים ‪104 ................................. ................................‬‬ ‫‪7.5‬‬

‫שונות משותפת בין משתנים מקריים ומקדם המתאם ‪104 .....................................‬‬ ‫‪7.6‬‬

‫תוחלת ושונות של סכום משתנים מקריים ‪106 ..................... ................................‬‬ ‫‪7.7‬‬

‫פרק ‪ - 8‬רווחי סמך ‪108 ................................. ................................ ................................‬‬


‫רווח סמך לתוחלת של אוכלוסייה נורמלית ‪ -‬שונות ידועה ‪108 .................................‬‬ ‫‪8.1‬‬

‫רווח סמך לתוחלת של אוכלוסייה נורמלית ‪ -‬שונות לא ידועה ‪110 ............................‬‬ ‫‪8.2‬‬

‫רווח סמך לפרופורציה של אוכלוסייה אחת ‪111 ..................... ................................‬‬ ‫‪8.3‬‬

‫רווח סמך להפרש פרופורציות ‪115 ...................................... ................................‬‬ ‫‪8.4‬‬

‫רווח סמך לתוחלת של שתי אוכלוסיות ‪ -‬השונויות ידועות ‪116 .................................‬‬ ‫‪8.5‬‬

‫רווח סמך לתוחלת של שתי אוכלוסיות ‪ -‬שונויות לא ידועות ‪119 ..............................‬‬ ‫‪8.6‬‬

‫רווח סמך לשונות של אוכלוסייה המתפלגת נורמלית ‪121 .......................................‬‬ ‫‪8.7‬‬

‫פרק ‪ - 9‬מבחני השערות ‪123 ......................... ................................ ................................‬‬


‫בדיקת השערה לתוחלת של אוכלוסייה ‪ -‬שונות ידועה ‪125 .....................................‬‬ ‫‪9.1‬‬

‫‪4‬‬
‫בדיקת השערות לתוחלת של אוכלוסייה ‪ -‬שונות לא ידועה ‪130 ................................‬‬ ‫‪9.2‬‬

‫השערות על הפרש תוחלת של שתי אוכלוסיות – שונויות ידועות ‪132 .......................‬‬ ‫‪9.3‬‬

‫השערות על הפרש תוחלת של שתי אוכלוסייות ‪ -‬שונויות לא ידועות ‪135 ..................‬‬ ‫‪9.4‬‬

‫בדיקת השערות על הפרש תוחלות ‪ -‬מדגמים מזווגים ‪138 .....................................‬‬ ‫‪9.5‬‬

‫בדיקת השערה על פרופורציה של אוכלוסייה אחת ‪142 ..........................................‬‬ ‫‪9.6‬‬

‫בדיקת השערות על הפרש פרופורציות ‪144 .......................... ................................‬‬ ‫‪9.7‬‬

‫בדיקת השערות לשונות של אוכלוסייה המתפלגת נורמלית ‪147 ..............................‬‬ ‫‪9.8‬‬

‫בדיקת השערות על יחס שונויות של שתי אוכלוסיות ‪148 ........................................‬‬ ‫‪9.9‬‬

‫פרק ‪ – 10‬מבחן חי בריבוע [‪ ]2‬לבדיקת טיב ההתאמה ואי תלות ‪153 .....................‬‬
‫מבוא ‪153 ........................................ ................................ ................................‬‬ ‫‪10.1‬‬

‫מבחן טיב ההתאמה ‪153 ................... ................................ ................................‬‬ ‫‪10.2‬‬

‫מבחן חי‪-‬בריבוע לאי תלות בטבלאות דו‪-‬מימדיות ‪157 ........... ................................‬‬ ‫‪10.3‬‬

‫מבחן חי‪-‬בריבוע בגיליון אלקטרוני אקסל ‪160 ....................... ................................‬‬ ‫‪10.4‬‬

‫פרק ‪ – 11‬מדדי קשר למשתנים איכותניים‪/‬שמיים ‪162 .............. ................................‬‬


‫מקדם המתאם של קרמר [‪162 ............................. ................................ ]CRAMER‬‬ ‫‪11.1‬‬

‫מדדי קשר למדה ‪163 .................. ................................ ................................  -‬‬ ‫‪11.2‬‬

‫פרק ‪ – 12‬ניתוח שונות חד כיווני ‪167 ........................... ................................ ANOVA -‬‬


‫מבוא ‪167 ........................................ ................................ ................................‬‬ ‫‪12.1‬‬

‫עקרונות מבחן ‪ F‬לניתוח שונות חד כיווני ‪167 ........................ ................................‬‬ ‫‪12.2‬‬

‫פתרון בעזרת אקסל ‪172 ................... ................................ ................................‬‬ ‫‪12.3‬‬

‫פרק ‪ – 13‬מבחנים אפרמטרים ‪174 ............... ................................ ................................‬‬


‫מבחן הבינום [‪174 .......................................... ................................ ]Binom test‬‬ ‫‪13.1‬‬

‫מבחן הסימן [‪176 ............... ................................ ................................ ]Sign test‬‬ ‫‪13.2‬‬

‫מבחן ‪ U‬של מאן‪-‬וויטני [‪178 .............. ................................ ]Mann-whitney U test‬‬ ‫‪13.3‬‬

‫מבחן ווילקוקסון למדגמים מזווגים [‪181 .................... ]Wilcoxon Signed-Ranks Test‬‬ ‫‪13.4‬‬

‫מבחן מקנמר [‪183 .......................................... ................................ ]Mecnemar‬‬ ‫‪13.5‬‬

‫פרק ‪ - 14‬טבלאות ‪187 .................................. ................................ ................................‬‬


‫טבלה מספר ‪ – 1‬התפלגות בינומית מצטברת [‪ 2‬דפים] ‪187 ................. ................................‬‬

‫טבלה מספר ‪ – 2‬התפלגות פואסונית מצטברת [‪ 2‬דפים] ‪189 ............... ................................‬‬

‫טבלה מספר ‪ – 3‬התפלגות נורמלית סטנדרטית – ערכי ‪191 ......................................... ](Z‬‬

‫‪5‬‬
‫טבלה מספר ‪ – 4‬התפלגות ‪ t‬מצטברת ‪192 ........................................ ................................‬‬

‫טבלה מספר ‪ - 5‬התפלגות חי‪-‬בריבוע ‪193 .......................................... ................................‬‬

‫טבלה מספר ‪ – 6‬ערכי ‪ 4[ F‬דפים] ‪194 ............... ................................ ................................‬‬

‫טבלה מספר ‪ 7‬ערכים קריטיים בהתפלגות חי בריבוע ‪198 .................... ................................‬‬

‫טבלה מספר ‪ 8‬התפלגות בינומית מצטברת עבור ‪199 ................. ................................ P=0.5‬‬

‫טבלה מספר ‪ – 9‬ערכי ‪ U‬ל‪200 ........................... ................................ Mann whitney Test -‬‬

‫טבלה מספר ‪ – 10‬ערכי ‪ W‬ל‪201 ............ ................................ Wilcoxon Signed-Ranks Test -‬‬

‫טבלה מספר ‪ - 11‬ערכים קריטיים של מבחן ‪ Wilcoxon‬למדגמים בלתי תלויים ‪202 ...................‬‬

‫‪6‬‬
‫פרק ‪ - 1‬הקדמה‬
‫השימוש בכלים סטטיסטיים נרחב ונוגע כמעט לכל תחום [דיסצפלינה] מדעי‪ :‬הנדסה‬
‫בכלל‪ ,‬הנדסת תעשייה וניהול [בקרת איכות סטטיסטית‪ ,‬דגימת קבלה‪ ,‬תחזיות וכו']‪,‬‬
‫דמוגרפיה‪ ,‬כלכלה‪ ,‬פסיכולוגיה‪ ,‬מחשבים‪ ,‬פיסיקה‪ ,‬רפואה‪ ,‬חינוך‪/‬הוראה‪ ,‬ספורט ועוד‪.‬‬

‫המטרות העיקריות של הסטטיסטיקה הן קבלת תמונת מצב של נתונים ובעיקר קבלת‬


‫החלטות והסקה סטטיסטית‪.‬‬

‫מעבר לשימוש המדעי‪ ,‬אין יום שבו אין מזכירים במדיה [הכתובה‪ ,‬הנשמעת והנצפית]‬
‫נתונים סטטיסטיים בנושאים שונים‪ ,‬יש לצפות לכך שהנחשף אליהם לא רק יבין נכונה את‬
‫הנתונים אלא יוכל גם לבחון‪ ,‬לפחות על פניו‪ ,‬את נכונותם‪ .‬בהתייחס לנפוצות אזכורי‬
‫הנתונים הסטטיסטיים מחד ולקושי בלמידת המקצוע סטטיסטיקה מאידך מעניין מאוד מה‬
‫שכתב ד"ר חיים שפירא‪" :‬סטטיסטיקה נמצאת בכל מקום סביבנו – ממוצעים‪ ,‬חציונים‪,‬‬
‫אחוזים‪ ,‬פערים‪ ,‬מדדים‪ ,‬עשירונים – רק תרימו את הראש ותיתקלו בה‪ .‬אך האם אנו מבינים‬
‫באמת במה המדובר? האם הדקויות שמאחורי החישובים ברורות לכול? אני שואל זאת כיוון‬
‫שאחד הדברים המעניינים והמוזרים הקשורים בסטטיסטיקה הוא העובדה שאנשים‬
‫שמעולם לא למדו את המקצוע ‪ -‬משוכנעים שהם מבינים בו‪ .‬זו אגב סיטואציה הפוכה‬
‫לתחום קרוב לסטטיסטיקה‪ ,‬אין כמעט איש שלא למד בשלב כזה או אחר בחייו משוואות‬
‫דיפרנציאליות חלקיות או אנליזה פונקציונלית‪ ,‬ואין כמעט איש שחושב שהוא מבין‬
‫בתחומים האלה" [זהירות‪ ,‬סטטיסטיקה‪ :‬טעויות נפוצות של משקיעים בבורסה‪ ,‬גלובס‬
‫‪.]10.2.2012‬‬

‫לסטודנטים‪ ,‬לימוד המקצוע סטטיסטיקה אינו פשוט כלל ועיקר‪ ,‬תופעה זו [בעיקר 'ללא‬
‫סטטיסטיקאים'] ידועה בעולם והיא חוצה גבולות ותחומי לימוד‪ .‬ישנם כמה מחקרים בנושא‪,‬‬
‫רבים מהם הראו כי רעיונות של הסתברות וסטטיסטיקה‪ ,‬לעיתים קרובות‪ ,‬קשים מאוד‬
‫לתלמידים בשל סתירה לאמונות [‪ ]Beliefs‬שלהם ולאינטואיציה שלהם לגבי נתונים‪ .‬חלק‬
‫מהמחקרים מעלים דרכים להקטנה של קשיי הלומדים‪.‬‬

‫ההוצאה הראשונה של הספר [להלן חלק א'] הוגדרה כמיועדת להנדסאים במגמות שונות‪:‬‬
‫תעשייה וניהול‪ ,‬מחשבים ועוד‪ ,‬לסטודנטים מתחומי מדעי החברה ולאחרים‪.‬‬

‫למעשה‪ ,‬להוציא נושא של ניתוח שונות חד כיווני [‪ ,]ANOVA‬כל פרקי חלק א' של הספר‬
‫תואמים לתוכנית הלימודים של טכנאי והנדסאי תעשייה וניהול‪ .‬ממשוב שהתקבל ממורים‬
‫ומסטודנטים במכללות ובאוניברסיטאות [מתחומים שאינם 'מדעים מדויקים' או שאינם‬
‫לומדים סטטיסטיקה לשמה‪ ,‬היינו סטטיסטיקאים] הבנו כי על מנת להיתאם לתוכניות‬
‫הלימוד שלהם יש להשלים ולהוסיף נושאים נוספים כמו למשל מקדמי מתאם נוספים‬
‫ומבחנים אפרמטריים‪.‬‬

‫‪7‬‬
‫הוצאה ב' של הספר כוללת את הנושאים הנוספים [להלן חלק ב'] הנדרשים כאמור וכן‬
‫מבחר רב של שאלות פתורות – שאלות 'פתוחות' ושאלות 'רב ברירה' הן לנושאים שבחלק‬
‫א' והן לנושאים שנוספו בחלק ב'‪.‬‬

‫כמו בחלק א' ‪ -‬החומר בחלק ב' כתוב‪ ,‬ככול האפשר בצורה עניינית‪-‬מובנת ואינו כולל‬
‫תאוריות 'כבדות' והוכחות‪ ,‬המרצה לאחר שיכיר ביכולות התלמידים [בכפוף למגבלה‬
‫הקשוחה של שעות הלימוד המוקצות לנושא] יוכל להעשיר את החומר המועבר בתאוריות‪,‬‬
‫בהוכחות‪ ,‬ובשימושים בתוכנות סטטיסטיות מתאימות‪.‬‬

‫יש נושאים שאינם נמצאים בתוכנית הלימודים‪ ,‬אך כיוון שהם מסוג הנושאים שהלומד עשוי‬
‫להידרש להם בעבודה [בתום הלימודים] הם מובאים בספר‪ .‬על מנת לזהות‬
‫נושאים אלו‪ ,‬חומר שכזה יוזח מהימין [כלומר שוליו הימניים יהיו גדולים יותר]‪,‬‬
‫הטקסט יודגש בצבע ובתחילת הנושא יבוא סימן הינשוף‪.‬‬

‫נשמח למשובים נוספים מכל משתמשי הספר‪.‬‬

‫‪8‬‬
‫פרק ‪ - 2‬סטטיסטיקה תיאורית‬
‫‪ 2.1‬מבוא‬

‫סטטיסטיקה ‪ -‬היא מדע הכולל אוסף של כלים ושיטות לאיסוף‪ ,‬ארגון‪ ,‬תיאור‪ ,‬ניתוח‪,‬‬
‫הצגה והסקת מסקנות או לימוד מנתונים של אוכלוסייה שלמה או חלק ממנה [מדגם] על‬
‫תמונת המצב ועל השינויים וההתפתחויות של האוכלוסייה הנבדקת‪.‬‬

‫סדרה סטטיסטית ‪ -‬היא קבוצה של נתוני משתנה או משתנים שיש להם מכנה‬
‫משותף מסוים והם מסודרים בסדר מסוים לפי גודל או לפי חוקיות אחרת‪.‬‬

‫סטטיסטיקה תיאורית ‪ -‬כוללת ארגון‪ ,‬עיבוד והצגה של נתונים שנאספו‪.‬‬

‫משתנה ‪ -‬הוא מאפיין או תכונה היכולים לקבל ערכים שונים‪ ,‬מספריים או איכותניים‬
‫[איכותיים] לדוגמה‪ :‬מקום לידה‪ ,‬משקל בלידה‪ ,‬גיל‪ ,‬הכנסה‪ ,‬מרחק זריקת פטיש בתחרות‬
‫אולימפית‪ ,‬סוג דם‪.‬‬

‫סולמות מדידה‪ – 1‬נהוג לסווג את המשתנים לפי סולמות מדידה כלהלן‪:‬‬

‫סולם שמי ‪ -‬ערכי המשתנה הם שמות‪ ,‬לדוגמה‪ :‬מין הנבדק‪ ,‬סוג דם‪ ,‬ארץ מוצא‪ ,‬מקצוע‬
‫נלמד‪ .‬בסולם כזה אין משמעות לסדר הערכים‪.‬‬

‫סולם סדר – ערכי המשתנה ניתנים לדרוג מערך נמוך לגבוה או מאיכותי יותר לאיכותי‬
‫פחות‪ .‬אין משמעות לערכים המספריים של המשתנה אלא רק לסדרם‪ ,‬לדוגמה‪ :‬שביעות‬
‫רצון בסולם ‪ 1‬עד ‪ ,5‬דרגות בצבא‪.‬‬

‫סולם רווח ‪ -‬ערכי המשתנה מספריים עם משמעות למרווחים שבין הערכים‪ .‬ערכי‬
‫המשתנה הם ללא אפס מוחלט‪ ,‬לדוגמה‪ :‬טמפרטורה‪ ,‬גובה מעל פני הים [במרבית‬
‫המקרים ההתייחסות הסטטיסטית לסולם זה דומה לחלוטין להתייחסות לסולם המנה אותו‬
‫נכיר מייד]‪.‬‬

‫סולם מנה – ערכי המשתנה כמו בסולם רווח אולם לערכי המשתנה יש אפס מוחלט‪,‬‬
‫לדוגמה‪ :‬מרחק קפיצה לרוחק בתחרות אולימפית‪ ,‬ציון המבחן הפסיכומטרי‪.‬‬

‫משתנה כמותי ‪ -‬משתנה הנמדד במספר כאשר הערכים מייצגים "כמות של אותו‬
‫משתנה"‪ .‬שערכיו נבדלים זה מזה כמותית‪ .‬הגדרה נוספת למשתנה כמותי היא – משתנה‬
‫שנמדד בסולם מנה או בסולם רווח‪ .‬נהוג לעשות אבחנה נוספת בין שני סוגי משתנים‬
‫כמותיים‪:‬‬

‫משתנה כמותי רציף – הוא משתנה מדיד‪ ,‬בדרך כלל עם מספר גדול מאוד של ערכים‪,‬‬
‫שבין כל שני ערכים שלו יש אינסוף אפשרויות נוספות‪ ,‬לדוגמה‪ :‬תנובת החלב החודשית‬

‫‪ 1‬ישנן גישות הדנות במשתנה סדר‪ ,‬משתנה כמותי רציף ומשתנה כמותי בדיד ואינן עוסקות בסולמות מדידה‪,‬‬
‫הסולמות מוזכרים בכל זאת לטובת המקרים בהם הנושא קיים בתוכנית הלימודים‪.‬‬
‫‪9‬‬
‫בליטרים ברפת מסוימת‪ ,‬גובהם של תלמידי כיתה י' [בין הגובה ‪ 168‬ס"מ לגובה ‪ 169‬ס"מ‪.‬‬
‫יש‪ ,‬תיאורטית‪ ,‬אין ספור אפשרויות כאשר מבחינה מעשית מספר האפשרויות תלוי ברגישות‬
‫מכשיר המדידה]‪ ,‬מרחק במטרים בקפיצה לרוחק בתחרות אולימפית‪.‬‬

‫משתנה כמותי בדיד – הוא משתנה ספיר‪ ,‬בדרך כלל עם מספר קטן של ערכים‪,‬‬
‫שבתהליך הספירה והמדידה שלו מקבלים ערכים שלמים בלבד‪ ,‬לדוגמה‪ :‬מספר ילדים‬
‫במשפחה [באופן מעשי במשפחה יכולים להיות ‪ 4‬ילדים‪ 5 ,‬ילדים או ‪ 7‬ילדים]‪ ,‬מספר‬
‫תקלות חשמל ביממה‪ ,‬מספר חלקים פסולים במשלוח‪.‬‬

‫משתנה איכותני [איכותי] ‪ -‬הוא משתנה שנמדד בסולם שמי או סולם סדר‪ ,‬לדוגמה‪:‬‬
‫ארץ‪/‬מקום לידת האב‪ ,‬מין הנבדק‪ ,‬מקצוע עיקרי של סטודנט לתואר ראשון‪.‬‬

‫הערה‪ :‬סוג המשתנה נקבע על פי הגדרת החוקר‪ .‬לדוגמה‪ ,‬אם החוקר בודק מרחק‬
‫בקפיצה לרוחק במטרים‪ ,‬סוג המשתנה יהיה משתנה מנה‪ ,‬אולם הוא יכול להגדיר כי מרחק‬
‫קפיצה הקטן מ‪ 6.65 -‬מטרים ייחשב כמרחק קצר‪ ,‬מעל ‪ 7.32‬מטרים ייחשב כמרחק ארוך‬
‫וכל תוצאה אחרת – מרחק בינוני‪ ,‬במקרה זה הסולם הפך לסולם סדר ופעולה זו על‬
‫הסולמות נקראת "שנמוך" [‪ .]Downgrading‬אם החוקר היה הופך את המשתנה מסולם סדר‬
‫לסולם מנה אזי זו פעולה של "שדרוג" [‪.]Upgrading‬‬

‫משתנה תלוי – המשתנה או הגורם אותו אנו רוצים להסביר באמצעות המחקר [המשתנה‬
‫המושפע]‪.‬‬

‫משתנה בלתי תלוי [ב"ת] – המשתנה או המשתנים שחושבים כי באמצעותם ניתן‬


‫להסביר את המשתנה התלוי [במחקרים נקרא גם המשתנה המסביר‪/‬המשפיע]‪.‬‬

‫משתנה מתווך ‪ -‬משתנה שיוצר קשר בין שני משתנים שאינם קשורים באופן ישיר‪.‬‬
‫משתנה מתערב ‪ -‬משתנה חיצוני שעשוי להשפיע על המשתנה התלוי‪.‬‬
‫משתנה דיכוטומי – משתנה היכול לקבל שני ערכים בלבד‪ :‬גבר‪/‬אישה‪ ,‬יש‪/‬אין‪,‬‬
‫גדול‪/‬קטן‪.‬‬

‫‪ 2.2‬המחקר‬
‫סוגי המחקר המשמשים והמוערכים רבות בקרב הקהילה המדעית המתעניינת בגורמים‬
‫והסיבות להתרחשות מאורע הם‪ :‬מחקר לגילוי קשרים סיבתיים‪ ,‬קשרי תלות ושייכות‪.‬‬
‫המחקר בודק השערות‪ ,‬תלות‪ ,‬קשרים וסיבתיות‪ .‬פרקי הלימוד בתוכנית הלימודים‪ ,‬ובעיקר‬
‫הפרקים‪ :‬רווחי סמך ומבחני השערות‪ ,‬רגרסיה‪ ,‬מבחנים לאי תלות וניתוח שונות‪ ,‬מכוונים‬
‫לסוג זה של מחקר שהלומד בהחלט יכול להידרש לו במסגרת עבודתו [יתכן שאז יצטרך‬
‫להעמיק בחומר]‪.‬‬

‫מחקר אקספלורטיבי – עוסק בתופעות או תחומים שאין מספיק ידע לגביהם‪ ,‬לא‬
‫נחקרו ולא נבדקו‪ .‬מ חקר מסוג זה אופייני למשל למחקר אנטרפולוגי בשבטים שאין ידע‬
‫עליהם ועל התופעות אותן רוצים לחקור‪.‬‬

‫‪10‬‬
‫מחקר תיאורי – מחקר האוסף ידע המתאר תופעות שונות‪ .‬הסקרים של הלשכה‬
‫המרכזית לסטטיסטיקה מציגים ומצביעים על תופעות והם יכולים להצביע על קשרים‬
‫בהיבט התיאורי בלבד אך לא בהיבט המסביר‪.‬‬

‫שלבים מקובלים במחקר סטטיסטי‬

‫הסברים ודוגמאות‬ ‫השלב‬

‫מה אנו רוצים לבדוק‪ ,‬מהן ההשערות [השערת האפס ‪Ho‬‬ ‫הצגת‬
‫וההשערה האלטרנטיבית – ‪.]H1‬‬
‫שאלת‪/‬השערת‬
‫דוגמאות להשערת מחקר‪:‬‬
‫המחקר‬
‫"ככול שהשכלת ההורים גבוהה יותר כך נוטה להיות גבוהה‬
‫יותר השכלת ילדיהם"‪.‬‬
‫"הקטנה‪/‬קיצור ה'ספגטי' בתהליך ייצור [מסוים] תביא להקטנה‬
‫בעלויות הייצור ובחיסכון של כִשלי איכות"‪.‬‬
‫הגדרת האוכלוסייה הנחקרת‪/‬הנבדקת [לדוגמה‪ ,‬בניסוי קליני‬ ‫תכנון המחקר‬
‫של תרופה חדשה לטיפול באקנה‪ ,‬האוכלוסייה הנבדקת‪:‬‬
‫גברים ונשים בגילאים ‪ 42-14‬עם אקנה‪ .‬המשתנה שנבדק‪:‬‬
‫מספר הפצעים‪ ,‬קומודונים ופפולות‪ ,‬אצל המשתתפים במדגם]‪.‬‬
‫ברוב המחקרים הסטטיסטיים אין אפשרות לבדוק את כל‬
‫האוכלוסייה הנחקרת ולכן יש להגדיר את גודל המדגם‬
‫"המייצג" שיילקח מאותה אוכלוסייה ודרך לקיחתו‪ .‬התכנון חייב‬
‫[הב"ת‬ ‫המשתנים‬ ‫של‬ ‫המדידה‬ ‫תתבצע‬ ‫איך‬ ‫להסביר‬
‫והתלוי‪/‬תלויים] – תצפיות‪ ,‬סקרים‪ ,‬עבודה עם נתונים קיימיים‬
‫של מקורות מהימנים‪ .‬האם תתבצע מניפולציה במחקר‪ ,‬מה‬
‫רמת המובהקות בה ייערך המבחן‪ ,‬מהם כללי הקבלה והדחייה‬
‫של השערת האפס ועוד‪.‬‬

‫יש לשמור על תוקף ומהימנות הנתונים הנאספים ולהימנע‪ ,‬ככל‬ ‫איסוף הנתונים‬
‫האפשר‪ ,‬מהטית הנתונים [הדבר אינו מתייחס‪ ,‬כמובן לשימוש‬
‫בנתונים קיימים של מקורות מהימנים]‪.‬‬

‫את הנתונים שנאספו [בדרך כלל יש כמויות גדולות של נתונים‬ ‫ארגון הנתונים‬
‫גולמיים] יש לארגן במסד נתונים שתוכנן מראש במבנה‬ ‫בטבלאות ותרשימים‬
‫שיאפשר עיבודם‪.‬‬

‫התוכנות הסטטיסטיות [‪ SPSS‬לדוגמה] מאפשרות לבצע את‬ ‫עיבוד הנתונים‬


‫פרוצדורת מבחני ההשערה [למשל ניתוח שונות – ‪,ANOVA‬‬ ‫וחישוב מדדים ‪/‬‬
‫מבחן ‪ t‬למדגמים מזווגים‪ ,‬מבחן חי‪-‬בריבוע] אולם בדרך כלל‬
‫לא נסתפק בכך ונחלץ מהנתונים פרמטרים אודות המשתנים‬

‫‪11‬‬
‫והסטטיסטים המחושבים ‪ -‬איתם נעשה שימוש במלל של‬ ‫סטטיסטים של‬
‫מסקנות המחקר‪.‬‬ ‫המשתנים‬

‫יש להסיק מסקנות על האוכלוסייה שממנה נלקח המדגם על‪-‬‬ ‫הסקת מסקנות‬
‫סמך המדדים והסטטיסטים של המדגם וגם על ידי ביצוע מבחן‬
‫על פי הדרישות המקובלות‪ .‬חשוב לציין כי החל בשלב תכנון‬
‫המחקר יש להתייחס לתהליך שיבטיח שהקשר הסטטיסטי‬
‫שיימצא יהיה אכן קשר של "סיבה ומסובב" [יש לבדוק האם יש‬
‫"גורם מתערב"]‪.‬‬

‫‪ 2.3‬ארגון נתונים‬

‫משתנה [‪ – ]X‬הוא נושא הסדרה הסטטיסטית אותו אנו רוצים לעבד‪ ,‬להציג או לעשות בו‬
‫שימוש בהמשך המחקר‪.‬‬

‫שכיחות ]‪ – [f‬בסדרה סטטיסטית‪ ,‬מספר הפעמים בהם מופיע המשתנה ‪ X‬בסדרה‪.‬‬

‫שכיחות יחסית [‪ - ]Rf‬הערך המתקבל מחלוקת השכיחות במספר הכולל של נתונים‬


‫בסדרה‪ .‬הערך יכול להיות מוצג כשבר עשרוני או כאחוזים‪.‬‬

‫‪fi‬‬
‫‪Rf i ‬‬ ‫לנתונים בסדרה ‪-‬‬
‫‪n‬‬
‫כאשר‪:‬‬
‫‪ – fi‬שכיחות הנתון ה‪-i -‬י‬
‫‪ – n‬מספר הנתונים בסדרה‬
‫‪fi‬‬
‫‪Rf i ‬‬ ‫‪k‬‬
‫לנתונים בטבלת שכיחויות ‪-‬‬
‫‪ fi‬‬
‫‪i 1‬‬

‫כאשר‪:‬‬
‫‪ – fi‬שכיחות המחלקה ה‪-i -‬ית [מתוך ‪ k‬מחלקות]‬

‫שכיחות מצטברת [‪ – ]F‬מספר נתוני הסדרה שהצטברו עד נקודה מסוימת ושערכם הוא‬
‫קטן או שווה לערך נתון‪.‬‬

‫שכיחות מצטברת יחסית [‪ – ]RF‬הערך המתקבל מחלוקת השכיחות המצטברת [‪]F‬‬


‫במספר הכולל של נתונים בסדרה‪ .‬הערך יכול להיות מוצג כשבר עשרוני או כאחוזים‪.‬‬
‫ככלל‪ ,‬משתמשים בשכיחות יחסית או בשכיחות מצטברת יחסית כאשר היחס‬
‫[הפרופורציה] של מספר הנתונים הנמצאים במחלקה נתונה או עד המחלקה הנתונה חשוב‬
‫יותר ממספר הנתונים הנמצאים במחלקה או מעל המחלקה‪.‬‬

‫מהשכיחות היחסית ומהשכיחות המצטברת יחסית קל יותר להבין ו'לתפוס' חזותית נתונים‬
‫שכן התפיסה של כמות מתוך ‪ 100‬נוחה [ואולי אף טבעית] על פני הבנה‪/‬תפיסה של‬

‫‪12‬‬
‫מספרים מוחלטים‪ .‬יתרון נוסף‪ ,‬לשכיחות היחסית‪ ,‬בא לידי ביטוי כאשר רוצים להשוות‬
‫משתנה מסוים בשתי אוכלוסיות שגודלן שונה‪ ,‬למשל במקרה שבו עוסקים בהתפלגות גיל‬
‫התושבים בערים‪ ,‬כשבעיר אחת מספר התושבים מתקרב למיליון ובאחרת רק למאה אלף‬
‫‪ -‬אזי הכלי היותר טוב להשוואה מהירה הוא השכיחות היחסית‪.‬‬

‫טבלת שכיחויות – צורת ארגון נתונים המביאה לצד ערך המשתנה את שכיחותו‪.‬‬

‫תרגיל מספר ‪1‬‬

‫בדקו ‪ 15‬משפחות ורשמו את מספר הילדים בכל משפחה‪ ,‬התקבלו התוצאות הבאות‪:‬‬

‫‪1 2 3 4 4 2 5 3 0 3 2 3 1 6 5‬‬

‫הצג טבלת שכיחויות מתאימה‪.‬‬

‫לכמה משפחות ‪ 2‬ילדים או פחות?‬ ‫א‪.‬‬


‫לכמה משפחות ‪ 2‬ילדים או יותר?‬ ‫ב‪.‬‬
‫מהו אחוז המשפחות שלהן ‪ 2‬ילדים או יותר אך פחות מ‪ 5 -‬ילדים?‬ ‫ג‪.‬‬

‫פתרון‬

‫הערך ‪ 3‬ילדים חוזר ‪ 4‬פעמים ולכן שכיחות של ‪ 3‬ילדים היא ‪ ,4‬באופן דומה המשתנה ‪2‬‬
‫ילדים חוזר ‪ 3‬פעמים ולכן שכיחות של ‪ 2‬ילדים שווה ‪ .3‬אם נגדיר ‪ - X‬מספר הילדים‬
‫במשפחה אזי ‪ .f(x=3)=4‬ניתן להציג את טבלת השכיחויות כך‪:‬‬

‫כפי שניתן לראות בעמודת "שכיחות מצטברת ‪ "Fi‬שבטבלה – ל‪ 6 -‬משפחות ‪ 2‬ילדים‬ ‫א‪.‬‬
‫או פחות‪.‬‬
‫ל‪ 12 -‬משפחות ‪ 2‬ילדים או יותר ‪.f(x≥2)=f(x≤7)-f(x≤1)=15-3=12‬‬ ‫ב‪.‬‬
‫אחוז המשפחות שלהן ‪ 2‬ילדים או יותר אך פחות מ‪ 5 -‬ילדים – אפשר לפתור זאת‬ ‫ג‪.‬‬
‫‪2  3 4‬‬
‫ואפשר להשתמש בנתוני‬ ‫כתרגיל חשבוני פשוט כך‪ 100  60% :‬‬
‫‪15‬‬
‫‪f  X  4   f  X  1‬‬ ‫‪12  3‬‬
‫‪ 100 ‬‬ ‫השכיחות המצטברת ולפתור זאת כך‪ 60% :‬‬
‫‪n‬‬ ‫‪15‬‬

‫‪13‬‬
‫)‪F (4)  F (1‬‬ ‫‪12  3‬‬
‫אפשר להוסיף עמודת שכיחות יחסית‬ ‫‪ 100 ‬‬ ‫או ‪ 60%‬‬
‫‪n‬‬ ‫‪15‬‬
‫מצטברת באחוזים ואיתה להשתמש בחישובים‪.‬‬

‫‪ 2.4‬קיבוץ במחלקות‬

‫נתונים גולמיים – הם נתונים שנאספו [ע"י מדידה או בכל דרך אחרת] אך לא אורגנו‬
‫מבחינה מספרית‪.‬‬

‫לדוגמה‪ ,‬גיאוגרף רצה לבחון את הטמפרטורה בבאר שבע‪ ,‬במהלך היום‪ ,‬בחודש הראשון‬
‫של האביב‪ .‬התחנה המטאורולוגית בבאר שבע מבצעת ומדווחת על מדידות מידי ‪ 3‬שעות‪.‬‬
‫הגיאוגרף בחר בשעות‪ 17:00 ,14:00 ,11:00 ,08:00 :‬ו‪ 20:00 -‬בתאריכים מ‪ 21.3.2014 -‬עד‬
‫וכולל ‪[ 20.4.2014‬החודש הראשון של האביב]‪ .‬מספר המדידות האפשרי היה ‪ 155‬אולם‬
‫באחד הימים [‪ ]26.3‬לא דווח על מדידה אחת‪ ,‬כך שבסך הכול דווחו ‪ 154‬מדידות‪ .‬הדיווח‬
‫במעלות צלסיוס מובא בטבלה הבאה‪:‬‬

‫הנתונים שבטבלה הם ללא כל עיבוד שהוא והם נקראים נתונים גולמיים‪.‬‬

‫קיבוץ במחלקות ‪ -‬שתי סיבות עיקריות לקיבוץ במחלקות‪:‬‬

‫כיוון שכמות המידע שאפשר להשיג מהסתכלות על כמות רבה של עשרות‪ ,‬מאות‪,‬‬ ‫‪‬‬
‫אלפים ויותר של נתונים גולמיים היא קטנה ‪ -‬הקיבוץ במספר מחלקות‪ ,‬בדרך כלל‬
‫מ‪ 5 -‬מחלקות ועד ‪ 15‬מחלקות‪ ,‬מאפשר "תפיסה חזותית" מהירה של מאפייני‬
‫התפלגות המשתנה נשוא הטבלה‬
‫בעבר‪ ,‬קושי בחישובים סטטיסטיים ידניים‪ ,‬על כמות רבה של נתונים גולמיים‪ ,‬הביא‬ ‫‪‬‬
‫לכך שקיבוץ הנתונים הגולמיים במחלקות פישט את החישובים‪ .‬כיום‪ ,‬בעזרת‬
‫התוכנות הסטטיסטיות לסוגיהן‪ ,‬החישובים על כמות רבה ואפילו רבה מאוד של‬
‫נתונים גולמיים הפך קל ופשוט‪.‬‬

‫‪14‬‬
‫נוהגים לארגן‪-‬לקבץ את הנתונים בטבלת התפלגות שכיחויות במחלקות [טווחים‪,‬‬
‫קטגוריות‪ ,‬תאים]‪ .‬הטבלה בנויה ממספר מחלקות כשלצד כל מחלקה השכיחות המתאימה‬
‫לה‪ .‬אם נרצה שהטבלה תכיל יותר נתונים שיאפשרו לנו להשיב על שאלות נוספות – נוסיף‬
‫גם עמודה עבור השכיחות המצטברת והשכיחות המצטברת היחסית‪ .‬טבלת השכיחויות‬
‫במחלקות‪ ,‬של נתוני הטמפרטורה בבאר שבע‪ ,‬במהלך היום‪ ,‬בחודש הראשון של האביב‪,‬‬
‫תראה כך‪:‬‬

‫‪i‬‬ ‫גבול המחלקה‬ ‫אמצע המחלקה ‪Xi -‬‬ ‫‪fi‬‬ ‫‪Fi‬‬ ‫‪Fi/n‬‬
‫‪1‬‬ ‫‪11.95‬‬ ‫‪-‬‬ ‫‪15.05‬‬ ‫‪13.5‬‬ ‫‪13‬‬ ‫‪13‬‬ ‫‪0.084‬‬
‫‪2‬‬ ‫‪15.05‬‬ ‫‪-‬‬ ‫‪18.15‬‬ ‫‪16.6‬‬ ‫‪28‬‬ ‫‪41‬‬ ‫‪0.266‬‬
‫‪3‬‬ ‫‪18.15‬‬ ‫‪-‬‬ ‫‪21.25‬‬ ‫‪19.7‬‬ ‫‪48‬‬ ‫‪89‬‬ ‫‪0.578‬‬
‫‪4‬‬ ‫‪21.25‬‬ ‫‪-‬‬ ‫‪24.35‬‬ ‫‪22.8‬‬ ‫‪29‬‬ ‫‪118‬‬ ‫‪0.766‬‬
‫‪5‬‬ ‫‪24.35‬‬ ‫‪-‬‬ ‫‪27.45‬‬ ‫‪25.9‬‬ ‫‪15‬‬ ‫‪133‬‬ ‫‪0.864‬‬
‫‪6‬‬ ‫‪27.45‬‬ ‫‪-‬‬ ‫‪30.55‬‬ ‫‪29.0‬‬ ‫‪15‬‬ ‫‪148‬‬ ‫‪0.961‬‬
‫‪7‬‬ ‫‪30.55‬‬ ‫‪-‬‬ ‫‪33.65‬‬ ‫‪32.1‬‬ ‫‪4‬‬ ‫‪152‬‬ ‫‪0.987‬‬
‫‪8‬‬ ‫‪33.65‬‬ ‫‪-‬‬ ‫‪36.75‬‬ ‫‪35.2‬‬ ‫‪2‬‬ ‫‪154‬‬ ‫‪1.000‬‬
‫סה"כ‬ ‫‪154‬‬

‫יש מספר כללים אליהם יש לתת את הדעת בתהליך של קיבוץ במחלקות‪:‬‬

‫מספר המחלקות וגבולות המחלקות צריכים להיות ממצים ומוציאים‪ .‬משמעות‬ ‫‪‬‬
‫הדבר‪ :‬ממצים ‪ -‬שלכל נתון גולמי תימצא מחלקה אליה ניתן יהיה לשייכו‪ ,‬מוציאים ‪-‬‬
‫שגבולות המחלקות יהיו כאלו שכל נתון גולמי יוכל להיות משויך למחלקה אחת‬
‫בלבד‬
‫רוחב מחלקה נתונה [‪ ]r‬שווה לגבול העליון פחות הגבול התחתון של המחלקה‬ ‫‪‬‬
‫כמה מחלקות [‪ ]k‬יש לבחור? – יש כללים מנחים אך לא מוחלטים‪ .‬בדרך כלל רצוי‬ ‫‪‬‬
‫שמספר המחלקות לא יהיה קטן מ‪ 5 -‬ולא גדול מ‪ .15 -‬מספר המחלקות צריך להביא‬
‫בחשבון את מספר הנתונים הגולמיים [התצפיות‪/‬מדידות] וכן את מידת פיזור הנתונים‬
‫עדיף להשתמש במחלקות שוות רוחב‬ ‫‪‬‬
‫לעיתים משתמשים ב"מחלקה פתוחה"‪ ,‬היינו מחלקה שבה יש רק גבול אחד [עליון‬ ‫‪‬‬
‫או תחתון]‪ ,‬לדוגמה במחלקה יירשם "גדול מ‪ ,"-‬או קטן מ‪ ,"-‬צריך לזכור כי במצב זה‬
‫אנו מגבילים את היכולת לחישובים סטטיסטיים‬

‫צפיפות ['‪ – ]fi‬צפיפות של מחלקה מוגדרת כיחס בין שכיחות המחלקה [‪ ]fi‬ורוחב‬
‫המחלקה [‪ ]ri‬והיא חשובה [בעיקר] בעת הצגה גרפית של נתונים סטטיסטיים המקובצים‬
‫במחלקות שונות רוחב [במחלקות שוות רוחב ההצגה הגרפית המתייחסת לשכיחות תהיה‬
‫דומה להצגה המתייחסת לצפיפות]‪:‬‬

‫‪fi‬‬
‫‪fi' ‬‬
‫‪ri‬‬

‫‪15‬‬

You might also like