סיכומים

‫בס"ד‬
‫שיעור ‪ :1‬מרצה אילן כהן‬

‫סטטיסטיקה תאורתית‬
‫אוכלסייה‪ -‬אוסף של פריטים בעלי תכונה משותפת שהם הנושא המרכזי של המחקר‪.‬‬
‫אוכלסייה כולל את כל הפריטים שאת מאפייניהם אנו חוקרים‪.‬‬
‫אוכלסייה זה לא בהכרח אנשים יכול להיות תרופות‪ ,‬מדדי לחץ דם וכו‪...‬‬
‫מדגם‬
‫תת קבוצה מתוך האוכלסייה הנבחרת לצורך מחקר(צריך שיהיה ייצוג הולם של כל‬
‫האוכלסיות)‬
‫אוכלסייה מול מדגם‬
‫פקידה‪-‬אנו בוחרים את כל הפריטים באוכלסיית המחקר המסויימת‬
‫דגימה‪ -‬מתבצעת רק שבודקים חלק מהפריטים באוכלסיית המחקר ואנו מהווים‬
‫מדגם(צבע חולצה‪ ,‬עיניים)‬
‫מדגם אקראי‪ -‬מדגם בו לכל אחד מהפריטים באוכלסיית המחקר יש סיכוי להיבחר זה‬
‫גם מדגם מייצג‬
‫התוצרים העיקרים הינם‪:‬‬
‫בניית לוחות סטטיסטים‬
‫הצגת גראפית של הנתונים‬
‫מדדים ‪-‬סיכום הנתונים ע"י ערכים מרכזיים‪ ,‬מדדי פיזור וניתוח קשרים סטטיסטים‬
‫מיקוד‪:‬‬
‫מתרכזים בתיאור הנתונים שנאספו במחקר מאוכלסיית היעד של המחקר(כלל‬
‫האוכלסייה)‪.‬‬
‫מרכיבי הסטטיסטיקה (גרף)‬
‫‪-‬סטטיסטיקה תאורתית (אוכלסייה שלמה)‬
‫‪-‬הסקה סטטיסטית (ממדגם לכלל האוכלסייה)‬
‫מודל לעבודת חקר‬
‫חוקר שואל שאלה‬
‫בודק את כל האוכלסייה\ בודק חלק מהאוכלסייה‬
‫מחליט על דרך מדידה‬
‫אוסף נתונים‬
‫בס"ד‬
‫מקבץ את הנתונים (טבלה\גרף\חוק)‬

‫מסכם אותם על ידי מדד(מהתאם לשאלה ששאל‪ ,‬לסוג האינפורמציה ולטיבה של‬
‫התופעה)‬
‫החוקר שואל את עצמו האם‪:‬‬
‫היה זה מדגם או אוכלסיה?‬
‫אם מדובר באוכלסייה גדולה\אם מדובר במדגם‬
‫סוף \ מסיק מהמדד במדגם למדד באוכלסייה כולה‬
‫סוף‬
‫תהליך מחקר‬
‫צריכה להגיע למסקנות על כל האוכלסייה‬
‫אוספים נתונים‬
‫מקלטגים אותם ‪ ,‬מנתחים אותם ומזה – סטטיסטירה תאורתית‬
‫מפיקים תבונה‪ -.‬הסקה סטטיסטית‬
‫סטטיסטיקה תיאורתית‬
‫מושגים בסיסיים‪ :‬משתנים‬
‫משתנה‪-‬כמו מיכל\קונטיינר שיכול לקבל כמה ערכים בתוכו‪-‬לפחות ‪ ,2‬ערכים אלו‬
‫משתנים‪...‬‬
‫חייבים להיות זהים במבנה‪.‬‬
‫חייבים להיות לפחות שני ערכים שווים אחרת הוא קבוע‪.‬‬
‫כדי לתאר תופעות ולערוך השוואות בין דברים‪ ,‬אנו משתמשים במשתנים‬
‫‪-‬יש משתנה‪ ,‬ערכים‪ ,‬מקרים‪ ,‬וערכים שאנו קבענו‬
‫שיטות למיון משתנים‪ -‬התחלה של המחקר‬
‫מיון לפי סוג משתנה‪ -‬מחלקים למשתנה איכותי‪ -‬מילים‪ ,‬תיאור מילולי‬ ‫‪.1‬‬
‫כגון ‪:‬צבע ירוק ‪ ,‬כחול וכו‪..‬‬
‫ומשתנה כמותי – מודד אותם במספרים‬
‫הכמותי יכול להיות בדיד (שלמים) או רציף‪(-‬שברים)‬
‫לפי סולם מדידה(רמת מדידה)‬ ‫‪.2‬‬

‫משתנים איכותיים‬
‫משתנה שמית‪:‬‬
‫תיאור מילולי בלי היררכיה‬
‫בס"ד‬
‫אורדינאלית\סדר‪:‬‬
‫יש היררכיה‪ -‬משהו יותר ממשהו אחר‬
‫משתנים כמותיים‪ :‬בדיד‪-‬שלם \רציף‪-‬שברים‬

‫משתני רווח\אינטרבלי‪ -‬אם האפס הוא חלק מהסקלה‪ ,‬זאת אומרת האם יש לו‬
‫ערך‪,.‬כמו ש‪ 0‬מעלות זה טמפרטורה ולא כמו ‪ 0‬ילדים‪.‬‬
‫יחס\ מנה‪ -‬זה בעצם ‪ 0‬מוחלט כגון אין ילדים וכו‪..‬‬
‫מבדילים ביניסם ע"י מבחן ה‪0‬‬
‫לפי תפקיד המשתנה‪( :‬אנו צריכים לבחור אם הוא תלוי או לא)‬ ‫‪.3‬‬
‫ככל שאני עולה בסולם המדידה המשתנה שלי יותר חכם‪.‬‬
‫מתחלק ל‪:2‬‬
‫תלוי(מושפע)‪-‬תלוי באחרים‪ ,‬והוא המסביר של הבלתי תלוי (מוסבר)‪ ,‬אותו אנו‬
‫מסבירים במחקר‪.‬‬
‫בלתי תלוי (משפיע)‪-‬המסביר של התלוי (המסבירים)‬
‫לפי כל זה אני אדע איך להתקדם סטטיסטית‪.‬‬
‫שאלת סיכום‬
‫משתנה‪ :‬מצב משפחתי‬
‫(החוקר קובע)ערכים‪ :‬רווק ‪ ,‬נשוי‪ ,‬גרוש‪ ,‬אלמן‬
‫סוג משתנה‪:‬איכותי‪ -‬כי זה מילולי ולא מספרי‬
‫סולם מדידה‪ :‬בגלל שהמצב מאוד דינמי ‪ ,‬אין לו מעצור במצב שלו‪ ,‬לכן זה‬
‫שמית‬
‫תפקיד המשתנה‪ :‬לא רלוונטי כי זה רק משתנה ‪ 1‬ולא יותר‪.‬‬
‫עוד דוגמה‪:‬‬
‫משתנה ‪:‬גיל‬
‫ערכים‪ :‬עד אינסוף‬
‫סוג משתנה‪ :‬כמותי (בדיד\רציף)‬
‫סולם מדידה‪ :‬יחס‬
‫תפקיד משתנה‪ :‬אין‬
‫אפשר למצוא ספר סטטיסטיקה ממכללת אשקלון‪.‬‬

‫בס"ד‬
‫שיעור ‪:2‬‬
‫למה צריך לארגן נתונים?‬

‫רוצים לארגן ולקבץ את הנתונים כדי שנוכל לארגן אותם בצורה חכמה‪ ,‬לקבל מבט על‪.‬‬
‫איך עושים את זה?‬
‫כלי ‪:1‬‬
‫לוחות סטטיסטיים (טבלאות שכיחויות)‬
‫כלי ‪:2‬‬
‫הצגה גרפית (תרשימים)‬
‫כלי ‪:3‬‬
‫מדדים‬
‫לוחות סטטיסטיים‪:‬‬
‫לוח פשוט לקריאה‬ ‫‪.1‬‬
‫ל‪ 4-‬משתנים ‪ 4‬ממדים וכו‪...‬‬ ‫‪.2‬‬
‫כל משתנה מוסיף לנו מימד‬ ‫‪.3‬‬
‫מעל ‪ 3‬או ‪ 4‬יהיה לנו קשה בעין ונצטרך תוכנה סטטיסטית‬ ‫‪.4‬‬
‫מונח המושג שכיחות‪-‬‬
‫מס' הפעמים שמופיעים ערכי המשתנה‪.‬‬
‫טבלת שכיחויות‪:‬‬
‫מרכזת כל משתנה מה יהיו הערכים וכמה מופעים יש לכל ערך וערך‪.‬‬
‫יתרונות‪:‬‬
‫‪-‬על סמך זה אפשר לדעת באיזה מדדים אשתמש‪.‬‬
‫‪ -‬ניתן לקבל תמונה כללית‪.‬‬
‫חסרונות‪:‬‬
‫‪-‬קבלת תמונה יותר מידי כוללנית‬
‫*תמיד החוקרים יגדירו את המשתנים‪.‬‬

‫לוח שכיחות חד מימדי‪:‬‬
‫את גודל המדגם מסמנים באות ‪N‬‬
‫לדוגמה‪:‬‬
‫)‪ -f(x‬שכיחות‬ ‫‪ X-‬המשתנה‬
‫‪3‬‬ ‫קורנפלקס‬
‫מולטי ציריוס ‪9‬‬
‫‪7‬‬ ‫שוגי‬
‫‪11‬‬ ‫קראנצ‬
‫בס"ד‬
‫‪30‬‬ ‫סה"כ‬
‫סוגי שכיחויות‪:‬‬
‫שכיחות רגילה )‪-f(X‬‬ ‫‪.1‬‬

‫מתארת את מספר המופעים של כל משתנה ‪ ,‬נגיד חולצה אדומה – ‪ 3‬אנשים לובשים‬
‫הנפוץ ביותר‪ -‬השכיח ‪ -‬הערך של השתנה שיש לו הכי הרבה מופעים (מופיעה הכי הרבה פעמים)‬
‫הכמות מצביע על השכיח ולא הכמות עצמה‪.‬‬
‫תרגיל ‪:1‬‬
‫)‪ -F(X‬שכיחות‬ ‫‪- X‬טמפ'‬

‫‪1‬‬ ‫‪25‬‬
‫‪3‬‬ ‫‪26‬‬
‫‪4‬‬ ‫‪27‬‬
‫‪2‬‬ ‫‪28‬‬
‫‪5‬‬ ‫‪29‬‬
‫‪10‬‬ ‫‪30‬‬
‫‪2‬‬ ‫‪31‬‬
‫‪1‬‬ ‫‪32‬‬
‫‪1‬‬ ‫‪33‬‬
‫‪1‬‬ ‫‪34‬‬
‫‪30‬‬ ‫סה"כ‬
‫המשתנה‪ :‬טמפרטורה‬
‫‪ .2‬שכיחות מצטברת –)‪F(X‬‬

‫הצטברות המופעים של ערכים עד ערך מסויים‪.‬‬
‫מה המשמעות של שכיחות מצטברת של משתנה ברמת מדידה שמית(לא‬
‫מספרי)?‬
‫אין לה משמעות ברמת מדידה שמית‪ ,‬אלא רק מייצגת את גודל המדגם‪.‬‬
‫זה רלוונטי רק שזה ברמת מדידה של סדר ומעלה כולל‪.‬‬
‫בס"ד‬
‫‪ .3‬שכיחות יחסית )‪f%(X‬‬

‫מה גודל החתיכה באופו יחסי מתוך השלם באחוזים‪.‬‬
‫) ‪f (x‬‬
‫שכיחות רגילה‬ ‫‪n‬‬
‫)‪∗100=f % (x‬‬
‫‪ .4‬שכיחות יחסית מצטברת )‪F%(x‬‬

‫עד ערך מסויים‬
‫‪F‬‬
‫שכיחות מצטברת‬ ‫‪n‬‬
‫) ‪∗100=f % (x‬‬
‫סה"כ‬
‫תרגיל‪:‬‬
‫‪ -X‬מס'‬ ‫)‪-f(x‬מספר‬ ‫)‪F(X‬‬ ‫)‪f%(X‬‬ ‫)‪F%(X‬‬
‫ילדים‬ ‫המשפחות‬
‫‪0‬‬ ‫‪19‬‬ ‫‪19‬‬ ‫‪9.5%‬‬ ‫‪9.5%‬‬
‫‪1‬‬ ‫‪21‬‬ ‫‪40‬‬ ‫‪10.5%‬‬ ‫‪20%‬‬
‫‪2‬‬ ‫‪87‬‬ ‫‪127‬‬ ‫‪43.5%‬‬ ‫‪63.5%‬‬
‫‪3‬‬ ‫‪51‬‬ ‫‪178‬‬ ‫‪25.5%‬‬ ‫‪89%‬‬
‫‪4‬‬ ‫‪22‬‬ ‫‪200‬‬ ‫‪11%‬‬ ‫‪100%‬‬
‫‪N=200‬‬
‫תרגיל ‪:2‬‬
‫)‪F%(x‬‬ ‫)‪f%(x‬‬ ‫)‪F(X‬‬ ‫מס תינוקות‬ ‫צבע עיניים‬
‫‪100*8:36‬‬ ‫‪8‬‬ ‫כחול‬
‫‪100*8:36‬‬ ‫‪8‬‬ ‫ירוק‬
‫‪100*10:36‬‬ ‫‪10‬‬ ‫חום‬
‫‪100*3:36‬‬ ‫‪3‬‬ ‫אפור‬
‫‪100*7:36‬‬ ‫‪7‬‬ ‫אחר‬
‫‪=36n‬‬
‫אי אפשר לכתוב את השאר כי זה משתנה שמי‪.‬‬

‫בס"ד‬
‫‪-‬הצגה גרפית‬
‫סוגים‪:‬‬
‫דיאגרמת מעגל‬ ‫‪.1‬‬
‫דיאגרמת מקלו‬ ‫‪.2‬‬
‫היסטוגרמה ופוליגון‬ ‫‪.3‬‬
‫צורת ההתפלגות‬ ‫‪.4‬‬
‫מי קובע באיזה תרשים ? סולם המדידה‬
‫‪ .5‬דיאגרמת מעגל‪:‬‬
‫מתאים למשתנה שמי‬
‫מתאימה למשתנים בסולם מדידה נומינאלית‪ -‬תרשים עוגה שמתאים‬
‫לאיכותי ברמת מדידה שמית‬
‫חישוב זווית הפלח‪:‬‬
‫‪f ⋅360‬‬
‫שכיחות הערך‬ ‫‪n‬‬
‫סך כל המקרים‬
‫מכירות‬
‫רבעון ראשון‬ ‫רבעון שני‬ ‫רבעון שלישי‬ ‫רבעון רביעי‬
‫‪ .6‬דיאגרמת מקלות\עמודות‪:‬‬
‫משמשת לרמת מדידה סדר ‪,‬גם כמותי בדיד עם מעט ערכים‪.‬‬
‫שכיחות בא לידי ביטוי בגבוה המקל‪.‬‬
‫בס"ד‬
‫ערכי המשתנה על ציר ה‪X -‬‬

‫והשכיחויות על ציר ה‪.Y -‬‬
‫היסטוגרמה‪+‬פוליגון‬ ‫‪.7‬‬
‫מתאים להצגת השכיחויות של משתנה כמותי‪ -‬רציף או בדיד עם ערכים‬
‫מרובים‪.‬‬
‫נצטרך למדוד צפיפות‪.‬‬
‫מרגע שהמחלקות לא יהיו זהות‪ -‬יש משמעות למונח הצפיפות‪.‬‬
‫צפיפות‪ :‬גובה של המלבן‬
‫בהיסטוגרמה הגבוה מייצג את הצפיפות‪.‬‬
‫‪f‬‬
‫‪ -i‬רוחב הקבוצה‬ ‫‪ -f‬שכיחות בקבוצה‬ ‫‪ -d‬צפיפות‬ ‫=‪d‬‬
‫‪I‬‬
‫רוחב הקבוצה זה גבול עליון פחות גבול תחתון‬

‫‪i‬‬ ‫אם הגיל הוא ‪ 18-24‬אז ‪7 =24-18‬‬
‫ציר ה ‪ -x‬רוחב הקבוצה‬
‫ציר ה ‪ -Y‬צפיפות‬
‫בס"ד‬
‫רוחב‬
‫❑‬ ‫צפיפות=‬
‫‪ .8‬פוליגון‪:‬‬
‫קו שמקשר בין נקודות האמצע ‪MEETPOINT‬‬
‫השטח מתחת לפוליגון מבטא הסתברויות‪.‬‬
‫בס"ד‬
‫מדדי נטיית למרכז‪:‬‬
‫שלושה מדדי מרכז‪:‬‬
‫שכיח‪ -‬מסומן ‪MO‬‬ ‫‪.9‬‬

‫קיים בכל סולמות המדידה (שמי‪ ,‬אורגינלי‪ ,‬כמותי)‬
‫הערך יש לו הכי הרבה מופעים‪ ,‬ערך (מספר וכו) שיש אותו הכי הרבה מכולם‪.‬‬
‫יכול להיות שלא יהיה שכיח אחד(שהכל אותו גובה) ויכול להיות יותר משכיח‬
‫אחד ( שניים באותו גובה)‬
‫איך מחשבים שכיח מתוך טבלת שכיחות עם מחלקות? (זאת אומרת ‪ 2-4 , 1-0‬וכו‪)..‬‬
‫מדווחים על המחלקה כולה(הגבולות של המחלקה) או מדווחים על המיט פוינט‪(.‬נקודת‬
‫אמצע ל ‪)3 :2-4‬‬
‫תכונותיו‪-‬‬
‫קל לחישוב‬ ‫‪‬‬
‫לא מושפע מהערכים הקיצוניים‬ ‫‪‬‬
‫ערך המשתנה הנפוץ ביותר‪.‬‬ ‫‪‬‬
‫חציון ‪Md‬‬ ‫‪.10‬‬

‫מדיה‪:‬‬
‫הערך של המשתנה שנמצא במיקום האמצעי‪.‬‬
‫מסדרים בסדר עולה או יורד מימינו או משמאלו‪.‬‬
‫מדיה על משתנה שמי לא קיים‪.‬‬
‫מתאים לרמת מדידה סדר והשאר (ולא שמי\נומינלי)‬
‫המיקום האמצעי לעולם יהיה תלוי בגודל המדגם‪.‬‬
‫אם הגודל אי זוגי‪ -‬אוסיף אחד ואחלק ב‪ 2‬וזה יוביל אותי למיקום האמצעי‪.‬‬
‫בס"ד‬
‫‪n+1‬‬
‫‪ =N‬גודל מדגם (שאני סופרת)‪ -‬מוצאת את המיקום ואז מה שמולו‬ ‫‪2‬‬
‫זה החציון‪.‬‬
‫אם הערך זוגי‪-‬‬
‫אם גודל המדגם זוגי ניקח את ה‪ N‬חלקי ‪ 2‬ואת הבא אחריו‬
‫‪ 2‬הערכים הנמצאים באמצע(בגלל שזה זוגי ואין רק מספר אחד באמצע‬
‫מדוייק) אני אחבר ואחלק ל‪( .2‬זה רק שהעמודה הראשונה היא מספרים‬
‫ולא מילים)‬
‫תכונות חציון‪:‬‬
‫משתנה אורדינלי ומעלה‬ ‫‪‬‬
‫מיקום אמצע ההתפלגות שממוקם באמצע‬ ‫‪‬‬
‫מושפע מסדר הערכים ולא מהערכים עצמם‪.‬‬ ‫‪‬‬
‫נוסיף את עמודת השכיחות המצטברת שהמדגם זוגי (רק בסדר ומעלה)‬
‫לוקחים את שני הערכים של האמצע ומתאימים לפי הטווחים בטבלה של‬
‫השכיחות המצטברת‪.‬‬
‫ואם זה בין שני ערכים אז כותבים את שניהם בבין לבין‪ .‬נגיד‪ :‬די הרבה‪-‬‬
‫כמעט כולם‪.‬‬
‫‪ .11‬ממוצע ‪MEAN‬‬
‫הממוצע שווה למספר האיברים חלקי מספר האיברים‬
‫מסמנים אותו ‪x -‬‬
‫נוסחה‪:‬‬
‫‪∑ xi‬‬
‫=‪x‬‬
‫‪n‬‬
‫∑סיגמא המציינת את פעולת חיבור‬ ‫‪-‬‬

‫תכונות הממוצע‪:‬‬
‫ניתן לחישוב רק במשתנים כמותיים‬ ‫‪‬‬
‫מתאר ממוצע שלאו דווקא קיים‪ ,‬נגיד ממוצא של אחים במשפחה יוצא ‪ 2.5‬זה לא רלוונטי‪.‬‬ ‫‪‬‬
‫מושפע מכל הערכים בסדרה הסטטיסטית כולל קיצוניים‪.‬‬ ‫‪‬‬
‫איך נחשב ממוצע בטבלת שכיחויות?‬
‫בס"ד‬
‫‪∑ xi‬‬
‫=‪x‬‬ ‫)‪∗f (xi‬‬
‫‪n‬‬
‫בעצם‪:‬‬
‫שכיחות ‪ F‬כפול ‪ – X‬ערך המשתנה‪ ,‬בכל שורה‬
‫ואת הסה"כ של כל החישובים לחלק לסה"כ של השכיחות‪.‬‬
‫‪x‬‬ ‫)‪F(x‬‬ ‫)‪F(x‬‬ ‫)‪F(Xi‬‬
‫‪84‬‬ ‫‪4‬‬ ‫‪4‬‬ ‫‪4*84‬‬
‫‪74‬‬ ‫‪5‬‬ ‫‪9‬‬ ‫‪5*74‬‬
‫‪92‬‬ ‫‪1‬‬ ‫‪10‬‬ ‫‪1*92‬‬
‫‪87‬‬ ‫‪7‬‬ ‫‪17‬‬ ‫‪7*87‬‬
‫‪22‬‬ ‫‪12‬‬ ‫‪= 29N‬‬ ‫‪12*88‬‬
‫‪29‬‬ ‫‪∑ x i=2463‬‬
‫במחלקות מקובצות‪:‬‬
‫מחשב ע"י נקודות האמצע (‪ )MP‬של המחלקות‪.‬‬
‫) ‪Mp ( x )∗f (x‬‬

‫=‪x‬‬ ‫¿ ∑=‪0‬‬
‫‪n‬‬
‫בס"ד‬
‫שיעור ‪ :4‬מדדי פיזור וצורות התפלגות‬

‫משתמשים בזה כי מדדי המרכז לא מספקים לנו תמונת מצב כוללת יותר‪.‬‬
‫מדדי הפיזור‪:‬‬
‫מדדים המלמדים על מידת הפיזור סביב הממוצע‬
‫(כמה הולכים לצדדים)‬
‫צורות התפלגות‪:‬‬
‫תיאורים גרפיים לתיאום התפלגות משתנים‪.‬‬
‫קבוצה א‪:‬‬
‫‪3,3,3,3‬‬
‫קבוצה ב‪:‬‬
‫‪2,3,3,4‬‬
‫כבר אנו רואים שקבוצה א אין פיזור כי כל המדדים זהים‪.‬‬
‫וקבוצה ב קיים הבדל בין הערכים – יש פיזור‪.‬‬
‫כשיש לי מדד פיזור‪ ,‬צריך להיעזר במדדי פיזור‪.‬‬
‫יש חמישה מדדי פיזור‪:‬‬
‫אחוז השגיאות (מהשכיח)‬
‫‪ ,‬תחום(‪RANGE(-‬‬
‫תחום בין רבעוני‪- IQR -‬‬
‫שונות(‪)variance‬‬
‫וסטיית תקן((‪.standard deviation‬‬
‫מדדי פיזור מתארים את המידה שבה הערכים בקבוצה שונים אחד מהשני‪.‬‬ ‫‪‬‬
‫סטייה קטנה יחסית שך ערכים‪:‬‬ ‫‪.12‬‬
‫מצביעה על התקבצות ערכי המשתנה סביב מדדי המרכז‬
‫סטייה גדולה יחסית של ערכים‪:‬‬ ‫‪.13‬‬
‫אחוז השגיאות‪:‬‬ ‫‪o‬‬
‫מדד זה מתייחס לחלק יחסי של התצפיות אשר אינן שייכות לקטגוריה השכיחה‪.‬‬
‫בס"ד‬
‫כמה שלא בשכיח‪ -‬באחוזים‪.‬‬

‫‪3,3,3,21,21,20‬‬
‫השכיח‪3 :‬‬
‫גודל המדגם‪N=6 :‬‬
‫‪3‬‬
‫‪=50 %‬‬
‫‪6‬‬
‫‪100* kn‬‬
‫‪ -K‬מספר המקרים השונים מן השכיח‬
‫‪ -N‬מספר האיברים בקבוצה‬
‫אחוז השגיאות ניתן לחישוב עבור כל סולמות המדידה‪ :‬אך הוא הכי מתאים לשמי‪.‬‬
‫‪-‬מדד זה לא מתחשב בכמה השגיאות גדולות‪.‬‬
‫התחום‪:‬‬ ‫‪o‬‬
‫שמצויין טווח‪ ,‬או ‪ RANGE‬אז הכוונה היא לערכים של ‪.X‬‬
‫מתאים לסולם מדידה סדר ומעלה‪(.‬לא שמי)‬ ‫‪.14‬‬

‫מתאים למשתנים כמותיים‪.‬‬ ‫‪.15‬‬
‫הינו ההפרש בין הערך הגבוה ביותר של המשתנה(מקסימום) לבין הערך הנמוך ביותר של‬ ‫‪.16‬‬
‫המשתנה(מינימום)‬
‫הוא מבטא בין מספר למספר‪ .‬ולא ספציפית‪.‬‬ ‫‪.17‬‬
‫‪R=5-5=0 5,5,5,5‬‬
‫‪R=8-1=7 1,3,2,8‬‬
‫לוקחים את נק המקסימום פחות נק המינימום‪.‬‬

‫התחום לוקח בחשבון רק את שני הערכים הקיצוניים‪ ,‬תוך התעלמות ממרכז ההתפלגות‪.‬‬ ‫‪.18‬‬
‫לא בהכרח שה‪ RANGE‬דומה ההתפלגות תיהיה זהה‪ -.‬פה זה אומר שה‪ RANGE‬לא מספיק ‪.‬‬ ‫‪.19‬‬
‫נצטרך בהמון מקרים גם וגם‪.‬‬

‫תכונות התחום‪:‬‬
‫מתאים למשתנים כמותיים בעיקר‪.‬‬ ‫‪.20‬‬
‫תחום בין רבעוני‪IQR:‬‬ ‫‪o‬‬

‫כמו ‪ RANGE‬אבל רק ב‪ 50%‬המרכזיים‪.‬‬ ‫‪.21‬‬
‫אנחנו מחפשים רק את ה‪ 50%‬המרכז ואותם אני רוצה לתאר‪.‬‬
‫בס"ד‬
‫צריך למצוא ‪IQ1 , IQ 3‬‬

‫חישוב התחום בין רבעוני‪:‬‬
‫‪IQR= Q3-Q1‬‬
‫מתאים למשתנים כמותיים‬ ‫‪.22‬‬

‫‪1‬‬
‫‪4‬‬
‫השטח מתחת לפוליגון עד ‪ Q1‬הוא‬
‫השטח מתחת לפוליגון מציין את אחוז המופעים‪.‬‬
‫מחפשים את התחום הבין רבעוני ע"י ‪.X‬‬
‫גודל המדגם*רבע =‪Q1‬‬
‫גודל המדגם * שלושת רבעי= ‪Q3‬‬
‫מתאים למשתנים כמותיים בלבד!‬ ‫‪.23‬‬
‫ככל שהמרחק בין ‪ Q1‬ו‪ -Q3‬יהיה קטן הפיזור יהיה קטן וככל שיהיה רחב יותר‬ ‫‪.24‬‬
‫הפיזור יהיה גדול יותר‪.‬‬
‫שונות וסטיית תקן‪:‬‬ ‫‪o‬‬
‫‪ .25‬מנסה למדוד את המרחק הממוצע ביחידות קבועות‪.‬‬

‫‪ .26‬צריך קודם כל לחשב את הממוצע בשביל מדד המרכז ואז את המדד פיזור‪.‬‬
‫פיזור‪ :‬נוסחה שכתובה במצגת‬
‫ואז אני מעלה את הכל בריבוע(כדי לשנות כיווניות) ובסך הכל של העמודה השניה של‬
‫העלאה בריבוע אני מחלקת ב‪ N‬ואז עושה לו שורש‪.‬‬
‫המדד פיזור הכי חשוב למשתנים כמותיים‪.‬‬ ‫‪.27‬‬
‫מתוקנן‪ -‬ממוצע‪ -‬שכיח‬
‫כשיש טבלת שכיחויות‪:‬‬
‫צריך להתחשב במופעים פעמיים‪ ,‬פעם בחישוב ממוצע ופעם בחישוב השונות‪.‬‬
‫)‪ F(x‬בממוצע ולחלק מספר הדגמים‪.‬‬ ‫להכפיל את ה‬
‫‪ :CV‬מדד פיזור בין קבוצה שונה‪.‬‬
‫מדד פיזור קבוצתי‪ :‬נוסחה‬
‫‪S‬‬
‫‪x‬‬
‫‪=Cv‬‬
‫ככל שההתפלגות יותר גבוהה כך תיהיה רחבה‪.‬‬

‫בס"ד‬
‫בהתפלגות לא סימטרית‪ ,‬לעולם השכיח במקום הכי גבוה ולעולם הממוצע בורח לזנב‬
‫ולעולם החיציון איפשהו בינהם(לא בהכרח באמצע)‬
‫תרגיל‪:‬‬
‫חברת מעיין הנעורים ערכה סקר אודות כמות שתיית המי היומית(בכוסות שלמות)‬
‫‪ f‬שכיחות‬ ‫‪ X‬כוסות מים‬
‫ביום‬
‫בס"ד‬
‫שיעור ‪ :5‬מדדי מיקום יחסי‪-‬ציוני תקן‪ -‬מציין מיקום יחסי וההתפלגות הנורמאלית‪-‬מאפשר לחשב‬
‫אחוזונים‬
‫לומדים‪-‬איפה מישהו נמצא בהתפלגות ביחס לקבוצה שלו‪.‬‬
‫הנתון הקבוע ייתווסף לכל אחד מהערכים‪.‬‬
‫הסטיית תקן לא תשתנה כשהקבוע מסויים משתנה‪.‬‬
‫אם מחסירים זה זז לצד שמאל ואם מחברים זה זז לצד ימין‪.‬‬
‫הוספה רק מזיז את הסטיית התקן‪.‬‬
‫הכפלה בקבוע‪:‬‬
‫היא משפיעה על סטיית התקן והשונות‪.‬‬
‫זה יכפיל את הממוצע בערך קבוע‪.‬‬ ‫‪.28‬‬
‫אם מכפילים בקבוע זה מזיז את ערכי המרכז ומשפיעה על מדדי הפיזור‬
‫הכפלה‪-‬זז ימינה וחילוק‪ -‬זז שמאלה‪.‬‬
‫התפלגות נורמאלית‪ -‬ציון תקן‪:‬‬

‫ציון התקן בעצם שייך להתפלגות נורמאלית מתוקננת‪ ,‬נקראת התפלגות ‪ Z‬שהמאפיינים שהממוצע‬
‫לעולם תיהיה שווה אפס וסטיית התקן לעולם תיהיה ‪.1‬‬
‫ציון תקן‪:‬‬
‫יש שני קנה מידה האחד זה הציונים הגולמיים והשני זה הסרגל המתוקנן‪ -.‬הנקודות‬ ‫‪.29‬‬
‫מקבילות‪.‬‬
‫מספר טהור שלא תלוי ביחידות המדידה של הנתון הגולמי המקורי‪.‬‬ ‫‪.30‬‬
‫אם יש שתי קבוצות שקבוצה אחת ילד קיבל ‪ 90‬ובקבוצה ‪ 2‬ילד קיבל ‪ 80‬משם אני צריכה‬ ‫‪.31‬‬
‫לגלות את ציון התקן‪ .‬כי הציון הוא יחסי וכך אני אגלה האם הם שווים ומי יותר מהשני‪.‬‬
‫‪Xi−x‬‬
‫=‪ - Z i‬נוסחה‬
‫‪Sx‬‬
‫דוגמה ‪:1‬‬
‫משה מקבוצת תרגול ‪,1‬‬
‫קיבל ציון ‪ 90‬במטלת הג'אגלינג‬
‫ושמעון מקבוצת תרגול ‪, 2‬‬
‫קיבל ציון ‪ 80‬במטלת הג'אגלינג‪.‬‬
‫מי מבין השניים הצליח יותר בהשוואה לקבוצת התרגול שלו?‬
‫בס"ד‬
‫תשובה‪:‬‬
‫ציון התקן של משה מקבוצת תרגול ‪1‬‬
‫‪Xi=90‬‬
‫= ‪70 x‬‬
‫‪Sx=10‬‬
‫‪90−70‬‬
‫=‪2‬‬ ‫לפי הנוסחה‪:‬‬
‫‪10‬‬
‫ציון התקן של שמעון מקבוצת תרגול ‪:2‬‬
‫‪Yi-80‬‬
‫‪70- y‬‬
‫‪Sy-5‬‬
‫גם פה זה שווה ‪ 2‬לפי הנוסחה‬
‫ולכן אין הבדל ביניהם‪.‬‬
‫דוגמה ‪:2‬‬
‫על מנת להתקבל לאקדמיה לכדורת‪ ,‬נדרשים המועמדים להשיג בבחינת המיון בהשלכת כדורים‪ ,‬ציון‬
‫שהינו מעל ל‪ 3-‬סטיות תקן מהממוצע‪.‬‬
‫איזה ציון מינימלי על המועמדים להשיג אם ידוע שהציון הממוצע הוא ‪ 620‬וסטיית התקן היא ‪.40‬‬
‫‪Xi−620‬‬
‫‪>3‬‬
‫‪40‬‬
‫‪Xi-620 <40*3‬‬
‫‪Xi>620+120‬‬
‫‪Xi>740‬‬
‫על מנת להתקבל צריך ציון שמעל ‪720‬‬
‫התפלגות ‪Z‬‬
‫איך מיילדת יודעת שהמשקל של התינוק תקין?‬ ‫‪.32‬‬
‫כתוצאה מהמרת כל הערכים של התפלגות נורמאלית מסויימת לציוני תקן תתקבל התפלגות‬
‫נורמאלית מתוקננת של ציוני תקן‪.‬‬
‫בהתפלגות זו הממוצע= ‪0‬‬
‫‪S=1‬‬
‫תמיד סרג ‪ Z‬נשאר אותו דבר‪.‬‬
‫למה עושים את זה?‬
‫כדי להשוות אותם מי יותר ממה או מי יותר ממי‪.‬‬
‫בס"ד‬
‫נשתמש בזה שהמספ*ם לא יהיו שלמים‪.‬‬

‫‪-‬השכיח באמצע(הכי גבוה)‪ ,‬הממוצע בורח לזנב‪ ,‬והחציון הוא לא בדיוק באמצע‪-.‬‬
‫חשוב לזכור‬
‫צריך להוסיף פה מה שנמחק‪.‬‬

‫חישוב אחוזים בין שני ציונים‪:‬‬
‫מה אחוז הנבחנים שקיבלו במסחן הידע הכללי ציונים בין ‪ 450‬ל‪?600‬‬
‫בס"ד‬
‫מדידת קשר‪:‬‬
‫ממדי קשר מודדים את רמת הקשר בין המתנים במדגם\אוכלסייה‬
‫המשתנים הבלתי תלויים הם בציר ה‪ X‬והביטוי של התלויים זה בציר ה‪.Y‬‬
‫תיאור קשר ומשמעותו בין שני משתנים‪:‬‬
‫‪-‬מחקר עוסק בחיפוש קשר בין תופעות‪.‬‬
‫המטרה‪ :‬גילוי חוקיות וסדר‪ -‬זה יסייע בחיזוי טוב יותר את התפועות‪.‬‬
‫מדד קשר סופר את הקשר בין המשתנים ומאפשר ניבוי משתנה אחד על פי משתנה אחר‪.‬‬
‫דוגמאות‪,:‬‬
‫במצבים רבים מתעניינים בקשר הקיים בין שתי תופעות‪.‬‬
‫למשל קשר בין‪:‬‬
‫בלתי תלוי‪-‬הרקע המשפחתי לבין נשירה מבית ספר‪ -‬תלוי‬ ‫‪‬‬

‫(התלוי הוא המושפע והבלתי תלוי הוא המשפיע‪).‬‬
‫כדי להשיב על השאלות האלה אנחנו מחפשים מדד לקשר בין המשתנים‪.‬‬
‫מדד סטטיסטי כזה נקרא מתאם ובלועזית ‪Correlation‬‬
‫נלמד לחפש את הקשר של מה גורם למה‪ -‬סיבה ותוצאה‪ ,‬מדדים המלמדים על המתאם(קשר) בין‬
‫משתנים במחקר והמאפשרים ניבוי משתנה אחד על פי משתנה אחר‪.‬‬
‫דרכים לתיאור הקשר‪:‬‬
‫‪ 3‬דרכים לתיאור קשר בין משתנים תלויים לבלתי תלויים‪:‬‬
‫טבלת שכיחויות דו ממדית‬ ‫‪‬‬
‫דיאגרמת פיזור‬ ‫‪‬‬
‫מדדי קשר‬ ‫‪‬‬
‫לפעמים משתמשים בכמה מהדרכים הללו במקביל‪.‬‬
‫דיאגרמת פיזור‬
‫מתאימה למשתנים סדר ומעלה‪.‬‬
‫זה תיאור בתרשים איך כל אחד משפיע על השני‪.‬‬
‫ההשפעה היא חיובית שהבלתי תלוי עולה גם התלוי עולה‪.‬‬
‫מדדי קשר‬
‫משתנה תלוי‪ :‬היא התופעה שמוסברת(בציר ה ‪)Y‬‬
‫משתנה בלתי תלוי‪ :‬היא תופעה המסבירה( בציר ה‪)X‬‬
‫הערה‪ :‬המשתנה התלוי יכול להיות תלוי בכמה גורמים\משתנים בלתי תלויים‪.‬‬
‫מאפייני הקשר (בין המשתנים)‪:‬‬
‫בס"ד‬
‫סוג הקשר? (לניארי\לא ליניארי)‬ ‫‪.1‬‬

‫כיוון הקשר?(חיובי\שלילי)‬ ‫‪.2‬‬
‫עוצמת הקשר(‪)0-1‬‬ ‫‪.3‬‬
‫מה שמתואר למעלה זה לפי שלבים מתחילים מלזהות אם הקשר בין המשתנים הוא ליניארי או לא ואז‬
‫אם הוא חיובי או שלילי לאחר מכן‪ ,‬לבדוק את עוצמת הקשר‪.‬‬
‫סוג הקשר‬
‫קשר לניארי(רווי)‪ -‬העברת קו דמיוני‪ .‬ולראות האם יש מגמה קווית ( נראה קקו ישר אם נדמיין קו בין‬
‫הנקודות)‬
‫קשר שאינו ליניארי (שאינו קווי)‪ -‬שהמגמה היא לא אחידה‪( .‬אמור להראות כלא קו ישר אלא כמו פרבולה)‬
‫כיוון הקשר‬
‫קשר חיובי‪ -‬שהקו עולה‪ ,‬של הנקודות‬
‫קשר שלילי‪ -‬שהקו יורד ‪ ,‬של הנקודות‬
‫עוצמת הקשר‬
‫יש כמה סרגלים שמודדים אך אנחנו נשתמש בסרגל הנוכחי שנציג‪.‬‬
‫מודדים את עוצמת הקשר ע"י כמה הנקודות קרובות לקו‪ .‬זאת אומרת כמה שקרובים ל‪.1‬‬
‫וכשהן קרובות הקשר יותר חזק‪ .‬ושרחוקות הקשר יותר חלש‪.‬‬
‫הממוצע חייב לעולם להיות על הקו‪ -‬כי הוא ביטוי של כל הנקודות האחרות‪.‬‬
‫עוצמות הקשר‪:‬‬
‫קשר חלש‪0-0.3 -‬‬
‫קשר בינוני ‪0.3-0.7‬‬
‫קשר חזק ‪0.7-1‬‬
‫אם זה יוצא בדיוק ב ‪ 0.3‬ובדיוק ב ‪ 0.7‬הם שייכים מעל המספר שיצא בדיוק‪.‬‬
‫חריגים‪ -‬זה אומר שנקודה או שתיים רחוקים מהקו(אלא שלא מייצגים את הרוב) ‪-‬הכי חשוב‬
‫האינטואציה מהתרשים וכך אדע בדיוק את ממדי הקשר‪.‬‬
‫סוגי מדדי קשר‪:‬‬
‫מדדי קשר למשתנים שמיים‬ ‫‪-‬‬
‫מדדי קשר למשתני סדר‬ ‫‪-‬‬
‫מדדי קשר למשתנים כמותיים (רווח‪ ,‬מנה)‬ ‫‪-‬‬
‫סולמות מדידה ואופן בלירת מדד הקשר‪:‬‬
‫בחירת המדד תוכרע ע"י סולמות מידידה של המשתנים ביניהם נמדד הקשר‪.‬‬ ‫‪-‬‬
‫הסולם הנמוך ביותר מבין השניים הוא שיגביל ויכתיב את בחירת מדד הקשר( אם משתנה א מדד‬ ‫‪-‬‬
‫בסולפ סדר ומשתנה ב ברווח הרי שמדד הקשר שנשתמש יהיה הנמוך מביניהם)‪.‬‬
‫ככל שסולם המדידה גבוה יותר כך הניבוי מדויק יותר‪.‬‬ ‫‪-‬‬
‫מדדי קשר למשתנים שמיים‪:‬‬
‫מדדי למדא‪-‬‬ ‫‪-‬‬
‫מדדי קרמר‬ ‫‪-‬‬
‫מדדי פי‬ ‫‪-‬‬
‫מדד למדא ‪: λ‬‬
‫בס"ד‬
‫ניבוי ‪ Y‬לפי ‪ X‬או ניבוי ‪ X‬לפי ‪( Y‬מדד אסימטרי‪-‬משפיע עליי מאופן שונה ממה שאני משפיע עליו)‬ ‫‪‬‬
‫העוצמה שלו לעולם יהיה בין ‪.0-1‬‬ ‫‪‬‬
‫מבוסס על חישוב שגיאות מהשכיח‬ ‫‪‬‬
‫משמש לבדיקת טיב הניבוי של משתנה באמצעות משתנה אחר‪.‬‬ ‫‪‬‬
‫¿ ‪Ly−L y‬‬
‫‪λy‬‬ ‫❑‬
‫‪∕ x‬‬ ‫=‬
‫‪Ly‬‬
‫‪ -Ly‬סך ההפסד הנגרם מניבוי ‪ Y‬ללא שימוש בידיעת ‪X.‬‬

‫‪ -Ly\x‬סך ההפסד הנגרם בניבוי ‪ Y‬תוך שימוש בידיעת ‪.X‬‬
‫‪Lx-‬סך ההפסד הנגרם מניבוי ‪ X‬ללא שימוש בידיעת ‪Y‬‬
‫‪ -Lx\y‬סך ההפסד הנגרם בניבוי ‪ X‬תוך שימוש בידיעת ‪.Y‬‬
‫הערה‪:‬צריך קודם כל לבדוק שיש קשר ליניארי ואז להשתמש במדד למדא‪.‬‬
‫דוגמה‪ :‬חישוב בשורות‪ -‬כי זה ‪ Y‬בתלות של ‪. X‬‬
‫‪Y\X‬‬ ‫מערך‬ ‫ליכוד‬ ‫ד"ש‬ ‫מפלגות‬ ‫אחר‬ ‫)‪f(x‬‬
‫דתיות‬
‫זכר‬ ‫‪40‬‬ ‫‪160‬‬ ‫‪40‬‬ ‫‪40‬‬ ‫‪20‬‬ ‫‪300‬‬
‫נקבה‬ ‫‪110‬‬ ‫‪40‬‬ ‫‪35‬‬ ‫‪10‬‬ ‫‪5‬‬ ‫‪200‬‬
‫)‪f(y‬‬ ‫‪150‬‬ ‫‪200‬‬ ‫‪75‬‬ ‫‪50‬‬ ‫‪25‬‬ ‫‪500‬‬
‫שלב א'‪ :‬חישוב ‪ -Ly‬לוקח את הסה"כ פחות הסך שכיח ‪300=500-200‬‬

‫שלב ב'‪F(x)- :‬השכיח של הנקבה ‪ +‬סה"כ ‪ - ) )Fx‬השכיח של הזכר‬
‫‪140=300-160‬‬
‫‪90=200-110‬‬
‫‪230=140+90‬‬
‫שלב ג‪ :‬להציב בנוסחה‬
‫‪300−230‬‬
‫‪λy‬‬‫❑‬
‫‪∕ x‬‬
‫=‬
‫‪300‬‬
‫‪70‬‬
‫= ‪0.233‬‬ ‫=‬
‫‪300‬‬
‫שלב ד‪ :‬הצגת תובנות בסרגל מדידה‪ -‬זה חלש כי זה קטן מ‪.0.3‬‬
‫הערה‪ X :‬בתלות ב‪ Y‬עובדים בתורים‪.‬‬
‫‪ Y‬בתלות ב‪ X‬עובדים בשורות‪.‬‬
‫אותו תרגיל רק שה‪X‬בתלות ב‪: Y‬‬ ‫‪-‬‬
‫בס"ד‬
‫‪Lx= 500-300=200‬‬
‫‪Lx\y= 150-110+200-160+75-40+50-40+25-20=130‬‬
‫סה"כ בכל שורה פחות השכיח בשורה‪.‬‬
‫‪200−130‬‬
‫= ‪0.35‬‬
‫‪200‬‬
‫לכן זה עוצמה בינונית‪.‬‬
‫‪ r c :‬קרמר מדד‬
‫‪-‬מדד סימטרי‬
‫‪-‬מחושב על פי שכיחויות‬
‫‪-‬לחשב צפויה (שנחשב) ונצפית‪( -‬מה שראיתי במדגם)‬
‫‪-‬בכל ריבוע בתוך הטבלה אני אצטרך לעשות מה ציפיתי פחות מה חישבתי ומה אני צריך לחשב בלי לדעת‬
‫מה יצא‪.‬‬
‫‪-‬הוא תמיד יהיה חיובי זה אומר שאני לא מודד את הכיוון אלא רק עוצמה‪.‬‬
‫‪-‬מחשב אותו כהפרש בין ‪ OBZERVE‬ל‪ EXEPTED -‬מחשבים את ה‪ EXEPTED‬על סמך השוליים‪.‬‬
‫שאני מתייחסת למתאם קרמר לפחות אחד משמשתנים שמים והשאר יכול להיות כמותי‪ ,‬סדר‪..‬‬
‫‪2‬‬
‫מחשבים קודם את ‪x‬‬
‫רק לאחר מכן מחשבים את מדד קרמר‬
‫חישוב חי בריבוע‪:‬‬
‫‪2‬‬
‫) ‪(Oi−Ei‬‬
‫∑‬ ‫‪Ei‬‬
‫‪=X 2‬‬
‫חישוב מדד קרמר‪:‬‬
‫¿‬
‫√‬‫‪X2 c‬‬
‫❑‬
‫‪r‬‬
‫מחשבים את הצפוי ‪ EXEPTED‬שוליים – שוליים חלקי סה"כ‬
‫‪ =L‬שורות‪ -‬תורים‬
‫דוגמה‪:‬‬
‫‪ 100‬סטודנטים ענו על שאלון אישי‪:‬‬
‫המסווג אנשים לשלושה טיפוסים(א‪,‬ב‪,‬ג)‬
‫אני מקבלת את תוצאות ה‪:OBSARVE‬‬
‫‪Y\X‬‬ ‫מדעי החברה‬ ‫מדעי הטבע‬ ‫מדעי הרוח‬ ‫אחר‬ ‫‪Fx‬‬
‫א‬ ‫‪9‬‬ ‫‪5‬‬ ‫‪35‬‬ ‫‪1‬‬ ‫‪50‬‬
‫ב‬ ‫‪15‬‬ ‫‪2‬‬ ‫‪3‬‬ ‫‪5‬‬ ‫‪25‬‬
‫ג‬ ‫‪6‬‬ ‫‪8‬‬ ‫‪2‬‬ ‫‪9‬‬ ‫‪25‬‬
‫)‪F(y‬‬ ‫‪30‬‬ ‫‪15‬‬ ‫‪40‬‬ ‫‪15‬‬ ‫‪100‬‬
‫בס"ד‬
‫שלבי פתרון‪:‬‬
‫יצירת חישוב טבלת שכיחויות צפויה ‪E‬‬ ‫א‪.‬‬
‫מחשבים את חי בריבוע‬ ‫ב‪.‬‬
‫מחשבים את מתאם קרמר‬ ‫ג‪.‬‬
‫מציגים תובנות‬ ‫ד‪.‬‬
‫ואז אני פשוט מחשבת את ה‪ :EXEPTED‬ע"י שוליים ‪+‬שוליים חלקי הסה"כ‬
‫‪Y\X‬‬ ‫מדעי החברה‬ ‫מדעי הטבע‬ ‫מדעי הרוח‬ ‫אחר‬ ‫‪Fx‬‬

‫א‬ ‫‪9‬‬ ‫‪15 5‬‬ ‫‪7.50 35‬‬ ‫‪20‬‬ ‫‪1‬‬ ‫‪7.50‬‬ ‫‪50‬‬
‫ב‬ ‫‪15‬‬ ‫‪7.5 2‬‬ ‫‪3.75 3‬‬ ‫‪10 5‬‬ ‫‪3.75‬‬ ‫‪25‬‬
‫ג‬ ‫‪6‬‬ ‫‪7.5 8‬‬ ‫‪3.75 2‬‬ ‫‪10 9‬‬ ‫‪3.75‬‬ ‫‪25‬‬
‫)‪F(y‬‬ ‫‪30‬‬ ‫‪15‬‬ ‫‪40‬‬ ‫‪15‬‬ ‫‪100‬‬
‫ועושה בכל משבצת ע"י הנוסחה הראשונה‪:‬‬

‫‪2‬‬
‫)‪(9−15‬‬
‫‪r‬‬
‫‪ +‬וכ'ו‪ ....‬וזה יהיה שווה ל ‪. c‬‬
‫‪15‬‬
‫תרגיל לבית ‪:1‬‬
‫‪Y\X‬‬ ‫בעד‬ ‫נגד‬ ‫נמנע‬ ‫)‪F(x‬‬
‫גבר‬ ‫‪50‬‬ ‫‪40‬‬ ‫‪10‬‬ ‫‪100‬‬
‫אשה‬ ‫‪30‬‬ ‫‪60‬‬ ‫‪10‬‬ ‫‪100‬‬
‫)‪F(y‬‬ ‫‪80‬‬ ‫‪100‬‬ ‫‪20‬‬ ‫‪N=200‬‬
‫תרגיל לבית ‪:2‬‬

‫הקשר בין מין להשכלה לגבי כל נחקר נדבק המין שלו והשכלתי להלן תוצאות‪:‬‬
‫השכלה\מין‬ ‫נמוכה‬ ‫תיכונית‬ ‫גבוהה‬ ‫)‪F(x‬‬
‫גבר‬ ‫‪120‬‬ ‫‪40‬‬ ‫‪20‬‬ ‫‪180‬‬
‫אישה‬ ‫‪20‬‬ ‫‪20‬‬ ‫‪80‬‬ ‫‪120‬‬
‫)‪F(y‬‬ ‫‪140‬‬ ‫‪60‬‬ ‫‪100‬‬ ‫‪=300N‬‬
‫האם קיים קשר בין מין להשכלה?‬

‫מדד פי‪:‬‬
‫הוא מקרה פרטי של קרמר‪ -‬רק במקרה של קרמר של שני עמודות ושני תורים‪ -‬יש קיצור דרך‪.‬‬
‫‪Y\X‬‬ ‫‪Y1‬‬ ‫‪Y2‬‬ ‫‪Fx‬‬
‫‪X1‬‬ ‫‪a‬‬ ‫‪b‬‬ ‫‪r‬‬
‫‪X2‬‬ ‫‪c‬‬ ‫‪d‬‬ ‫‪k‬‬
‫)‪F(y‬‬ ‫‪e‬‬ ‫‪f‬‬ ‫‪n‬‬
‫=∅‬
‫√‬ ‫‪(a∗d−b∗c )2‬‬
‫‪e∗f∗r∗k‬‬
‫תרגיל לבית מדדי פי‪:‬‬
‫לרשום פעם אחת במדד קרמר ופעם אחת במדד פי וקבל אותן תשובות‪.‬‬
‫בס"ד‬
‫מפעל עובד בשתי משמרות‪ ,‬משמרת יום ומשמרת לילה‪,‬‬

‫דגמו ‪ 300‬מוצרים ממשמרת היום ו ‪ 200‬ממשמרת הלילה‪,‬‬
‫מתוך המוצרים שנדגמו ביום ‪ 10‬היו פגומים‪,‬‬
‫מתוך המוצרים שנדגמו בלילה ‪ 150‬היו תקינים‬
‫האם יש קשר בין סוג המשמרת לטיב המוצר?‬
‫משמרת\מוצרים‬
‫בס"ד‬
‫שיעור ‪:7‬מדדי קשר למשתני סדר\ אורדינאלים‬

‫יש משמעות לסדר ולכיוונו‬ ‫‪-‬‬
‫הערך מציין את עוצמת הקשר והסימן מציין את הכיוון( חיובי או שלילי‬ ‫‪-‬‬
‫מדד קשר עיקרי‪:‬‬
‫מדד ספירמן‪rs:‬‬
‫מודד הפרשים‬ ‫‪-‬‬
‫מדד סימטרי‪ ,‬מספיק שאחשב אותו פעם אחת‬ ‫‪-‬‬
‫אנחנו מחפשים את ההפרשים בין ‪ X‬ל‪.Y-‬‬ ‫‪-‬‬
‫מתי אנחנו משתמשים בו?‬
‫שאחד מהמשתנים שלנו סדר\ אורדר והשני או אורדר או כמותי‪.‬‬
‫הקשר שהמדד בודק הוא קשר של דירוג הוא בודק עוצמה וקיבול‪.‬‬
‫המדד מקבל ערכים בין ‪ 1‬ל ‪.-1‬‬
‫לא אחפש את הערכים של ‪ X‬ו‪ y‬אלא אחפש את הפוזישן‪.‬‬

‫הערכים לא מעניינים אלא הפוזישן‪.‬‬
‫הם מעניינים רק לטובת הדירוג‪.‬‬
‫משתמש בערך של ‪ X‬ו‪ Y -‬רק כדי לקבוע את הפוזישן‪.‬‬

‫בס"ד‬
‫מדדי קשר ליניארי ‪:‬למשתנים כמותיים‪ :‬מדד פירסון ‪r‬‬

‫משמש למדידת קשר כמותי ליניארי‪.‬‬ ‫‪‬‬
‫המשתנים התלויים והבלתי תלויים הם מסולם מדידה כמותי והם ליניארים‪.‬‬ ‫‪‬‬
‫יש משמעות לעוצמה ולכיוון‪ ,‬כיוון חיובי ‪ +‬הקשר הוא חיובי עולה (כ‪ X‬עולה גם ה‪ Y‬עולה)‪ ,‬כיוון‬ ‫‪‬‬
‫שלילי – הקשר הוא יורד ( ש‪ X‬עולה ‪ Y‬יורד)‪.‬‬
‫העוצמה אומרת כמה הנקודות קרובות לקו‪.‬‬ ‫‪‬‬
‫מדד פירסון הוא מדד סימטרי‪ -‬מספיק לחשב אותו בכיוון אחד‪.‬‬ ‫‪‬‬
‫משתמשים במדד פירסון כשיש לי משתנה כמותי והקשר אחרי דיאגרמת פיזור‪ -‬ליניארי‪.‬‬
‫לא חייב לעבור בראשית הצירים‪.‬‬
‫אנחנו עובדים בנורמאלי סטנדרטית מתוקננת‬
‫הסבר לנוסחה‪:‬‬
‫‪ -r‬מבטא את מדד מתאם פירסון (עוצמת הקר וכיוונו)‬
‫‪ -Zxi‬מבטא את ציון התקן של משתנה ‪Xi‬‬
‫‪ -Zyi‬מבטא את ציון התקן של משתנה ‪yi‬‬
‫‪ -n‬מבטא את גודל המדגם‬
‫במחברת‬
‫דוגמאות‪ :‬במחברת הסגולה‬
‫משותפת‪COVARIARN:‬‬ ‫שונות‬
‫מבטאת כמה רחוקה הנקודה החריגה (מה המרחק) מנקודת הממוצעים‬
‫יש אפשרות לחשב את פירסון גם לפי שונות משותפת‬
‫נוסחה במחברת‬
‫בס"ד‬

סיכומים

Uploaded by

Copyright:

Available Formats

You might also like

סיכומים

Uploaded by

Document Information

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

סיכומים

Uploaded by

Copyright:

Available Formats

‫בס"ד‬

‫שיעור ‪ :1‬מרצה אילן כהן‬

‫מקבץ את הנתונים (טבלה\גרף\חוק)‬

‫לפי סולם מדידה(רמת מדידה)‬ ‫‪.2‬‬

‫משתנים כמותיים‪ :‬בדיד‪-‬שלם \רציף‪-‬שברים‬

‫לפי כל זה אני אדע איך להתקדם סטטיסטית‪.‬‬

‫אפשר למצוא ספר סטטיסטיקה ממכללת אשקלון‪.‬‬

‫למה צריך לארגן נתונים?‬

‫*תמיד החוקרים יגדירו את המשתנים‪.‬‬

‫שכיחות רגילה )‪-f(X‬‬ ‫‪.1‬‬

‫)‪ -F(X‬שכיחות‬ ‫‪- X‬טמפ'‬

‫‪ .2‬שכיחות מצטברת –)‪F(X‬‬

‫‪ .3‬שכיחות יחסית )‪f%(X‬‬

‫‪ .4‬שכיחות יחסית מצטברת )‪F%(x‬‬

‫אי אפשר לכתוב את השאר כי זה משתנה שמי‪.‬‬

‫רבעון ראשון‬ ‫רבעון שני‬ ‫רבעון שלישי‬ ‫רבעון רביעי‬

‫ערכי המשתנה על ציר ה‪X -‬‬

‫רוחב הקבוצה זה גבול עליון פחות גבול תחתון‬

‫שכיח‪ -‬מסומן ‪MO‬‬ ‫‪.9‬‬

‫חציון ‪Md‬‬ ‫‪.10‬‬

‫∑סיגמא המציינת את פעולת חיבור‬ ‫‪-‬‬

‫) ‪Mp ( x )∗f (x‬‬

‫שיעור ‪ :4‬מדדי פיזור וצורות התפלגות‬

‫כמה שלא בשכיח‪ -‬באחוזים‪.‬‬

‫‪ -N‬מספר האיברים בקבוצה‬

‫מתאים לסולם מדידה סדר ומעלה‪(.‬לא שמי)‬ ‫‪.14‬‬

‫לוקחים את נק המקסימום פחות נק המינימום‪.‬‬

‫נצטרך בהמון מקרים גם וגם‪.‬‬

‫מתאים למשתנים כמותיים בעיקר‪.‬‬ ‫‪.20‬‬

‫תחום בין רבעוני‪IQR:‬‬ ‫‪o‬‬

‫צריך למצוא ‪IQ1 , IQ 3‬‬

‫מתאים למשתנים כמותיים‬ ‫‪.22‬‬

‫שונות וסטיית תקן‪:‬‬ ‫‪o‬‬

‫‪ .25‬מנסה למדוד את המרחק הממוצע ביחידות קבועות‪.‬‬

‫ככל שההתפלגות יותר גבוהה כך תיהיה רחבה‪.‬‬

‫התפלגות נורמאלית‪ -‬ציון תקן‪:‬‬

‫נשתמש בזה שהמספ*ם לא יהיו שלמים‪.‬‬

‫צריך להוסיף פה מה שנמחק‪.‬‬

‫בלתי תלוי‪-‬הרקע המשפחתי לבין נשירה מבית ספר‪ -‬תלוי‬ ‫‪‬‬

‫סוג הקשר? (לניארי\לא ליניארי)‬ ‫‪.1‬‬

‫‪ -Ly‬סך ההפסד הנגרם מניבוי ‪ Y‬ללא שימוש בידיעת ‪X.‬‬

‫שלב א'‪ :‬חישוב ‪ -Ly‬לוקח את הסה"כ פחות הסך שכיח ‪300=500-200‬‬

‫חישוב מדד קרמר‪:‬‬

‫‪Y\X‬‬ ‫מדעי החברה‬ ‫מדעי הטבע‬ ‫מדעי הרוח‬ ‫אחר‬ ‫‪Fx‬‬

‫ועושה בכל משבצת ע"י הנוסחה הראשונה‪:‬‬

‫תרגיל לבית ‪:2‬‬

‫האם קיים קשר בין מין להשכלה?‬

‫מפעל עובד בשתי משמרות‪ ,‬משמרת יום ומשמרת לילה‪,‬‬

‫שיעור ‪:7‬מדדי קשר למשתני סדר\ אורדינאלים‬

‫לא אחפש את הערכים של ‪ X‬ו‪ y‬אלא אחפש את הפוזישן‪.‬‬

‫משתמש בערך של ‪ X‬ו‪ Y -‬רק כדי לקבוע את הפוזישן‪.‬‬

‫מדדי קשר ליניארי ‪:‬למשתנים כמותיים‪ :‬מדד פירסון ‪r‬‬

You might also like