סיכומים

You might also like

Download as docx, pdf, or txt
Download as docx, pdf, or txt
You are on page 1of 28

‫בס"ד‬

‫שיעור ‪ :1‬מרצה אילן כהן‬


‫סטטיסטיקה תאורתית‬
‫אוכלסייה‪ -‬אוסף של פריטים בעלי תכונה משותפת שהם הנושא המרכזי של המחקר‪.‬‬
‫אוכלסייה כולל את כל הפריטים שאת מאפייניהם אנו חוקרים‪.‬‬
‫אוכלסייה זה לא בהכרח אנשים יכול להיות תרופות‪ ,‬מדדי לחץ דם וכו‪...‬‬
‫מדגם‬
‫תת קבוצה מתוך האוכלסייה הנבחרת לצורך מחקר(צריך שיהיה ייצוג הולם של כל‬
‫האוכלסיות)‬
‫אוכלסייה מול מדגם‬
‫פקידה‪-‬אנו בוחרים את כל הפריטים באוכלסיית המחקר המסויימת‬
‫דגימה‪ -‬מתבצעת רק שבודקים חלק מהפריטים באוכלסיית המחקר ואנו מהווים‬
‫מדגם(צבע חולצה‪ ,‬עיניים)‬
‫מדגם אקראי‪ -‬מדגם בו לכל אחד מהפריטים באוכלסיית המחקר יש סיכוי להיבחר זה‬
‫גם מדגם מייצג‬
‫התוצרים העיקרים הינם‪:‬‬
‫בניית לוחות סטטיסטים‬
‫הצגת גראפית של הנתונים‬
‫מדדים ‪-‬סיכום הנתונים ע"י ערכים מרכזיים‪ ,‬מדדי פיזור וניתוח קשרים סטטיסטים‬
‫מיקוד‪:‬‬
‫מתרכזים בתיאור הנתונים שנאספו במחקר מאוכלסיית היעד של המחקר(כלל‬
‫האוכלסייה)‪.‬‬
‫מרכיבי הסטטיסטיקה (גרף)‬
‫‪-‬סטטיסטיקה תאורתית (אוכלסייה שלמה)‬
‫‪-‬הסקה סטטיסטית (ממדגם לכלל האוכלסייה)‬
‫מודל לעבודת חקר‬
‫חוקר שואל שאלה‬
‫בודק את כל האוכלסייה\ בודק חלק מהאוכלסייה‬
‫מחליט על דרך מדידה‬
‫אוסף נתונים‬
‫בס"ד‬

‫מקבץ את הנתונים (טבלה\גרף\חוק)‬


‫מסכם אותם על ידי מדד(מהתאם לשאלה ששאל‪ ,‬לסוג האינפורמציה ולטיבה של‬
‫התופעה)‬
‫החוקר שואל את עצמו האם‪:‬‬
‫היה זה מדגם או אוכלסיה?‬
‫אם מדובר באוכלסייה גדולה\אם מדובר במדגם‬
‫סוף \ מסיק מהמדד במדגם למדד באוכלסייה כולה‬
‫סוף‬
‫תהליך מחקר‬
‫צריכה להגיע למסקנות על כל האוכלסייה‬
‫אוספים נתונים‬
‫מקלטגים אותם ‪ ,‬מנתחים אותם ומזה – סטטיסטירה תאורתית‬
‫מפיקים תבונה‪ -.‬הסקה סטטיסטית‬
‫סטטיסטיקה תיאורתית‬
‫מושגים בסיסיים‪ :‬משתנים‬
‫משתנה‪-‬כמו מיכל\קונטיינר שיכול לקבל כמה ערכים בתוכו‪-‬לפחות ‪ ,2‬ערכים אלו‬
‫משתנים‪...‬‬
‫חייבים להיות זהים במבנה‪.‬‬
‫חייבים להיות לפחות שני ערכים שווים אחרת הוא קבוע‪.‬‬
‫כדי לתאר תופעות ולערוך השוואות בין דברים‪ ,‬אנו משתמשים במשתנים‬
‫‪-‬יש משתנה‪ ,‬ערכים‪ ,‬מקרים‪ ,‬וערכים שאנו קבענו‬
‫שיטות למיון משתנים‪ -‬התחלה של המחקר‬
‫מיון לפי סוג משתנה‪ -‬מחלקים למשתנה איכותי‪ -‬מילים‪ ,‬תיאור מילולי‬ ‫‪.1‬‬
‫כגון ‪:‬צבע ירוק ‪ ,‬כחול וכו‪..‬‬
‫ומשתנה כמותי – מודד אותם במספרים‬
‫הכמותי יכול להיות בדיד (שלמים) או רציף‪(-‬שברים)‬

‫לפי סולם מדידה(רמת מדידה)‬ ‫‪.2‬‬


‫משתנים איכותיים‬
‫משתנה שמית‪:‬‬
‫תיאור מילולי בלי היררכיה‬
‫בס"ד‬

‫אורדינאלית\סדר‪:‬‬
‫יש היררכיה‪ -‬משהו יותר ממשהו אחר‬

‫משתנים כמותיים‪ :‬בדיד‪-‬שלם \רציף‪-‬שברים‬


‫משתני רווח\אינטרבלי‪ -‬אם האפס הוא חלק מהסקלה‪ ,‬זאת אומרת האם יש לו‬
‫ערך‪,.‬כמו ש‪ 0‬מעלות זה טמפרטורה ולא כמו ‪ 0‬ילדים‪.‬‬
‫יחס\ מנה‪ -‬זה בעצם ‪ 0‬מוחלט כגון אין ילדים וכו‪..‬‬
‫מבדילים ביניסם ע"י מבחן ה‪0‬‬

‫לפי תפקיד המשתנה‪( :‬אנו צריכים לבחור אם הוא תלוי או לא)‬ ‫‪.3‬‬
‫ככל שאני עולה בסולם המדידה המשתנה שלי יותר חכם‪.‬‬
‫מתחלק ל‪:2‬‬
‫תלוי(מושפע)‪-‬תלוי באחרים‪ ,‬והוא המסביר של הבלתי תלוי (מוסבר)‪ ,‬אותו אנו‬
‫מסבירים במחקר‪.‬‬
‫בלתי תלוי (משפיע)‪-‬המסביר של התלוי (המסבירים)‬

‫לפי כל זה אני אדע איך להתקדם סטטיסטית‪.‬‬

‫שאלת סיכום‬
‫משתנה‪ :‬מצב משפחתי‬
‫(החוקר קובע)ערכים‪ :‬רווק ‪ ,‬נשוי‪ ,‬גרוש‪ ,‬אלמן‬
‫סוג משתנה‪:‬איכותי‪ -‬כי זה מילולי ולא מספרי‬
‫סולם מדידה‪ :‬בגלל שהמצב מאוד דינמי ‪ ,‬אין לו מעצור במצב שלו‪ ,‬לכן זה‬
‫שמית‬
‫תפקיד המשתנה‪ :‬לא רלוונטי כי זה רק משתנה ‪ 1‬ולא יותר‪.‬‬

‫עוד דוגמה‪:‬‬
‫משתנה ‪:‬גיל‬
‫ערכים‪ :‬עד אינסוף‬
‫סוג משתנה‪ :‬כמותי (בדיד\רציף)‬
‫סולם מדידה‪ :‬יחס‬
‫תפקיד משתנה‪ :‬אין‬

‫אפשר למצוא ספר סטטיסטיקה ממכללת אשקלון‪.‬‬


‫בס"ד‬

‫שיעור ‪:2‬‬

‫למה צריך לארגן נתונים?‬


‫רוצים לארגן ולקבץ את הנתונים כדי שנוכל לארגן אותם בצורה חכמה‪ ,‬לקבל מבט על‪.‬‬
‫איך עושים את זה?‬
‫כלי ‪:1‬‬
‫לוחות סטטיסטיים (טבלאות שכיחויות)‬
‫כלי ‪:2‬‬
‫הצגה גרפית (תרשימים)‬
‫כלי ‪:3‬‬
‫מדדים‬
‫לוחות סטטיסטיים‪:‬‬
‫לוח פשוט לקריאה‬ ‫‪.1‬‬
‫ל‪ 4-‬משתנים ‪ 4‬ממדים וכו‪...‬‬ ‫‪.2‬‬
‫כל משתנה מוסיף לנו מימד‬ ‫‪.3‬‬
‫מעל ‪ 3‬או ‪ 4‬יהיה לנו קשה בעין ונצטרך תוכנה סטטיסטית‬ ‫‪.4‬‬
‫מונח המושג שכיחות‪-‬‬
‫מס' הפעמים שמופיעים ערכי המשתנה‪.‬‬
‫טבלת שכיחויות‪:‬‬
‫מרכזת כל משתנה מה יהיו הערכים וכמה מופעים יש לכל ערך וערך‪.‬‬
‫יתרונות‪:‬‬
‫‪-‬על סמך זה אפשר לדעת באיזה מדדים אשתמש‪.‬‬
‫‪ -‬ניתן לקבל תמונה כללית‪.‬‬
‫חסרונות‪:‬‬
‫‪-‬קבלת תמונה יותר מידי כוללנית‬

‫*תמיד החוקרים יגדירו את המשתנים‪.‬‬


‫לוח שכיחות חד מימדי‪:‬‬
‫את גודל המדגם מסמנים באות ‪N‬‬
‫לדוגמה‪:‬‬
‫)‪ -f(x‬שכיחות‬ ‫‪ X-‬המשתנה‬
‫‪3‬‬ ‫קורנפלקס‬
‫מולטי ציריוס ‪9‬‬
‫‪7‬‬ ‫שוגי‬
‫‪11‬‬ ‫קראנצ‬
‫בס"ד‬

‫‪30‬‬ ‫סה"כ‬
‫סוגי שכיחויות‪:‬‬

‫שכיחות רגילה )‪-f(X‬‬ ‫‪.1‬‬


‫מתארת את מספר המופעים של כל משתנה ‪ ,‬נגיד חולצה אדומה – ‪ 3‬אנשים לובשים‬
‫הנפוץ ביותר‪ -‬השכיח ‪ -‬הערך של השתנה שיש לו הכי הרבה מופעים (מופיעה הכי הרבה פעמים)‬
‫הכמות מצביע על השכיח ולא הכמות עצמה‪.‬‬
‫תרגיל ‪:1‬‬

‫)‪ -F(X‬שכיחות‬ ‫‪- X‬טמפ'‬


‫‪1‬‬ ‫‪25‬‬
‫‪3‬‬ ‫‪26‬‬
‫‪4‬‬ ‫‪27‬‬
‫‪2‬‬ ‫‪28‬‬
‫‪5‬‬ ‫‪29‬‬
‫‪10‬‬ ‫‪30‬‬
‫‪2‬‬ ‫‪31‬‬
‫‪1‬‬ ‫‪32‬‬
‫‪1‬‬ ‫‪33‬‬
‫‪1‬‬ ‫‪34‬‬
‫‪30‬‬ ‫סה"כ‬
‫המשתנה‪ :‬טמפרטורה‬

‫‪ .2‬שכיחות מצטברת –)‪F(X‬‬


‫הצטברות המופעים של ערכים עד ערך מסויים‪.‬‬
‫מה המשמעות של שכיחות מצטברת של משתנה ברמת מדידה שמית(לא‬
‫מספרי)?‬
‫אין לה משמעות ברמת מדידה שמית‪ ,‬אלא רק מייצגת את גודל המדגם‪.‬‬
‫זה רלוונטי רק שזה ברמת מדידה של סדר ומעלה כולל‪.‬‬
‫בס"ד‬

‫‪ .3‬שכיחות יחסית )‪f%(X‬‬


‫מה גודל החתיכה באופו יחסי מתוך השלם באחוזים‪.‬‬
‫) ‪f (x‬‬
‫שכיחות רגילה‬ ‫‪n‬‬
‫)‪∗100=f % (x‬‬

‫‪ .4‬שכיחות יחסית מצטברת )‪F%(x‬‬


‫עד ערך מסויים‬
‫‪F‬‬
‫שכיחות מצטברת‬ ‫‪n‬‬
‫) ‪∗100=f % (x‬‬

‫סה"כ‬

‫תרגיל‪:‬‬
‫‪ -X‬מס'‬ ‫)‪-f(x‬מספר‬ ‫)‪F(X‬‬ ‫)‪f%(X‬‬ ‫)‪F%(X‬‬
‫ילדים‬ ‫המשפחות‬
‫‪0‬‬ ‫‪19‬‬ ‫‪19‬‬ ‫‪9.5%‬‬ ‫‪9.5%‬‬
‫‪1‬‬ ‫‪21‬‬ ‫‪40‬‬ ‫‪10.5%‬‬ ‫‪20%‬‬
‫‪2‬‬ ‫‪87‬‬ ‫‪127‬‬ ‫‪43.5%‬‬ ‫‪63.5%‬‬
‫‪3‬‬ ‫‪51‬‬ ‫‪178‬‬ ‫‪25.5%‬‬ ‫‪89%‬‬
‫‪4‬‬ ‫‪22‬‬ ‫‪200‬‬ ‫‪11%‬‬ ‫‪100%‬‬
‫‪N=200‬‬
‫תרגיל ‪:2‬‬
‫)‪F%(x‬‬ ‫)‪f%(x‬‬ ‫)‪F(X‬‬ ‫מס תינוקות‬ ‫צבע עיניים‬
‫‪100*8:36‬‬ ‫‪8‬‬ ‫כחול‬
‫‪100*8:36‬‬ ‫‪8‬‬ ‫ירוק‬
‫‪100*10:36‬‬ ‫‪10‬‬ ‫חום‬
‫‪100*3:36‬‬ ‫‪3‬‬ ‫אפור‬
‫‪100*7:36‬‬ ‫‪7‬‬ ‫אחר‬
‫‪=36n‬‬

‫אי אפשר לכתוב את השאר כי זה משתנה שמי‪.‬‬


‫בס"ד‬

‫‪-‬הצגה גרפית‬
‫סוגים‪:‬‬
‫דיאגרמת מעגל‬ ‫‪.1‬‬
‫דיאגרמת מקלו‬ ‫‪.2‬‬
‫היסטוגרמה ופוליגון‬ ‫‪.3‬‬
‫צורת ההתפלגות‬ ‫‪.4‬‬
‫מי קובע באיזה תרשים ? סולם המדידה‬
‫‪ .5‬דיאגרמת מעגל‪:‬‬
‫מתאים למשתנה שמי‬
‫מתאימה למשתנים בסולם מדידה נומינאלית‪ -‬תרשים עוגה שמתאים‬
‫לאיכותי ברמת מדידה שמית‬
‫חישוב זווית הפלח‪:‬‬
‫‪f ⋅360‬‬
‫שכיחות הערך‬ ‫‪n‬‬

‫סך כל המקרים‬

‫מכירות‬

‫רבעון ראשון‬ ‫רבעון שני‬ ‫רבעון שלישי‬ ‫רבעון רביעי‬

‫‪ .6‬דיאגרמת מקלות\עמודות‪:‬‬
‫משמשת לרמת מדידה סדר ‪,‬גם כמותי בדיד עם מעט ערכים‪.‬‬
‫שכיחות בא לידי ביטוי בגבוה המקל‪.‬‬
‫בס"ד‬

‫ערכי המשתנה על ציר ה‪X -‬‬


‫והשכיחויות על ציר ה‪.Y -‬‬

‫היסטוגרמה‪+‬פוליגון‬ ‫‪.7‬‬
‫מתאים להצגת השכיחויות של משתנה כמותי‪ -‬רציף או בדיד עם ערכים‬
‫מרובים‪.‬‬
‫נצטרך למדוד צפיפות‪.‬‬
‫מרגע שהמחלקות לא יהיו זהות‪ -‬יש משמעות למונח הצפיפות‪.‬‬
‫צפיפות‪ :‬גובה של המלבן‬
‫בהיסטוגרמה הגבוה מייצג את הצפיפות‪.‬‬
‫‪f‬‬
‫‪ -i‬רוחב הקבוצה‬ ‫‪ -f‬שכיחות בקבוצה‬ ‫‪ -d‬צפיפות‬ ‫=‪d‬‬
‫‪I‬‬

‫רוחב הקבוצה זה גבול עליון פחות גבול תחתון‬


‫‪i‬‬ ‫אם הגיל הוא ‪ 18-24‬אז ‪7 =24-18‬‬
‫ציר ה ‪ -x‬רוחב הקבוצה‬
‫ציר ה ‪ -Y‬צפיפות‬
‫בס"ד‬

‫רוחב‬
‫❑‬ ‫צפיפות=‬
‫‪ .8‬פוליגון‪:‬‬
‫קו שמקשר בין נקודות האמצע ‪MEETPOINT‬‬
‫השטח מתחת לפוליגון מבטא הסתברויות‪.‬‬
‫בס"ד‬

‫שיעור ‪:3‬‬
‫מדדי נטיית למרכז‪:‬‬
‫שלושה מדדי מרכז‪:‬‬

‫שכיח‪ -‬מסומן ‪MO‬‬ ‫‪.9‬‬


‫קיים בכל סולמות המדידה (שמי‪ ,‬אורגינלי‪ ,‬כמותי)‬
‫הערך יש לו הכי הרבה מופעים‪ ,‬ערך (מספר וכו) שיש אותו הכי הרבה מכולם‪.‬‬
‫יכול להיות שלא יהיה שכיח אחד(שהכל אותו גובה) ויכול להיות יותר משכיח‬
‫אחד ( שניים באותו גובה)‬
‫איך מחשבים שכיח מתוך טבלת שכיחות עם מחלקות? (זאת אומרת ‪ 2-4 , 1-0‬וכו‪)..‬‬
‫מדווחים על המחלקה כולה(הגבולות של המחלקה) או מדווחים על המיט פוינט‪(.‬נקודת‬
‫אמצע ל ‪)3 :2-4‬‬
‫תכונותיו‪-‬‬
‫קל לחישוב‬ ‫‪‬‬
‫לא מושפע מהערכים הקיצוניים‬ ‫‪‬‬
‫ערך המשתנה הנפוץ ביותר‪.‬‬ ‫‪‬‬

‫חציון ‪Md‬‬ ‫‪.10‬‬


‫מדיה‪:‬‬
‫הערך של המשתנה שנמצא במיקום האמצעי‪.‬‬
‫מסדרים בסדר עולה או יורד מימינו או משמאלו‪.‬‬
‫מדיה על משתנה שמי לא קיים‪.‬‬
‫מתאים לרמת מדידה סדר והשאר (ולא שמי\נומינלי)‬
‫המיקום האמצעי לעולם יהיה תלוי בגודל המדגם‪.‬‬
‫אם הגודל אי זוגי‪ -‬אוסיף אחד ואחלק ב‪ 2‬וזה יוביל אותי למיקום האמצעי‪.‬‬
‫בס"ד‬

‫‪n+1‬‬
‫‪ =N‬גודל מדגם (שאני סופרת)‪ -‬מוצאת את המיקום ואז מה שמולו‬ ‫‪2‬‬
‫זה החציון‪.‬‬
‫אם הערך זוגי‪-‬‬
‫אם גודל המדגם זוגי ניקח את ה‪ N‬חלקי ‪ 2‬ואת הבא אחריו‬
‫‪ 2‬הערכים הנמצאים באמצע(בגלל שזה זוגי ואין רק מספר אחד באמצע‬
‫מדוייק) אני אחבר ואחלק ל‪( .2‬זה רק שהעמודה הראשונה היא מספרים‬
‫ולא מילים)‬
‫תכונות חציון‪:‬‬
‫משתנה אורדינלי ומעלה‬ ‫‪‬‬
‫מיקום אמצע ההתפלגות שממוקם באמצע‬ ‫‪‬‬
‫מושפע מסדר הערכים ולא מהערכים עצמם‪.‬‬ ‫‪‬‬
‫נוסיף את עמודת השכיחות המצטברת שהמדגם זוגי (רק בסדר ומעלה)‬
‫לוקחים את שני הערכים של האמצע ומתאימים לפי הטווחים בטבלה של‬
‫השכיחות המצטברת‪.‬‬
‫ואם זה בין שני ערכים אז כותבים את שניהם בבין לבין‪ .‬נגיד‪ :‬די הרבה‪-‬‬
‫כמעט כולם‪.‬‬

‫‪ .11‬ממוצע ‪MEAN‬‬
‫הממוצע שווה למספר האיברים חלקי מספר האיברים‬
‫מסמנים אותו ‪x -‬‬

‫נוסחה‪:‬‬
‫‪∑ xi‬‬
‫=‪x‬‬
‫‪n‬‬

‫∑סיגמא המציינת את פעולת חיבור‬ ‫‪-‬‬


‫תכונות הממוצע‪:‬‬
‫ניתן לחישוב רק במשתנים כמותיים‬ ‫‪‬‬
‫מתאר ממוצע שלאו דווקא קיים‪ ,‬נגיד ממוצא של אחים במשפחה יוצא ‪ 2.5‬זה לא רלוונטי‪.‬‬ ‫‪‬‬
‫מושפע מכל הערכים בסדרה הסטטיסטית כולל קיצוניים‪.‬‬ ‫‪‬‬
‫איך נחשב ממוצע בטבלת שכיחויות?‬
‫בס"ד‬

‫‪∑ xi‬‬
‫=‪x‬‬ ‫)‪∗f (xi‬‬
‫‪n‬‬

‫בעצם‪:‬‬
‫שכיחות ‪ F‬כפול ‪ – X‬ערך המשתנה‪ ,‬בכל שורה‬
‫ואת הסה"כ של כל החישובים לחלק לסה"כ של השכיחות‪.‬‬
‫‪x‬‬ ‫)‪F(x‬‬ ‫)‪F(x‬‬ ‫)‪F(Xi‬‬
‫‪84‬‬ ‫‪4‬‬ ‫‪4‬‬ ‫‪4*84‬‬
‫‪74‬‬ ‫‪5‬‬ ‫‪9‬‬ ‫‪5*74‬‬
‫‪92‬‬ ‫‪1‬‬ ‫‪10‬‬ ‫‪1*92‬‬
‫‪87‬‬ ‫‪7‬‬ ‫‪17‬‬ ‫‪7*87‬‬
‫‪22‬‬ ‫‪12‬‬ ‫‪= 29N‬‬ ‫‪12*88‬‬
‫‪29‬‬ ‫‪∑ x i=2463‬‬

‫במחלקות מקובצות‪:‬‬
‫מחשב ע"י נקודות האמצע (‪ )MP‬של המחלקות‪.‬‬

‫) ‪Mp ( x )∗f (x‬‬


‫=‪x‬‬ ‫¿ ∑=‪0‬‬
‫‪n‬‬
‫בס"ד‬

‫שיעור ‪ :4‬מדדי פיזור וצורות התפלגות‬


‫משתמשים בזה כי מדדי המרכז לא מספקים לנו תמונת מצב כוללת יותר‪.‬‬
‫מדדי הפיזור‪:‬‬
‫מדדים המלמדים על מידת הפיזור סביב הממוצע‬
‫(כמה הולכים לצדדים)‬
‫צורות התפלגות‪:‬‬
‫תיאורים גרפיים לתיאום התפלגות משתנים‪.‬‬
‫לדוגמה‪:‬‬
‫קבוצה א‪:‬‬
‫‪3,3,3,3‬‬
‫קבוצה ב‪:‬‬
‫‪2,3,3,4‬‬
‫כבר אנו רואים שקבוצה א אין פיזור כי כל המדדים זהים‪.‬‬
‫וקבוצה ב קיים הבדל בין הערכים – יש פיזור‪.‬‬
‫כשיש לי מדד פיזור‪ ,‬צריך להיעזר במדדי פיזור‪.‬‬
‫יש חמישה מדדי פיזור‪:‬‬
‫אחוז השגיאות (מהשכיח)‬
‫‪ ,‬תחום(‪RANGE(-‬‬
‫תחום בין רבעוני‪- IQR -‬‬
‫שונות(‪)variance‬‬
‫וסטיית תקן((‪.standard deviation‬‬
‫מדדי פיזור מתארים את המידה שבה הערכים בקבוצה שונים אחד מהשני‪.‬‬ ‫‪‬‬
‫סטייה קטנה יחסית שך ערכים‪:‬‬ ‫‪.12‬‬
‫מצביעה על התקבצות ערכי המשתנה סביב מדדי המרכז‬
‫סטייה גדולה יחסית של ערכים‪:‬‬ ‫‪.13‬‬
‫אחוז השגיאות‪:‬‬ ‫‪o‬‬

‫מדד זה מתייחס לחלק יחסי של התצפיות אשר אינן שייכות לקטגוריה השכיחה‪.‬‬
‫בס"ד‬

‫כמה שלא בשכיח‪ -‬באחוזים‪.‬‬


‫לדוגמה‪:‬‬
‫‪3,3,3,21,21,20‬‬
‫השכיח‪3 :‬‬
‫גודל המדגם‪N=6 :‬‬
‫‪3‬‬
‫‪=50 %‬‬
‫‪6‬‬
‫נוסחה‪:‬‬

‫‪100* kn‬‬
‫‪ -K‬מספר המקרים השונים מן השכיח‬

‫‪ -N‬מספר האיברים בקבוצה‬

‫אחוז השגיאות ניתן לחישוב עבור כל סולמות המדידה‪ :‬אך הוא הכי מתאים לשמי‪.‬‬
‫‪-‬מדד זה לא מתחשב בכמה השגיאות גדולות‪.‬‬

‫התחום‪:‬‬ ‫‪o‬‬
‫שמצויין טווח‪ ,‬או ‪ RANGE‬אז הכוונה היא לערכים של ‪.X‬‬

‫מתאים לסולם מדידה סדר ומעלה‪(.‬לא שמי)‬ ‫‪.14‬‬


‫מתאים למשתנים כמותיים‪.‬‬ ‫‪.15‬‬
‫הינו ההפרש בין הערך הגבוה ביותר של המשתנה(מקסימום) לבין הערך הנמוך ביותר של‬ ‫‪.16‬‬
‫המשתנה(מינימום)‬
‫הוא מבטא בין מספר למספר‪ .‬ולא ספציפית‪.‬‬ ‫‪.17‬‬
‫לדוגמה‪:‬‬

‫‪R=5-5=0 5,5,5,5‬‬
‫‪R=8-1=7 1,3,2,8‬‬

‫לוקחים את נק המקסימום פחות נק המינימום‪.‬‬


‫התחום לוקח בחשבון רק את שני הערכים הקיצוניים‪ ,‬תוך התעלמות ממרכז ההתפלגות‪.‬‬ ‫‪.18‬‬
‫לא בהכרח שה‪ RANGE‬דומה ההתפלגות תיהיה זהה‪ -.‬פה זה אומר שה‪ RANGE‬לא מספיק ‪.‬‬ ‫‪.19‬‬

‫נצטרך בהמון מקרים גם וגם‪.‬‬


‫תכונות התחום‪:‬‬

‫מתאים למשתנים כמותיים בעיקר‪.‬‬ ‫‪.20‬‬

‫תחום בין רבעוני‪IQR:‬‬ ‫‪o‬‬


‫כמו ‪ RANGE‬אבל רק ב‪ 50%‬המרכזיים‪.‬‬ ‫‪.21‬‬
‫אנחנו מחפשים רק את ה‪ 50%‬המרכז ואותם אני רוצה לתאר‪.‬‬
‫בס"ד‬

‫צריך למצוא ‪IQ1 , IQ 3‬‬


‫חישוב התחום בין רבעוני‪:‬‬

‫‪IQR= Q3-Q1‬‬

‫מתאים למשתנים כמותיים‬ ‫‪.22‬‬


‫‪1‬‬
‫‪4‬‬
‫השטח מתחת לפוליגון עד ‪ Q1‬הוא‬
‫השטח מתחת לפוליגון מציין את אחוז המופעים‪.‬‬
‫מחפשים את התחום הבין רבעוני ע"י ‪.X‬‬
‫גודל המדגם*רבע =‪Q1‬‬
‫גודל המדגם * שלושת רבעי= ‪Q3‬‬
‫מתאים למשתנים כמותיים בלבד!‬ ‫‪.23‬‬
‫ככל שהמרחק בין ‪ Q1‬ו‪ -Q3‬יהיה קטן הפיזור יהיה קטן וככל שיהיה רחב יותר‬ ‫‪.24‬‬
‫הפיזור יהיה גדול יותר‪.‬‬

‫שונות וסטיית תקן‪:‬‬ ‫‪o‬‬

‫‪ .25‬מנסה למדוד את המרחק הממוצע ביחידות קבועות‪.‬‬


‫‪ .26‬צריך קודם כל לחשב את הממוצע בשביל מדד המרכז ואז את המדד פיזור‪.‬‬
‫פיזור‪ :‬נוסחה שכתובה במצגת‬
‫ואז אני מעלה את הכל בריבוע(כדי לשנות כיווניות) ובסך הכל של העמודה השניה של‬
‫העלאה בריבוע אני מחלקת ב‪ N‬ואז עושה לו שורש‪.‬‬
‫המדד פיזור הכי חשוב למשתנים כמותיים‪.‬‬ ‫‪.27‬‬
‫מתוקנן‪ -‬ממוצע‪ -‬שכיח‬
‫כשיש טבלת שכיחויות‪:‬‬
‫צריך להתחשב במופעים פעמיים‪ ,‬פעם בחישוב ממוצע ופעם בחישוב השונות‪.‬‬
‫)‪ F(x‬בממוצע ולחלק מספר הדגמים‪.‬‬ ‫להכפיל את ה‬
‫‪ :CV‬מדד פיזור בין קבוצה שונה‪.‬‬
‫מדד פיזור קבוצתי‪ :‬נוסחה‬
‫‪S‬‬
‫‪x‬‬
‫‪=Cv‬‬

‫ככל שההתפלגות יותר גבוהה כך תיהיה רחבה‪.‬‬


‫בס"ד‬

‫בהתפלגות לא סימטרית‪ ,‬לעולם השכיח במקום הכי גבוה ולעולם הממוצע בורח לזנב‬
‫ולעולם החיציון איפשהו בינהם(לא בהכרח באמצע)‬

‫תרגיל‪:‬‬
‫חברת מעיין הנעורים ערכה סקר אודות כמות שתיית המי היומית(בכוסות שלמות)‬
‫‪ f‬שכיחות‬ ‫‪ X‬כוסות מים‬
‫ביום‬
‫בס"ד‬

‫שיעור ‪ :5‬מדדי מיקום יחסי‪-‬ציוני תקן‪ -‬מציין מיקום יחסי וההתפלגות הנורמאלית‪-‬מאפשר לחשב‬
‫אחוזונים‬
‫לומדים‪-‬איפה מישהו נמצא בהתפלגות ביחס לקבוצה שלו‪.‬‬
‫הנתון הקבוע ייתווסף לכל אחד מהערכים‪.‬‬
‫הסטיית תקן לא תשתנה כשהקבוע מסויים משתנה‪.‬‬
‫אם מחסירים זה זז לצד שמאל ואם מחברים זה זז לצד ימין‪.‬‬
‫הוספה רק מזיז את הסטיית התקן‪.‬‬
‫הכפלה בקבוע‪:‬‬
‫היא משפיעה על סטיית התקן והשונות‪.‬‬
‫זה יכפיל את הממוצע בערך קבוע‪.‬‬ ‫‪.28‬‬
‫אם מכפילים בקבוע זה מזיז את ערכי המרכז ומשפיעה על מדדי הפיזור‬
‫הכפלה‪-‬זז ימינה וחילוק‪ -‬זז שמאלה‪.‬‬

‫התפלגות נורמאלית‪ -‬ציון תקן‪:‬‬


‫ציון התקן בעצם שייך להתפלגות נורמאלית מתוקננת‪ ,‬נקראת התפלגות ‪ Z‬שהמאפיינים שהממוצע‬
‫לעולם תיהיה שווה אפס וסטיית התקן לעולם תיהיה ‪.1‬‬
‫ציון תקן‪:‬‬
‫יש שני קנה מידה האחד זה הציונים הגולמיים והשני זה הסרגל המתוקנן‪ -.‬הנקודות‬ ‫‪.29‬‬
‫מקבילות‪.‬‬
‫מספר טהור שלא תלוי ביחידות המדידה של הנתון הגולמי המקורי‪.‬‬ ‫‪.30‬‬
‫אם יש שתי קבוצות שקבוצה אחת ילד קיבל ‪ 90‬ובקבוצה ‪ 2‬ילד קיבל ‪ 80‬משם אני צריכה‬ ‫‪.31‬‬
‫לגלות את ציון התקן‪ .‬כי הציון הוא יחסי וכך אני אגלה האם הם שווים ומי יותר מהשני‪.‬‬
‫‪Xi−x‬‬
‫=‪ - Z i‬נוסחה‬
‫‪Sx‬‬

‫דוגמה ‪:1‬‬
‫משה מקבוצת תרגול ‪,1‬‬
‫קיבל ציון ‪ 90‬במטלת הג'אגלינג‬
‫ושמעון מקבוצת תרגול ‪, 2‬‬
‫קיבל ציון ‪ 80‬במטלת הג'אגלינג‪.‬‬
‫מי מבין השניים הצליח יותר בהשוואה לקבוצת התרגול שלו?‬
‫בס"ד‬

‫תשובה‪:‬‬
‫ציון התקן של משה מקבוצת תרגול ‪1‬‬
‫‪Xi=90‬‬
‫= ‪70 x‬‬
‫‪Sx=10‬‬
‫‪90−70‬‬
‫=‪2‬‬ ‫לפי הנוסחה‪:‬‬
‫‪10‬‬
‫ציון התקן של שמעון מקבוצת תרגול ‪:2‬‬
‫‪Yi-80‬‬
‫‪70- y‬‬
‫‪Sy-5‬‬
‫גם פה זה שווה ‪ 2‬לפי הנוסחה‬
‫ולכן אין הבדל ביניהם‪.‬‬
‫דוגמה ‪:2‬‬
‫על מנת להתקבל לאקדמיה לכדורת‪ ,‬נדרשים המועמדים להשיג בבחינת המיון בהשלכת כדורים‪ ,‬ציון‬
‫שהינו מעל ל‪ 3-‬סטיות תקן מהממוצע‪.‬‬
‫איזה ציון מינימלי על המועמדים להשיג אם ידוע שהציון הממוצע הוא ‪ 620‬וסטיית התקן היא ‪.40‬‬
‫‪Xi−620‬‬
‫‪>3‬‬
‫‪40‬‬
‫‪Xi-620 <40*3‬‬
‫‪Xi>620+120‬‬
‫‪Xi>740‬‬
‫על מנת להתקבל צריך ציון שמעל ‪720‬‬
‫התפלגות ‪Z‬‬
‫איך מיילדת יודעת שהמשקל של התינוק תקין?‬ ‫‪.32‬‬
‫כתוצאה מהמרת כל הערכים של התפלגות נורמאלית מסויימת לציוני תקן תתקבל התפלגות‬
‫נורמאלית מתוקננת של ציוני תקן‪.‬‬
‫בהתפלגות זו הממוצע= ‪0‬‬
‫‪S=1‬‬
‫תמיד סרג ‪ Z‬נשאר אותו דבר‪.‬‬
‫למה עושים את זה?‬
‫כדי להשוות אותם מי יותר ממה או מי יותר ממי‪.‬‬
‫בס"ד‬

‫נשתמש בזה שהמספ*ם לא יהיו שלמים‪.‬‬


‫‪-‬השכיח באמצע(הכי גבוה)‪ ,‬הממוצע בורח לזנב‪ ,‬והחציון הוא לא בדיוק באמצע‪-.‬‬
‫חשוב לזכור‬

‫צריך להוסיף פה מה שנמחק‪.‬‬


‫חישוב אחוזים בין שני ציונים‪:‬‬
‫מה אחוז הנבחנים שקיבלו במסחן הידע הכללי ציונים בין ‪ 450‬ל‪?600‬‬
‫בס"ד‬

‫שיעור ‪:6‬‬
‫מדידת קשר‪:‬‬
‫ממדי קשר מודדים את רמת הקשר בין המתנים במדגם\אוכלסייה‬
‫המשתנים הבלתי תלויים הם בציר ה‪ X‬והביטוי של התלויים זה בציר ה‪.Y‬‬
‫תיאור קשר ומשמעותו בין שני משתנים‪:‬‬
‫‪-‬מחקר עוסק בחיפוש קשר בין תופעות‪.‬‬
‫המטרה‪ :‬גילוי חוקיות וסדר‪ -‬זה יסייע בחיזוי טוב יותר את התפועות‪.‬‬
‫מדד קשר סופר את הקשר בין המשתנים ומאפשר ניבוי משתנה אחד על פי משתנה אחר‪.‬‬
‫דוגמאות‪,:‬‬
‫במצבים רבים מתעניינים בקשר הקיים בין שתי תופעות‪.‬‬
‫למשל קשר בין‪:‬‬

‫בלתי תלוי‪-‬הרקע המשפחתי לבין נשירה מבית ספר‪ -‬תלוי‬ ‫‪‬‬


‫(התלוי הוא המושפע והבלתי תלוי הוא המשפיע‪).‬‬
‫כדי להשיב על השאלות האלה אנחנו מחפשים מדד לקשר בין המשתנים‪.‬‬
‫מדד סטטיסטי כזה נקרא מתאם ובלועזית ‪Correlation‬‬
‫נלמד לחפש את הקשר של מה גורם למה‪ -‬סיבה ותוצאה‪ ,‬מדדים המלמדים על המתאם(קשר) בין‬
‫משתנים במחקר והמאפשרים ניבוי משתנה אחד על פי משתנה אחר‪.‬‬
‫דרכים לתיאור הקשר‪:‬‬
‫‪ 3‬דרכים לתיאור קשר בין משתנים תלויים לבלתי תלויים‪:‬‬
‫טבלת שכיחויות דו ממדית‬ ‫‪‬‬
‫דיאגרמת פיזור‬ ‫‪‬‬
‫מדדי קשר‬ ‫‪‬‬
‫לפעמים משתמשים בכמה מהדרכים הללו במקביל‪.‬‬
‫דיאגרמת פיזור‬
‫מתאימה למשתנים סדר ומעלה‪.‬‬
‫זה תיאור בתרשים איך כל אחד משפיע על השני‪.‬‬
‫ההשפעה היא חיובית שהבלתי תלוי עולה גם התלוי עולה‪.‬‬
‫מדדי קשר‬
‫משתנה תלוי‪ :‬היא התופעה שמוסברת(בציר ה ‪)Y‬‬
‫משתנה בלתי תלוי‪ :‬היא תופעה המסבירה( בציר ה‪)X‬‬
‫הערה‪ :‬המשתנה התלוי יכול להיות תלוי בכמה גורמים\משתנים בלתי תלויים‪.‬‬
‫מאפייני הקשר (בין המשתנים)‪:‬‬
‫בס"ד‬

‫סוג הקשר? (לניארי\לא ליניארי)‬ ‫‪.1‬‬


‫כיוון הקשר?(חיובי\שלילי)‬ ‫‪.2‬‬
‫עוצמת הקשר(‪)0-1‬‬ ‫‪.3‬‬
‫מה שמתואר למעלה זה לפי שלבים מתחילים מלזהות אם הקשר בין המשתנים הוא ליניארי או לא ואז‬
‫אם הוא חיובי או שלילי לאחר מכן‪ ,‬לבדוק את עוצמת הקשר‪.‬‬
‫סוג הקשר‬
‫קשר לניארי(רווי)‪ -‬העברת קו דמיוני‪ .‬ולראות האם יש מגמה קווית ( נראה קקו ישר אם נדמיין קו בין‬
‫הנקודות)‬
‫קשר שאינו ליניארי (שאינו קווי)‪ -‬שהמגמה היא לא אחידה‪( .‬אמור להראות כלא קו ישר אלא כמו פרבולה)‬
‫כיוון הקשר‬
‫קשר חיובי‪ -‬שהקו עולה‪ ,‬של הנקודות‬
‫קשר שלילי‪ -‬שהקו יורד ‪ ,‬של הנקודות‬
‫עוצמת הקשר‬
‫יש כמה סרגלים שמודדים אך אנחנו נשתמש בסרגל הנוכחי שנציג‪.‬‬
‫מודדים את עוצמת הקשר ע"י כמה הנקודות קרובות לקו‪ .‬זאת אומרת כמה שקרובים ל‪.1‬‬
‫וכשהן קרובות הקשר יותר חזק‪ .‬ושרחוקות הקשר יותר חלש‪.‬‬
‫הממוצע חייב לעולם להיות על הקו‪ -‬כי הוא ביטוי של כל הנקודות האחרות‪.‬‬
‫עוצמות הקשר‪:‬‬
‫קשר חלש‪0-0.3 -‬‬
‫קשר בינוני ‪0.3-0.7‬‬
‫קשר חזק ‪0.7-1‬‬
‫אם זה יוצא בדיוק ב ‪ 0.3‬ובדיוק ב ‪ 0.7‬הם שייכים מעל המספר שיצא בדיוק‪.‬‬
‫חריגים‪ -‬זה אומר שנקודה או שתיים רחוקים מהקו(אלא שלא מייצגים את הרוב) ‪-‬הכי חשוב‬
‫האינטואציה מהתרשים וכך אדע בדיוק את ממדי הקשר‪.‬‬
‫סוגי מדדי קשר‪:‬‬
‫מדדי קשר למשתנים שמיים‬ ‫‪-‬‬
‫מדדי קשר למשתני סדר‬ ‫‪-‬‬
‫מדדי קשר למשתנים כמותיים (רווח‪ ,‬מנה)‬ ‫‪-‬‬
‫סולמות מדידה ואופן בלירת מדד הקשר‪:‬‬
‫בחירת המדד תוכרע ע"י סולמות מידידה של המשתנים ביניהם נמדד הקשר‪.‬‬ ‫‪-‬‬
‫הסולם הנמוך ביותר מבין השניים הוא שיגביל ויכתיב את בחירת מדד הקשר( אם משתנה א מדד‬ ‫‪-‬‬
‫בסולפ סדר ומשתנה ב ברווח הרי שמדד הקשר שנשתמש יהיה הנמוך מביניהם)‪.‬‬
‫ככל שסולם המדידה גבוה יותר כך הניבוי מדויק יותר‪.‬‬ ‫‪-‬‬
‫מדדי קשר למשתנים שמיים‪:‬‬
‫מדדי למדא‪-‬‬ ‫‪-‬‬
‫מדדי קרמר‬ ‫‪-‬‬
‫מדדי פי‬ ‫‪-‬‬
‫מדד למדא ‪: λ‬‬
‫בס"ד‬

‫ניבוי ‪ Y‬לפי ‪ X‬או ניבוי ‪ X‬לפי ‪( Y‬מדד אסימטרי‪-‬משפיע עליי מאופן שונה ממה שאני משפיע עליו)‬ ‫‪‬‬
‫העוצמה שלו לעולם יהיה בין ‪.0-1‬‬ ‫‪‬‬
‫מבוסס על חישוב שגיאות מהשכיח‬ ‫‪‬‬
‫משמש לבדיקת טיב הניבוי של משתנה באמצעות משתנה אחר‪.‬‬ ‫‪‬‬
‫¿ ‪Ly−L y‬‬
‫‪λy‬‬ ‫❑‬
‫‪∕ x‬‬ ‫=‬
‫‪Ly‬‬

‫‪ -Ly‬סך ההפסד הנגרם מניבוי ‪ Y‬ללא שימוש בידיעת ‪X.‬‬


‫‪ -Ly\x‬סך ההפסד הנגרם בניבוי ‪ Y‬תוך שימוש בידיעת ‪.X‬‬
‫‪Lx-‬סך ההפסד הנגרם מניבוי ‪ X‬ללא שימוש בידיעת ‪Y‬‬
‫‪ -Lx\y‬סך ההפסד הנגרם בניבוי ‪ X‬תוך שימוש בידיעת ‪.Y‬‬

‫הערה‪:‬צריך קודם כל לבדוק שיש קשר ליניארי ואז להשתמש במדד למדא‪.‬‬
‫דוגמה‪ :‬חישוב בשורות‪ -‬כי זה ‪ Y‬בתלות של ‪. X‬‬
‫‪Y\X‬‬ ‫מערך‬ ‫ליכוד‬ ‫ד"ש‬ ‫מפלגות‬ ‫אחר‬ ‫)‪f(x‬‬
‫דתיות‬
‫זכר‬ ‫‪40‬‬ ‫‪160‬‬ ‫‪40‬‬ ‫‪40‬‬ ‫‪20‬‬ ‫‪300‬‬
‫נקבה‬ ‫‪110‬‬ ‫‪40‬‬ ‫‪35‬‬ ‫‪10‬‬ ‫‪5‬‬ ‫‪200‬‬
‫)‪f(y‬‬ ‫‪150‬‬ ‫‪200‬‬ ‫‪75‬‬ ‫‪50‬‬ ‫‪25‬‬ ‫‪500‬‬

‫שלב א'‪ :‬חישוב ‪ -Ly‬לוקח את הסה"כ פחות הסך שכיח ‪300=500-200‬‬


‫שלב ב'‪F(x)- :‬השכיח של הנקבה ‪ +‬סה"כ ‪ - ) )Fx‬השכיח של הזכר‬
‫‪140=300-160‬‬
‫‪90=200-110‬‬
‫‪230=140+90‬‬
‫שלב ג‪ :‬להציב בנוסחה‬
‫‪300−230‬‬
‫‪λy‬‬‫❑‬
‫‪∕ x‬‬
‫=‬
‫‪300‬‬
‫‪70‬‬
‫= ‪0.233‬‬ ‫=‬
‫‪300‬‬
‫שלב ד‪ :‬הצגת תובנות בסרגל מדידה‪ -‬זה חלש כי זה קטן מ‪.0.3‬‬
‫הערה‪ X :‬בתלות ב‪ Y‬עובדים בתורים‪.‬‬
‫‪ Y‬בתלות ב‪ X‬עובדים בשורות‪.‬‬
‫אותו תרגיל רק שה‪X‬בתלות ב‪: Y‬‬ ‫‪-‬‬
‫בס"ד‬

‫‪Lx= 500-300=200‬‬
‫‪Lx\y= 150-110+200-160+75-40+50-40+25-20=130‬‬
‫סה"כ בכל שורה פחות השכיח בשורה‪.‬‬

‫‪200−130‬‬
‫= ‪0.35‬‬
‫‪200‬‬
‫לכן זה עוצמה בינונית‪.‬‬
‫‪ r c :‬קרמר מדד‬
‫‪-‬מדד סימטרי‬
‫‪-‬מחושב על פי שכיחויות‬
‫‪-‬לחשב צפויה (שנחשב) ונצפית‪( -‬מה שראיתי במדגם)‬
‫‪-‬בכל ריבוע בתוך הטבלה אני אצטרך לעשות מה ציפיתי פחות מה חישבתי ומה אני צריך לחשב בלי לדעת‬
‫מה יצא‪.‬‬
‫‪-‬הוא תמיד יהיה חיובי זה אומר שאני לא מודד את הכיוון אלא רק עוצמה‪.‬‬
‫‪-‬מחשב אותו כהפרש בין ‪ OBZERVE‬ל‪ EXEPTED -‬מחשבים את ה‪ EXEPTED‬על סמך השוליים‪.‬‬
‫שאני מתייחסת למתאם קרמר לפחות אחד משמשתנים שמים והשאר יכול להיות כמותי‪ ,‬סדר‪..‬‬
‫‪2‬‬
‫מחשבים קודם את ‪x‬‬
‫רק לאחר מכן מחשבים את מדד קרמר‬
‫חישוב חי בריבוע‪:‬‬
‫‪2‬‬
‫) ‪(Oi−Ei‬‬
‫∑‬ ‫‪Ei‬‬
‫‪=X 2‬‬

‫חישוב מדד קרמר‪:‬‬

‫¿‬
‫√‬‫‪X2 c‬‬
‫❑‬
‫‪r‬‬
‫מחשבים את הצפוי ‪ EXEPTED‬שוליים – שוליים חלקי סה"כ‬
‫‪ =L‬שורות‪ -‬תורים‬
‫דוגמה‪:‬‬
‫‪ 100‬סטודנטים ענו על שאלון אישי‪:‬‬
‫המסווג אנשים לשלושה טיפוסים(א‪,‬ב‪,‬ג)‬
‫אני מקבלת את תוצאות ה‪:OBSARVE‬‬
‫‪Y\X‬‬ ‫מדעי החברה‬ ‫מדעי הטבע‬ ‫מדעי הרוח‬ ‫אחר‬ ‫‪Fx‬‬
‫א‬ ‫‪9‬‬ ‫‪5‬‬ ‫‪35‬‬ ‫‪1‬‬ ‫‪50‬‬
‫ב‬ ‫‪15‬‬ ‫‪2‬‬ ‫‪3‬‬ ‫‪5‬‬ ‫‪25‬‬
‫ג‬ ‫‪6‬‬ ‫‪8‬‬ ‫‪2‬‬ ‫‪9‬‬ ‫‪25‬‬
‫)‪F(y‬‬ ‫‪30‬‬ ‫‪15‬‬ ‫‪40‬‬ ‫‪15‬‬ ‫‪100‬‬
‫בס"ד‬

‫שלבי פתרון‪:‬‬
‫יצירת חישוב טבלת שכיחויות צפויה ‪E‬‬ ‫א‪.‬‬
‫מחשבים את חי בריבוע‬ ‫ב‪.‬‬
‫מחשבים את מתאם קרמר‬ ‫ג‪.‬‬
‫מציגים תובנות‬ ‫ד‪.‬‬
‫ואז אני פשוט מחשבת את ה‪ :EXEPTED‬ע"י שוליים ‪+‬שוליים חלקי הסה"כ‬

‫‪Y\X‬‬ ‫מדעי החברה‬ ‫מדעי הטבע‬ ‫מדעי הרוח‬ ‫אחר‬ ‫‪Fx‬‬


‫א‬ ‫‪9‬‬ ‫‪15 5‬‬ ‫‪7.50 35‬‬ ‫‪20‬‬ ‫‪1‬‬ ‫‪7.50‬‬ ‫‪50‬‬
‫ב‬ ‫‪15‬‬ ‫‪7.5 2‬‬ ‫‪3.75 3‬‬ ‫‪10 5‬‬ ‫‪3.75‬‬ ‫‪25‬‬
‫ג‬ ‫‪6‬‬ ‫‪7.5 8‬‬ ‫‪3.75 2‬‬ ‫‪10 9‬‬ ‫‪3.75‬‬ ‫‪25‬‬
‫)‪F(y‬‬ ‫‪30‬‬ ‫‪15‬‬ ‫‪40‬‬ ‫‪15‬‬ ‫‪100‬‬

‫ועושה בכל משבצת ע"י הנוסחה הראשונה‪:‬‬


‫‪2‬‬
‫)‪(9−15‬‬
‫‪r‬‬
‫‪ +‬וכ'ו‪ ....‬וזה יהיה שווה ל ‪. c‬‬
‫‪15‬‬
‫תרגיל לבית ‪:1‬‬
‫‪Y\X‬‬ ‫בעד‬ ‫נגד‬ ‫נמנע‬ ‫)‪F(x‬‬
‫גבר‬ ‫‪50‬‬ ‫‪40‬‬ ‫‪10‬‬ ‫‪100‬‬
‫אשה‬ ‫‪30‬‬ ‫‪60‬‬ ‫‪10‬‬ ‫‪100‬‬
‫)‪F(y‬‬ ‫‪80‬‬ ‫‪100‬‬ ‫‪20‬‬ ‫‪N=200‬‬

‫תרגיל לבית ‪:2‬‬


‫הקשר בין מין להשכלה לגבי כל נחקר נדבק המין שלו והשכלתי להלן תוצאות‪:‬‬
‫השכלה\מין‬ ‫נמוכה‬ ‫תיכונית‬ ‫גבוהה‬ ‫)‪F(x‬‬
‫גבר‬ ‫‪120‬‬ ‫‪40‬‬ ‫‪20‬‬ ‫‪180‬‬
‫אישה‬ ‫‪20‬‬ ‫‪20‬‬ ‫‪80‬‬ ‫‪120‬‬
‫)‪F(y‬‬ ‫‪140‬‬ ‫‪60‬‬ ‫‪100‬‬ ‫‪=300N‬‬

‫האם קיים קשר בין מין להשכלה?‬


‫מדד פי‪:‬‬
‫הוא מקרה פרטי של קרמר‪ -‬רק במקרה של קרמר של שני עמודות ושני תורים‪ -‬יש קיצור דרך‪.‬‬
‫‪Y\X‬‬ ‫‪Y1‬‬ ‫‪Y2‬‬ ‫‪Fx‬‬
‫‪X1‬‬ ‫‪a‬‬ ‫‪b‬‬ ‫‪r‬‬
‫‪X2‬‬ ‫‪c‬‬ ‫‪d‬‬ ‫‪k‬‬
‫)‪F(y‬‬ ‫‪e‬‬ ‫‪f‬‬ ‫‪n‬‬

‫=∅‬
‫√‬ ‫‪(a∗d−b∗c )2‬‬
‫‪e∗f∗r∗k‬‬
‫תרגיל לבית מדדי פי‪:‬‬
‫לרשום פעם אחת במדד קרמר ופעם אחת במדד פי וקבל אותן תשובות‪.‬‬
‫בס"ד‬

‫מפעל עובד בשתי משמרות‪ ,‬משמרת יום ומשמרת לילה‪,‬‬


‫דגמו ‪ 300‬מוצרים ממשמרת היום ו ‪ 200‬ממשמרת הלילה‪,‬‬
‫מתוך המוצרים שנדגמו ביום ‪ 10‬היו פגומים‪,‬‬
‫מתוך המוצרים שנדגמו בלילה ‪ 150‬היו תקינים‬
‫האם יש קשר בין סוג המשמרת לטיב המוצר?‬
‫משמרת\מוצרים‬
‫בס"ד‬

‫שיעור ‪:7‬מדדי קשר למשתני סדר\ אורדינאלים‬


‫יש משמעות לסדר ולכיוונו‬ ‫‪-‬‬
‫הערך מציין את עוצמת הקשר והסימן מציין את הכיוון( חיובי או שלילי‬ ‫‪-‬‬
‫מדד קשר עיקרי‪:‬‬

‫מדד ספירמן‪rs:‬‬
‫מודד הפרשים‬ ‫‪-‬‬
‫מדד סימטרי‪ ,‬מספיק שאחשב אותו פעם אחת‬ ‫‪-‬‬
‫אנחנו מחפשים את ההפרשים בין ‪ X‬ל‪.Y-‬‬ ‫‪-‬‬
‫מתי אנחנו משתמשים בו?‬
‫שאחד מהמשתנים שלנו סדר\ אורדר והשני או אורדר או כמותי‪.‬‬
‫הקשר שהמדד בודק הוא קשר של דירוג הוא בודק עוצמה וקיבול‪.‬‬
‫המדד מקבל ערכים בין ‪ 1‬ל ‪.-1‬‬

‫לא אחפש את הערכים של ‪ X‬ו‪ y‬אלא אחפש את הפוזישן‪.‬‬


‫הערכים לא מעניינים אלא הפוזישן‪.‬‬
‫הם מעניינים רק לטובת הדירוג‪.‬‬

‫משתמש בערך של ‪ X‬ו‪ Y -‬רק כדי לקבוע את הפוזישן‪.‬‬


‫בס"ד‬

‫שיעור ‪:8‬‬
‫שיעור ‪:8‬‬

‫מדדי קשר ליניארי ‪:‬למשתנים כמותיים‪ :‬מדד פירסון ‪r‬‬


‫משמש למדידת קשר כמותי ליניארי‪.‬‬ ‫‪‬‬
‫המשתנים התלויים והבלתי תלויים הם מסולם מדידה כמותי והם ליניארים‪.‬‬ ‫‪‬‬
‫יש משמעות לעוצמה ולכיוון‪ ,‬כיוון חיובי ‪ +‬הקשר הוא חיובי עולה (כ‪ X‬עולה גם ה‪ Y‬עולה)‪ ,‬כיוון‬ ‫‪‬‬
‫שלילי – הקשר הוא יורד ( ש‪ X‬עולה ‪ Y‬יורד)‪.‬‬
‫העוצמה אומרת כמה הנקודות קרובות לקו‪.‬‬ ‫‪‬‬
‫מדד פירסון הוא מדד סימטרי‪ -‬מספיק לחשב אותו בכיוון אחד‪.‬‬ ‫‪‬‬
‫משתמשים במדד פירסון כשיש לי משתנה כמותי והקשר אחרי דיאגרמת פיזור‪ -‬ליניארי‪.‬‬
‫לא חייב לעבור בראשית הצירים‪.‬‬
‫אנחנו עובדים בנורמאלי סטנדרטית מתוקננת‬
‫הסבר לנוסחה‪:‬‬
‫‪ -r‬מבטא את מדד מתאם פירסון (עוצמת הקר וכיוונו)‬
‫‪ -Zxi‬מבטא את ציון התקן של משתנה ‪Xi‬‬
‫‪ -Zyi‬מבטא את ציון התקן של משתנה ‪yi‬‬
‫‪ -n‬מבטא את גודל המדגם‬
‫נוסחה‪:‬‬
‫במחברת‬
‫דוגמאות‪ :‬במחברת הסגולה‬

‫משותפת‪COVARIARN:‬‬ ‫שונות‬
‫מבטאת כמה רחוקה הנקודה החריגה (מה המרחק) מנקודת הממוצעים‬
‫יש אפשרות לחשב את פירסון גם לפי שונות משותפת‬
‫נוסחה במחברת‬
‫בס"ד‬

You might also like