Download as doc, pdf, or txt
Download as doc, pdf, or txt
You are on page 1of 26

‫תרגיל בסטטיסטיקה ‪ -‬מתאם ורגרסיה‬

‫חזרה על מתאם ומקדם המתאם של פירסון‬


‫מתאם )‪ - (correlation‬מתאם מציין קשר בין שני משתנים )למשל‪ ,‬אינטליגנציה‬
‫והכנסה(‪.‬‬
‫מתוך המדגם נחשב את המתאם וננסה להסיק‪:‬‬
‫האם קיים קשר בין שני המשתנים‬ ‫‪.1‬‬
‫מהי עוצמת הקשר‬ ‫‪.2‬‬
‫מהו כיוון הקשר‬ ‫‪.3‬‬

‫חישוב המתאם משמש לשתי מטרות‪:‬‬


‫תיאורית – תיאור קשר כמותי בין שני משתנים‬ ‫‪.1‬‬
‫‪ .2‬היסקית – בעזרת המתאם נוכל לדעת מה היא מידת הוודאות בניבוי ערכים‬
‫של משתנה אחד על פי ערכיו של משתנה אחר‪.‬‬

‫* מתאם המבטא קשר ליניארי בין שני משתנים *‬


‫קשר ליניארי – שינוי במשתנה אחד ))‪ x‬יגרור שינוי קבוע במשתנה השני ))‪y‬‬
‫ולהיפך‪ .‬קשר כזה ניתן לתיאור כקו ישר על מערכת צירים‪.‬‬
‫כל הקווים הישרים ניתנים לתיאור ע"י הנוסחא‪ y=bx+a :‬כאשר‪:‬‬

‫נקודת החיתוך עם ציר ה‪ .y -‬הנקודה על ציר ה‪ y -‬כאשר ‪. x=0‬‬ ‫‪-a‬‬


‫מקדם השיפוע של הקו‪ :‬בכמה יחידות משתנה ‪ y‬כאשר ‪ x‬משתנה‬ ‫‪-b‬‬

‫ביחידה אחת )שינוי ב‪ x -‬יגרור שינוי קבוע ב‪.(y -‬‬


‫= ‪y2-y1‬‬ ‫=‪b‬‬ ‫‪y‬‬ ‫))‪x1, y1) (x2, y2‬‬ ‫חישוב ‪ b:‬נתון‬
‫‪x‬‬ ‫‪x2-x1‬‬

‫סימן ה‪ (-/+) -‬של ה‪ b -‬מתאר את כיוון הקשר‪:‬‬

‫כשהסימן חיובי‪ ,‬הקשר חיובי – ככל ש‪ x -‬עולה‪ y ,‬עולה‪.‬‬

‫כשהסימן שלילי‪ ,‬הקשר שלילי ‪ -‬ככל ש‪ x -‬עולה‪ y ,‬יורד‪.‬‬

‫כאשר ‪ b‬חיובי ‪-‬‬ ‫כאשר ‪ b‬שלילי ‪-‬‬


‫‪y‬‬ ‫‪ X‬עולה ‪ Y‬עולה‬ ‫‪y‬‬ ‫‪ X‬עולה ‪ Y‬יורד‬

‫‪1‬‬

‫‪x‬‬ ‫‪x‬‬
‫ערך ה‪) b -‬גודל ה‪ b -‬בערך מוחלט( מתאר את מידת ההשתנות )תלילות הקו( –‬

‫ככל ש‪ b -‬גדול יותר‪ ,‬כך שינוי ביחידה אחת ב‪ x -‬גורר שינוי גדול יותר ב‪.y -‬‬

‫‪y‬‬ ‫‪b‬גדול‪-‬‬ ‫‪y‬‬ ‫‪b‬קטן‪-‬‬

‫‪x‬‬ ‫‪x‬‬

‫עוצמת הקשר הליניארי‪ :‬משתנה בהתאם לפיזור ערכי התצפיות )אינה תלויה‬
‫בשיפוע הקו(‪ .‬ככל שהתצפיות מקבלות ערכים המפוזרים הרחק יותר מהקו‬
‫הליניארי‪ ,‬כך עוצמת הקשר פחותה יותר‪ .‬כאשר התצפיות נופלות כולן על אותו קו‬
‫ישר‪ ,‬ישנו קשר מושלם! זאת משום שבמצב כזה הניבוי מושלם‪.‬‬
‫)זכרו כי כיוון הקשר‬ ‫להלן דוגמאות לעוצמות שונות ולכיוונים שונים של קשר לינארי‬
‫עולה ו‪ y -‬יורד(‪:‬‬ ‫הליניארי יכול להיות חיובי‪ -‬כאשר ‪ x‬עולה ו‪ y -‬עולה או יכול להיות שלילי – כאשר ‪x‬‬

‫קשר ליניארי חיובי‬ ‫קשר ליניארי שלילי‬


‫אין קשר לינארי‬
‫מלא‬ ‫מלא‬
‫‪r=0‬‬ ‫‪r=1‬‬ ‫‪r= -1‬‬
‫‪y‬‬ ‫‪y‬‬ ‫‪y‬‬

‫‪x‬‬ ‫‪x‬‬ ‫‪x‬‬


‫קשר ליניארי שלילי‬ ‫קשר ליניארי חיובי‬
‫חזק‬ ‫חזק‬
‫‪r= -0.8‬‬ ‫‪r=0.8‬‬
‫אופן ציור הקו מתוך הנוסחה לתיאור קו ישר‪:‬‬
‫‪y‬‬ ‫‪y‬‬
‫דוגמא‪ :‬כיצד ייראה הקו – ‪y = -2x+3‬‬
‫צריך להציב ‪ 2‬נקודות ולהעביר דרכן קו ישר‪ -‬פעם נניח ש‪ x -‬שווה ל‪ 0-‬ונקבל את‬

‫נקודת החיתוך עם ציר ה‪ y -‬ופעם נניח ש‪ y -‬שווה ל‪ 0-‬ונקבל את החיתוך עם ציר‬


‫‪x‬‬ ‫‪x‬‬
‫ה‪.x -‬‬

‫‪2‬‬
‫בגלל ש‪ b -‬שלילי אנו יכולים להסיק שהשיפוע שלילי‪.‬‬

‫את נקודת החיתוך עם ציר ‪ y‬נקבל ע"י הצבת ) ‪ x=0): -2·0+3=3‬נקודות החיתוך )‬
‫‪(0,3‬‬
‫את נקודת החיתוך עם ציר ה‪ x -‬נקבל ע"י הצבת ))‪:y=0‬‬

‫→ ‪2x+3‬‬ ‫→ ‪-3= -2x‬‬ ‫→ ‪x=3/2‬‬ ‫‪x=1.5- = 0‬‬


‫נקודות החיתוך )‪(1.5,0‬‬
‫ציור הקו העובר בין ‪ 2‬הנקודות שמצאנו‪:‬‬
‫‪y‬‬
‫‪33‬‬
‫‪2‬‬
‫‪1‬‬

‫‪1‬‬ ‫‪2‬‬ ‫‪x‬‬

‫כאשר אנו מזהים מגמה של קשר לינארי בין שני משתנים‪ ,‬עלינו להגדירו בעזרת‬
‫מדד מסוים‪ .‬מדד זה יראה האם הקשר מובהק‪ ,‬מהי עוצמתו ומהו כיוונו‪ .‬כמדד‬
‫לכיוון הקשר הליניארי ועוצמתו משתמשים במקדם המתאם של פירסון‪.‬‬

‫שונויות‬
‫הגדרה ‪ :‬השונות היא מדד לפיזור הציונים‪ .‬היא מהווה‪ ,‬כפי שכבר למדנו‪ ,‬את‬
‫ממוצע סכום ריבועי סטיות הציונים מן הממוצע )כלומר‪ ,‬השונות מייצגת את‬
‫הסטייה הממוצעת של הציונים מממוצע ההתפלגות(‪.‬‬
‫כזכור ממערך השיעור העוסק בשונות‪:‬‬

‫‪s²x = Σ (xi –x)²‬‬ ‫שונות של ציוני ‪=x‬‬


‫‪n‬‬
‫‪s²y = Σ (yi –y)²‬‬ ‫שונות של ציוני ‪=y‬‬
‫‪n‬‬
‫סטייה של כל ציון ספציפי מהממוצע נובעת משני גורמים‪:‬‬

‫שונות מוסברת – הסטייה של הציון המנובא )‪ (ỹ‬מהציון הממוצע‬ ‫‪.1‬‬

‫) )‪ ,ỹ- y‬הנובעת מהקשר בין המשתנה ‪ x‬לבין המשתנה ‪ y‬ולכן מוסברת‬

‫ע"י ‪.x‬‬

‫‪3‬‬
‫שונות טעות )לא מוסברת( – הסטייה של הציון הספציפי מהציון‬ ‫‪.2‬‬

‫המנובא )‪ (yi- ỹ‬שאינה מוסברת ע"י ‪ x‬אלא נובעת מהבדלים‬


‫אינדיבידואליים בין הנבדקים ומטעויות מדידה‪.‬‬

‫דוגמא‪ :‬ידוע כי קיים קשר בין משקל וגובה‪ .‬גובהו של יוני הוא ‪ 198‬ס"מ‪ .‬על מנת‬
‫להבין מדוע יוני סוטה מהממוצע )‪ 180‬ס"מ( נתייחס למשקלו‪ .‬יוני שוקל ‪ 85‬ק"ג‪.‬‬
‫הגובה המנובא למשקל זה הוא ‪ 190‬ס"מ‪ .‬ההפרש בין ‪ 190‬ל‪ 180 -‬מוסבר על ידי‬
‫משקלו של יוני )העובדה שהוא שוקל ‪ 85‬ק"ג(‪ ,‬אך ההפרש בין ‪ 198‬ל‪ 190 -‬איננו‬
‫יכול להיות מוסבר ע"י המשקל ולכן נחשב כסטייה הנובעת ממשתנים אחרים‪.‬‬
‫‪ - Y‬גובה‬
‫שונות בלתי‬
‫מוסברת – שונות‬
‫‪198‬‬ ‫בגובה שאינה‬ ‫‪yi‬‬
‫מוסברת ע"י‬ ‫שונות מוסברת‬
‫המשקל‬ ‫‪-‬שונות בגובה‬
‫‪190‬‬ ‫שמוסברת ע"י‬
‫‪ỹ‬‬ ‫המשקל‬
‫הגובה ‪ -‬ממוצע ‪180‬‬
‫‪y‬‬

‫‪ - X‬משקל‬
‫‪80‬‬ ‫‪90‬‬
‫יישום עיקרון זה לחישוב שונות‪ :‬השונות הכללית מורכבת משונות המוסברת ע"י‬

‫הקשר בין ‪ x‬לבין ‪ ,y‬בתוספת שונות לא מוסברת‪ ,‬הקשורה לטעויות מדידה‬


‫ולהבדלים בין אישיים‪.‬‬
‫סטיית ציון מנובא מהממוצע‬ ‫סטיית ציון אמיתי ממנובא‬

‫‪s²y = Σ (yi –y)²‬‬ ‫‪= Σ (ỹ– y)²‬‬ ‫‪+‬‬ ‫‪Σ (yi – ỹ)²‬‬
‫‪n‬‬ ‫‪n‬‬ ‫‪n‬‬
‫השונות המוסברת ע"י‬ ‫השונות הנובעת מטעות‬
‫שונות בלתי מוסברת‬ ‫השונות הכללית‬
‫הקשר בין ‪ x‬ל‪y -‬‬

‫‪ -yi‬ערך ‪) y‬אמיתי( של תצפית‬


‫‪ – ỹ‬ערך ‪ y‬מנובא )עבור ערך ‪ x‬אמיתי של תצפית(‪.‬‬
‫‪ -y‬ממוצע ערכי ‪ y‬של התצפיות‬
‫)‪ – (yi- ỹ‬הסטייה של התצפית )שהתקבלה בפועל( מהערך המנובא‬
‫)‪ – (ỹ– y‬הסטייה של הערך המנובא מן הממוצע‬

‫‪4‬‬
‫)‪ – (yi –y‬הסטייה של התצפית )שהתקבלה בפועל( מן הממוצע‬
‫‪ – n‬מס' התצפיות במדגם )לכל תצפית יש ערך ‪ x‬וערך ‪(y‬‬

‫‪5‬‬
‫הקשר בין מקדם המתאם של פירסון והשונות‬
‫ריבוע מקדם המתאם )‪ (r²‬מבטא את אחוז השונות המוסברת‪ .‬ככל שהקשר בין ‪x‬‬
‫ל‪ y -‬חזק יותר‪ ,‬תהינה פחות טעויות בלתי מוסברות‪ ,‬כלומר‪ ,‬תהינה פחות סטיות‬
‫של הציונים האמיתיים מהציונים המנובאים‪ ,‬והתצפיות תהינה קרובות יותר לקו‬
‫הישר )קו הרגרסיה(‪ ,‬כך שאחוז השונות המוסברת יהיה גדול יותר‪.‬‬
‫‪ = r²‬אחוז )פרופורציית( השונות המוסברת מתוך השונות הכללית‪.‬‬

‫‪ :r = 0.8‬משקל ‪ :y‬גובה(‪ .‬כלומר‪ ,‬משקל האדם‬ ‫‪r² = 0.64 , (x‬‬ ‫דוגמא ‪:‬‬
‫מסביר ‪ 64%‬מהשונות בגובהו‪ 36% .‬מהשונות מוסברת ע"י גורמים אחרים‪.‬‬

‫נוסחה‪:‬‬

‫= ‪- r²‬‬ ‫שונות מוסברת‪Σ (ỹ - y)²‬‬


‫‪Σ (yi - y)² -‬‬ ‫שונות כללית‬

‫רגרסיה‬

‫קו רגרסיה‪:‬‬
‫כאשר קיים קשר ליניארי מלא בין ‪ x‬לבין ‪ y‬ניתן לנבא בלי שום טעות את ‪ y‬מתוך‬

‫‪ x‬ולהיפך על סמך נוסחא ליניארית‪ .‬במצב זה תהינה כל התצפיות על קו ישר אחד‬


‫בדיאגרמת הפיזור והמתאם יהיה שווה ל‪ .1-‬מכיוון שהנתונים )תצפיות( במדגם‬
‫)וגם באוכלוסיה( אינם נופלים‪ ,‬ע"פ רוב‪ ,‬על קו ישר )אין קשר ליניארי מלא(‪ ,‬אנו‬
‫מחפשים את הקו הליניארי שיתאר בצורה הטובה ביותר את הקשר בין התצפיות‪.‬‬
‫קו זה נקרא קו הרגרסיה ומטרתו לסייע לנו בניבוי האופטימלי של ערכי משתנה‬

‫‪ x‬מתוך ערכי משתנה ‪ y‬או להיפך‪ .‬קו הרגרסיה לניבוי ערכי משתנה ‪ X‬מתוך‬
‫ערכי משתנה ‪ ,Y‬שונה מקו הרגרסיה לניבוי ערכי משתנה ‪ Y‬מתוך ערכי משתנה‬
‫‪ ,X‬כפי שנראה בהמשך‪.‬‬

‫על מנת שקו הרגרסיה יסייע בידינו בניבוי אופטימלי של ערכי משתנה אחד מתוך‬
‫ערכי המשתנה השני‪ ,‬עליו לעמוד בדרישות הבאות‪:‬‬

‫‪6‬‬
‫א‪ .‬סכום הסטיות של כל התצפיות )ציונים אמיתיים( מהקו הישר )ציונים מנובאים(‬
‫יהיה ‪:0‬‬
‫‪ . Σ (yi- ỹ)=0‬סכום התצפיות מצדו האחד של הקו שווה לסכום הסטיות מצדו‬
‫השני‪ ,‬כך שסך כל הסטיות של התצפיות מן הקו מתקזז ל‪ .0-‬כיוון שממוצע מוגדר‬
‫כערך שסכום הסטיות ממנו שווה לאפס‪ ,‬קו הרגרסיה עובר דרך נקודת הממוצעים‬

‫)‪.(x,y‬‬
‫ב‪ .‬סכום ריבועי הסטיות של כל התצפיות מהקו הישר יהיה מינימלי )"עקרון‬

‫=‪min (yi- ỹ)² Σ‬‬ ‫הריבועים הפחותים"(‬

‫ניבוי ‪ y‬מתוך ‪x‬‬

‫‪y‬‬ ‫סטייה מהקו )‪(yi- ỹ‬‬


‫‪x,y‬‬
‫ציון אמיתי‬

‫‪x‬‬

‫כפי שניתן לראות באיור בתחתית עמוד זה‪ ,‬בכל דיאגרמת פיזור נתונה יהיו שני‬

‫קווי רגרסיה שונים – האחד לניבוי ‪ y‬מתוך ‪ (x (ỹ =bx+a‬והשני לניבוי ‪ x‬מתוך ‪y‬‬
‫‪ .((x=by+a‬במקרה הראשון‪ ,‬מחפשים את הקו שממנו הסטייה המינימלית היא‬

‫בכיוון ‪) y‬מינימום מרחק אנכי בין הציון האמיתי לקו הרגרסיה) ובמקרה השני‬

‫מחפשים את הקו שממנו הסטייה המינימלית היא בכיוון ‪) x‬מינימום מרחק אופקי‬
‫בין הציון האמיתי לקו הרגרסיה(‪ .‬שני קווי הרגרסיה נפגשים בנקודת הממוצעים‪,‬‬
‫נקודה בה הסטיות האופקית והאנכית הן מינימליות‪.‬‬

‫‪x=by+a‬‬
‫‪y‬‬ ‫‪ỹ‬‬ ‫‪=bx+a‬‬
‫ציון אמיתי‬
‫מרחק אנכי‬

‫ציון אמיתי‬

‫מרחק אופקי‬

‫‪x‬‬
‫‪7‬‬
‫*כאשר הקשר בין ‪ x‬ל‪ y -‬מלא )מקדם המתאם של פירסון ‪ ,(r=+1‬מתלכדים שני‬
‫קווי הרגרסיה לקו אחד‪ ,‬שכל התצפיות נופלות עליו‪*.‬‬

‫מציאת משוואות קו הרגרסיה )נוסחאות(‪:‬‬


‫‪ .1‬ניבוי ‪ y‬מתוך ‪:x‬‬

‫‪ỹ = bx + a‬‬
‫=‪b‬‬ ‫‪n (Σ xiyi) - Σ xi · Σyi‬‬
‫‪nΣ xi² - (Σ xi)²‬‬
‫=‪b‬‬ ‫‪Σxiyi - n x · y‬‬

‫‪Σ xi² - n x²‬‬ ‫‪.1‬‬

‫‪a = y - bx‬‬
‫לאחר שנחשב את ‪ a‬ו‪) b -‬מתוך המדגם(‪ ,‬נדע מהי משוואת הרגרסיה לניבוי ‪y‬‬
‫מתוך ‪ ,x‬ונוכל להציב את ערכי ה‪ x -‬האמיתיים )מתוך האוכלוסייה( במשוואה‬

‫ולקבל את ערכי ה‪y -‬המנובאים עבורם‪.‬‬

‫‪ .2‬ניבוי ‪ x‬מתוך ‪:y‬‬

‫‪x = by + a‬‬
‫=‪b‬‬ ‫‪n (Σ xiyi) - Σ xi · Σyi‬‬
‫‪nΣ yi² - (Σ yi)²‬‬
‫=‪b‬‬ ‫‪Σxiyi - n x · y‬‬

‫‪Σ yi² - n y²‬‬

‫‪a = x – by‬‬
‫לאחר שנחשב את ‪ a‬ו‪) b -‬מתוך המדגם(‪ ,‬נדע מהי משוואת הרגרסיה לניבוי ‪x‬‬
‫מתוך ‪ ,y‬ונוכל להציב את ערכי ה‪ y -‬האמיתיים )מתוך האוכלוסייה( במשוואה‬

‫ולקבל את ערכי ה‪ x -‬המנובאים עבורם‪.‬‬

‫קיימת דרך אלטרנטיבית לחישוב שיפוע קו הרגרסיה ‪ b‬כאשר ה‪) r -‬מקדם‬


‫המתאם של פירסון( ידוע‪:‬‬

‫‪8‬‬
‫נוסחאות עבודה‪:‬‬
‫‪ỹ = bx + a‬‬ ‫‪x = by + a‬‬
‫‪b = r · sy‬‬ ‫‪b = r · sx‬‬
‫‪sx‬‬ ‫‪sy‬‬

‫‪a = y - bx‬‬ ‫‪a = x - by‬‬


‫‪ .3‬ניבוי מתוך ציוני תקן‪:‬‬
‫כאשר ערכי ההתפלגות מוצגים כציוני תקן‪ ,‬קו הרגרסיה מתאפיין‬
‫במספר תכונות‪:‬‬
‫א‪ .‬השיפוע של קו הרגרסיה )שבקו רגרסיה בציוני תקן נקרא ‪ β‬במקום ‪ , (b‬שווה‬

‫ל‪ r-‬של פירסון‪ .‬כלומר‪ ,‬שיפוע קו הרגרסיה מבטא את עוצמת הקשר בין‬
‫המשתנים‪.‬‬
‫כזכור‪ ,‬ציון התקן של סטיית התקן הוא ‪ .((zsx = zsy = 1 1‬לכן‪:‬‬

‫‪β= r · sx‬‬ ‫‪β= r · 1‬‬ ‫‪β= r‬‬


‫‪sy‬‬ ‫‪1‬‬

‫*לכן זכור ‪ -‬כשההתפלגות ניתנת בציוני תקן תמיד שיפוע קו הרגרסיה שווה ל‪r, -‬‬

‫‪ ,β= r‬אך יש לשים לב כי ‪ β‬של ציוני תקן שונה מ‪ b -‬של ציוני גלם !! *‬

‫ב‪ ,a .‬המבטא את נקודת החיתוך של קו הרגרסיה עם ציר ה‪ ,y-‬שווה לאפס‪,‬‬


‫כלומר‪ ,‬קו הרגרסיה עובר דרך ראשית הצירים‪ .‬כזכור‪ ,‬ציון התקן של הממוצע הוא‬
‫‪ .(Zx=Zy=0) 0‬לכן‪:‬‬
‫‪a = y – βx) ) 0‬‬
‫‪= a= 0 – β· 0‬‬ ‫‪a‬‬
‫ג‪.‬כאשר ‪ ,r=1‬קיימת זווית של ‪ º45‬בין קו הרגרסיה לראשית הצירים‪.‬‬

‫‪r=1‬‬
‫‪r = -1‬‬

‫‪45º‬‬

‫‪9‬‬
‫קו הרגרסיה לניבוי ‪ y‬מתוך ‪:x‬‬

‫‪z ỹ = β· zx + a‬‬ ‫‪z ỹ = r · zx‬‬

‫קו הרגרסיה לניבוי ‪ x‬מתוך ‪:y‬‬

‫‪zx = β· zy + a‬‬ ‫‪zx = r · zy‬‬

‫‪10‬‬
‫תרגילי כיתה‬

‫הבט על הגרפים הבאים וצור לפיהם את משוואת קו הרגרסיה = ‪ỹ‬‬ ‫‪.1‬‬

‫‪bx + a‬‬

‫‪y‬‬ ‫‪y‬‬ ‫‪y‬‬


‫‪4‬‬ ‫ג‬ ‫‪4‬‬ ‫ב‬ ‫‪4‬‬ ‫א‬
‫‪3‬‬ ‫‪3‬‬ ‫‪3‬‬

‫‪2‬‬ ‫‪2‬‬ ‫‪2‬‬

‫‪1‬‬ ‫‪1‬‬ ‫‪1‬‬


‫‪0‬‬ ‫‪0‬‬ ‫‪0‬‬
‫‪1‬‬ ‫‪4‬‬
‫‪x‬‬ ‫‪x‬‬ ‫‪x‬‬
‫‪-1‬‬ ‫‪2‬‬ ‫‪3‬‬ ‫‪-1‬‬ ‫‪1‬‬ ‫‪2‬‬ ‫‪3‬‬ ‫‪4‬‬ ‫‪-1‬‬ ‫‪1‬‬ ‫‪2‬‬ ‫‪3‬‬ ‫‪4‬‬

‫‪-2‬‬ ‫‪-2‬‬ ‫‪-2‬‬

‫חוקר ניסה לגלות האם קיים קשר בין מספר החתלתולים בבית‬ ‫‪.2‬‬
‫משפחה לבין מספר קרטוני השמנת שמשפחה צורכת ביום‪ .‬הוא אסף את‬
‫הנתונים הבאים‪:‬‬

‫)מס' חתולים(‬ ‫‪x: 1 5 5 3 2 0 0‬‬


‫)מס' שמנות(‬ ‫‪y: 2 4 5 2 3 1 0‬‬
‫צייר את דיאגרמת פיזור הנתונים ותאר את צורת הקשר‪.‬‬ ‫‪.1‬‬
‫חשב את נוסחת משוואת הרגרסיה המנבאת את מס' קרטוני‬ ‫‪.2‬‬
‫השמנת שצורכת משפחה ע"פ מספר החתלתולים‪.‬‬
‫כמה קרטוני שמנת לפי ניבוייך‪ -‬תצרוך משפחה בעלת ‪3‬‬ ‫‪.3‬‬
‫חתלתולים ?‬
‫בדיעבד התברר כי דיווחי המשפחות באשר לצריכת השמנת לא היו‬ ‫‪.4‬‬
‫מדויקים וכי למעשה כל משפחה צורכת ‪ 2‬שמנות ליום יותר ממה שדיווחו‬
‫בהתחלה‪ .‬אם החוקר יוסיף ‪ 2‬שמנות לכל משפחה וייחשב משוואת קו‬
‫רגרסיה חדשה‪ ,‬מה יקרה למקדם השיפוע )‪ (b‬ולקבוע )‪?(a‬‬
‫מקדם השיפוע ישתנה‪ ,‬אך הקבוע לא ישתנה‪.‬‬ ‫‪(1‬‬
‫מקדם השיפוע לא ישתנה‪ ,‬אך הקבוע ישתנה‪.‬‬ ‫‪(2‬‬
‫שניהם לא ישתנו‪.‬‬ ‫‪(3‬‬
‫שניהם ישתנו‪.‬‬ ‫‪(4‬‬

‫‪11‬‬
‫במחקר בדקו האם קיים קשר בין מידת החרדה שאדם נמצא בה‬ ‫‪.3‬‬
‫בזמן מבחן לבין מספר השאלות עליהן הוא עונה נכון‪ .‬נאספו הנתונים‬
‫הבאים‪:‬‬

‫)מידת החרדה(‬ ‫‪x: 1‬‬ ‫‪2‬‬ ‫‪5‬‬ ‫‪6‬‬ ‫‪4‬‬ ‫‪1‬‬ ‫‪8‬‬ ‫‪8‬‬ ‫‪7‬‬

‫)שאלות נכונות(‬ ‫‪y: 20 35 60 40 50 10 15 5 30‬‬


‫צייר את דיאגרמת הפיזור של הנתונים‬ ‫‪.1‬‬
‫האם מותר לחשב קו רגרסיה על נתונים אלו‪ ,‬נמק‪.‬‬ ‫‪.2‬‬

‫בגרף שלפניך מתוארים נתונים שנלקחו מארבעה פאבים שווים‬ ‫‪.4‬‬


‫בת"א‪ .‬עבור כל פאב נמדדה כמות המשקאות האלכוהוליים שהוזמנו בערב‬
‫מסויים ומידת השמחה בפאב במהלך הערב‪ .‬הקו המתואר בגרף הוא קו‬
‫הרגרסיה‪...‬‬
‫מידת השמחה‬

‫כמות השתיה‬
‫לניבוי כמות השתיה ממידת השמחה‪.‬‬ ‫‪(1‬‬
‫לניבוי מידת השמחה מכמות השתיה‪.‬‬ ‫‪(2‬‬
‫לניבוי מידת השמחה מכמות השתייה וכן לניבוי כמות‬ ‫‪(3‬‬
‫השתייה ממידת השמחה‪.‬‬
‫אין לדעת מהנתונים‪.‬‬ ‫‪(4‬‬

‫חוקר בדק את הקשר בין חשיפה לאלימות בטלוויזיה )דורגה מ‪1-‬‬ ‫‪.5‬‬
‫עד ‪ (10‬לבין מספר הפשעים האלימים בקרב אוכלוסיית כלא מגידו‪ .‬הוא‬
‫מצא את הנתונים הבאים‪:‬‬

‫)חשיפה לאלימות בטלוויזיה(‬ ‫‪x: 1 2 3 4 2 5 6 5‬‬


‫)מספר פשעים אלימים(‬ ‫‪y: 9 8 9 7 10 6 5 4‬‬

‫‪12‬‬
‫ע"פ קו הרגרסיה – אם ג'ק המרטש נחשף לאלימות בטלוויזיה‬ ‫‪.1‬‬
‫ברמה ‪ ,4‬מה מספר הפשעים האלימים שתצפה שהוא יבצע?‬
‫צ'רלס מנסון ביצע ‪ 8‬פשעים אלימים‪ .‬ע"פ קו הרגרסיה‪ ,‬מהי הרמה‬ ‫‪.2‬‬
‫הצפויה של חשיפתו לאלימות בטלוויזיה?‬
‫בחישוב מתאם פירסון בין שני המשתנים נמצא כי ‪ . r= 0.6‬מהו אחוז‬ ‫‪.3‬‬
‫השונות במספר הפשעים האלימים של פושע שאינו מוסבר על ידי החשיפה‬
‫לאלימות בטלוויזיה?‬

‫‪.6‬נבדק הקשר בין גיל ילדים לבין מידת ההצלחה בהתמודדות עם תסכול‪.‬‬
‫במחקר נבדקו ‪ 5‬ילדים ונמצאו הנתונים הבאים‪:‬‬

‫)ציונים במבחן התמודדות עם תסכול(‬ ‫‪x: 95 100 120 105 110‬‬


‫)גיל ילדים(‬ ‫‪y: 6‬‬ ‫‪8‬‬ ‫‪10‬‬ ‫‪7‬‬ ‫‪9‬‬

‫חשב לפי נתונים אלו את קו הרגרסיה לניבוי גילה של שממית על‬ ‫‪.1‬‬
‫פי ציונה במבחן התסכול‪.‬‬
‫אם ידוע כי רק ילדים בעלי ציון ‪ 120‬ומעלה במבחן התמודדות עם‬ ‫‪.2‬‬
‫תסכול מסוגלים להישאר שפויים לנוכח התסכולים הרבים שבמבחני‬
‫הקבלה לפסטיגל‪ ,‬בת כמה צריכה להיות נינט בשביל שנרשה לה להיבחן‬
‫במבחני הקבלה?‬

‫‪ .7‬איזה מקווי הרגרסיה הבאים מתאר ניבוי מושלם של ‪ x‬לפי ‪?y‬‬


‫א( ‪y=3x+3‬‬
‫ב( ‪y=x‬‬
‫ג( ‪y= -x‬‬
‫ד( לא ניתן לדעת מהנתונים‪.‬‬

‫‪13‬‬
‫כיתה‬ ‫תשובות לתרגילי‬

‫‪ .1‬א‪ .‬ראשית‪ ,‬ניתן לראות כי נקודת החיתוך עם ציר ה‪ y -‬היא )‪ ,(0,3‬לפיכך ניתן לקבוע‬

‫כי ‪ .a=3‬בשלב הבא מציבים את הנקודה ) ‪ (3,0‬אשר נמצאת על קו הרגרסיה‪ ,‬במשוואת‬

‫הרגרסיה )‪ ,(ỹ = bx + a‬על מנת למצוא את ‪ . b: 0=b•3+3‬על ידי חילוץ ‪ b‬מהמשוואה‬


‫מגלים כי הוא שווה ל‪ .(-1) -‬לפיכך‪ ,‬משוואת קו הרגרסיה היא‪:‬‬
‫‪a = 3, b = -1‬‬ ‫‪ỹ = -x + 3‬‬
‫ב‪ .‬נקודת החיתוך עם ציר ה‪ y-‬היא )‪ ,(0,1‬לפיכך ‪ .a=1‬ניתן לראות מהציור כי כאשר ‪X‬‬

‫גדל באחד‪ y ,‬גדל באחד‪ ,‬לכן מקדם השיפוע ‪ b‬שווה ל‪) 1-‬אפשר היה גם לקחת נקודה‬

‫נתונה על קו הרגרסיה על פי הציור‪ ,‬להציב ולמצוא את ‪ , b‬כפי שעשינו בסעיף א'(‪ .‬לכן‪,‬‬
‫משוואת קו הרגרסיה היא‪:‬‬
‫‪a = 1, b = 1‬‬ ‫‪ỹ=x+1‬‬
‫נקודת החיתוך עם ציר ה‪ y -‬היא )‪ ,(0,-2‬לכן ‪ .(a=(-2‬מציבים את הנקודה )‪(2,1‬‬ ‫‪.3‬‬
‫שמופיעה בקו‬
‫הרגרסיה‪ . b·2-2=1:‬לאחר חילוץ ‪ b‬מגלים כי הוא שווה ל‪ . 1.5 -‬לפיכך‪ ,‬משוואת קו‬
‫הרגרסיה היא‪:‬‬
‫‪a = -2, b = 1.5‬‬ ‫‪ỹ = 1.5x - 2‬‬
‫‪.2‬‬

‫‪5‬‬
‫‪4‬‬
‫‪3‬‬

‫‪2‬‬
‫‪1‬‬

‫‪1‬‬ ‫‪2‬‬ ‫‪3‬‬ ‫‪4‬‬ ‫‪5‬‬ ‫‪6‬‬ ‫‪7‬‬

‫אפשר לראות שהנתונים מסתדרים באופן המקורב לליניארי‪ ,‬כך שניתן לחשב‬ ‫‪.1‬‬
‫את קו הרגרסיה‪.‬‬
‫ניבוי ‪ y‬מתוך ‪:x‬‬ ‫‪.2‬‬

‫‪x‬‬ ‫‪y‬‬ ‫‪xy‬‬ ‫‪x²‬‬ ‫‪y²‬‬


‫‪1‬‬ ‫‪2‬‬ ‫‪2‬‬ ‫‪1‬‬ ‫‪4‬‬
‫‪5‬‬ ‫‪4‬‬ ‫‪20‬‬ ‫‪25‬‬ ‫‪16‬‬
‫‪5‬‬ ‫‪5‬‬ ‫‪25‬‬ ‫‪25‬‬ ‫‪25‬‬
‫‪3‬‬ ‫‪2‬‬ ‫‪6‬‬ ‫‪9‬‬ ‫‪4‬‬
‫‪2‬‬ ‫‪3‬‬ ‫‪6‬‬ ‫‪4‬‬ ‫‪9‬‬

‫‪14‬‬
‫‪0‬‬ ‫‪1‬‬ ‫‪0‬‬ ‫‪0‬‬ ‫‪1‬‬
‫‪0‬‬ ‫‪0‬‬ ‫‪0‬‬ ‫‪0‬‬ ‫‪0‬‬
‫סה"כ‬ ‫‪16‬‬ ‫‪17‬‬ ‫‪59‬‬ ‫‪64‬‬ ‫‪59‬‬

‫‪ỹ = bx + a‬‬
‫=‬ ‫=‪b‬‬ ‫‪n (Σ xiyi) - Σ xi ·Σyi‬‬ ‫= ‪= 7 ·59 - 16 ·17‬‬ ‫‪413 -272‬‬
‫‪0.73‬‬
‫‪nΣ xi² - (Σ xi)²‬‬ ‫‪7 ·64 - 16²‬‬ ‫‪448 - 256‬‬

‫‪a = y – bx‬‬
‫‪x = Σx = 16‬‬ ‫‪= 2.29‬‬ ‫‪y = Σy = 17 = 2.43‬‬
‫‪n‬‬ ‫‪7‬‬ ‫‪n‬‬ ‫‪7‬‬

‫‪a = 2.43 – 0.73 ·2.29 = 0.76‬‬ ‫‪:‬משוואת הרגרסיה ‪ỹ = 0.73x + 0.76‬‬


‫ג‪ .‬מציבים ‪ 3‬ב‪.X -‬‬

‫‪X=3‬‬
‫‪ỹ = 0.76 + 0.73 ·3 = 2.95‬‬
‫משפחה בעלת שלושה חתולים תצרוך כ‪ 2.95 -‬שמנות ביום‪.‬‬

‫ד‪ .‬תשובה ב' נכונה‪.‬‬


‫עקב השינוי‪ ,‬כל אחת מהתצפיות נעה ‪ 2‬מקומות מעלה על ציר ה‪ .y -‬קו הרגרסיה החדש‬
‫שיווצר יהיה גבוה בגרף מהקו הישן אך ישאר מקביל לו‪ ,‬כך שמקדם השיפוע ישאר‬
‫כשהיה בעוד שנקודת החיתוך עם ציר ה‪ y -‬תשתנה ולכן ישתנה הקבוע ‪.a‬‬

‫‪ .3‬א‪.‬‬

‫ב‪ .‬מותר‪ ,‬אך מיותר לחשב קו רגרסיה על הנתונים‪ ,‬מכיוון שנראה שהקשר בין המשתנים‬
‫אינו ליניארי אלא בצורת ‪ U‬הפוכה‪.‬‬

‫‪15‬‬
‫קווים אנכיים ואופקיים בין הנקודות בגרף לקו‬ ‫תשובה ב' נכונה‪ .‬אם מותחים‬ ‫‪.4‬‬
‫הרגרסיה‪ ,‬ניתן לראות כי המרחק האנכי בין הנקודות לקו הרגרסיה קטן מהמרחק‬
‫האופקי של הנקודות מהקו‪ .‬משמעות הדבר‪ ,‬שקו הרגרסיה מצמצם למינימום את‬
‫הטעות בניבוי ‪) y‬מידת השמחה( מתוך ‪) x‬כמות השתייה( ולא להיפך‪ .‬כזכור‪ ,‬אחת‬
‫מהדרישות מקו הרגרסיה‪ ,‬על פי עיקרון הריבועים הפחותים‪ ,‬היא שסכום ריבועי‬
‫הסטיות של כל התצפיות מהקו הישר יהיה מינימלי‪.‬‬

‫‪ .5‬ראשית נבדוק האם הנתונים מסודרים בצורה הקרובה ללינארית‪:‬‬

‫נראה שהנתונים אכן מסודרים בצורה ליניארית שלילית‬

‫‪x‬‬ ‫‪y‬‬ ‫‪xy‬‬ ‫‪x²‬‬ ‫‪y²‬‬


‫‪1‬‬ ‫‪9‬‬ ‫‪9‬‬ ‫‪1‬‬ ‫‪81‬‬
‫‪2‬‬ ‫‪8‬‬ ‫‪16‬‬ ‫‪4‬‬ ‫‪64‬‬
‫‪3‬‬ ‫‪9‬‬ ‫‪27‬‬ ‫‪9‬‬ ‫‪81‬‬
‫‪4‬‬ ‫‪7‬‬ ‫‪28‬‬ ‫‪16‬‬ ‫‪49‬‬
‫‪2‬‬ ‫‪10‬‬ ‫‪20‬‬ ‫‪4‬‬ ‫‪100‬‬
‫‪5‬‬ ‫‪6‬‬ ‫‪30‬‬ ‫‪25‬‬ ‫‪36‬‬
‫‪6‬‬ ‫‪5‬‬ ‫‪30‬‬ ‫‪36‬‬ ‫‪25‬‬
‫‪5‬‬ ‫‪4‬‬ ‫‪20‬‬ ‫‪25‬‬ ‫‪16‬‬
‫סה"כ‬ ‫‪28‬‬ ‫‪58‬‬ ‫‪180‬‬ ‫‪120‬‬ ‫‪452‬‬

‫א‪.‬‬

‫‪16‬‬
‫‪ỹ = bx + a‬‬

‫=‬ ‫=‪b‬‬ ‫‪n (Σ xiyi) - Σ xi ·Σyi‬‬ ‫‪= 8 ·180- 28 ·58 = 1440 -1624- 1.05‬‬

‫‪nΣ xi² - (Σ xi)²‬‬ ‫‪8 ·120 - 28²‬‬ ‫‪960 - 784‬‬

‫‪a = y – bx‬‬
‫‪x = Σx = 28‬‬ ‫‪= 3.5‬‬ ‫‪y = Σy = 58 = 7.25‬‬
‫‪n‬‬ ‫‪8‬‬ ‫‪n‬‬ ‫‪8‬‬

‫‪a = 7.25 – (-1.05 ·3.5) = 10.92‬‬ ‫משוואת הרגרסיה‪ỹ =– 1.05x + 10.92 :‬‬

‫חשיפתו של ג'ק לאלימות בטלוויזיה–נתון ‪x = 4‬‬


‫‪ỹ =– 1.05 ·4 + 10.92 = 6.72‬‬
‫תשובה‪ :‬נראה כי מספר הפשעים האלימים שייבצע ג'ק הוא ‪6.72‬‬

‫ב‪.‬‬
‫‪x = by + a‬‬

‫=‬ ‫=‪b‬‬ ‫‪8 ·180- 28 ·58‬‬ ‫=‬ ‫‪-184‬‬


‫‪- 0.73‬‬
‫‪252‬‬ ‫‪58² - 452· 8‬‬

‫‪a = 3.5 – (-0.73) ·7.25 = 8.79‬‬


‫‪x =– 0.73y + 8.79‬‬
‫נתון‪ :‬מס' הפשעים האלימים שביצע מנסון ‪y=8‬‬
‫‪x =– 0.73 ·8 + 8.79 = 2.95‬‬
‫תשובה‪ :‬נראה כי רמת החשיפה של מנסון לאלימות בטלוויזיה היא‬
‫‪3.‬‬

‫‪r=0.6‬‬ ‫ג‪ .‬נתון‪r²=0.36 :‬‬


‫כלומר‪ 36% ,‬ממספר הפשעים האלימים מוסבר על ידי החשיפה לאלימות בטלוויזיה‪ .‬משמע‪,‬‬
‫‪ 64%‬ממספר הפשעים האלימים אינו מוסבר על ידי החשיפה לאלימות בטלוויזיה‪.‬‬

‫‪17‬‬
‫‪ .6‬א‪.‬‬
‫‪x‬‬ ‫‪y‬‬ ‫‪xy‬‬ ‫‪x²‬‬ ‫‪y²‬‬
‫‪95‬‬ ‫‪6‬‬ ‫‪570‬‬ ‫‪9025‬‬ ‫‪36‬‬
‫‪100‬‬ ‫‪8‬‬ ‫‪800‬‬ ‫‪1000‬‬ ‫‪64‬‬
‫‪0‬‬
‫‪120‬‬ ‫‪10‬‬ ‫‪1200‬‬ ‫‪1440‬‬ ‫‪100‬‬
‫‪0‬‬
‫‪105‬‬ ‫‪7‬‬ ‫‪735‬‬ ‫‪1102‬‬ ‫‪49‬‬
‫‪5‬‬
‫‪110‬‬ ‫‪9‬‬ ‫‪990‬‬ ‫‪1210‬‬ ‫‪81‬‬
‫‪0‬‬
‫סה"כ‬ ‫‪530‬‬ ‫‪40‬‬ ‫‪429‬‬ ‫‪565‬‬ ‫‪330‬‬
‫‪5‬‬ ‫‪50‬‬
‫‪ỹ = bx +a‬‬

‫=‬ ‫=‪b‬‬ ‫‪5 ·4295- 530 ·40‬‬ ‫=‬ ‫‪21475 - 21200 0.15‬‬

‫‪280900 - 282750‬‬ ‫‪530² - 56550· 5‬‬

‫‪a=y-bx‬‬
‫‪x = Σx = 530‬‬ ‫‪= 106‬‬ ‫‪y = Σy = 40 = 8‬‬
‫‪n‬‬ ‫‪5‬‬ ‫‪n‬‬ ‫‪5‬‬

‫‪a = 8 – 0.15 ·106 = -7.9‬‬


‫‪ỹ = 0.15x – 7.9‬‬ ‫'תשובה לסעיף א‬

‫תשובה לסעיף ב ‪x = 120‬‬ ‫'נתון‪:‬‬


‫‪ỹ = 0.15 ·120 – 7.9 = 10.1‬‬
‫תשובה‪ :‬לפי התחזית‪ ,‬ציון ‪ 120‬במבחן התמודדות עם תסכול מקבל ילד בן ‪ .10.1‬לכן‬
‫נינט צריכה להיות בת ‪ 10.1‬לפחות על מנת להישאר שפויה במהלך המבחנים‪.‬‬

‫‪.7‬תשובה ד' נכונה‪.‬‬


‫טיב הניבוי נקבע על פי מידת פיזור הנקודות סביב קו הרגרסיה )עוצמת הקשר( ואינו תלוי‬
‫בשיפוע קו הרגרסיה )‪ (b‬או בקבוע )‪ .(a‬היות ואין לנו נתונים על הפיזור סביב קו‬
‫הרגרסיה‪ ,‬אין באפשרותנו לומר דבר על טיב הניבוי‪.‬‬

‫‪18‬‬
19
‫תרגילי בית מתאם ורגרסיה‬

‫‪ .1‬אלה ממורמרת מכך שהיא יוצאת לדייטים ולא מצליחה למצוא אהבה‪ .‬היא מאשימה את‬
‫אימה שגידלה אותה להיות בררנית מידי‪ .‬האם נחרדה והחליטה לבדוק האם קיים קשר בין‬
‫מס' המחמאות שנותנות אמהות לבנותיהן בילדותן‪ ,‬לבין מס' הדייטים הכושלים של הבנות‬
‫בבגרותן‪ .‬היא דגמה חמישה זוגות של אמהות ובנותיהן וקיבלה את הנתונים הבאים‪:‬‬
‫‪x: 40,55,75,70,82‬מס' המחמאות‬
‫‪y: 57,60,83,60,82‬מס' דייטים‬

‫חשב את קו הרגרסיה לניבוי מס' הדייטים הכושלים של הבנות לפי מס'‬ ‫‪.1‬‬
‫המחמאות שנתנו האמהות‪.‬‬
‫צייר את הנתונים בדיאגרמת פיזור וצייר בה את קו הרגרסיה‪.‬‬ ‫‪.2‬‬

‫‪ .2‬מנהלי השיווק של תנובה רצו לבדוק האם קיים קשר בין מס' הפעמים בהן משודרת‬
‫הפרסומת ליוגורט יופלה לבין מס' גביעי היופלה הנרכשים במרכולים‪ .‬הם דגמו נתונים של‬
‫שיבעה ימים וקיבלו את הממצאים הבאים‪:‬‬
‫מס' השידורים‬ ‫‪x: 14, 19 , 25, 6 , 12, 9, 8‬‬
‫מס' גביעי יופלה‬ ‫‪y: 3,‬‬ ‫‪5,‬‬ ‫‪1, 8,‬‬ ‫‪6, 7, 10‬‬

‫מצא מהי משוואת הרגרסיה לניבוי מס' הגביעים הנרכשים מתוך מס' שידורי‬ ‫‪.1‬‬
‫הפרסומת‪.‬‬
‫כמה גביעים סביר שירכוש אדם שצפה בשישה שידורים?‬ ‫‪.2‬‬
‫מצא מהי משוואת קו הרגרסיה לניבוי מספר השידורים ממס' הגביעים‪.‬‬ ‫‪.3‬‬
‫בכמה שידורים סביר שצפה אדם שרכש ארבעה גביעים?‬ ‫‪.4‬‬
‫ציירו את דיאגרמת הפיזור ואת קווי הרגרסיה‪ .‬באיזו נקודה הם מתלכדים?‬ ‫‪.5‬‬
‫מה ניתן לומר על שונות הטעות בניבוי מס' הגביעים ממס' השידורים?‬ ‫‪.6‬‬

‫‪ .3‬לפניך מס' המעריצים )במאות( את הראל סקעת )‪ (x‬ואת הראל מויאל )‪ (y‬מכוכב נולד‪,‬‬
‫בשלוש ערים גדולות‪:‬‬

‫‪y‬‬ ‫‪x‬‬ ‫המקום‬


‫‪8‬‬ ‫‪3‬‬ ‫מעלה אדומים‬
‫‪4‬‬ ‫‪8‬‬ ‫כפר סבא‬
‫‪2‬‬ ‫‪10‬‬ ‫חיפה‬

‫‪20‬‬
‫חשב את מקדם המתאם )‪(r‬‬ ‫‪.1‬‬
‫חשב את קו הרגרסיה לחיזוי ‪ Y‬מתוך ‪. X‬‬ ‫‪.2‬‬
‫ברעננה רק עשרה אנשים מעריצים את הראל סקעת‪ .‬כמה מעריצים סביר‬ ‫‪.3‬‬
‫שיהיו להראל מויאל ברעננה?‬

‫במחקר נאספו נתונים על מס' השעות שישנו שלושה סטודנטים בלילה‬ ‫‪.5‬‬
‫)‪ (x‬ועל מספר הפיהוקים שלהם בשיעור למחרת )‪:(y‬‬
‫‪x – 7, 5, 3‬‬
‫‪y - 3, 6, 10‬‬
‫א‪ .‬הציגו את הנתונים בדיאגרמת פיזור ותארו את כיוון הקשר‪.‬‬
‫ב‪ .‬חשבו את קו הרגרסיה לניבוי ‪ y‬מתוך ‪.x‬‬
‫ג‪ .‬איזה אחוז מהשונות במספר הפיהוקים מוסבר על ידי מספר שעות השינה?‬
‫ד‪ .‬חוקר שינה מציע להשתמש בציוני תקן במקום יחידות גולמיות‪ .‬מה יהיה המתאם‬
‫לפי הצעה זו ומה יהיה קו הרגרסיה לניבוי מס' פיהוקים לפי מס' שעות שינה?‬
‫ה‪ .‬כמה פיהוקים צפויים למי שישן שעה וחצי בלבד?‬
‫ו‪ .‬איזה מידע מכיל הפרמטר ‪ b‬במשוואת הרגרסיה?‬

‫‪21‬‬
‫תשובות לתרגילי הבית‬

‫* התשובות ע"פ עיגול של שתי ספרות אחרי הנקודה‬

‫‪ .1‬א‪ .‬ניבוי ‪( y‬מס' דייטים( מ‪) x -‬מס' מחמאות(‬


‫‪x‬‬ ‫‪y‬‬ ‫‪Xy‬‬ ‫‪x²‬‬ ‫‪y²‬‬
‫‪40‬‬ ‫‪57 2280 1600‬‬ ‫‪3249‬‬
‫‪55‬‬ ‫‪60 3300 3025‬‬ ‫‪3600‬‬
‫‪75‬‬ ‫‪83 6225 5625‬‬ ‫‪6889‬‬
‫‪70‬‬ ‫‪60 4200 4900‬‬ ‫‪3600‬‬
‫‪82‬‬ ‫‪82 6724 6724‬‬ ‫‪6724‬‬
‫סה"‬ ‫‪322‬‬ ‫‪342‬‬ ‫‪227‬‬ ‫‪218‬‬ ‫‪240‬‬
‫כ‬ ‫‪99‬‬ ‫‪74‬‬ ‫‪62‬‬

‫=‪b‬‬ ‫‪5 ·22799 – 322 ·342‬‬ ‫‪= 3871 = 0.7‬‬


‫‪5 ·21874 - 322²‬‬ ‫‪5686‬‬

‫‪x = 64.4‬‬ ‫‪y = 68.4‬‬


‫‪a = 68.4 – 0.7 ·64.4 = 23.32‬‬

‫‪ỹ = 0.7x + 23.32‬‬

‫ב‪.‬‬
‫דייטים‬

‫‪22‬‬
‫מחמאות‬

‫‪ .2‬א‪ .‬ניבוי ‪) y‬מס גביעים( מתוך ‪) x‬מספרשידורים(‪:‬‬


‫‪x‬‬ ‫‪y‬‬ ‫‪xy‬‬ ‫‪x²‬‬ ‫‪y²‬‬
‫‪14‬‬ ‫‪3‬‬ ‫‪42‬‬ ‫‪196‬‬ ‫‪9‬‬
‫‪19‬‬ ‫‪5‬‬ ‫‪95‬‬ ‫‪361‬‬ ‫‪25‬‬
‫‪25‬‬ ‫‪1‬‬ ‫‪25‬‬ ‫‪625‬‬ ‫‪1‬‬
‫‪6‬‬ ‫‪8‬‬ ‫‪48‬‬ ‫‪36‬‬ ‫‪64‬‬
‫‪12‬‬ ‫‪6‬‬ ‫‪72‬‬ ‫‪144‬‬ ‫‪36‬‬
‫‪9‬‬ ‫‪7‬‬ ‫‪63‬‬ ‫‪81‬‬ ‫‪49‬‬
‫‪8‬‬ ‫‪10‬‬ ‫‪80‬‬ ‫‪64‬‬ ‫‪100‬‬
‫סה"‬ ‫‪93‬‬ ‫‪40‬‬ ‫‪425‬‬ ‫‪150‬‬ ‫‪284‬‬
‫כ‬ ‫‪7‬‬

‫=‪b‬‬ ‫‪7 ·425 – 93 ·40‬‬ ‫= ‪= -745‬‬ ‫‪-0.39‬‬


‫‪7 ·1507 - 93²‬‬ ‫‪1900‬‬

‫‪x = 13.3‬‬ ‫‪y = 5.7‬‬

‫‪a = 5.7 –(-0.39)·13.3 = 10.9‬‬


‫‪ỹ = -0.39x + 10.9‬‬

‫ב‪ .‬נתון‪x=6 :‬‬


‫‪ỹ =-0.39·6 + 10.9 = 8.56‬‬
‫‪.‬צפוי כי אדם שצפה בשישה שידורים ירכוש ‪ 8.56‬גביעים‬

‫ג‪ .‬ניבוי ‪ x‬מ‪:y -‬‬


‫=‪b‬‬ ‫‪7 ·425 – 93 ·40‬‬ ‫=‬ ‫‪-745‬‬ ‫=‬ ‫‪-1.92‬‬
‫‪7 ·284 - 40²‬‬ ‫‪388‬‬
‫‪x = 13.3‬‬ ‫‪y = 5.7‬‬
‫‪23‬‬
‫‪a = 13.3 – (-1.92) ·5.7 = 24.24‬‬
‫‪x =-1.92y+24.24‬‬
‫ד‪ .‬נתון‪y=4 :‬‬
‫‪x= -1.92 ·4 +24.24 = 16.56‬‬
‫‪.‬נצפה כי אדם שקנה ארבעה גביעים צפה ב‪ 16.56 -‬שידורים‬

‫כלומר )‪ (13.3,5.7‬שהיא גם נקודת‬ ‫ה‪ .‬שני הקווים נפגשים בנקודה )‪(x, y‬‬
‫מס' גביעים‬
‫הממוצעים‪.‬‬
‫דיאגרמת הפיזור‪:‬‬

‫מס' שידורים‬

‫על מנת למצוא את שונות הטעות עלינו לחשב את ‪r‬‬ ‫‪.7‬‬


‫=‪r‬‬ ‫‪7 ·425 – 93 ·40‬‬ ‫=‬ ‫‪-0.87‬‬ ‫‪ :‬תשובה‬
‫)‪(7 ·1507 - 93 ² ) · (7 ·284- 40 ²‬‬

‫השונות המוסברת היא ‪ .r², 0.87²- = 0.76‬שונות הטעות שווה ל‪ 1 -‬פחות השונות‬
‫המוסברת‪ ,‬ולכן שווה ל‪. 0.24 -‬‬

‫‪.3‬‬
‫‪x‬‬ ‫‪y‬‬ ‫‪xy‬‬ ‫‪x²‬‬ ‫‪y²‬‬

‫‪24‬‬
‫מעלה‬ ‫‪2‬‬ ‫‪5‬‬ ‫‪10‬‬ ‫‪4‬‬ ‫‪25‬‬
‫אדומים‬
‫כפר סבא‬ ‫‪4‬‬ ‫‪3‬‬ ‫‪12‬‬ ‫‪16‬‬ ‫‪9‬‬
‫חיפה‬ ‫‪6‬‬ ‫‪1‬‬ ‫‪6‬‬ ‫‪36‬‬ ‫‪1‬‬
‫סה"כ‬ ‫‪12‬‬ ‫‪9‬‬ ‫‪28‬‬ ‫‪56‬‬ ‫‪35‬‬

‫א‪.‬‬
‫=‪r‬‬ ‫‪3 ·28 – 12 ·9‬‬ ‫=‬ ‫‪1-‬‬ ‫‪ :‬תשובה‬
‫)‪(3 ·56 - 12 ² ) · (3 ·35- 9 ²‬‬
‫ב‪ .‬ניבוי ‪ y‬מתוך ‪:x‬‬
‫=‪b‬‬ ‫‪3 ·28 – 12 ·9‬‬ ‫=‬ ‫‪24-‬‬ ‫=‬ ‫‪1-‬‬
‫‪3 ·56 - 12²‬‬ ‫‪24‬‬

‫‪x=4‬‬ ‫‪y = 2.25‬‬

‫‪a = 2.25 + 1 ·4 = 6.25‬‬


‫‪ỹ = 1-x + 6.25‬‬
‫ג‪ .‬היות והנתונים לפיהם חושבה המשוואה הם במאות‪ ,‬נמיר את ‪ 10‬ל‪ .0.1 -‬נציב ‪x=0.1‬‬
‫‪ỹ = 1-·0.1+6.25= 6.15‬‬
‫נצפה כי מס' המעריצים את הראל מויאל ברעננה יהיה ‪.615‬‬

‫‪ .4‬א‪ .‬קשר ליניארי שלילי‬

‫מס' פיהוקים‬

‫שעות שינה‬
‫‪25‬‬
‫ב‪ .‬ניבוי ‪ y‬מתוך ‪:x‬‬
‫‪x‬‬ ‫‪y‬‬ ‫‪xy‬‬ ‫‪x²‬‬ ‫‪y²‬‬
‫‪7‬‬ ‫‪3‬‬ ‫‪21‬‬ ‫‪49‬‬ ‫‪9‬‬
‫‪5‬‬ ‫‪6‬‬ ‫‪30‬‬ ‫‪25‬‬ ‫‪36‬‬
‫‪3‬‬ ‫‪10‬‬ ‫‪30‬‬ ‫‪9‬‬ ‫‪100‬‬
‫סה"‬ ‫‪15‬‬ ‫‪19‬‬ ‫‪81‬‬ ‫‪83‬‬ ‫‪172‬‬
‫כ‬

‫=‪b‬‬ ‫‪3 ·81 – 15 ·19‬‬ ‫=‬ ‫‪-42‬‬ ‫=‬ ‫‪- 1.75‬‬


‫‪3 ·83 - 15²‬‬ ‫‪24‬‬

‫‪x=5‬‬ ‫‪y = 6.33‬‬

‫‪a = 6.33– (-1.75) ·5 = 15.08‬‬


‫‪ỹ = -1.75x + 15.08‬‬
‫ג‪ .‬כדי לחשב את אחוז השונות יש לחשב את ‪r‬‬
‫=‪r‬‬ ‫‪3 ·81 – 15 ·19‬‬ ‫=‬ ‫‪- 0.69‬‬ ‫‪ :‬תשובה‬
‫)‪(3 ·83 - 15 ² ) · (3 ·172- 19 ²‬‬
‫‪r² = 100 · (-0.69)² =· 100‬‬ ‫אחוז השונות המוסברת ‪:‬‬
‫‪47.61%‬‬

‫ד‪ .‬המתאם נשאר אותו מתאם ‪. -0.69‬‬


‫קו הרגרסיה לניבוי מס' פיהוקים ע"פ מס' שעות שינה ‪:‬‬

‫‪Zy = r ·Zx‬‬
‫‪Zy = -0.69 ·Zx‬‬
‫ה‪ .‬נציב ‪x = 1.5‬‬
‫‪ỹ = -1.75·1.5 + 15.08 = 12.45‬‬
‫צפוי כי אדם שישן רק שעה וחצי בלילה‪ ,‬יפהק ‪ 12.45‬פיהוקים‪.‬‬ ‫תשובה‪:‬‬

‫ו‪ .‬המידע שמכיל הפרמטר ‪ b‬הוא‪ :‬ככל שמס' שעות השינה בלילה גדל ביחידה אחת )שעה‬

‫אחת(‪ ,‬כך הוא מפהק ‪ 1.75‬פיהוקים פחות‪.‬‬

‫‪26‬‬

You might also like