Professional Documents
Culture Documents
שיעור 6
שיעור 6
המודלים מאפשרים לנו לקבל השפעות נקיות אחרי שמנטרלים את הקשרים העקיפים .אם אני רוצה
לדעת מה ההשפעה הנקייה של תמיכה חברתית על ,PTSDאחרי שמנטרלים את המתאמים בין תמיכה
לשאר המשתנים -אני מסתכל על .β2הבטאות נותנות לנו את הגודל של ההשפעה הישירה של המשתנה
הרלוונטי (טראומה\תמיכה\ )IQעל .PTSD
מבחינת הגודל ,לבטאות יש סדר גודל כמו מתאמים למרות שהן לא מתאמים .אם אתם רגילים שמתאם
0.3מתחיל להיות מעניין ומתאם 0.5הוא כבר גדול – אז כנ"ל לגבי הבטאות.
מבחינת פרשנות ,את הבטאות אפשר להשוות בין משתנים שונים כי זה בציוני תקן .אם יש הבדלים
בסקאלות – כמו למשל בגרות ( )0-100ופסיכומטרי ( )300-800כמנבאים לציוני תואר ראשון ,אז יהיה
מאוד קשה להסתכל על המקדמים הגולמיים שלהם כי כל מקדם גולמי מתייחס לסקאלה ויש לו רזולוציה
שונה .לכן המשקלות הגולמיים לא מאפשרים להשוות בין ה b-של הפסיכומטרי ל b-של הבגרות.
הבטאות כן מאפשרות את זה – אם לפסיכומטרי יש β 0.4ולבגרות ,0.2אפשר להגיד שהפסיכומטרי
משפיע יותר.
על אף שאי אפשר להשוות ביניהם ,אפשר בהחלט לפרש מקדמים גולמיים במונחים של ציוני גלם.
למשל ,מה שווה כל תוספת של נקודה באינטליגנציה לציון .PTSDיש מודלים של רגרסיה שמנבאים
תוחלת חיים – אז אתם יכולים להגיד כמה חודשים בחיים מפחיתה כל סיגריה שאתם מעשנים ביום ("על
כל סיגריה ,אתם מפסידים Xחודשים מהחיים") .שימו לב שהיתרון של המקדמים זה אחרי שמנטרלים
את כל יתר ההשפעות .אם אני שם במודל רגרסיה גם כמה חברים יש לכם וכמה שנים חיו ההורים שלכם,
צריך לנטרל אותם כדי להגיד כמה שווה כל סיגריה בניבוי משך החיים שלכם.
מה קורה במקרה שצריך לטפל בקבוצת משתנים כמבטאת דבר אחד?
למשל ,אנחנו רוצים לדעת מה ההשפעה של אינטליגנציה אחרי שאני מנטרל גיל ,מין וסטטוס .ההבחנות
בין משתנים אלו לא מעניינות אותי ואני רוצה לטפל בהם כאילו הם משתנה אחד .דוגמא נוספת היא
תמיכה חברתית שהיא דבר מאוד רחב שאפשר לפרק אותו לתמיכה מההורים ,תמיכה מחברים ותמיכה
מבן\בת זוג – אך לא מעניין אותי ההבדל ביניהם.
כשאני רוצה לטפל בקבוצה שלמה של משתנים ,הפרשנות כפי שהוצגה עד עכשיו לא עוזרת .נגיד
שתמיכה מההורים זה ,X1תמיכה מחברים זה X2וכך הלאה ,ולכל אחד תהיה בטא משלו .המשמעות של
הבטאות היא למשל מה ההשפעות של תמיכת בן זוג אחרי שאני מנטרל תמיכה מהורים ומחברים – וזה
לא מה שרציתי ,כי אני רוצה לדעת תמיכה חברתית באופן כללי.
כדי לטפל בבעיה הזו ,יש לנו רגרסיה היררכית.
דוגמא א' :ניבוי חומרת PTSD
מודל :1מנבא מתוך חומרת טראומה ואינטליגנציה. ‹
מודל : 2מנבא מתוך חומרת טראומה ,אינטליגנציה ותמיכה חברתית אשר נמדדת באמצעות ‹
שלושה משתנים.
כרגע יש לי שני מודלים ולכל מודל יהיה אחוז שונות מוסברת ( .)R2אני אקבל תשובה לשאלה שלי אם
תהיה עלייה משמעותית בכוח ההסברי -אם מודל 2מסביר הרבה יותר טוב ממודל ,1זה עונה לי על
השאלה שתמיכה חברתית מנבאת ( PTSDבמקרה זה – מקטינה).
בשביל לנתח את זה אני חייב לצרף את כל מקורות התמיכה למשתנה "תמיכה" .השיטה החלופית והיותר
מוצלחת היא לא לצרף למשתנה אחד אלא לעשות השוואה בין מודלים .במודל 1לא תהיה תמיכה
חברתית ובמודל 2יהיו טראומה ,IQ ,ושלושה משתנים שונים של תמיכה חברתית שלכל אחד בטא
משלו .הבטאות מספרות לך על תמיכת הורים\בן זוג וכו' ,אבל הן לא עונות לך על השאלה הגלובלית
שמעניינת אותך -תמיכה חברתית .כדי לפתור את הבעיה אני משווה בין שני המודלים האלה .אני מסתכל
בכמה מודל 2מנבא יותר טוב מאשר מודל ,1וככה אני יכול לדעת האם התוספת הזו (תמיכה חברתית)
משפרת את הניבוי.
דוגמה ב' :תרומת יכולות רקע (חשיבה מתמטית ,כושר ביטוי מילולי ,שליטה באנגלית) לניבוי
הצלחה אקדמית אחרי ניכוי השפעות עקיפות שמערבות משתנים דמוגרפיים.
מודל : 1ניבוי באמצעות משתנים דמוגרפיים. ‹
מודל : 2ניבוי באמצעות משתנים דמוגרפיים ומשתני יכולת רקע ( 3משתנים(. ‹
אנחנו יודעים שאנשים יכולים להיות יותר טובים בתחומים האלה בגלל הסטטוס הסוציו-אקונומי (אפשר
מורים פרטיים ,תמיכה מההורים וכו') ,אבל אני רוצה לנטרל את הדברים האלה ולדעת האם היכולת הזאת
תורמת בלעדית להצלחה אקדמית.
אני עושה מודל ראשון ומנבא הצלחה אקדמית רק באמצעות משתנים דמוגרפיים .במודל השני אני מנבא
באמצעות משתנים דמוגרפיים וכל משתני היכולת .גם כאן מה שמעניין אותי זה בכמה הניבוי השתפר בין
המודלים.
יש לכל משתנה בטא משלו ,ולכן בשביל לקבל תחליף בטא עושים את השיטה הזו של רגרסיה היררכית.
אנחנו מסתכלים בכמה השתפר הניבוי במודל 2יחסית למודל – 1אם הניבוי הרבה יותר מוצלח זה מעיד
על כך שהיכולות האקדמיות תורמות מעבר למשתנה הרקע בלבד (מעמד סוציו-אקונומי) .אנחנו לא נדע
מה ה ,β-אנחנו נדע מה אחוז השונות המוסברת באמצעות תמיכה חברתית (השונות שהיא מסבירה מעבר
למשתנה הרקע) -כמה שונות מוסברת התווספה בגין זה שהוספנו שלושה משתנים.
הוספת מנבאים לא יכולה להוריד את ה ,R2-רק לא לשנות אותו או להעלות אותו .כשבונים את נוסחת
הרגרסיה המרובה ,ומוסיפים משתנים שלא תורמים כלום – המשקל שלהם הוא 0ולכן הם לא משפיעים
על המשוואה .כלומר ,הוספת מנבאים לעולם לא תזיק אלא רק תשפר את ה( R2-עם זאת ,יש בעיה של
.)overfitting
בשתי הדוגמאות למודל 2יהיה ה R2-גדול יותר או שווה למודל ,1והשאלה שלנו היא האם התוספת הזו
אמתית או לא אמתית ( \ overfittingסתם משחקים עם מספרים).
עוד שאלות ב00:19-00:24
שאלה :אם אתה רוצה לדעת האם משתנה אחד משפיע לך על המודל ,למה אתה לא בודק ישירות את המתאם בין אותו משתנה למנבא שלך
ואז אם יש מתאם הוא משפיע ואם לא אז לא?
שים לב – מתאם הוא תוצר של השפעות ישירות אך גם עקיפות .כמו שראינו במקרה של משתנה מדכא ,מתאם יכול להיות גם כשאין לך
שום השפעה של המשתנה אלא רק דרך השפעות עקיפות .לכן מתאם לא פותר את הבעיה.
שתי דוגמאות להשפעות עקיפות .1 :מורידים לגמל שלמה רגל ואומרים לו לקפוץ ,ומגיעים למסקנה שגמל שלמה בלי רגליים לא שומע.2 .
מגיעים למסקנה שסוכרזית משמינה כי יש מתאם גבוה בינה לבין אנשים עם משקל עודף.
קיבלנו .BF = 7.32אפשר לקבל את H 0ולהסיק כי התוספת של שלושת המנבאים מובהקת והם אכן
תרמו לי לניבוי – H 1יותר סביר מ H 0פי .7.32
תרגול ב:R-
גישה שכיחותנית:
אני בונה מודל לינארי שמנבא נוירוטיות מתוך שתי תכונות ( )1ומודל שמנבא
נוירוטיות מתוך 5תכונות ( .)2אפשר לעשות summaryשייתן לנו מבחן
מובהקות על כל אחד מהפרמטרים; R2ועוד.
אנחנו רוצים לדעת האם
הדלתא שלנו מובהקת אז
אנחנו עושים ANOVA
שמשווה בין המודלים:
מקבלים את ה DF-מונה,
= 41.003ו- הF-
Probabilityקטן מאוד .בדוגמה הזאת מודל 2עדיף בהרבה על מודל .1
המבחן Fמשווה בין שתי שונויות :התוספת לשונות המוסברת יחסית לשונות הטעות.
גישה בייסיאנית:
אנחנו מטעינים את הספרייה של בייס פקטור ,ואז מריצים את הפקודה
regressionBFובסוגריים שמים את המודל המלא .אנחנו מקבלים רשימה של
כל המודלים החלקיים מתוכו.
אנחנו מחשבים את ה BF-של שני מודלים .E+O ; E+O+A+C :החלוקה
ביניהם מביאה לנו BFגדול מאוד ומובהק לטובת H. 1
– 7בחירת מנבאים
לפעמים רוצים לצמצם את מספר המנבאים:
כדי למנוע overfitting
כדי לחסוך בעלויות הבחי נה – למשל אם אני משתמש במנבאים לצורך קבלה לעבודה ויש לי
הגבלה של זמן למועמדים .אני רוצה לבחור סט של מועמדים שיעשה עבודה טובה בלי לבחור
בכולם.
כדי לקצר שאלונים – ניתן לבחור באמצעות שיטות של בחירת מנבאים קבוצה של שאלות שתעשה
עבודה טובה כמו לבחור בכל השאלות.
המטרה מאוד פרגמטית :אני רוצה לנבא בצורה יעילה באמצעות פחות מנבאים .אנשים מתבלבלים
ומשתמשים בשיטות לבחירת מנבאים כדי להסיק מסקנות לסיבתיות וכו' – וזה לא טוב ,זה עושה טעויות.
אם באים עם שאלה תאורטית צריך לעבוד עם פרשנות של הבטאות והרגרסיות ,ואם יש שאלה פרגמטית
(איך לנבא) צריך לעבוד עם השיטות האלו.