HW 11 New New

You might also like

Download as pdf or txt
Download as pdf or txt
You are on page 1of 2

‫מבוא לסטטיסטיקה‬ ‫הטכניון ‪ -‬מוסד טכנולוגי לישראל‬

‫חורף תש"ע‬ ‫הפקולטה להנדסת תעשייה וניהול‬

‫תרגיל בית מספר ‪11‬‬


‫שאלה ‪:1‬‬
‫חוקרת רצתה לבדוק האם קיימת תלות בין גיל וצריכה יומית של קוקה‪-‬קולה‪ .‬על מנת לחקור שאלה‬
‫זו היא חילקה את משתנה גיל ל‪ 3 -‬קטגוריות‪ :‬עד גיל ‪ , 20‬בין ‪ 20‬ל ‪ 50‬ו יותר מ‪ .50 -‬את המשתנה‬
‫השני היא הגדירה בצורה הבאה‪ :‬רמה ‪ - 1‬לא שותה כלל ‪,‬רמה ‪ - 2‬צורך עד ‪ 4‬כוסות ביום ‪ ,‬רמה ‪- 3‬‬
‫צורך יותר מ‪ 5 -‬כוסות ביום‪.‬‬
‫מספר הנבדקים היה ‪ .300‬להלן טבלה המסכמת את התוצאות‪:‬‬

‫גיל‬
‫‪ 50‬ומעלה‬ ‫‪20- 50‬‬ ‫עד ‪) 20‬כולל(‬

‫‪55‬‬ ‫‪80‬‬ ‫‪10‬‬ ‫רמה ‪1‬‬ ‫צריכה יומית‬


‫‪33‬‬ ‫‪2‬‬ ‫‪35‬‬ ‫רמה ‪2‬‬ ‫של קוקה‬
‫קולה‬
‫‪5‬‬ ‫‪22‬‬ ‫‪58‬‬ ‫רמה ‪3‬‬

‫א‪ .‬בדוק ברמת מובהקות של ‪ 5%‬האם קיימת תלות בין שני המשתנים‪.‬‬
‫ב‪ .‬חוקר מחברת קוקה קולה הודיע לחוקרת כי ידועה לו ההתפלגות של הצריכה היומית של‬
‫קוקה קולה באוכלוסייה‪ .‬ידוע שההסתברות להיות שייך לרמה ‪ 1‬היא ‪ , 0.3‬ההסברות להיות‬
‫שייך לרמה ‪ 2‬היא ‪ 0.5‬וההסתברות להיות שייך לרמה ‪ 3‬היא ‪ . 0.2‬מה תהיה המסקנה של‬
‫החוקרת ‪,‬בהינתן המידע הנוסף ‪,‬ברמת מובהקות של ‪? 5%‬‬
‫ג‪ .‬מהו ערך ה‪ p-value -‬עבור סעיף ב'?‬

‫שאלה ‪:2‬‬

‫הטבלא הבאה מתארת מדגם של ‪ 2216‬חולות בסרטן השד בשני בתי חולים בארה"ב‪ ,‬וכמו כן את סוג‬
‫סרטן השד‪ Early-stage cancer :‬יותר קל לריפוי מ‪ .Later-stage cancer-‬כל תא בטבלא מראה את‬
‫מספר מקרי המוות מסרטן השד ואת מספר הניתוחים‪ .‬למשל‪ ,‬ב‪ community hospital -‬היו ‪12‬‬
‫מקרי מוות מתוך ‪ 120‬ניתוחים לטיפול ב‪. Early-stage cancer -‬‬

‫‪Hospital‬‬ ‫‪Early stage‬‬ ‫‪Late stage‬‬


‫‪Community Hospital‬‬ ‫‪12/120‬‬ ‫‪48/84‬‬ ‫‪60/204‬‬
‫‪University Hospital‬‬ ‫‪20/392‬‬ ‫‪720/1620 740/2012‬‬

‫א‪ .‬האם יש קשר בין סוג בית החולים לשיעור התמותה עבור חולות בסרטן השד? בידקו ברמת‬
‫מובהקות ‪ .0.05‬אם יש קשר‪ ,‬תארו את כיוון הקשר‪.‬‬
‫ב‪ .‬האם יש קשר בין סוג בית החולים לשיעור התמותה עבור חולות ב‪Early-stage -‬‬
‫‪ ?cancer‬בידקו ברמת מובהקות ‪ .0.05‬אם יש קשר‪ ,‬תארו את כיוון הקשר‪.‬‬

‫‪1‬‬
‫מבוא לסטטיסטיקה‬ ‫הטכניון ‪ -‬מוסד טכנולוגי לישראל‬
‫חורף תש"ע‬ ‫הפקולטה להנדסת תעשייה וניהול‬

‫ג‪ .‬האם יש קשר בין סוג בית החולים לשיעור התמותה עבור חולות ב‪?Late-stage cancer -‬‬
‫בידקו ברמת מובהקות ‪ .0.05‬אם יש קשר‪ ,‬תארו את כיוון הקשר‪.‬‬
‫על סמך הניתוחים הסטטיסטיים הנ"ל‪ ,‬לאיזה משני בתי החולים עדיף לחולה לפנות?‬ ‫ד‪.‬‬
‫הסבר‪.‬‬

‫שאלה ‪:3‬‬

‫חברה החליטה לבחון את רשת התקשורת הפנימית שלה‪ .‬המטרה של החברה היתה למדוד מהירות‬
‫העברת מידע דרך הרשת‪ .‬לשם כך הועברו דרך הרשת ‪ 80‬קבצים בגדלים )‪ 20-100(MB‬בכל שעות‬
‫היום ונמדד זמן העברה )בשניות( של כל קובץ‪ .‬הנתונים בקובץ המצורף לתרגיל ”‪. “download.xls‬‬

‫א( ציירו דיאגראמת פיזור של הנתונים כאשר זמן העברה על ציר ה‪ Y-‬וגודל הקובץ על ציר ה‪.X-‬‬
‫האם המודל הלינארי מתאים?‬
‫ב( הריצו את מודל הרגרסיה הלינארית והוסיפו את קו הרגרסיה לציור מסעיף א'‪ .‬מהי משוואת‬
‫קו הרגרסיה?‬
‫ג( מה משמעות החותך והשיפוע במשוואת קו הרגרסיה? בתשובתך ציין את היחידות שלהם‪.‬‬
‫ד( מהו מקדם המתאם בין המשתנים?‬
‫ה( כמה זמן לוקח להעביר קובץ בגודל ‪?30MB‬‬
‫ו( עובדי החברה החליטו להציג את הנתונים להנהלה ביחידות אחרות‪ :‬את זמני ההעברה‬
‫בדקות )‪ (min‬ואת גודלי הקבצים ב‪ .(1 MB = 1024 kilobytes) kilobytes-‬מהי משוואת‬
‫קו הרגרסיה החדשה? האם המשוואה החדשה מתאימה טוב יותר לנתונים מאשר המשוואה‬
‫שמצאת בסעיף ב'?‬
‫ז( מהי כמות המידע שניתנת להעברה דרך הרשת ב‪ 15-‬שניות? ענה על השאלה בשתי דרכים‪:‬‬
‫‪ (1‬התאם את מודל הרגרסיה כאשר זמן העברה הוא משתנה ה‪ X-‬וגודל הקובץ הוא‬
‫משתנה ה‪.Y-‬‬
‫‪ (2‬על סמך המשוואה שמצאת בסעיף ב'‪.‬‬
‫האם התשובות זהות? מהי הדרך המתאימה )מבין השתיים לעיל( לענות על השאלה?‬

‫‪2‬‬

You might also like