Loading AI tools
מונח בסטטיסטיקה מוויקיפדיה, האנציקלופדיה החופשית
בסטטיסטיקה, טעות ריבועית ממוצעת או שגיאה ריבועית בינונית (שר"ב) (Mean Squared Error) של אומד מודדת את ממוצע ריבועי ה"טעויות", כלומר ההבדל בין האומד לבין מה שנאמד. ההבדל נובע בגלל האקראיות או בגלל שהאומד לא לוקח בחשבון מידע שיכול לייצר אומד מדויק יותר.
טעות ריבועית ממוצעת היא מומנט מסדר שני של השגיאה, ולכן משלבת גם את השונות של האומד וגם את ההטייה שלו. עבור אומד חסר הטיה, הטעות הריבועית הממוצעת היא שונות האומד. בדומה לשונות, לשונות הריבועית הממוצעת יש אותם יחידות מדידה כמו לריבוע המידה שנאמדת. באנלוגיה לסטיית התקן, אם ניקח את השורש של הטעות הריבועית הממוצעת נקבל את שורש הטעות הריבועית הממוצעת (RMSE), אשר יש לה את אותן יחידות מידה כמו למידה שנאמדת; עבור אומד חסר הטיה, שורש הטעות הריבועית הממוצעת הוא שורש השונות, הידוע כסטיית התקן.
אם Ŷ הוא וקטור של n ערכים חזויים, ו-Y הוא הווקטור של הערכים האמיתיים, אזי הטעות הריבועית הממוצעת המוערכת היא:
המדד מחושב בהינתן מדגם מסוים, ובהתאם תלוי בו. הטעות הריבועית הממוצעת של אומד בהתייחס לפרמטר לא ידוע מוגדרת כ:
הגדרה זו תלויה בפרמטר הלא ידוע, והטעות הריבועית הממוצעת בהקשר הזה היא תכונה של אומד. הטעות הריבועית הממוצעת שווה לסכום השונות וריבוע ההטייה של האומד או של התחזיות . במקרה של טעות ריבועית ממוצעת של אומד:
הוכחה:
(יש טעות בשורה האחרונה של הפיתוח. הביטוי של ה-bias שגוי)
כלומר לטעות הריבועית הממוצעת יש תכונה של אומד או סט של תחזיות במונחים של השוני שלה ושל רמת ההטייה. משום שהטעות הריבועית הממוצעת זו תחזית, טכנית זה לא משתנה מקרי, אבל היא תהיה נתונה לטעות בהערכה כאשר תחושב עבור אומד ספציפי של עם ערך אמיתי בלתי ידוע. כלומר, כל הערכה של הטעות הריבועית הממוצעת על סמך פרמטר מוערך היא אכן משתנה מקרי.
טעות ריבועית ממוצעת עם ערך אפס, משמעותה שהאומד חוזה את ערכו של הפרמטר האמיתי בדיוק מושלם. כלומר האומד אידיאלי.
ניתן להשוות בין מודלים סטטיסטיים שונים על-בסיס ערכי ה-MSE שלהם, על-מנת להעריך את רמת הדיוק שבה הם מפרשים קבוצה נתונה של תצפיות - אומד חסר הטיה (הנשען על מודל סטטיסטי כלשהו) עם שונות מזערית ביחס ליתר האומדים הקיימים, יהיה האומד בעל התחזית הטובה ביותר, במובן שהוא ממזער את השונות. אומד כזה מכונה MVUE - Minimum Variance Unbiased Estimator.
שיטות לרגרסיה ליניארית מנסות להעריך את ה-MSE כחלק מהאנליזה שהן מבצעות, ומשתמשות ב-MSE המוערך על-מנת לקבוע את המובהקות הסטטיסטית של הגורמים הנמצאים בבחינה.
בדומה לשונות, לטעות הריבועית הממוצעת יש חיסרון בכך שהיא נותנת משקל רב לתצפיות חריגות. דבר זה מתרחש בשל ההעלאה בריבוע של הסטיות, אשר נותנת משקל רב יותר לטעויות הגדולות. תכונה זו, שהיא בעייתית במקרים רבים, גרמה לחוקרים רבים לזנוח את הטעות הריבועית הממוצעת לטובת מדדים אחרים, כגון טעות מוחלטת ממוצעת או מדדים המבוססים על חציונים.
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.