Loading AI tools
מושג בסטטיסטיקה מוויקיפדיה, האנציקלופדיה החופשית
בסטטיסטיקה, השכיחות (או השכיחות המוחלטת) של אירוע הוא המספר של פעמים שהתצפית התרחשה בניסוי או במחקר.[1] שכיחויות אלה מתוארות לעיתים קרובות בצורה גרפית או בצורת טבלה. במילים פשוטות, שכיחות היא מספר הפעמים שערך נתון (או קבוצת ערכים אם מדובר בנתונים מקובצים) הופיע. ברב המקרים ידובר על שכיחות במדגם נתון ואז נהוג להציג טבלת שכיחויות. סך השכיחויות במדגם הוא מספר התצפיות הכולל.
במושג שכיחות נעשה שימוש תדיר במחקר, למשל בתחום האפידמיולוגיה, לשם הצגת שכיחותה של מחלה, כלומר הצגת מספר החולים במחלה זו מבין כלל האוכלוסייה הנבדקת. נהוג להציג גם שכיחות יחסית - שכיחות באחוזים או כשבר (השכיחות מחולקת בסך התצפיות), או במספר מופעים לגודל אוכלוסייה מתאים, למשל מספר מופעים לאלף או למיליון. דוגמה: שכיחות הגידול אינסולינומה היא בין 1 ל-4 חולים לכל מיליון איש בשנה.
השכיחות המוחלטת של אירוע הוא המספר של פעמים שהתצפית התרחשה בניסוי או במחקר.[1]
השכיחות המצטברת היא סך השכיחויות המוחלטות של כל האירועים בנקודה מסוימת או מתחתיה ברשימה מסודרת של אירועים.[1]
השכיחות היחסית (או הסתברות אמפירית (אנ')) של אירוע היא השכיחות המוחלטת המנורמלת לפי המספר הכולל של האירועים:
את הערכים של עבור כל האירועים ניתן לשרטט כדי לייצר התפלגות שכיחויות.
אם אז , ניתן להוסיף פסאודו-ספירות (אנ').
התפלגות שכיחויות (או פרוס שכיחויות) מציגה קיבוץ מסוכם של נתונים המחולקים למחלקות זרות זו לזו, ואת מספר ההתרחשויות במחלקה. זוהי דרך להציג נתונים לא מאורגנים, בעיקר להראות תוצאות של בחירות, צפיפות האנשים באזור מסוים, מכירות של מוצר בפרק זמן מסוים, סכומי הלוואות סטודנטים של בוגרים וכו'. חלק מהגרפים שניתן להשתמש בהם עם התפלגות שכיחויות הם היסטוגרמות, תרשימי קווים, תרשימי עמודות ותרשימי עוגה. התפלגויות שכיחויות משמשות הן לנתונים איכותניים והן לנתונים כמותיים.
בדרך כלל מרווח המחלקה או רוחב המחלקה זהים עבור כל המחלקות. השיעורים כולם ביחד חייבים לכסות לפחות את המרחק מהערך הנמוך ביותר (מינימום) בנתונים לערך הגבוה ביותר (המקסימלי). מרווחי מחלקות שווים עדיפים בהתפלגות השכיחויות, בעוד שרווחי מחלקות לא שווים (לדוגמה מרווחים לוגריתמיים) עשויים להיות נחוצים במצבים מסוימים על מנת ליצור פיזור טוב של תצפיות בין המחלקות ולהימנע ממספר רב של מחלקות ריקות, או כמעט ריקות.[2]
להלן כמה שיטות נפוצות לתיאור שכיחות:[3]
היסטוגרמה היא ייצוג של שכיחויות בלוח, המוצגות כמלבנים או ריבועים סמוכים (בחלק מהמצבים), המוקמים על פני אזורים נפרדים, עם שטח פרופורציונלי לתדירות התצפיות במרווח. גובהו של מלבן שווה גם לצפיפות השכיחות של המרווח, כלומר השכיחות חלקי רוחב המרווח. השטח הכולל של ההיסטוגרמה שווה למספר הנתונים. היסטוגרמה עשויה להיות גם מנורמלת המציגה שכיחויות יחסיות. לאחר מכן היא מראה את שיעור המקרים הנכללים בכל אחת מכמה קטגוריות, כאשר השטח הכולל שווה ל-1. הקטגוריות מצוינות בדרך כלל כמרווחים עוקבים, שאינם חופפים, למשתנה. הקטגוריות (מרווחים) חייבות להיות צמודות, ולעיתים קרובות הן נבחרות להיות באותו גודל.[4] המלבנים של היסטוגרמה מצוירים כך שהם נוגעים זה בזה כדי לציין שהמשתנה המקורי הוא רציף.[5]
תרשים עמודות או גרף עמודות הוא תרשים עם עמודות מלבניות עם אורכים פרופורציונליים לערכים שהם מייצגים. ניתן לשרטט את הפסים אנכית או אופקית.
טבלת שכיחויות היא טבלה שמציגה את השכיחויות של תוצאות שונות במדגם. כל רשומה בטבלה מכילה את השכיחות או המנייה של הופעתם של ערכים בתוך קבוצה או מרווח מסוימים. בדרך זו הטבלה מסכמת את ההתפלגות של הערכים במדגם.
טבלת התפלגות שכיחויות היא סידור של הערכים שמשתנה אחד או יותר מהם משתתף במדגם. כל ערך בטבלה מכיל את השכיחות או הספירה של מופעי הערכים בתוך קבוצה או מרווח מסוים, ובאופן זה, הטבלה מסכמת את התפלגות הערכים במדגם.
זוהי דוגמה לטבלת תדרים חד-משתנית (= משתנה יחיד). מתוארת השכיחות של כל תגובה לשאלת הסקר.
דַרגָה | מידת הסכמה | מספר |
---|---|---|
1 | מסכים לחלוטין | 22 |
2 | מסכים קצת | 30 |
3 | לא בטוח | 20 |
4 | לא מסכים במידת מה | 15 |
5 | מאוד לא מסכים | 15 |
סכימת טבלאות שונות אוספת ערכים לקטגוריות, כך שכל חלק מקיף טווח של ערכים. לדוגמה, ניתן לארגן את הגבהים של התלמידים בכיתה בטבלת התדירות הבאה.
טווח גובה | מספר תלמידים | מספר מצטבר |
---|---|---|
פחות מ-1.52 מטר | 25 | 25 |
1.52–1.68 מטר | 35 | 60 |
1.68–1.83 מטר | 20 | 80 |
1.53–1.98 מטר | 20 | 100 |
התפלגויות שכיחויות של משתנים דו-כיווניים מוצגות לרוב כלוח שכיחות (דו-כיווניות):
לִרְקוֹד | ספורט | טֵלֶוִיזִיָה | סך הכל | |
---|---|---|---|---|
גברים | 2 | 10 | 8 | 20 |
נשים | 16 | 6 | 8 | 30 |
סך הכל | 18 | 16 | 16 | 50 |
השורה והעמודה המסכמות מדווחות על שכיחויות השוליים או ההתפלגות השולית, בעוד גוף הטבלה מדווח על השכיחויות המשותפות.[6]
לפי פרשנות השכיחות של ההסתברות, ההנחה היא שככל שאורכה של סדרת ניסויים גדל ללא גבול, חלק מהניסויים שבהם מתרחש אירוע נתון יתקרב לערך קבוע, המכונה השכיחות היחסית המגבילה.[7][8]
פרשנות זו עומדת לעיתים קרובות בניגוד להסתברות בייסיאנית. למעשה, המונח 'פרקטיביסט' שימש לראשונה על ידי MG קנדל ב-1949, בניגוד לבייסיאנים, שאותם כינה "non-frequentists",[9][10] הוא כתב למשל:
"ניתן להבחין באופן רחב בשתי גישות עיקריות. האחת לוקחת הסתברות כ'דרגה של אמונה רציונלית', או רעיון דומה... השני מגדיר הסתברות במונחים של שכיחויות התרחשות של אירועים, או לפי פרופורציות יחסיות ב'אוכלוסיות' או 'קולקטיבים'."
— קנדל, עמ' 101
"אפשר לחשוב שההבדלים בין התדירים והלא-תדרים (אם יורשה לי לקרוא להם כאלה) נובעים במידה רבה מההבדלים בין התחומים שהם מתיימרים לכסות."
— קנדל, עמ' 104
"'אני טוען שזה לא כך'... ההבחנה המהותית בין התדירים ללא-התדירים היא, לדעתי, שהראשונים, מתוך מאמץ להימנע מכל דבר המענג עניינים של דעה, מבקשים להגדיר הסתברות במונחים של מאפיינים אובייקטיביים של אוכלוסייה, ממשית או היפותטית, ואילו האחרונים לא." [ההדגשה במקור]
— קנדל, עמ' 104
ניהול ושימוש בנתוני טבלאות שכיחות הם הרבה יותר פשוטים מאשר שימוש בנתונים גולמיים. ישנם אלגוריתמים פשוטים לחישוב חציון, ממוצע, סטיית תקן וכו' מהטבלאות הללו.
בדיקת השערות סטטיסטית מבוססת על הערכת שונות ודמיון בין התפלגויות שכיחות. הערכה זו כוללת מדדים של נטייה או ממוצעים מרכזיים, כגון ממוצע וחציון, ומדדים של שונות או פיזור סטטיסטי, כגון סטיית התקן או השונות.
נאמר כי התפלגות שכיחויות מוטה כאשר הממוצע והחציון שלה שונים באופן משמעותי, או באופן כללי יותר כאשר הוא א-סימטרי. הקורטוזיס של התפלגות שכיחות הוא מדד לשיעור הערכים הקיצוניים (חריגים), המופיעים בשני קצות ההיסטוגרמה. אם ההתפלגות נוטה יותר לחריגות מההתפלגות הנורמלית, היא נקראת לפטוקורטית ואם היא פחות נוטה לחריגים, היא נקראת פלטיקורטית.
התפלגויות שכיחות עבור אותיות משמשות גם בניתוח תדירויות לפיצוח צפנים, ומשמשות להשוואת השכיחויות היחסיות של אותיות בשפות שונות ושפות אחרות. הן משמשות לעיתים קרובות לשפות כגון יוונית, לטינית וכו'.
עיינו גם בפורטל: | |||
---|---|---|---|
פורטל מתמטיקה |
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.