בדיקת התפלגות נורמלית במחקר רפואי
בדיקת התפלגות נורמלית, או בדיקת התפלגות גאוסיאנית, היא שלב חשוב לפני שימוש במבחנים סטטיסטיים פרמטריים כמו מבחן t, ANOVA או מודלים מסוימים של רגרסיה. במחקר רפואי, הבדיקה אינה רק פעולה טכנית בתוכנה סטטיסטית. היא חלק מהשאלה האם שיטת הניתוח מתאימה למבנה הנתונים, לגודל המדגם ולמסקנות שרוצים להסיק.
כאשר הנתונים אינם מתפלגים נורמלית, לא תמיד המשמעות היא שהמחקר נכשל או שחייבים לוותר על הניתוח. לעיתים אפשר להשתמש במבחן לא פרמטרי, לבצע טרנספורמציה, לבחור מודל מתאים יותר או להציג את הנתונים בצורה אחרת. ההחלטה צריכה להיעשות לפי שאלת המחקר, סוג המשתנה, מספר התצפיות והמשמעות הקלינית של התוצאה.
מהי התפלגות נורמלית או התפלגות גאוסיאנית?
התפלגות נורמלית, המכונה גם התפלגות גאוסיאנית או Gaussian distribution, היא התפלגות סימטרית בצורת פעמון. ברוב המקרים הערכים מתרכזים סביב הממוצע, וחלק קטן יותר של הערכים נמצא בקצוות ההתפלגות. במונחים פשוטים, רוב המדידות קרובות למרכז, ומעט מדידות רחוקות ממנו.
במחקרים רפואיים, משתנים כמו לחץ דם, מדדי מעבדה, ציוני שאלונים או מדדים פיזיולוגיים עשויים להתקרב להתפלגות נורמלית, אך לא תמיד. לעיתים הנתונים מוטים, כוללים חריגים, מוגבלים בטווח מסוים או מתפלגים באופן שאינו מתאים להנחות של מבחן פרמטרי.
למה חשוב לבדוק נורמליות לפני ניתוח סטטיסטי?
בדיקת נורמליות עוזרת להחליט האם אפשר להשתמש במבחן פרמטרי, או האם נכון יותר לבחור שיטה אחרת. מבחנים פרמטריים מניחים בדרך כלל מבנה נתונים מסוים, ולעיתים גם נורמליות של המשתנה או של שאריות המודל. כאשר ההנחות אינן מתקיימות, התוצאה הסטטיסטית עלולה להיות פחות אמינה.
עם זאת, חשוב לא לפרש בדיקת נורמליות בצורה מכנית מדי. במדגם גדול מאוד גם סטייה קטנה מנורמליות עשויה לצאת מובהקת, ובמדגם קטן מאוד בדיקה פורמלית עלולה לא לזהות בעיה אמיתית. לכן משלבים בין מבחנים סטטיסטיים, גרפים, היכרות עם הנתונים והבנה של מטרת המחקר.
אם המטרה היא לבחור את המבחן המתאים למחקר, כדאי לקרוא גם את המדריך על באיזה מבחן סטטיסטי להשתמש במחקר רפואי.
איך בודקים התפלגות נורמלית?
בדיקת נורמליות נעשית בדרך כלל בשילוב של כמה כלים. אין כלי אחד שמספיק לכל מצב, ולכן מומלץ לבדוק גם את צורת ההתפלגות וגם את ההקשר המחקרי.
בדיקה גרפית
היסטוגרמה מאפשרת לראות האם הנתונים מתרכזים סביב המרכז והאם צורת ההתפלגות סימטרית. בנוסף, Q-Q plot יכול לעזור להבין האם הערכים מתיישרים בקירוב עם מה שהיינו מצפים מהתפלגות נורמלית. גרפים חשובים במיוחד כי הם חושפים חריגים, זנבות ארוכים או הטיה שאינה תמיד ברורה ממבחן פורמלי בלבד.
מבחנים סטטיסטיים לנורמליות
מבחנים כמו Shapiro-Wilk או Kolmogorov-Smirnov בודקים האם קיימת סטייה מובהקת מהתפלגות נורמלית. כאשר ערך ה-p קטן מ-0.05, בדרך כלל מפרשים זאת כעדות לכך שהנתונים אינם מתפלגים נורמלית. אבל יש לפרש את התוצאה בזהירות, במיוחד במדגמים קטנים מאוד או גדולים מאוד.
מדדי skewness ו-kurtosis
מדדי skewness ו-kurtosis יכולים להראות האם ההתפלגות מוטה או האם היא חדה או שטוחה יחסית להתפלגות נורמלית. הם שימושיים כחלק מתיאור הנתונים, אך אינם מחליפים בחירה מושכלת של שיטת הניתוח.
איך בודקים נורמליות ב-SPSS?
ב-SPSS ניתן לבדוק נורמליות בכמה דרכים. אחת הדרכים המקובלות היא דרך Analyze, לאחר מכן Descriptive Statistics ואז Explore. שם ניתן לבחור את המשתנה, להציג היסטוגרמה, Q-Q plot ומבחני נורמליות. בחלק מהגרסאות ניתן לבצע גם בדיקות דרך Nonparametric Tests.
בפלט חשוב להסתכל לא רק על ערך ה-p. כדאי לבדוק את הגרפים, את מספר התצפיות, את קיום החריגים ואת השאלה המחקרית. לדוגמה, במחקר עם מדגם קטן מאוד ייתכן שהגרף יראה הטיה ברורה גם אם המבחן הפורמלי אינו מובהק.
כאשר הניתוח מתבצע כחלק ממחקר רפואי רחב יותר, בדיקת הנורמליות צריכה להשתלב בתוכנית הניתוח ולא להיעשות רק אחרי קבלת תוצאה לא צפויה.
מה עושים אם הנתונים אינם מתפלגים נורמלית?
כאשר הנתונים אינם נורמליים, יש כמה אפשרויות פעולה. הבחירה תלויה בסוג המשתנה, במטרת הניתוח, בגודל המדגם ובשאלה האם הבעיה היא חריגים, הטיה, מדגם קטן או מבנה נתונים שאינו מתאים למבחן שנבחר.
- שימוש במבחן לא פרמטרי: לדוגמה Mann-Whitney, Wilcoxon או Kruskal-Wallis, בהתאם למבנה המחקר.
- טרנספורמציה של המשתנה: למשל Log transformation, כאשר הדבר מתאים מבחינה מתודולוגית וניתן לפרש את התוצאה.
- בחירת מודל מתאים יותר: למשל רגרסיה לוגיסטית לתוצאה בינארית או מודלים אחרים כאשר המשתנה אינו רציף נורמלי.
- דיווח תיאורי מתאים: לעיתים נכון לדווח median ו-IQR במקום mean ו-standard deviation.
- בדיקת חריגים ואיכות נתונים: לפני שינוי שיטת הניתוח, יש לוודא שאין טעויות קידוד, ערכים בלתי אפשריים או נתונים חסרים שמשפיעים על ההתפלגות.
איך נורמליות מתחברת לגודל מדגם ולפרוטוקול?
הנחת הנורמליות אינה מנותקת מתכנון המחקר. כבר בשלב הפרוטוקול כדאי להגדיר מהו המשתנה המרכזי, כיצד הוא יימדד, איזה מבחן סטטיסטי מתוכנן ומה יקרה אם ההנחות לא יתקיימו. כך ניתן להימנע מהחלטות מאוחרות שמושפעות מהתוצאה עצמה.
גם חישוב גודל מדגם למחקר רפואי קשור להנחות הסטטיסטיות. אם החישוב מבוסס על השוואת ממוצעים, אך בפועל הנתונים צפויים להיות מוטים או אורדינליים, ייתכן שצריך לתכנן אחרת את הניתוח או את איסוף הנתונים.
בשלב כתיבת פרוטוקול מחקר, כדאי להגדיר מראש את שיטת בדיקת ההנחות, את המבחנים החלופיים ואת אופן הדיווח. זה מחזק את שקיפות המחקר ומקל על מעבר לשלב הניתוח והכתיבה.
טעויות נפוצות בבדיקת התפלגות נורמלית
- להסתמך רק על ערך p: בדיקה פורמלית לבדה אינה מספיקה, במיוחד במדגמים קיצוניים בגודלם.
- לבדוק נורמליות אחרי בחירת המבחן בלבד: ההנחות צריכות להיות חלק מתוכנית הניתוח מראש.
- להתעלם מחריגים: ערך חריג אחד יכול לשנות את צורת ההתפלגות ואת המסקנות.
- להניח שכל משתנה רציף חייב להיות נורמלי: יש מצבים שבהם המודל או שאריות המודל חשובים יותר מההתפלגות הגולמית.
- לבצע טרנספורמציה בלי לחשוב על פרשנות: שינוי מתמטי יכול לעזור, אבל הוא חייב להיות ניתן להסבר בדיווח המחקרי.
איך PlanetMed יכולה לעזור?
PlanetMed מלווה רופאים וחוקרים בתכנון מחקר, ניתוח נתונים וכתיבה מדעית. במסגרת שירותי ביוסטטיסטיקה למחקרים קליניים ניתן לסייע בבחירת שיטת הניתוח, בדיקת הנחות סטטיסטיות, פרשנות תוצאות והצגת הנתונים באופן שמתאים למחקר רפואי.
המטרה אינה רק לבדוק אם הנתונים נורמליים, אלא להבין מה המשמעות של מבנה הנתונים עבור המחקר: איזה מבחן מתאים, איך לדווח את התוצאות, האם יש צורך במודל אחר, ואיך לחבר את הניתוח לכתיבת המאמר.
אם המחקר נמצא בשלב תכנון, איסוף נתונים, ניתוח או כתיבה, אפשר לשלב את בדיקת הנורמליות כחלק מתהליך רחב יותר של ליווי מחקר קליני לרופאים וכתיבת מאמר רפואי לאחר ניתוח הנתונים.
להמשך תכנון הניתוח הסטטיסטי
אם אתם בודקים הנחות סטטיסטיות לקראת מחקר רפואי, כדאי להמשיך מכאן לעמודים הרלוונטיים באתר:
שאלות ותשובות נפוצות
האם חייבים לבדוק נורמליות בכל מחקר רפואי?
לא בכל מצב, אבל כאשר מתכננים להשתמש במבחנים פרמטריים או במודלים שמניחים מבנה נתונים מסוים, חשוב לבדוק את ההנחות הרלוונטיות כחלק מתוכנית הניתוח.
מה עושים אם הנתונים לא מתפלגים נורמלית?
אפשר לשקול מבחן לא פרמטרי, טרנספורמציה, מודל מתאים יותר או דיווח תיאורי אחר. הבחירה תלויה בשאלת המחקר, בסוג המשתנה ובגודל המדגם.
האם ערך p קטן מ-0.05 אומר שאי אפשר להשתמש במבחן t או ANOVA?
לא בהכרח. צריך לפרש את התוצאה יחד עם גרפים, גודל המדגם, חריגים ומבנה המחקר. לעיתים סטייה קטנה אינה משנה את ההחלטה, ולעיתים נדרשת שיטה אחרת.
האם בדיקת נורמליות צריכה להופיע בפרוטוקול המחקר?
במחקר רפואי מסודר כדאי להגדיר מראש כיצד ייבדקו הנחות סטטיסטיות ומה תהיה החלופה אם הן לא יתקיימו. זה מחזק את שקיפות הניתוח ואת אמינות הדיווח.
איך נוכל לעזור לכם?
מלאו את הפרטים ונחזור אליכם בהקדם האפשרי!