בדיקת התפלגות נורמלית, או בדיקת התפלגות גאוסיאנית, היא שלב חשוב לפני שימוש במבחנים סטטיסטיים פרמטריים כמו מבחן t, ANOVA או מודלים מסוימים של רגרסיה. במחקר רפואי, הבדיקה אינה רק פעולה טכנית בתוכנה סטטיסטית. היא חלק מהשאלה האם שיטת הניתוח מתאימה למבנה הנתונים, לגודל המדגם ולמסקנות שרוצים להסיק.
כאשר הנתונים אינם מתפלגים נורמלית, לא תמיד המשמעות היא שהמחקר נכשל או שחייבים לוותר על הניתוח. לעיתים אפשר להשתמש במבחן לא פרמטרי, לבצע טרנספורמציה, לבחור מודל מתאים יותר או להציג את הנתונים בצורה אחרת. ההחלטה צריכה להיעשות לפי שאלת המחקר, סוג המשתנה, מספר התצפיות והמשמעות הקלינית של התוצאה.
התפלגות נורמלית, המכונה גם התפלגות גאוסיאנית או Gaussian distribution, היא התפלגות סימטרית בצורת פעמון. ברוב המקרים הערכים מתרכזים סביב הממוצע, וחלק קטן יותר של הערכים נמצא בקצוות ההתפלגות. במונחים פשוטים, רוב המדידות קרובות למרכז, ומעט מדידות רחוקות ממנו.
במחקרים רפואיים, משתנים כמו לחץ דם, מדדי מעבדה, ציוני שאלונים או מדדים פיזיולוגיים עשויים להתקרב להתפלגות נורמלית, אך לא תמיד. לעיתים הנתונים מוטים, כוללים חריגים, מוגבלים בטווח מסוים או מתפלגים באופן שאינו מתאים להנחות של מבחן פרמטרי.
בדיקת נורמליות עוזרת להחליט האם אפשר להשתמש במבחן פרמטרי, או האם נכון יותר לבחור שיטה אחרת. מבחנים פרמטריים מניחים בדרך כלל מבנה נתונים מסוים, ולעיתים גם נורמליות של המשתנה או של שאריות המודל. כאשר ההנחות אינן מתקיימות, התוצאה הסטטיסטית עלולה להיות פחות אמינה.
עם זאת, חשוב לא לפרש בדיקת נורמליות בצורה מכנית מדי. במדגם גדול מאוד גם סטייה קטנה מנורמליות עשויה לצאת מובהקת, ובמדגם קטן מאוד בדיקה פורמלית עלולה לא לזהות בעיה אמיתית. לכן משלבים בין מבחנים סטטיסטיים, גרפים, היכרות עם הנתונים והבנה של מטרת המחקר.
אם המטרה היא לבחור את המבחן המתאים למחקר, כדאי לקרוא גם את המדריך על באיזה מבחן סטטיסטי להשתמש במחקר רפואי.
בדיקת נורמליות נעשית בדרך כלל בשילוב של כמה כלים. אין כלי אחד שמספיק לכל מצב, ולכן מומלץ לבדוק גם את צורת ההתפלגות וגם את ההקשר המחקרי.
היסטוגרמה מאפשרת לראות האם הנתונים מתרכזים סביב המרכז והאם צורת ההתפלגות סימטרית. בנוסף, Q-Q plot יכול לעזור להבין האם הערכים מתיישרים בקירוב עם מה שהיינו מצפים מהתפלגות נורמלית. גרפים חשובים במיוחד כי הם חושפים חריגים, זנבות ארוכים או הטיה שאינה תמיד ברורה ממבחן פורמלי בלבד.
מבחנים כמו Shapiro-Wilk או Kolmogorov-Smirnov בודקים האם קיימת סטייה מובהקת מהתפלגות נורמלית. כאשר ערך ה-p קטן מ-0.05, בדרך כלל מפרשים זאת כעדות לכך שהנתונים אינם מתפלגים נורמלית. אבל יש לפרש את התוצאה בזהירות, במיוחד במדגמים קטנים מאוד או גדולים מאוד.
מדדי skewness ו-kurtosis יכולים להראות האם ההתפלגות מוטה או האם היא חדה או שטוחה יחסית להתפלגות נורמלית. הם שימושיים כחלק מתיאור הנתונים, אך אינם מחליפים בחירה מושכלת של שיטת הניתוח.
ב-SPSS ניתן לבדוק נורמליות בכמה דרכים. אחת הדרכים המקובלות היא דרך Analyze, לאחר מכן Descriptive Statistics ואז Explore. שם ניתן לבחור את המשתנה, להציג היסטוגרמה, Q-Q plot ומבחני נורמליות. בחלק מהגרסאות ניתן לבצע גם בדיקות דרך Nonparametric Tests.
בפלט חשוב להסתכל לא רק על ערך ה-p. כדאי לבדוק את הגרפים, את מספר התצפיות, את קיום החריגים ואת השאלה המחקרית. לדוגמה, במחקר עם מדגם קטן מאוד ייתכן שהגרף יראה הטיה ברורה גם אם המבחן הפורמלי אינו מובהק.
כאשר הניתוח מתבצע כחלק ממחקר רפואי רחב יותר, בדיקת הנורמליות צריכה להשתלב בתוכנית הניתוח ולא להיעשות רק אחרי קבלת תוצאה לא צפויה.
כאשר הנתונים אינם נורמליים, יש כמה אפשרויות פעולה. הבחירה תלויה בסוג המשתנה, במטרת הניתוח, בגודל המדגם ובשאלה האם הבעיה היא חריגים, הטיה, מדגם קטן או מבנה נתונים שאינו מתאים למבחן שנבחר.
הנחת הנורמליות אינה מנותקת מתכנון המחקר. כבר בשלב הפרוטוקול כדאי להגדיר מהו המשתנה המרכזי, כיצד הוא יימדד, איזה מבחן סטטיסטי מתוכנן ומה יקרה אם ההנחות לא יתקיימו. כך ניתן להימנע מהחלטות מאוחרות שמושפעות מהתוצאה עצמה.
גם חישוב גודל מדגם למחקר רפואי קשור להנחות הסטטיסטיות. אם החישוב מבוסס על השוואת ממוצעים, אך בפועל הנתונים צפויים להיות מוטים או אורדינליים, ייתכן שצריך לתכנן אחרת את הניתוח או את איסוף הנתונים.
בשלב כתיבת פרוטוקול מחקר, כדאי להגדיר מראש את שיטת בדיקת ההנחות, את המבחנים החלופיים ואת אופן הדיווח. זה מחזק את שקיפות המחקר ומקל על מעבר לשלב הניתוח והכתיבה.
PlanetMed מלווה רופאים וחוקרים בתכנון מחקר, ניתוח נתונים וכתיבה מדעית. במסגרת שירותי ביוסטטיסטיקה למחקרים קליניים ניתן לסייע בבחירת שיטת הניתוח, בדיקת הנחות סטטיסטיות, פרשנות תוצאות והצגת הנתונים באופן שמתאים למחקר רפואי.
המטרה אינה רק לבדוק אם הנתונים נורמליים, אלא להבין מה המשמעות של מבנה הנתונים עבור המחקר: איזה מבחן מתאים, איך לדווח את התוצאות, האם יש צורך במודל אחר, ואיך לחבר את הניתוח לכתיבת המאמר.
אם המחקר נמצא בשלב תכנון, איסוף נתונים, ניתוח או כתיבה, אפשר לשלב את בדיקת הנורמליות כחלק מתהליך רחב יותר של ליווי מחקר קליני לרופאים וכתיבת מאמר רפואי לאחר ניתוח הנתונים.
לא בכל מצב, אבל כאשר מתכננים להשתמש במבחנים פרמטריים או במודלים שמניחים מבנה נתונים מסוים, חשוב לבדוק את ההנחות הרלוונטיות כחלק מתוכנית הניתוח.
אפשר לשקול מבחן לא פרמטרי, טרנספורמציה, מודל מתאים יותר או דיווח תיאורי אחר. הבחירה תלויה בשאלת המחקר, בסוג המשתנה ובגודל המדגם.
לא בהכרח. צריך לפרש את התוצאה יחד עם גרפים, גודל המדגם, חריגים ומבנה המחקר. לעיתים סטייה קטנה אינה משנה את ההחלטה, ולעיתים נדרשת שיטה אחרת.
במחקר רפואי מסודר כדאי להגדיר מראש כיצד ייבדקו הנחות סטטיסטיות ומה תהיה החלופה אם הן לא יתקיימו. זה מחזק את שקיפות הניתוח ואת אמינות הדיווח.