איך בוחרים מבחן סטטיסטי למחקר רפואי?
בחירת מבחן סטטיסטי מתחילה בשאלה המחקרית, בסוג המשתנה המרכזי ובמבנה הנתונים. במחקר רפואי וקליני, הבחירה אינה רק טכנית. היא משפיעה על תקפות המסקנות, על תוכנית הניתוח הסטטיסטי, על חישוב גודל המדגם ולעיתים גם על ניסוח הפרוטוקול לפני הגשה לוועדת הלסינקי.
במקום לשאול רק "איזה מבחן מתאים לנתונים?", כדאי לשאול קודם: מה התוצאה המרכזית של המחקר, אילו קבוצות משווים, האם המדידות תלויות זו בזו, האם המטרה היא השוואה או ניבוי, והאם הנתונים עומדים בהנחות של המבחן.
השאלות שצריך לענות עליהן לפני בחירת המבחן
כדי לבחור מבחן סטטיסטי נכון, צריך להגדיר את מבנה המחקר לפני פתיחת התוכנה הסטטיסטית. ברוב המחקרים הרפואיים ההחלטה נשענת על כמה שאלות בסיסיות.
- מהי שאלת המחקר? האם בודקים הבדל בין קבוצות, קשר בין משתנים, שינוי לאורך זמן, גורמי סיכון או יכולת ניבוי?
- מהו ה-endpoint המרכזי? האם התוצאה היא מדד רציף, תוצאה בינארית, קטגוריה, דירוג, זמן עד אירוע או מספר אירועים?
- כמה קבוצות יש? שתי קבוצות, שלוש קבוצות או יותר, או קבוצה אחת שנמדדת במספר נקודות זמן?
- האם המדידות בלתי תלויות? למשל קבוצת טיפול מול ביקורת, או מדידות חוזרות באותם מטופלים לפני ואחרי התערבות.
- מה גודל המדגם? מדגם קטן, חוסר איזון בין קבוצות או מעט אירועים יכולים להשפיע על המבחן המתאים.
- האם יש משתנים מתערבים? גיל, מין, חומרת מחלה, טיפול קודם או גורמי רקע אחרים עשויים לחייב מודל רב משתני.
מבחנים נפוצים לפי סוג השאלה המחקרית
הטבלה הבאה אינה מחליפה תכנון סטטיסטי, אבל היא עוזרת להבין את כיוון הבחירה. בפועל, יש לבדוק גם את הנחות המבחן, מבנה הנתונים וגודל המדגם.
| סוג השאלה | דוגמה רפואית | כיוון סטטיסטי נפוץ |
|---|---|---|
| השוואת ממוצע בין שתי קבוצות בלתי תלויות | השוואת HbA1c בין קבוצת טיפול לקבוצת ביקורת | מבחן t למדגמים בלתי תלויים, או Mann-Whitney כאשר ההנחות אינן מתקיימות |
| השוואת מדד לפני ואחרי באותם מטופלים | כאב לפני ואחרי פרוצדורה באותה קבוצה | מבחן t למדגמים תלויים, או Wilcoxon למדידות תלויות |
| השוואה בין שלוש קבוצות או יותר | השוואת מדד מעבדה בין שלוש זרועות טיפול | ANOVA, או Kruskal-Wallis כאשר נדרש מבחן לא פרמטרי |
| קשר בין שני משתנים קטגוריאליים | קשר בין עישון לבין הופעת סיבוך | חי בריבוע, או Fisher exact כאשר התאים קטנים |
| קשר בין שני משתנים רציפים | קשר בין גיל לבין מדד תפקודי | מתאם Pearson או Spearman לפי סוג הקשר וההתפלגות |
| תוצאה בינארית עם כמה גורמי רקע | ניבוי הופעת סיבוך כן/לא | רגרסיה לוגיסטית |
| תוצאה רציפה עם כמה משתנים מסבירים | ניבוי ציון איכות חיים לפי גיל, טיפול וחומרת מחלה | רגרסיה ליניארית |
| זמן עד אירוע | זמן עד הישנות מחלה או אשפוז חוזר | ניתוח הישרדות, Kaplan-Meier או Cox regression לפי מטרת המחקר |
איך סוג המשתנה משפיע על הבחירה?
סוג המשתנה המרכזי הוא אחד הגורמים החשובים ביותר בבחירת מבחן סטטיסטי. משתנה רציף כמו לחץ דם, גיל או רמת המוגלובין מאפשר לרוב ניתוחים שונים ממשתנה בינארי כמו הופעת סיבוך, תמותה, אשפוז חוזר או תגובה לטיפול.
משתנים אורדינליים, כמו דירוג כאב או סולם חומרה, דורשים זהירות נוספת. אף שהם נראים מספריים, המרחק בין הדרגות לא תמיד שווה. לכן לעיתים מתאים להשתמש במבחנים לא פרמטריים או במודלים שמתאימים לסוג הסולם.
במחקר רפואי חשוב להגדיר מראש מהו המשתנה הראשי ומהם המשתנים המשניים. אם מחליפים endpoint תוך כדי ניתוח, או בוחרים מבחן רק לפי התוצאה שנראית מובהקת, עולה הסיכון למסקנות לא יציבות.
מתי משתמשים במבחן t, ANOVA או מבחנים לא פרמטריים?
מבחן t מתאים בדרך כלל להשוואת ממוצעים כאשר המשתנה התלוי רציף וההשוואה היא בין שתי קבוצות או בין שתי מדידות. ANOVA מרחיב את העיקרון למצבים שבהם יש שלוש קבוצות או יותר. אבל עצם העובדה שיש משתנה מספרי אינה מספיקה כדי לבחור אוטומטית במבחן פרמטרי.
לפני שימוש במבחן פרמטרי בודקים, בין היתר, את צורת ההתפלגות, חריגים, שונות בין קבוצות וגודל מדגם. כאשר ההנחות אינן סבירות, או כאשר מדובר במדגם קטן מאוד או משתנה אורדינלי, ייתכן שמבחן לא פרמטרי יתאים יותר.
אם הנושא הוא בדיקת התפלגות או הנחות סטטיסטיות, כדאי לקרוא גם על בדיקת התפלגות נורמלית ועל המשמעות שלה בבחירת מבחן.
מתי צריך רגרסיה ולא רק מבחן השוואה?
כאשר המחקר כולל כמה גורמי רקע או משתנים מתערבים, מבחן השוואה פשוט לא תמיד מספיק. לדוגמה, אם משווים תוצאה רפואית בין שתי קבוצות אבל הקבוצות שונות בגיל, מין או חומרת מחלה, ייתכן שצריך מודל שמאפשר התאמה לגורמים אלה.
רגרסיה ליניארית מתאימה בדרך כלל כאשר התוצאה רציפה. רגרסיה לוגיסטית מתאימה כאשר התוצאה בינארית, למשל סיבוך כן או לא. במצבים מסוימים נדרשים מודלים אחרים, כמו רגרסיה פואסונית, מודלים מעורבים או ניתוח הישרדות.
להרחבה על הבחירה בין מודלים, ראו גם את המאמר על רגרסיה ליניארית ורגרסיה לוגיסטית.
טעויות נפוצות בבחירת מבחן סטטיסטי
- בחירת מבחן אחרי שרואים את התוצאות: פעולה כזו עלולה להגדיל את הסיכון לממצא מקרי.
- התעלמות מתלות בין מדידות: למשל שימוש במבחן בלתי תלוי כאשר מדובר באותם מטופלים לפני ואחרי טיפול.
- שימוש במבחן פרמטרי בלי לבדוק הנחות: במיוחד במדגמים קטנים, נתונים מוטים או משתנים אורדינליים.
- ריבוי מבחנים ללא תכנון: בדיקות רבות מגדילות את הסיכון למובהקות מקרית ודורשות תכנון או תיקון מתאים.
- התעלמות מגודל המדגם: מבחן סטטיסטי אינו פותר בעיה של מחקר קטן מדי או חסר עוצמה.
- אי התאמה בין שאלת המחקר לניתוח: למשל שימוש בקורלציה כאשר המטרה היא ניבוי או התאמה לגורמי רקע.
איך בחירת המבחן מתחברת לפרוטוקול ולגודל המדגם?
במחקר רפואי רצוי להגדיר את המבחנים הסטטיסטיים כבר בשלב הפרוטוקול או תוכנית הניתוח הסטטיסטי. כך ניתן לוודא שהשאלה המחקרית, ה-endpoint, חישוב גודל המדגם ושיטת הניתוח מתאימים זה לזה.
לדוגמה, חישוב גודל מדגם למחקר רפואי תלוי לעיתים במבחן המתוכנן: השוואת ממוצעים, השוואת שיעורים, מתאם, רגרסיה או מודל אחר. אם המבחן משתנה לאחר איסוף הנתונים, ייתכן שגם ההצדקה למדגם כבר אינה מתאימה.
לכן בחירת המבחן אינה שלב שמומלץ להשאיר לסוף. היא חלק מתכנון המחקר, לצד כתיבת פרוטוקול מחקר, הגדרת המשתנים ותכנון איסוף הנתונים.
איך PlanetMed יכולה לעזור בבחירת המבחן?
PlanetMed מלווה רופאים וחוקרים בתכנון מחקרים רפואיים, בניתוח נתונים ובכתיבה לקראת פרסום. במסגרת ליווי מחקר קליני לרופאים ושירותי ביוסטטיסטיקה למחקרים קליניים ניתן לסייע בהגדרת שאלת המחקר, בחירת ה-endpoint, התאמת המבחן הסטטיסטי, בדיקת הנחות ובניית תוכנית ניתוח.
כאשר המחקר כבר כולל נתונים קיימים, ניתן לבחון האם מבנה הנתונים מתאים לניתוח המתוכנן, האם נדרש מודל מתקדם יותר, והאם כדאי לשנות את אופן הצגת התוצאות לפני כתיבת המאמר. במקרים כאלה, ניתוח סטטיסטי למחקרים קליניים הוא לא רק שלב חישובי, אלא חלק מהיכולת להציג מסקנות אמינות.
אם אתם מתכננים מחקר רפואי, מחקר רטרוספקטיבי, שאלון או ניתוח נתונים לקראת מאמר, כדאי להחליט על המבחן הסטטיסטי מוקדם ככל האפשר, לפני איסוף הנתונים או לפני סגירת בסיס הנתונים לניתוח.
שאלות ותשובות נפוצות
איך יודעים איזה מבחן סטטיסטי מתאים למחקר רפואי?
מתחילים מהשאלה המחקרית, ה-endpoint המרכזי, סוג המשתנה, מספר הקבוצות, תלות בין המדידות וגודל המדגם. לאחר מכן בודקים את הנחות המבחן ואת הצורך במודל רב משתני.
האם תמיד צריך לבחור בין מבחן t לבין ANOVA?
לא. מבחן t ו-ANOVA מתאימים בעיקר להשוואת ממוצעים. במחקרים עם תוצאה בינארית, משתנים קטגוריאליים, מדידות חוזרות, זמן עד אירוע או כמה משתנים מסבירים ייתכן שיידרשו מבחנים או מודלים אחרים.
מתי צריך מבחן לא פרמטרי?
מבחן לא פרמטרי עשוי להתאים כאשר המשתנה אורדינלי, כאשר ההנחות של מבחן פרמטרי אינן מתקיימות, כאשר המדגם קטן או כאשר קיימים חריגים שמשפיעים על הניתוח.
למה כדאי לבחור מבחן סטטיסטי כבר בשלב הפרוטוקול?
בחירת המבחן משפיעה על חישוב גודל המדגם, איסוף הנתונים, תוכנית הניתוח והדרך שבה יוצגו התוצאות. תכנון מוקדם מפחית טעויות ומחזק את אמינות המחקר.
האם כדאי להתייעץ עם ביוסטטיסטיקאי לפני איסוף הנתונים?
כן. במחקר רפואי מומלץ לבחור את המבחן הסטטיסטי כבר בשלב תכנון המחקר, לפני איסוף הנתונים או סגירת בסיס הנתונים. כך אפשר לוודא שהשאלה המחקרית, המשתנים, גודל המדגם ותוכנית הניתוח מתאימים זה לזה.
איך נוכל לעזור לכם?
מלאו את הפרטים ונחזור אליכם בהקדם האפשרי!