چند رویکرد برخورد با مقادیر گمشده‌ متغیرهای کمی و بررسی اثر آنها بر نتایج حاصل از یک کارآزمایی‌ بالینی

نویسندگان

1 گروه علوم پایه، دانشکده علوم توانبخشی دانشگاه علوم پزشکی شهید بهشتی، تهران، ایران

2 آمار زیستی گروه آمار زیستی، دانشکده پیراپزشکی دانشگاه علوم پزشکی شهید بهشتی، تهران، ایران

3 گروه فیزیوتراپی، دانشکده علوم توانبخشی دانشگاه علوم پزشکی شهید بهشتی، تهران، ایران

4 گروه آمار زیستی، دانشکده پیراپزشکی دانشگاه علوم پزشکی شهید بهشتی، تهران، ایران

5 فیزیوتراپی، دانشکده علوم توانبخشی دانشگاه علوم پزشکی شهید بهشتی، تهران، ایران

چکیده

مقدمه و هدف: چالشی اساسی که‌ مطالعات طولی را تحت تأثیر قرارمی‌دهد، مسئله‌ گمشدگی در داده‌هاست. گمشدگی در داده‌ها ممکن است به ازدست‌رفتن بخشی از اطلاعات منجرشود که این امر، باعث کاهش دقت برآوردگرها و دست‌یافتن به نتایج اریب و نادرست می‌‌شود لذا ضروری است تا ابتدا داده‌های حاصل از تحقیق‌های طولی از نظر ساختار گمشدگی ارزیابی‌شده، با درنظرگرفتن این نکته، تحلیلی مناسب با یا بدون جانهی روی داده‌ها انجام‌شود.
هدف از این پژوهش، شناسایی سازوکار گمشدگی موجود در داده‌های حاصل از کارآزمایی بالینی مربوط به اثربخشی دیسترکشن مفصلی به روش غیرجراحی در بهبود عملکرد بیماران مبتلا به استئوآرتریت شدید زانو و همچنین بررسی اثر استفاده از رویکردهای مختلف مواجهه با گمشدگی، بر نتایج حاصل از تحلیل این داده‌هاست.

مواد روش‌ها: به‌منظور به‌دست‌آوردن نتایج معتبر در تحلیل داده‌های مرتبط با مطالعات کارآزمایی بالینی طولی که شامل مقادیر گمشده هستند، رویکردهای مختلف برخورد با این‌گونه داده‌ها، ازجمله روش داده‌های کامل، روش داده‌های دردسترس، روش LOCF، روش مبتنی‌بر مدل پیش‌بینی‌کننده و روش‌های جانهی چندگانه‌ ازقبیل روش نمره تمایل (propensity score) و روش تطابق میانگین پیش‌بینی‌کننده (Predictive mean matching method) وجوددارند؛ این روش‌ها در داده‌های حاصل از کارآزمایی بالینی مربوط به اثربخشی دیسترکشن مفصلی به روش غیرجراحی که از دو روش فیزیوتراپی و فیزیوتراپی به‌علاوه دیسترکشن مفصلی، در بهبود عملکرد بیماران مبتلا به استئوآرتریت شدید زانو در سه زمان ابتدای مداخله، انتهای مداخله و یک ماه پس از آن حاصل‌شده‌است، مورد استفاده قرارگرفته، نتایج حاصل از آنها با یکدیگر مقایسه‌شدند. از نرم‌افزار 9.1 SAS برای برازش مدل حاشیه‌ای (marginal model) و از نرم‌افزار 4 SOLAS برای جانهی داده‌ها استفاده‌شد.

نتایج: با استفاده از رویکرد داده‌های کامل، داده‌های دردسترس و جانهی LOCF، اثر زمان معنی‌دار شد. هر سه روش جانهی چندگانه، نتایجی یکسان داشتند. در هیچ‌یک از رویکردهای مورد استفاده، اثر گروه درمانی، معنادار نشد اگرچه تفاوت‌هایی فاحش در طول فواصل اطمینان و ضرایب مدل وجودداشت.

نتیجه‌گیری: با توجه به ساختار گمشدگی داده‌ها و نتایج به‌دست‌آمده از مؤلفه‌های (پارامترهای) خطای معیار، ضرایب مدل و طول بازه اطمینان، استفاده از نتایج رویکردهای جانهی چندگانه مناسب‌تر بوده، روش جانهی LOCF برای داده‌های طولی مداخله‌ای مناسب نیست.

کلیدواژه‌ها


عنوان مقاله [English]

Different approaches to dealing with missing values in quantitative variables and survey of their effects on the results of a clinical trial

چکیده [English]

Background and Objectives: A major challenge that affects the longitudinal studies is the problem of missing data. Missing in the data may result in the loss of part of the information which reduces the accuracy of the estimator and obtain the results will be biased and inaccurate. Therefore, it is necessary to evaluate the missing data mechanism from a longitudinal research and to consider this fact, an analysis should be performed on the data with or without imputation. The purpose of this study was to identify the Missing data mechanism from a clinical trial Related to the efficacy of non-surgical method of joint distraction in improving performance in patients with severe knee osteoarthritis, and the effect of different approaches to dealing with the missing on the results the analysis of this data set.

Methods: In order to obtain reliable results in the analysis of the data associated with the longitudinal clinical studies involving missing values, there are different approaches for dealing with such data, including complete case data approach, available data, LOCF and multiple imputation methods such as predictive model based method, propensity score method (propensity score) and predictive mean matching method (Predictive mean matching method). This approaches were used on the data obtained from clinical trial of the effectiveness of non-surgical joint distraction by two methods physiotherapy and joint distraction in addition to physiotherapy in improving patients performance with severe knee osteoarthritis were measured in three times, beginning of treatment, end of treatment and one month later and the results were compared. SAS 9.1 software was applied for fitting the marginal model and SOLAS software version 4 for missing data imputation.

Results: By using the complete data, available data and LOCF imputation approaches time effect was significant. All the three multiple imputation methods had the same results. In none of the approaches used, the effect of treatment group was not significant, although there were significant differences in the length of confidence intervals and coefficients of the model.

Conclusion: According to the missing data mechanism and results obtained from coefficients of the model, standard errors and confidence interval length, to use of multiple imputation approach in the data is more appropriate and LOCF imputation method is not appropriate for interventional longitudinal data.

کلیدواژه‌ها [English]

  • Randomized clinical trials
  • longitudinal study
  • Multiple imputation