مقایسه شبکه‌های عصبی مصنوعی، درخت تصمیم، تحلیل تشخیصی و رگرسیون لوجستیک در پیش‌بینی بارداری ناخواسته در مادران مولتی‌پار شهر خرم‌آباد

نویسندگان

1 آمار زیستی گروه بهداشت عمومی، دانشکده بهداشت و تغذیه دانشگاه علوم پزشکی لرستان، خرم‌آباد، ایران

2 آمار زیستی، عضو مرکز تحقیقات پروتئومیکس، دانشکده پیراپزشکی دانشگاه علوم پزشکی شهید بهشتی، تهران، ایران

3 آمار زیستی گروه آمار زیستی، دانشکده علوم پزشکی دانشگاه تربیت مدرس، تهران، ایران

4 آمار گروه آمار، دانشکده علوم ریاضی و کامپیوتر دانشگاه صنعتی امیرکبیر، تهران، ایران

5 گروه بهداشت عمومی، دانشکده بهداشت و تغذیه دانشگاه علوم پزشکی لرستان، خرم‌آباد، ایران

6 آمار زیستی گروه آمار زیستی، دانشکده بهداشت دانشگاه علوم پزشکی ایران، تهران، ایران

چکیده

مقدمه و هدف: بارداری ناخواسته، نوعی از بارداری است که دست‌کم از نظر یکی از زوجین، ناخواسته باشد و پیامدهایی نامطلوب را برای خانواده و اجتماع به‌همراه‌دارد. در این مطالعه با استفاده از چهار مدل طبقه‌بندی، وقوع بارداری ناخواسته در جمعیت شهری خرم‌آباد پیش‌بینی‌شد و مدل‌ها مورد مقایسه قرارگرفتند.

مواد و روش‌ها: در این مطالعه مقطعی، 467 نفر از مادران باردار مولتی‌پار مراجعه‌کننده به مراکز بهداشتی- درمانی خرم‌آباد در سال1390 با روش نمونه‌گیری طبقه‌ای و خوشه‌ای انتخاب‌شده، متغیرهای مرتبط اندازه‌گیری‌شدند. در مدل‌بندی داده‌ها از مدل رگرسیون لوجستیک، تحلیل تشخیصی، درخت تصمیم‌گیری و شبکه‌های عصبی پرسپترون سه‌لایه و نرم‌افزار SPSS و MATLAB استفاده‌شد؛ برای مقایسه این مدل‌ها، شاخص‌های حساسیت، ویژگی، سطح زیر منحنی مشخصه و میزان پیش‌بینی صحیح به‌کارگرفته‌شدند.

نتایج: شیوع بارداری ناخواسته، 3/32 درصد بود. عملکرد مدل‌ها براساس شاخص سطح زیر منحنی مشخصه به‌ترتیب عبارت‌بود: از شبکه‌های عصبی مصنوعی (741/0)، درخت تصمیم‌گیری (731/0)، رگرسیون لوجستیک (712/0) و تحلیل تشخیصی (711/0). بیشترین درصد حساسیت به مدل درخت تصمیم‌گیری (5/73 درصد) و بیشترین میزان ویژگی به شبکه عصبی مصنوعی (3/62 درصد)، مربوط بوده‌است.

نتیجه‌گیری: با توجه به شیوع به‌نسبت بالای بارداری ناخواسته در شهر خرم‌آباد، لزوم بازنگری در برنامه‌های تنظیم خانواده، محسوس است. به‌رغم تشابه نسبی روش‌های یادشده، اگر توان پیشگویی بالاتر مدل، مدنظر محقق باشد، مدل شبکه‌های عصبی و اگرتفسیرپذیری بهتر نتایج، مدنظر باشد، استفاده از درخت تصمیم‌گیری و رگرسیون لوجستیک توصیه‌می‌شوند.

کلیدواژه‌ها


عنوان مقاله [English]

Comparison of neural networks, decision trees, discriminant analysis and logistic regression for predicting unwanted pregnancy of multiparous women in Khorramabad

چکیده [English]

Background and Objective: Unwanted pregnancy is a pregnancy that is considered to be unwanted by at least one member of the couple, and has adverse consequences for the family and community. Using four classification models, this study predicted unwanted pregnancy in the urban population of Khorramabad and compared these classification models.

Materials and methods: In this cross-sectional study, 467 multiparous pregnant women attending the urban health care centers of Khorramabad in 2011 were selected using stratified and cluster sampling and risk factors were collected. The logistic regression model, discriminant analysis, decision trees, andCART artificial neural networks, along with the SPSS and MATLAB software were applied in data modeling. The indices of sensitivity, specificity, area under the ROC curve, and accuracy rate were applied to compare the models.

Results: The prevalence of unwanted pregnancy was 32.3%. Based on the index of area under the ROC curve,ROC the best models were artificial neural networks (0.741), decision tree (0.731), logistic regression (0.712) and discriminant analysis (0.711). The highest. sensitivity was found for decision tree model (73.5%), and the highest specificity was for artificial neural network (62.3%).

Conclusion: Given the relatively high prevalence of unwanted pregnancy in Khorramabad, the revision of the family planning programs seems to be inevitable. Moreover, in selecting the best classification method, decision tree and logistic regression are recommended when the researcher is interested in better interpretability of the results, and the model of neural networks is recommended when a higher prediction power is intended.

کلیدواژه‌ها [English]

  • Neural networks
  • Decision Tree
  • Logistic regression
  • Discriminant analysis
  • Multiparous women