مقایسه نتایج خوشه‌بندی سلسله مراتبی و غیرسلسله مراتبی پروتئین‌های مرتبط با سرطان‌های مری، معده و کلون براساس تشابهات تفسیر هستی‌شناسی ژنی

نویسندگان

چکیده

  مقدمه و هدف: به کارگیری روش های پروتئومیک و پیشرفت پژوهش های با توان بالای پروتئین ها زمینه ساز نیاز به روش های تازه در تحلیل های بیوانفورماتیک نتایج آزمایشگاهی-شده است. تحلیل خوشه ای، روش آماری مناسبی است که می تواند در تحلیل این گونه داده ها، استفاده شود. هدف از این پژوهش، ارزیابی کارایی روش خوشه بندی فازی در تحلیل پروتئین های مرتبط با سرطان های دستگاه گوارش بوده است.     مواد و روش ها: در این پژوهش، پروتئین های شناسایی شده مرتبط با سرطان های مری، معده و کلون با استفاده از روش های خوشه بندی سلسله مراتبی و غیرسلسله مراتبی تحلیل و بررسی شدند. براساس هر یک از ابعاد هستی شناسی ژنی، پروتئین ها را خوشه بندی کرده، نتایج را با یکدیگر مقایسه کردیم.     یافته ها: نتایج به دست آمده نشان داد، عملکرد دو روش خوشه بندی سلسله مراتبی و تقسیم-بندی به یکدیگر نزدیک بوده است. با وجود چشمگیر نبودن عرض سایه نمای کل خوشه بندی ها، بیشتر پروتئین های در هر خوشه، دارای اشتراکات بیولوژیکی قابل توجهی هستند. نتایج به-دست آمده نشان می دهد، روش های خوشه بندی توانسته اند الگوهای تفسیری جدیدی را که قبل از خوشه بندی پروتئین ها مشخص نشده بودند، آشکار سازند.     نتیجه گیری: با بررسی نتایج حاصل از خوشه بندی PAM و خوشه بندی سلسله مراتبی، مشخص شد، نتایج این دو خوشه بندی بسیار مشابه یکدیگر هستند. شاید بتوان گفت، روش PAM به دلیل معرفی نماینده ای برای هر خوشه، موشکافانه تر عمل کرده، در حالی که روش سلسله مراتبی ساده تر بوده است. همچنین به نظر می رسد، پروتئین هایی که براساس تشابهات جایگاه سلولی در کنار یکدیگر قرار می گیرند، دارای تشابهات بیولوژیکی و عملکردی نیز هستند که باید این مسئله بیشتر بررسی شود.

کلیدواژه‌ها


عنوان مقاله [English]

Comparison of the results of hierarchical and non-hierarchical clustering of proteins associated with cancers of esophagus, stomach and colon via similarity of gene ontology annotation

نویسندگان [English]

  • hamid alavimajd
  • yalda zarnegarnia
  • mostafa rezaei tayervani
  • nasibe khayer
  • aliakbar khadem maaboodi
چکیده [English]

Background and Objective: Using proteomic methodologies and advent of high-throughput (HTP) investigation of proteins has created a need for new approaches in bioinformatics analysis of experimental results. Cluster analysis is a suitable statistical procedure that can be useful for analyzing these data sets.   Materials and Methods: In this research study, the identified proteins associated with esophagus, stomach and colon cancers were analyzed with the hierarchical and non-hierarchical clustering procedures. Proteins were clustered for three aspects of gene ontology and results were compared. Results: Despite non-substantial silhouette widths for the entire dataset, most of the proteins in each cluster have remarkable biological comm::union::s. According to the results, it was evident that clustering methods can reveal novel annotation patterns within dataset that would not have been identified otherwise.   Conclusion: Considering hierarchical and non-hierarchical clustering, results show that the clustering methods have similar results. Maybe we can say because of the introducing representative proteins for each cluster, the partitioning method operating with the greatest nicety while AGNES procedure is simpler. Furthermore, it was clear that the proteins were clustered via their cellular component similarities have also biological and functional similarities which this requires more researches

کلیدواژه‌ها [English]

  • Bioinformatics
  • Gene Ontology annotation
  • Clustering
  • Gastrointestinal system cancers