به کارگیری خوشه‌بندی دوبعدی با روش «زیرماتریس‌های با میانگین- درایه‌های بزرگ» در داده‌های بیان ژنی حاصل از ریزآرایه‌های DNA

نویسندگان

1 گروه آمار زیستی دانشکده پیراپزشکی دانشگاه علوم پزشکی شهید بهشتی

2 دانشکده پیراپزشکی دانشگاه علوم پزشکی شهید بهشتی

3 گروه علوم پایه دانشکده پیراپزشکی دانشگاه علوم پزشکی شهید بهشتی

چکیده

مقدمه و هدف: در سال‌های اخیر، فناوری ریزآرایه‌ی DNA نقش اساسی در تحقیقات ژنومی داشته‌­است. با استفاده از این فناوری که امکان آنالیز هم­زمان سطوح بیان هزاران ژن را در شرایط مختلف فراهم­آورده­است، به حجم انبوهی از داده‌ها دست­می‌یابیم. روش‌های کلاسیک خوشه‌بندی نظیر روش‌های سلسله‌مراتبی و غیرسلسله‌مراتبی، روش‌هایی مناسب برای تحلیل این­گونه داده‌ها هستند اما محدودیت‌هایی نیز دارند. در این روش‌ها فرض بر آن است که یک ژن یا یک شرایط آزمایشی را تنها می‌توان به یک خوشه منتسب­کرد و یک ژن، متعلق به گروهی از ژن‌هاست که با هم، تحت همه‌ شرایط آزمایشی تنظیم می‌شوند. بنابراین به­منظور رفع این کاستی‌ها از روش‌های خوشه‌بندی دوبعدی استفاده­می‌شود. هدف از این پژوهش، بررسی کارآیی یک روش خوشه‌بندی دو­بعدی در تحلیل داده‌های بیان ژنی مخمر است.   مواد و روش‌ها: در این پژوهش، داده‌های بیان ژنی مخمرِ Saccharomyces cerevisiae گسچ و همکاران (2000) با استفاده از روش خوشه‌بندی دوبعدی (LAS Large Average Submatrices) تحلیل­شده­اند. مجموعه‌ داده‌ها، 173 شرایط آزمایشی مختلف و مجموعه‌ای از 2993 ژن را در­بر­گرفته و برای تحلیل داده‌ها از نرم‌افزارهای LAS، JMP < /span> و  GOAL استفاده­شده­است.  نتایج: نتایج نشان­داد که روش LAS قادر است خوشه‌های دوبعدی مناسبی از دیدگاه آماری و زیست‌شناسی تولید­کند.  نتیجه‌گیری: این مطالعه نشان‌­می‌دهد که می‌توان با استفاده از روش LAS، زیرمجموعه‌هایی از ژن‌ها را با الگوهای بیان مشابه در زیرمجموعه‌ای از شرایط آزمایشی شناسایی­کرد که از نظر زیست‌شناسی معنی‌دارند.

کلیدواژه‌ها


عنوان مقاله [English]

Biclustering of DNA microarray gene expression data by Large Average Submatrices Method

نویسندگان [English]

  • Hamid Alavi Majd 1
  • Shima Younespoor 2
  • Farid Zayeri 1
  • Mostafa Rezaei Tavirani 3
چکیده [English]

Background and Objective: In recent years, DNA microarray technology has become a central tool in genomic research. Using this technology, which made it possible to simultaneously analyze expression levels for thousands of genes under different conditions, massive amounts of information will be obtained. While traditional clustering methods, such as hierarchical and K-means clustering have been shown to be useful in analyzing microarray data, they have some limitations. These methods assume that a gene or an experimental condition can be assigned to only one cluster and a gene belongs to a group of genes that are coexpressed under all conditions. Therefore, to overcome these shortcomings, biclustering methods are used. The purpose of this paper was to evaluate the efficiency of a biclustering method in analyzing yeast gene expression data.  Materials and Methods: In this study, Large Average Submatrices (LAS) method has been used to analyze the yeast Saccharomyces cerevisiae expression dataset, provided by Gasch et al. (2000). The dataset contains 2993 genes and 173 different experimental conditions. In this study, the software packages such as LAS, JMP and GOAL has been used for analyzing data.  Results: Results showed that the LAS method is able to produce biologically and statistically relevant biclusters.   Conclusion: This study showed that LAS can be used to discover biologically significant subsets of genes under subsets of conditions for microarray data analysis.

کلیدواژه‌ها [English]

  • Biclustering
  • Gene expression data
  • DNA microarray
  • Gene ontology
  • Large Average Submatrices (LAS)