دستهبندی و پیشبینی کلاله سهشاخه و چندشاخه زعفران با استفاده از ابزارهای آماری یادگیری ماشینی بدوننظارت |
|
مقاله 3، دوره 2، شماره 3، پاییز 1393، صفحه 199-204 |
|
نوع مقاله: مقاله علمی پژوهشی |
|
شناسه دیجیتال (DOI): 10.22048/jsat.2014.7810 |
|
نویسنده |
|
امیرحسین بیکی
|
|
استادیارگروه زیست شناسی، دانشکده علوم پایه، دانشگاه قم |
|
چکیده |
|
زعفران یک گیاه تریپلوئید و عقیم است که در همه کشورها بهعنوان یک ادویه و گیاه دارویی مورد استفاده قرار میگیرد. کلاله مهمترین قسمت گیاه زعفران میباشد. تاکنون هیچ روش مطمئن مولکولی برای شناسایی و پیشبینی گونههای دارای کلاله سه و چندشاخه ارائه نشده است. در این بررسی بر اساس نشانگرهای مولکولی چندشکلی توالی مربوط تکثیر یافته و با استفاده از الگوریتمهای بیوانفورماتیکی مختلف،روشهای جدیدی برای پیشبینی کلاله زعفران ارائه شده است. پنج آلل M131400، M151200، M151100، M10850 و G6500 بهعنوان مهمترین دستهبندی کننده با دقت پیشبینی بالا بر اساس مدلهای Attribute Weighting انتخاب شدند که دارای پتانسیل بالایی برای خوشهبندی و تشخیص کلاله سهشاخه ازچندشاخه هستند. دستهبندی بدون یادگیری بر اساس الگوریتمهای K-Means و K-Medoids قادر به خوشهبندی صحیح کلاله زعفران هستند. نتایج نشان میدهد که برای اولین بار، روشهای دادهکاوی میتوانند شیوهای بسیار مؤثر، با دقت و صحت بالای 90 درصد برای تمایز ژنتیکی کلاله سهشاخه از چندشاخه مورد استفاده قرار گیرد. این روشها میتوانند در مکانیابی ژنی و انتخاب به کمک بیومارکرها مورد استفاده قرار گیرند. |
|
کلیدواژهها |
|
چندشکلی توالی مربوط تکثیر یافته؛ مارکر مولکولی؛ یادگیری ماشینی |
|
موضوعات |
|
کشاورزی و علوم پایه |
|
عنوان مقاله [English] |
|
Classification and prediction of three and multi stigma in saffron by statistical, unsupervised machine learning tools. |
|
نویسندگان [English] |
|
Amir Hosein Beiki |
|
Assistant Professor,Department of Biology, Faculty of Science, Qom University |
|
چکیده [English] |
|
Saffron is a triploid, sterile plant, used as a spice and medicinalplant in all countries. Stigma is the most important part of saffron. So far no reliable molecular methods were provided to identify and prediction of the three/multi branches species. In this study, using different bioinformatics algorithms, new tools for prediction based on Sequence-Related Amplified Polymorphismmolecular markers is presented. Five alleles M1311400, M151200, M12100 and M10850 selected as the most important classifier by Attribute Weighting models which has the potential to cluster and recognize the three from multi branches stigma. K-Means and K-Medoids unsupervised clustering algorithms were fully able to cluster each genotype to the right classes. Our results showed that for the first time, data mining techniques can be effectively used to genetic differentiation between three and multi stigma with above 90 percent the accuracy andprecision. These methods can use in gene mapping and selection by biomarker. |
|
کلیدواژهها [English] |
|
classifier, Machine Learning, Molecular marker, Sequence-related amplified polymorphism |