دسته‌بندی و پیش‌بینی کلاله سه‌شاخه و چند‌‌شاخه زعفران با استفاده از ابزار‌های آماری یادگیری ماشینی بدون‌نظارت

مقاله 3، دوره 2، شماره 3، پاییز 1393، صفحه 199-204 

نوع مقاله: مقاله علمی پژوهشی

شناسه دیجیتال (DOI): 10.22048/jsat.2014.7810

نویسنده

امیرحسین بیکی

استادیارگروه زیست شناسی، دانشکده علوم پایه، دانشگاه قم

چکیده

زعفران یک گیاه تریپلوئید و عقیم است که در همه کشورها به‌عنوان یک ادویه و گیاه دارویی مورد استفاده قرار می‌گیرد. کلاله مهم‌ترین قسمت گیاه زعفران می‌باشد. تاکنون هیچ روش مطمئن مولکولی برای شناسایی و پیش‌بینی گونه‌های دارای کلاله سه و چند‌شاخه ارائه نشده است. در‌ این بررسی بر ‌اساس نشانگر‌های مولکولی چندشکلی توالی مربوط تکثیر یافته و با استفاده از الگوریتم‌های بیوانفورماتیکی مختلف،روش‌های جدیدی برای پیش‌بینی کلاله زعفران ارائه شده است. پنج آلل M131400، M151200، M151100، M10850 و G6500 به‌عنوان مهم‌ترین دسته‌بندی کننده با دقت پیش‌بینی بالا بر اساس مدل‌های Attribute Weighting انتخاب شدند که دارای پتانسیل بالایی برای ‌خوشه‌بندی و تشخیص کلاله سه‌شاخه ازچند‌‌شاخه هستند. دسته‌بندی بدون یادگیری بر اساس الگوریتم‌های K-Means و K-Medoids قادر به ‌خوشه‌بندی صحیح کلاله زعفران هستند. نتایج نشان می‌دهد که برای اولین بار، روش‌های داده‌کاوی می‌توانند شیوه‌ای بسیار مؤثر، با دقت و صحت بالای 90 درصد برای تمایز ژنتیکی کلاله سه‌شاخه از چند‌‌شاخه مورد استفاده قرار گیرد. این روش‌ها می‌توانند در مکان‌یابی ژنی و انتخاب به کمک بیومارکرها مورد استفاده قرار گیرند.

کلیدواژه‌ها

چندشکلی توالی مربوط تکثیر یافته؛ مارکر مولکولی؛ یاد‌گیری ماشینی

موضوعات

کشاورزی و علوم پایه

عنوان مقاله [English]

Classification and prediction of three and multi stigma in saffron by statistical, unsupervised machine learning tools.

نویسندگان [English]

Amir Hosein Beiki

Assistant Professor,Department of Biology, Faculty of Science, Qom University

چکیده [English]

Saffron is a triploid, sterile plant, used as a spice and medicinalplant in all countries. Stigma is the most important part of saffron. So far no reliable molecular methods were provided to identify and prediction of the three/multi branches species. In this study, using different bioinformatics algorithms, new tools for prediction based on Sequence-Related Amplified Polymorphismmolecular markers is presented. Five alleles M1311400, M151200, M12100 and M10850 selected as the most important classifier by Attribute Weighting models which has the potential to cluster and recognize the three from multi branches stigma. K-Means and K-Medoids unsupervised clustering algorithms were fully able to cluster each genotype to the right classes. Our results showed that for the first time, data mining techniques can be effectively used to genetic differentiation between three and multi stigma with above 90 percent the accuracy andprecision. These methods can use in gene mapping and selection by biomarker.

کلیدواژه‌ها [English]

classifier, Machine Learning, Molecular marker, Sequence-related amplified polymorphism

منبع : نشریه علمی پژوهشی زراعت و فناوری زعفران

دانلود اصل مقاله (406.79 K)