基因序列分類問題——多類分類器的設計

1. 問題背景 生物學研究中,用檢測DNA序列來判斷檢測對象的物種愈來愈成爲一種簡便、快捷的手段。如今的測量技術已經可以很方便地測量出物種的DNA序列,將其進行分類能夠運用機器學習的方法。本文將探討如何基於DNA序列的數據集設計一個性能良好的多類的分類器。 2. 數據集簡介 數據集中有共20000條基於序列,一共來自10個物種。其中一條基因是一個72個鹼基的序列,以下所示: AGGGGGCTGGC
相關文章
相關標籤/搜索