系统发育树
在研究生物进化和系统分类中,常用一种类似树状分支的图形来概括各种(类)生物之间的亲缘关系,这种树状分支的图形成为系统发育树(phylogenetic tree)。通过比较生物大分子序列差异的数值构建的系统树称为分子系统树(molecular phylogenetic tree)。图型中。分支的末端和分支的联结点成为结(node),代表生物类群,分支末端的结代表仍生存的种类。 树可分为[[有根树]]和[[无根树]]两类。有根树是具有方向的树,包含唯一的节点,将其作为树中所有物种的最近共同祖先。右图即是一个有根树,表示了[[三域系统]](Woese 1998)。最常用的确定树根的方法是使用一个或多个无可争议的同源物种作为[[外群]](英文outgroup),这个外群要足够近,以提供足够的信息,但又不能太近以致不能和树中的种类相混。 把有根树去掉根即成为无根树。一棵无根树在没有其他信息(外群)或假设(如假设最大枝长为根)时不能确定其树根。无根树是没有方向的,其中线段的两个演化方向都有可能。词条图册更多图册
我只知道大致的方法,还望大牛指正
先用Clustal或者MUSCLE把序列做对位处理(可能需要用GBLOCKS从中获取有效的序列)。如果只想知道大致的结构(比如像你这样需要用于帮助分类),可以用Clustal或者Phylip里的NJ树会比较快。否则的话,需要选取合适的构造算法及模型(比如比较常见的ML法和Bayesian法)。下面两个连接可以参考一下,不过里面还是有很多复杂的东西。如果你对此完全没概念的话,最好找些做进化或者生物信息的同学参考一下。
http://blog.sina.com.cn/s/blog_59b2eb470100del6.html
http://abc.cbi.pku.edu.cn/lectures/caas08f1c.pdf
另外,如果你已经有了这些序列,建议你去NCBI看看。我记得那里有批量BLAST的工具,可能不需要构树,应该也会对你有帮助。