|
Superior
序列同源查询
Software
PatternHunter 基准测试 以下是PatternHunter与Blastn、MegaBlast对BL2SEQ的测试比较。在测试中,Blastn、MegaBlast都使用了最佳参数,而PatternHunter使用了标准参数。 测试主机: PIII 700Mhz、 Redhat 7.1、 1G内存
下图是Pattern与Megablast在长序列上的时间、内存使用比较:
PatternHunter测试结果的质量比Blastn好一点,比MegaBlast要好的多。下图是对列结果下降的典型比较(从最好到最坏):
与Blastn敏感度的相同的条件下,PatternHunter能达到MegaBlast的运行速度,而内存的使用量仅为Blastn或者PatternHunter的1/4。对长度为N的基因组,PatternHunter大约使用8N字节数的内存;对长度分别为M、N的两个输入,PatternHunter需要使用M+8N字节数的内存。而且PatternHunter的自动数据库分片机制可以进一步的减少内存的使用量。 我们还比较了在不同的参数下PatternHunter与BLAST的速度与敏感度。在下图中,Smith-Waterman算法的敏感度被设定为100%,敏感度曲线表明了PatternHunter与BLAST检测的同源匹配的数量与Smith-Waterman算法检测数量的百分比。在测试中,我们使用了大约30K长的老鼠EST序列(25Mb)、4K长的人类EST序列(3M)。从下图可以看出,4个seed的PatternHunter计算速度与BLAST相同,但敏感度已经接近于Smith-Waterman算法的敏感度。
|
|
|||||||||||||
|
|
|||||||||||||
|
|
|