模序联配问题
寻找一条穿过编辑图的最长的块路径。
输入:两条序列u和v,并划分成大小为t的模序
输出:u和v的具有最大联配得分的模序联配,即:穿过编辑图的最长块路径。
考虑(n/t) * (n/t) 块对,每对块定义编辑图中的一个正方形区域,同时对每对模序计算联配得分βi,j。
Si,j表示U的前i个模序与v的前个模序之间的最优模序联配得分。那么:
σblock 是插入或删除整个模序的罚分。
Si,j=max{ Si-1,j - σblock ,Si,j-1 - σblock ,Si-1,j-1 +βi,j }
当t大约为logn时,通过四个俄罗斯人技术,代替构建来自于U和V中所有模序对的(n/t)*(n/t)最小联配,同时我们将构建所有成对的由t个核苷酸组成序列的(4^t)*(4^t)的最小联配,同时将它们的联配得分储存到大查找表中,笔者理解为核苷酸只有4种,将长度为t的4种核苷酸所有可能组合列入查找表中。则:
Si,j=max{ Si-1,j - σblock ,Si,j-1 - σblock ,Si-1,j-1 +Sorce(V的第i模序,U的第j模序) }