以下所有内容均属于个人学习过程中的总结,如有错误,欢迎批评指正!
Modeller是一款比较优秀的同源建模软件,包括单模板和多模板建模,Discovery Studio软件中就是采用的Modeller建模模块。Modeller目前最新的版本是9.19,下载网址为
https://salilab.org/modeller/download_installation.html,网站中也有教程文件,比较简单。下面是我自己总结的笔记,供大家参考学习。(本教程用的是Modeller9.18版本,windows7系统)
1、下载安装Modeller,本例采用Modeller9.18版本,注意要用管理员身份运行Modeller,执行python脚本时输入mod9.18 template.py即可;
2、在NCBI或者
Uniprot网站 上查找需要构建的目标蛋白的序列信息,也可以从
protein
data bank中查找已有晶体结构的蛋白质的序列,包括来源、种属、家族等信息,复制蛋白质序列信息,构建Sequence.ali文件,注意文件的格式如下:注意序列的最后的星号“*”不能少,最好将模板的抬头两行保持不变,TvLDH可以修改
3、采用NCBI中的
protein BLAST工具对目标序列进行比对,搜索同源性和得分较好的蛋白质晶体结构作为建模的模板,并从protein data bank中下载对应的晶体结构,保存到F:work目录下,同时在blast比对结果中确认是晶体结构中的哪条链与目标序列的相似性高;
4、修改脚本文件align2d.py中的内容(脚本文件可以从官网下载,
https://salilab.org/modeller/tutorial/),主要是序列文件的名称。windows下右键,以管理员身份运行Modeller,采用cd等命令进入到工作目录下(cd f: 进入F盘,cd
work 进入work目录,dir 可以查看当前目录的文件和文件夹),执行mod9.18 align2d.py,即可得到二者序列比对的文件.pap和.ali;
5、修改model-single.py脚本中对应的文件名称以及需要得到的模型的数目(默认为5个),再执行该文件(mol9.18 model-single.py)即可得到模建的结构,模型的整体评分在model-single.log文件的末尾,molpdf、DOPE score打分的数值越低,表示模型越好;
6、常用的同源建模的模型评价网站,
http://services.mbi.ucla.edu/SAVES/,SAVES是一个多功能的蛋白质模型评价网站,包括profile-3D,ERRAT,拉氏图等 。
http://molprobity.biochem.duke.edu/index.php,是Molprobity网站,几乎所有晶体结构在发布前都会经过该网站的评价,该网站对模型的要求比较严格,很难完全通过检测,但会给出每个氨基酸残基的评分情况,可以很直接的看到哪些氨基酸在结构上可能有问题。
总结:
1、选择模板蛋白这一步非常重要,一定要多对比蛋白质的来源,结构特点等,有些蛋白有氧化态和还原态区分时更要严谨;
2、在评价蛋白质模型的时候,网站给出的数据,包括profile-3D和拉氏图都只能作为参考,最重要的还是对比蛋白质结构与模板结构或者同源蛋白保守区域的结构相似程度,关键氨基酸是否合理等;
3、同源模建后的蛋白质模型是没有氢原子的,加氢可以选择
PDB2PQR网站。
最后,如果你对分子模拟、量子化学感兴趣,或者对文章有什么问题,欢迎加入我们的交流群:
微信群: qq群
580744615