详细内容

gromacs教程-5-了解什么是力场

如何理解什么是力场?

在化学和分子建模的背景下,力场是一种计算方法,用于估计分子内原子之间以及分子之间的力。更准确地说,力场是指用于计算分子力学、分子动力学或蒙特卡罗模拟中原子或粗粒粒子系统的势能的函数形式和参数集。所选能量函数的参数可以来自物理和化学实验、量子力学计算,或两者兼而有之。力场是原子间势,使用与经典物理学中的力场相同的概念,不同之处在于化学中的力场参数描述了能量景观,全原子力场为系统中每种类型的原子(包括氢)提供参数,而联合原子间势将甲基和亚甲基桥中的氢和碳原子视为一个相互作用中心。粗粒度势能通常用于长时间模拟蛋白质、核酸和多组分复合物等大分子,但会牺牲化学细节以获得更高的计算效率。

力场:分子如何运动,为啥会运动,是因为分子会受到分子间的相互做那个用力,建模只是描述了分子的坐标,这种坐标是一种虚无的,没有啥信息,为了让上面的原子有信息就需要给定一个参数叫做力场。这个力场不仅会告诉你原子的尺寸大小,电荷数,质量,键长,键角,二面角等所有用来描述分子的参数,同时他还会告诉你不同分子之间原子的相互作用力随位置关系的大小。

image.png

image.png

image.png

力场根据功能的划分?

根据对分子抽象程度的不同,分子力场一般分为精细化力场、原子力场、粗粒化力场三类。

精细化力场对分子的描述是超原子级别的,力场中所包含的位点个数多于分子中的原子数,可以更加细致地描述分子的相互作用,如水分子力场中就存在质荷与电荷分开的情况。原子力场对分子的描述是(准)原子级别的,

若考虑分子中的所有原子并为其定义力场参数,则称为全原子力场;若忽略分子中的一些原子(如非极性H原子),将相互作用整合到相邻原子上,则称为联合原子力场。

而粗粒化力场对分子的描述是亚原子级别的,它进一步抽象分子结构,将更大的基团视为一个位点,从而简化分子的拓扑形态。显然,对分子抽象程度越高的力场,计算速度越快,能处理的体系也越大,但对分子的描述越不精确。选择哪种分子模型,应根据实际情况加以权衡。


在早期的分子力场中,电荷点通常被赋予了固定的位置以及电荷数。这种力场又被称为不可极化力场,其缺点是不允许分子中的电荷重新分布,因此不能描述分子的极化现象。

这种考虑了极化效应的力场被称为极化力场 (polarizable FF),利用极化力场进行的分子动力学模拟被称为极化分子动力学模拟。极化分子力场相较于不可极化分子力场更加复杂,计算也更为庞大。在模拟过程中处理极化效应的方式有波动电荷 模型、经Drude 振子模型以及诱导点偶极子模型等。目前,极化分子动力学模拟也已被广泛用于聚合物/锂盐解质体系的研究中。

image.png

材料力场

cvff(consistent valence forcefield):参数用于有机分子、蛋白质模拟,函数形式略复杂。cvff_aug是对其扩展,可以用于研究硅酸盐、铝硅酸盐、磷酸盐、泥土

CFF(consistent family of forcefield):包括CFF91和CFF95。适用面很广,涵盖有机无机小分子、聚合物、多糖和生物大分子,还支持金属。函数形式挺复杂。参数由从头算获得,非键参数从CVFF弄来,不适合凝聚相模拟。

pcff:基于CFF91,适用范围做了扩展,主要用于聚合物和有机材料,也能用于无机材料,还有糖、核酸、脂的参数。

COMPASS=Condensed-phase Optimized Molecular Potentials for Atomistic Simulation Studies:在pcff基础上改进的新版本,同样由从头算获得参数,在凝聚相模拟方面大有改善。适用于有机和一些无机分子、高分子,常用于材料领域的各种性质计算,不支持生物分子。模拟超临界水不错。能够适应很宽范围的压强和温度。MS中COMPASS(即2.8)>COMPASS2.7>COMPASS2.6。在MaterialStudio中御用,参数是加密不公开的,虽然lammps也能用,但是参数不全。


普适力场

Dreiding:普适型力场,但支持的元素有限,并非涵盖整个周期表。可以用于有机、生物、主族无机分子。结构、结合能的计算结果精度一般。没有指定计算电荷的方法,建议用拟合静电势电荷,原文用Gasteiger勉强应付。

UFF=Universal Force Field:涵盖整个周期表的普适型力场。比Dreiding更好。函数不复杂。UFF计算结构、结合能的计算结果精度一般,主要适合找不到适合的力场时凑合用。默认用QEq电荷。缺少纯金属单质的参数,都是离子的。


反应力场

REBO:反应力场,主要用于固体,无非键参数。后来添加了C、H的LJ参数的叫做AI-REBO力场。

ReaxFF=Reactive force field:ADF、MS、lammps支持,作者本人也有相应的程序但不公开。这是反应力场,引入键级概念,可以研究模拟过程中的设计拓扑结构改变的化学反应,挺流行。对于结构新鲜的体系可能差一些。用于爆炸、燃烧过程的反应貌似不错。支持所有主族和部分过渡金属元素。电荷由EEM获得。参数很多很复杂难找全。形式复杂,步长需要比较小,比如0.1~0.5fs。计算速度慢,貌似介于半经验与一般分子力场耗时之间,只适合最多用于几千个分子,再多的话就得和普通力场联用(类似QM/MM)。


专业小分子力场

MMX:早期的有机小分子力场。

MM2/MM3/4=Molecular Mechanics versions 2/3/4:用于小分子。函数复杂。计算小分子结构能量好,适合构象搜索、计算频率、获得最稳定结构。由于VDW参数不好,凝聚相问题差。MM3是这一类中最流行的。MM3也有蛋白质参数,叫MM3PRO。

MMFF=Merck Molecular Force Field:各方面类似于MM2/3,但比之更好。在CFF之后才发展的,也是从头算计算参数,但提升至MP2级别。参数比较细而且广泛。凝聚相问题仍不好。


大分子力场

CHARMM=Chemistry at HARvard Macromolecular Mechanics,函数形式简单,包含以下版本:

CHARMM19:联合原子力场,也适用于蛋白质。

CHARMM22:全原子力场,适用于蛋白质。

CHARMM22/CMAP:适用于隐势GBSW。名字编号是最初使用这种力场的CHARMM版本得名的。

CHARMM27:适用于核酸和脂(膜)。与22结合可以混合使用模拟蛋白+核酸体系。应当用TIP3P,是在这种水模型下拟合的。

CHARMM General Force Field(CGenFF):用于药物类小分子,也可视为通用有机小分子力场。可结合其它CHARMM全原子力场使用。

CHARmm:CHARMM的商业版本,归Accelrys。


AMBER=Assisted Model Building with Energy Refinement:适合蛋白和核酸的凝聚相模拟,有机小分子支持得少。函数形式简单。包含以下版本:

ff12力场(parm10.dat+frcmod.ff12SB):与ff10的区别是对蛋白的骨架和侧链扭转项参数做了进一步修正以更吻合实验。核酸的参数没变。这是目前最好的amber力场。

ff10力场(parm10.dat):对ff99的各种参数补丁的集合,相当于parm99.dat+frcmod.ff03+bsc0+chi.OL3+新的离子参数+原子和残基名的修改以顺应PDB format version 3。蛋白的参数和ff99SB相同。

ff99SBildn(frcmod.ff99SBildn):对ff99SB的异亮氨酸、亮氨酸、天冬氨酸、天冬酰胺的侧链参数改进的补丁。

ff99SBnmr(frcmod.ff99SBnmr):基于NMR数据对ff99SB的骨架参数进行修正的补丁。

ff03.r1力场(parm99.dat+frcmod.ff03):ff99力场的修改版。获取电荷时通过连续介电模型表现溶剂可极化效应,修改了蛋白phi、psi骨架参数,减少了对螺旋构象的偏爱。核酸参数相对于ff99没变。ff03.r1与amber9中的ff03略有不同,那时仍用的是ff94的方法得来的碳、氮端基原子电荷,如果仍想用那时代的ff03就调用oldff/leaprc.ff03.

ff03ua力场(parm99.dat+frcmod.ff03+frcmod.ff03ua):ff03力场的united-atom版本,侧链的氢原子被united了,骨架上的氢原子和芳香环上的氢原子仍被保留。由于骨架还是全原子故骨架势参数没变,侧链上的参数因用了united故重新拟合。核酸参数完全没变,且还是全原子。

ff02力场(parm99.dat+frcmod.ff02pol.r1):ff99力场的可极化版,给原子上增加了可极化的偶极子。frcmod.ff02pol.r1是对原ff02的扭转参数的修正。


AMBER=Assisted Model Building with Energy Refinement:适合蛋白和核酸的凝聚相模拟,有机小分子支持得少。函数形式简单。包含以下版本:

ff02EP力场(parm99EP.dat+frcmod.ff02pol.r1):ff02力场基础上给诸如氧、氮、硫原子增加了偏离原子中心的点电荷以表现孤对电子效应。据称比ff02稍好点。

ff99力场(parm99.dat):大部分参数来自ff94力场,修改了许多扭转角的参数。甘氨酸的骨架参数有问题,螺旋和延展构象的平衡性不对。而对于DNA,ff99长时间模拟中亚稳态占统治地位,即alpha和gamma二面角倾向于分别为gauche+和trans状态。虽然在RNA中也有这问题,但不严重。ff99的这些毛病在ff94里也有。

ff99SB力场(parm99.dat+frcmod.ff99SB):对ff99的蛋白二面角参数进行修正,二级结构间分布的比例得到了改善,也解决了甘氨酸骨架参数问题。

bsc0(frcmod.parmbsc0):解决上述ff99在核酸模拟问题上的补丁,同时还改进了RNA的糖苷的gamma二面角扭转势。可参考http://mmb.pcb.ub.es/PARMBSC0。

ff99SB+bsc0力场:把bsc0补丁用到ff99SB上,相对于ff99同时增进对蛋白和核酸的效果。这个组合使gamma二面角过分偏离了trans型。如果初始结构有很多gamma角为trans的情况,还是用ff99比较好。

ff99SBildn(frcmod.ff99SBildn):在ff99SB基础上修改氨基酸侧链参数的补丁。

ff99SBnmr(frcmod.ff99SBnmr):在ff99SB基础上修改骨架扭转项参数以更符合NMR数据的补丁。


AMBER=Assisted Model Building with Energy Refinement:适合蛋白和核酸的凝聚相模拟,有机小分子支持得少。函数形式简单。包含以下版本:

ff98力场(parm98.dat):对ff94改进了糖苷的扭转角参数。

ff96力场(parm96.dat):与ff94扭转角不同,算出来的能量更接近量化结果。来自Beachy et al,由于构象有明显偏向beta等问题,使用不广泛。

ff94力场(parm94.dat):来自Cornell, Kollman et al。适合溶剂环境。电荷由RESP HF/6-31G*获得。

ff86力场(parm91X.dat):将ff84扩展为全原子力场。和ff84一样对氢键也是用Lennard-Jones 10-12势,故如果想在sander里用ff84/86,得重新带着-DHAS_10_12选项编译。之所以相应的文件叫parm91X是因为对原始ff86做了一些修正。(parm91X.dat是parm91.dat的补完版,加入了一些非键项,但非键项比如Mg、I等的参数都没调好,只是近似。)

ff84(parm91X.ua.dat):最早的AMBER力场,用于模拟核酸和蛋白质的联合原子力场。不推荐使用,但在真空或者距离依赖的介电常数下模拟还有用。


parmAM1和parmPM3力场(parmAM1.dat/parmPM3.dat):用这个参数对蛋白质优化可以得出与AM1/PM3相同的优化结果。如今已没什么价值。

GAFF力场(gaff.dat)=Generation Amber Force Field:普适型有机小分子力场,函数形式和AMBER力场相同,与AMBER力场完全兼容。

GLYCAM-06力场(GLYCAM_06g.dat):对以前GLYCAM力场做了改进,并且纳入了一小部分脂类的参数。

GLYCAM-04EP力场(GLYCAM04EP.dat):将GLYCAM04扩展到可用于TIP5P模型下的模拟。给氧加上非原子中心点电荷表现孤对电子效应。

GLYCAM-04力场(GLYCAM04.dat)=glycans and glycoconjugates in AMBER:专用于糖的模拟,和AMBER完全兼容,可一起用于糖蛋白的模拟。官网:http://glycam.ccrc.uga.edu/ccrc/index.jsp

lipid11:与Amber力场完全兼容的模拟磷脂和胆固醇的力场。

AMOEBA:可极化力场,能模拟水、蛋白、单价离子、有机分子。速度比起一般的固定点电荷力场慢8倍。

GROMOS=Groningen Molecular Simulation:适合烷烃、蛋白、核酸凝聚相的模拟,函数形式简单。A前边的数字代表此力场所含原子类型数目,后面的是版本号。

G43B1:适用于真空下的模拟,现在基本不用。

G43A1:是最早的GROMOS96力场,是联合原子力场(极化的氢才表达出来),用于凝聚相,后面那些都是对这个的小幅改进

G43A2:是改进了烷烃中原子类型的二面角参数

G45A3:是改了烷烃的VDW参数以更好地符合实验数据(气化焓、可压缩率、压强、水合热等)

G45A4:是为了改进核酸的模拟,增加了二面角参数、原子类型、改动了原子电荷

G53A5和G53A6:调整了参数,分别使生物分子(蛋白、DNA、糖、脂)在环己烷和水中的溶解自由焓贴近实验值。但是蛋白模拟时的结构比起G45A4却有了缺陷。

G54A7/B7:修改了psi/phi的扭转角参数以改正模拟蛋白质时对螺旋的稳定性问题,加入了一个-CH3的原子类型,修改了Na+和Cl-以符合其水合能,加入了一个和手性改变相关的improper项。模拟蛋白质的稳定性比G53A6更好了。G54B7是用于真空模拟,是在G53B6基础上做了类似G54A7对G53A6的改进得到的。


OPLS=Optimized potentials for liquid simulations:Jorgensen搞的。适合有机小分子、蛋白凝聚相的模拟。函数形式简单。最初OPLS-UA是联合原子力场,现在一般都用OPLS-AA全原子力场。

MARTINI:流行的粗粒化力场,四个原子(氢也算)凑一个原子,可以做磷脂、蛋白质、聚合物、糖、胆固醇。在gromacs里可以用。一般25~40fs一步,不能考虑二级结构的变化,必须事先指定好。http://md.chem.rug.nl/~marrink/coarsegrain.html

ENCAD=Energy Calculation and Dynamics:不流行。专门模拟溶液下蛋白和核酸,侧重于模拟过程中的能量保守性。

Shinoda2007=粗粒化力场,专用于模拟水与表面活性剂体系,平均三个重原子折合一个bead。


模拟有机小分子热力学性质用Charmm generalized >= OPLS-AA >= GAFF,但实际上GAFF已经很好了。它们计算各种有机分子的密度、蒸发焓都很准确,但是介电常数、等温压缩系数计算得都一般。GAFF对于带有硝基的分子不好。OPLS和GAFF对于苯甲醛、甲酸,以及有两个及以上Br或Cl相距较近的情况都不好。对蛋白质构象的模拟: ff99SB+ildn+nmr > CHARMM27 >OPLS >> f99。

Berger:专门用于磷脂的力场

PFF=Polarizable Force Field

VAMM=Virtual atom molecular mechanics


金属力场

Sutton-Chen:适合FCC金属模拟

对势、EAM适合fcc,bcc模拟,近似DFTB势适合bcc,hcp模拟。柳百新的势号称fcc,bcc,hcp都能模拟。


磷脂膜模拟的力场

Gromos96:rtp本身自带了DPPC参数,结果不好。

CHARMM27及改进版CHARMM36c:专门且常用的膜力场。

Glycam06:支持了少数磷脂分子,非主流。

GAFF:GAFF力场没有膜的参数,直接用在膜模拟效果不好。

Lipid11(2012):Skjevik提出的膜力场,作为amber系列力场的扩展,参数来自GAFF,几种头部(PC,PE,PS,PH,P2,PGR,PGS,PI)和几种尾部可以自由搭配(模块化)组成磷脂,还支持胆固醇,完全兼容amber力场,leap已支持。非主流。Dickson(2012)的GAFFlipid力场只是一个阶段性的膜力场,将会被融合进Lipid11。

Berger(1997):联合原子膜力场。成键参数基于GROMOS87,LJ参数基于OPLS-UA,适合搭配Gromos87,很常用也很好,几乎是唯一致命的问题在于不直接兼容Gromos96,若搭配OPLSAA需要很留神。虽然也有一些人结合Gromos96来模拟膜蛋白,但终究比较古怪,需谨慎。原文只给出了DPPC的参数,后来又有人基于此弄了其它磷脂的。Berger本身没直接提供参数和拓扑文件,Peter Tieleman基于Berger的参数制作了DPC、POPC、DPPC、DMPC、DLPC、DOPC、PLPC、POPE的itp文件,都需要lipid.itp中的参数,可以在这里下载:https://link.zhihu.com/?target=http%3A//wcm.ucalgary.ca/tieleman/downloads


G43A1-S3 (2006):Chiu弄的兼容Gromos43A1的膜力场。支持PC/PE/sphingomyelin和cholesterol。此力场的POPC不建议使用。

Kukol(2009):完全兼容Gromos96 G53A6的膜力场,烷烃链是联合原子,结果很好,和Berger相仿佛,弥补了它不支持Gromos96的遗憾。拓扑文件从原文的补充材料里得到。包含DPPC、DMPC、POPG、POPC、DMPC的参数。此力场的POPC不建议使用。

DAVID POGER(2010):完全兼容gromos96 G53A6的膜力场。JCC的文章中只提出了DPPC的参数,JCTC的文章中还提出了DLPC、DMPC、DOPC、POPC的参数。网址和gmx的拓扑文件:http://compbio.chemistry.uq.edu.au/~david/research/lipids.html

Stockholm lipids (Slipids) (2012):Jambeck弄的全原子膜力场。兼容amber。支持DPPC、DLPC、DMPC、POPC、DOPC、SOPC、POPE、DOPE、sphingomylin、PG和PS头部集团、胆固醇。gromacs的拓扑文件和预平衡的结构从这里下:http://people.su.se/~jjm/Stockholm_Lipids/Downloads.html

MARTINI:粗粒化。网址和gmx的拓扑文件:http://md.chem.rug.nl/cgmartini/index.php/downloads










最新评论
请先登录才能进行回复登录
技术支持: CLOUD | 管理登录
seo seo