【全网最新】全方位解读GROMACS文件类型:如何快速掌握分子模拟中的关键数据格式和实用技巧 GROMACS文件类型深度解析 不同类型的GROMACS文件类型所代表的含义 GROMACS关键数据格式
本文系统梳理了 GROMACS 常见文件格式及其作用,从模拟运行、结构拓扑、参数输入、索引分组到分析可视化文件进行了较全面说明。文章重点介绍了 gro、pdb、top、itp、mdp、tpr、trr、xtc、cpt、edr、ndx、rtp 等核心文件,解释了它们在建模、预处理、动力学计算、结果输出、轨迹存储与后处理分析中的具体用途。同时,还补充了 hdb、tdb、n2t、r2b、xpm、xvg 等相对不常见但很实用的辅助文件格式。整体来看,这篇内容适合作为 GROMACS 初学者的文件格式速查手册,帮助快速建立对整个分子动力学工作流程的文件认知。
摘要 模拟相关文件: cpt :检查点文件,保存模拟状态,可用于恢复模拟。 edr/ene :能量文件,存储能量数据,可使用 gmx energy 分析。 trr :模拟轨迹文件,记录坐标、速度、力等。 tpr :运行输入文件,包含分子拓扑、模拟参数等,二进制格式。 结构与拓扑文件: gro :分子结构文件,包含分子坐标和速度,支持简单的轨迹操作。 pdb :蛋白质数据库文件,描述分子结构,可包含多个模型。 itp/top :拓扑文件,定义分子及力场参数。 rtp :残基拓扑文件,用于生成蛋白质拓扑。 索引与分组文件: ndx :索引文件,定义原子或分子的分组,便于分析。 n2t/r2b :原子与残基名称的翻译文件,支持不同力场或命名系统间的转换。 输入参数文件: mdp :模拟参数文件,控制分子动力学模拟。 hdb :氢数据库文件,生成或修复缺失的氢原子。 tdb :端基数据库文件,定义多肽链的末端残基。 分析与可视化文件: eps/m2p :用于生成 PostScript 格式的可视化图形文件。 xpm :矩阵文件,可通过 gmx xpm2ps 转换为图像。 通用文件: dat/out :通用输入或输出文件,无固定格式。 log :日志文件,记录程序运行信息。 mtx :矩阵文件,用于保存 Hessian。 极为稀少,快收藏吧。 --- GROMACS 的文件格式说明 atp 文件 atp 文件包含有关原子类型的一般信息,如原子序数和以原子质量为单位的质量。 arn 文件 arn 文件允许原子从它们的力场名称重命名为 IUPAC/PDB 定义的名称,以便更容易地可视化和识别。 cpt 文件 cpt 文件扩展名代表便携式检查点文件。模拟的完整状态存储在检查点文件中,包括扩展恒温器/恒压器变量、随机数状态和 NMR 时间平均数据。域分解还存储了一些分解设置信息。 参阅 gmx mdrun 。 dat 文件 带有 dat 文件扩展名的文件包含通用输入或输出。由于无法对所有数据文件格式进行分类,GROMACS 有一种称为 dat 的通用文件格式,但未给出其格式。 edi 文件 带有 edi 文件扩展名的文件包含有关 gmx mdrun 的信息,用于运行具有基本动力学约束的分子动力学。以前可以通过 WHAT IF 程序中提供的选项生成这些信息。 edr 文件 edr 文件扩展名代表便携式能量文件。能量使用 xdr 协议存储。 可请参阅 gmx energy 。 ene 文件 ene 文件扩展名代表二进制能量文件。它保存着 gmx mdrun 期间生成的能量。 该文件可以使用程序 gmx eneconv 转换为可移植能量文件(可跨硬件平台移植),即 edr 文件。 eps 文件 eps 文件格式不是特殊的 GROMACS 格式,而只是标准 PostScript™ 的变体。下面包含由 gmx xpm2ps 程序生成的 eps 文件示例 。它显示了肽的二级结构随时间的变化。 1.png g96 文件 扩展名为 g96 的文件可以是 GROMOS-96 初始/最终配置文件或坐标轨迹文件,也可以是两者的组合。该文件是固定格式,所有浮点数都写为 15.9 (文件可能会变得很大)。GROMACS 按给定顺序支持以下数据块: 标题块: TITLE (强制的) 框架块: TIMESTEP (选修的) POSITION/POSITIONRED (强制的) VELOCITY/VELOCITYRED (选修的) BOX (选修的) 请注意,所有 GROMACS 程序都可以读取压缩文件或 g-zipped 文件。 gro 文件 带有 gro 文件扩展名的文件包含 Gromos87 格式的分子结构。只需将文件连接起来, gro 文件即可用作轨迹。将尝试从每帧的标题字符串中读取时间值,该时间值前面应加上 t= ,如下面的示例所示。 下面附有一个样本: text MD of 2 waters, t= 0.0 6 1WATER OW1 1 0.126 1.624 1.679 0.1227 -0.0580 0.0434 1WATER HW2 2 0.190 1.661 1.747 0.8085 0.3191 -0.7791 1WATER HW3 3 0.177 1.568 1.613 -0.9045 -2.6469 1.3180 2WATER OW1 4 1.275 0.053 0.622 0.2519 0.3140 -0.1734 2WATER HW2 5 1.337 0.002 0.680 -1.0641 -1.1349 0.0257 2WATER HW3 6 1.326 0.120 0.568 1.9427 -0.8216 -0.0244 1.82060 1.82060 1.82060 各行包含以下信息(从上到下): 标题字符串(自由格式字符串,ps 中 t= 后的可选时间) 原子数(自由格式整数) 每个原子一行(固定格式,见下文) 盒子向量(自由格式,空格分隔的实数),值: v1(x) v2(y) v3(z) v1(y) v1(z) v2(x) v2(z) v3(x) v3(y) ,最后 6 个值可以省略(它们将被设置为零)。GROMACS 仅支持 v1(y)=v1(z)=v2(z)=0 的盒子。 此格式是固定的,即所有列都处于固定位置。可选(目前仅限使用 trjconv )您可以编写具有任意小数位数的 gro 文件,格式将为带有 n+5 小数位的位置 n ( n+1 对于速度)而不是 8 带有 3 (对于 4 速度)。读取后,精度将从小数点之间的距离推断出来(将是 n+5 )。列包含以下信息(从左到右): 残基数(5 个位置,整数) 残基名称(5 个字符) 原子名称(5 个字符) 原子数(5 位,整数) 位置(单位为 nm,xyz 分为 3 列,每列 8 个位置,有 3 位小数) 速度(单位为 nm/ps(或 km/s),xyz 分为 3 列,每列 8 位,有 4 位小数) 请注意,单独的分子或离子(例如水或 Cl-)被视为残基。如果您想在不使用 GROMACS 库的情况下在自己的程序中编写此类文件,则可以使用以下格式: C format c "%5d%-5s%5s%5d%8.3f%8.3f%8.3f%8.4f%8.4f%8.4f" Fortran format fortran (i5,2a5,i5,3f8.3,3f8.4) 请注意,这是书写的格式,因为在上面的例子中,字段可能没有空格,因此不能用 C 中的相同格式语句读取。 hdb 文件 hdb 文件扩展名表示氢数据库, gmx pdb2gmx 在构建最初缺失或使用 -ignh 删除的氢原子时需要这样的文件。 itp 文件 itp 文件扩展名代表包含拓扑。这些文件包含在拓扑文件中(扩展名为 top )。 log 文件 日志文件是由一些 GROMACS 程序生成的,通常是人类可读的格式。使用更多的日志文件。 m2p 文件 text m2p 文件格式包含 gmx xpm2ps 程序的输入选项。 当您查看 gmx xpm2ps 的 PostScript(tm)输出时,所有这……
此 SEO 页面只展示文章公开预览内容。阅读全文、登录阅读或申请 VIP 解锁,请进入博客原文页面。
进入博客阅读全文