科技前沿

喻进/苏晓东合作团队以原子精度揭示转录因子在DNA上的自由扩散动力学

日期:2021-06-15  浏览次数:8476

来源:BioArt

转录因子(transcription factor)蛋白在DNA上扩散搜索并与特定序列的靶位点结合对基因的表达调控至关重要。基于上世纪80年代由von Hippel等研究组提出的易化扩散(facilitated diffusion)理论,转录因子不仅在三维空间进行扩散,同时往往需要交替性地在DNA的非特异性序列上进行一维随机行走扩散(1D diffusion),以便有效地搜索特异性DNA识别位点;而寻找靶位点的速率和准确性也直接影响了基因表达的效率和精准度。上述理论在后续的实验研究中得到了有效的支持, 而更细致的研究指出转录因子在DNA上的扩散包含了在DNA碱基上的行走 (stepping) 或沟槽上的滑移 (sliding),短距离的跳动 (hopping),以及不同DNA片段之间的转移(inter-segment transfer)等行为。


虽然转录因子蛋白的上述扩散模型已经比较明晰,但扩散过程中的精细分子动力学尚不甚明了,尤其是发生在微秒和毫秒之间的蛋白在DNA碱基或纳米尺度上的运动,在目前的实验测量精度上还难以直接观测。


近日,加州大学尔湾分校的喻进计算课题组与北京大学的苏晓东实验课题组合作,对高精度解析的WRKY转录蛋白与DNA结合的复合物结构进行长时间的全原子精度的分子动力学模拟(数十到上百微秒)该研究首次通过不施加外力干预的平衡态分子动力学模拟(计算显微镜 computational microscope)观测到了WRKY蛋白在单个DNA碱基尺度上自由扩散行走的原子精度过程,展示了蛋白DNA界面的氢健断裂和重组动力学行为,并提出了蛋白对DNA单链的偏好在扩散和识别上的协调作用最新研究成果于2021年6月8日发表在PNAS,题为Revealing atomic-scale molecular diffusion of a plant-transcription factor WRKY domain protein along DNA


WRKY是植物特有的锌指蛋白转录因子,对植物的防御,生长发育和代谢等方面都起到重要的调控作用。此次解析的WRKY蛋白结构具有约60个氨基酸并结合在W-box DNA识别序列上。基于该蛋白DNA精细结构和在非特异序列上的分子建模,课题研究人员以高性能计算支持的全原子分子动力学模拟 (all-atom molecular dynamics or MD simulation) 为主要手段,结合粗粒化(coarse-grained,CG)分子建模模拟和实验测量验证从不同时间和空间尺度上考察了WRKY在DNA上的扩散行为。

图:转录因子蛋白的三维扩散与一维DNA运动交替(左)以及计算显微镜下WRKY蛋白在DNA上沿DNA大沟(major)向前(右上)移动1bp或向后(右下)移动的结构动力学演化和采样。


该研究工作累计长达上百微秒的全原子分子模拟揭示了WRKY蛋白在DNA上向前以及向后运动一个碱基对(1-bp)的全过程以及蛋白在DNA上运动和信息识别的物理机制。该蛋白在非特异扩散运动中,位于运动前端的氨基酸(R131或R135)热运动涨落显著,以便探索前方DNA核苷酸并实现氢健位移;随后位于蛋白DNA结合中部的残基(e.g.K144)受到牵引会随之运动,导致相邻多个氨基酸与DNA核苷酸之间的氢键断裂并重组,从而实现一系列氢键在蛋白DNA界面上的协同位移,完成蛋白在DNA碱基上行走的一个循环。进一步,研究通过对蛋白与DNA双链间的相互作用能量的考察,揭示出WRKY蛋白同两条DNA单链间的显著结合差异,从而提供机理指出类似的小型转录蛋白因子倾向于在单链DNA上进行特异性信息识别,而在非特异扩散或随机运动过程中蛋白表现出更多的在DNA双链间作用的协同。


此外,采用基于蛋白DNA结构的粗粒化模拟和更充分的采样,研究显示了WRKY 蛋白在DNA进行螺旋运动主导的一维自由扩散,扩散行为以及蛋白DNA结合特征受到溶液离子浓度的显著调制。有趣的是,蛋白扩散的单位步长也在不同DNA序列上显示出不同。例如在全同的poly-A序列DNA上,蛋白扩散集中于单个碱基的步长;在循环周期为2-bp的poly-AT序列DNA上,蛋白扩散运动中双碱基的步长频率明显增高;而在随机DNA序列上,相应的蛋白步长分布又显示出不同特征。该WRKY蛋白在DNA的一维自由扩散运动以及在DNA特异/非特异序列的结合特征也同时通过实验研究进行了实证和测量。


深圳京鲁计算科学应用研究院的戴立强博士与北京大学生命科学院的徐永萍博士为该文章的共同第一作者,北京大学的苏晓东和加州大学尔湾分校的喻进为本文工作的共同通讯作者。


原文链接:

https://doi.org/10.1073/pnas.2102621118