一、一种预测蛋白质结构型的新方法(论文文献综述)
叶盛[1](2021)在《蛋白质分子光谱的理论模拟与人工智能预测》文中研究表明蛋白质分子是生命的基石。生物系统的各种功能,依赖于各种蛋白质分子不同形式和程度的表达。认识分子的功能,建立在对其结构的精准认识的基础上。特别是,揭示蛋白质分子动态过程中的结构变化,是理解具体环境中的蛋白质性质机理的关键。如何获得蛋白质动态过程的结构信息,以建立蛋白质分子精准的构效关系,是蛋白质结构研究的核心问题。分子光谱技术是研究物质结构最重要最广泛的手段之一,实验上通过测量分子与光照辐射相互作用的响应信号,结合量子化学计算可以获得分子体系精确的结构信息。然而对于蛋白质体系而言,量子化学计算模拟其光学响应信号是十分困难的,原因在于蛋白质往往含有成千上万个原子,对其使用量子化学模拟计算成本高昂,其次,蛋白质的生命功能主要取决于其自身结构的动态演变,这就意味着我们需要对上千个蛋白质动态构型做昂贵的量子化学计算,如此大的计算量成为蛋白质光谱理论模拟的最大瓶颈。这大大限制了实验光谱的解读,也严重制约了实时谱学探测技术的发展。因此,发展快速响应并实时探测蛋白质动态结构的分子光谱技术是生物化学领域的一个关键科学问题。本论文将数据驱动的机器学习方法与电子密度泛函计算、分子动力学模拟相结合,发展了替代量子化学计算生物大分子电子结构、激发态和相互作用的新方法,建立了蛋白质谱学响应与结构变化之间的构效关系,实现了快速有效的从蛋白质结构预测光谱信号。主要分为以下五个部分:第一章介绍了蛋白质分子光谱技术的发展。蛋白质分子的结构探测一直是蛋白质科学研究的核心。实验上发展的分子光谱技术被广泛用于表征探测蛋白质的结构信息。然而,蛋白质分子光谱的理论模拟面临严重的计算瓶颈问题,由于蛋白质在溶液中的结构是溶质分子与周围环境相互作用的整体效果的反映,既要计算大量的纳米尺度肽键的局域光电响应和分子间电子相互作用,还要考察几百纳米以上的蛋白质空间构象受到环境外场的影响,同时也要模拟激发态电荷在跨尺度体系内的演化过程,如此大的计算量给蛋白质光谱的理论模拟带来了巨大的挑战。随着大数据时代的到来,基于精确可控的科学数据进行训练的人工智能技术正在成为物理化学研究的强有力工具,为蛋白质光谱的理论模拟提供了新的路径。第二章介绍了密度泛函理论。密度泛函理论通过构建求解多电子体系的Kohn-Sham方程来获得体系的性质,随着众多不同而种类交换-相关泛函的提出,密度泛函理论成为了量子化学中应用最广泛且实用性最高的方法,随后我们介绍了用于体系激发态性质模拟的含时密度泛函。第三章介绍了分子动力学理论。随着体系原子数目的不断增加,使用量子力学计算体系的性质会变得越来越困难,尤其当模拟的对象是蛋白质这种生物大分子的体系时,严格的量子力学处理几乎是不可能的。而分子动力学方法使用经典力学的势函数来描述原子相互作用,是模拟蛋白质等生物大分子的主要理论框架之一。第四章介绍了使用机器学习方法结合传统的量子化学计算用来模拟蛋白质肽键电子性质的工作。蛋白质的结构是由肽键组成的基本骨架上面连接着不同种类的氨基酸残基组成的,其中蛋白质肽键骨架的紫外吸收光谱常被用于探测蛋白质的二级结构信息。然而理论模拟蛋白质肽键骨架的紫外光谱一直存在着严重的计算瓶颈,我们通过使用神经网络技术训练构建了蛋白质肽键模型分子基态结构信息与其电子激发态性质之间的构效关系,可以高效准确地预测蛋白质肽键的紫外光谱。第五章介绍了一种使用机器学习方法结合传统的量子化学计算用于预测蛋白质红外光谱的研究工作。在这个研究中,我们开发了一种基于高精度量子化学计算数据的机器学习流程,该流程仅需要输入蛋白质的基态结构信息,就可以快速准确的预测其酰胺I带的红外光谱,并且预测结果与实验测定的光谱很好的吻合。与传统的量子化学计算相比,我们这里开发的机器学习模型大大的提高了蛋白质红外光谱的模拟速度。更重要的是,我们这里建立的神经网络模型具有优秀的迁移性,它可以快速的预测机器学习训练集范围之外的蛋白质红外光谱信号,从而准确的分辨出不同蛋白质的二级结构,并且还可以模拟不同环境状态下蛋白质红外光谱的信号变化,考察温度对蛋白质红外光谱的影响、以及利用预测的谱学信号跟踪蛋白质的折叠过程。
路晶晶[2](2020)在《LC-MS辅助NMR信号归属的蛋白质高级结构表征方法研究》文中研究表明生物大分子药物由于具有高度的特异性,因此在有效性和安全性上拥有其他种类药物不可比拟的优势,广泛应用于治疗肿瘤,自身免疫性疾病等重大疾病领域。生物药的高级结构(即空间结构)对于实现其生物医学治疗功能至关重要,任何涉及到高级结构的改变都可能对生物药的安全性、有效性及药代特征产生影响,这一点是生物药物开发和质量控制上与小分子化药的一个重要区别。目前蛋白质高级结构表征的方法主要有X-射线晶体衍射(XRD)、核磁共振光谱(NMR)、冷冻电镜(cryo-EM)、圆二色光谱(CD)、质谱的氢氘交换法(HDX)等。其中XRD具有极高分辨率,可以提供更精细的高级结构信息,但因大多数蛋白质不易结晶而无法广泛利用,并且XRD测得的结果是基于晶体的固相结构,无法准确反映蛋白质在液相中的结构。CD的优点是检测快速简便,缺点是分辨率低,仅能够提供二级结构的信息。HDX可以提供特异性位点的高级结构信息,但由于实验精密度差,应用并不广泛。与以上高级结构表征方法相比,核磁共振(NMR)技术具有高分辨率,可在原子尺度上表征更接近生理状态的溶液状态下的蛋白质高级结构,能够提供包括精细三维结构,动态结构以及配体与靶细胞结合等诸多蛋白质的结构信息。然而目前NMR在单抗药物上的应用却还十分有限,这与NMR在其他药物研究中发挥的重大作用形成显着的反差。其中一个重要原因是单抗的全同位素标记在药品研发和生产过程中难以实现,从而导致NMR信号化学位移指认困难,因此无法通过NMR来获得蛋白质位点特异性的结构信息。针对这个问题,本论文拟研究一种借助液质联用技术(LC-MS)对于蛋白质NMR信号进行指认的新方法。这一方法不需要依赖同位素标记的样品,只需要自然丰度的蛋白样品。该方法是利用结构质谱学上的氨基酸的专属性修饰和溶剂可及性的原理,首先对蛋白质中的目标氨基酸进行选择性化学修饰,由于溶剂可及性的不同,不同位点上的目标氨基酸修饰反应速率之间会有差异,通过二维NMR与LC-MS技术测量各位点目标氨基酸的修饰反应速率。因为LC-MS是在肽段水平上测量目标氨基酸的修饰速率,本身就包含氨基酸的位点信息,因此,最终通过NMR与LC-MS测得的修饰速率的比对就能将NMR信号与目标氨基酸的位点对应起来,从而获得NMR信号的指认。鉴于精氨酸在各种生物过程中发挥的必不可少的重要作用,以及明确的精氨酸侧链NMR信号解析对于表征蛋白高级结构、蛋白质间相互作用和动力学研究所具有的重要意义,本论文以精氨酸为研究对象,使用模型蛋白——泛素,建立了这种借助LC-MS对于自然丰度的蛋白质的精氨酸侧链NMR信号指认的新方法。根据LC-MS和NMR测得的精氨酸修饰速率的排序比对,获得三个精氨酸NMR信号的归属,即信号A,B,C分别对应的是R54ε-NH,R72ε-NH,R42ε-NH。在方法建立的基础上,进一步探索新方法在以降钙素基因相关肽(CGRP)抗体为代表的抗体药物识别抗原表位研究中的应用。通过抗体对抗原NMR信号的扰动,并结合ELISA方法分析抗体与各段肽的交叉反应性,研究了新抗体CGRP-BOAN-Ig G2与对照抗体的抗原表位,并对抗原表位上的精氨酸NMR信号进行了指认。结果表明,新抗体与对照抗体的表位均位于CGRP的25-37段,C端酰胺是两种抗体结合必不可少的区域,同时,精氨酸R11和R18也属于对照抗体抗原表位的一部分,但不属于新抗体抗原表位的一部分;通过修饰速率的直接排序比对获得两个精氨酸NMR信号的归属,即信号A,B分别对应的是R11ε-NH和R18ε-NH。明确新抗体结合抗原上的具体位置,并准确归属表位上的精氨酸,对于新抗体的开发和特性鉴定具有重要意义。综上,本研究针对目前NMR技术在单抗药物高级结构表征上应用的瓶颈,即自然丰度下蛋白质NMR信号的指认问题,提出了一个全新的将MS和NMR技术相结合的方法,并创新地利用化学修饰对于NMR信号进行指认。本研究可为其他不易同位素标记的蛋白质的NMR信号指认提供有意义的参考,进一步推动MS和NMR技术在蛋白质高级结构和蛋白质间相互作用的应用,并进一步拓展NMR的应用到生物药研究中。
万晓耕[3](2021)在《基于K-mer扭转角偏好的蛋白质结构类型预测》文中提出蛋白质的序列、结构和功能多种多样。大量研究表明蛋白质的结构与其氨基酸序列的排序有关,并且局部的氨基酸序列环境对蛋白质的结构具有一定的影响。本文提出一种新的基于5-mer氨基酸扭转角统计偏好的蛋白质结构类型预测方法,该方法通过PDB数据库中5-mer中间氨基酸的扭转角统计偏好来进行结构类型的预测。新方法可以通过计算机仿真实现对新蛋白质序列结构类型的快速预测,并通过两组随机抽取的CATH数据验证了新方法的有效性。
赵鑫[4](2020)在《基于生物序列与结构大数据的分析方法及应用研究》文中指出随着科学技术的发展和进步,生物序列及结构数据在以指数增长的速度增加,如何高效地从海量数据中提取关键信息,预测新数据所属类别,以及根据序列与结构数据表现的相似性从而研究物种间的系统发育关系成为近年来生物信息学中重要的研究问题。生物信息学中传统的序列比对以及结构比对方法通常复杂度较高、运算时间久,难以处理数据规模大或是结构较复杂数据,这就启发我们提出序列分析以及结构分析的新方法。在对序列分析的研究中,为了进一步研究序列中核苷酸或氨基酸的分布情况,本文提出核苷酸(氨基酸)之间的相关性概念,并将此特征其加入到原始的自然向量中,提出改进的自然向量法。它是一种非比对的序列表示法,将每条序列转化为一个向量,并且每条序列和它所对应的自然向量存在一一对应关系。此算法计算复杂度低,能够准确有效地反映序列信息,通过向量之间的距离实现序列相似性的比较,是研究物种分类学以及系统发育关系的有力工具。此外,本文在研究中将自助抽样法与改进的自然向量方法结合,计算构建的系统发生树的置信概率。新方法在多组细菌、真菌、病毒等大规模数据集的具体应用研究中表现出了很强的鲁棒性。研究将新方法与多种序列分析的方法比较,以及根据系统发育关系的置信性检验,验证新方法的可靠性与稳定性。为了进一步探究相同物种或同一家族包含序列的自然向量在空间中的分布规律,本文提出凸分析原理,并且在包括人类全部蛋白质数据以及真核生物蛋白激酶在内的多个数据规模大、物种(家族)类别个数多的可靠数据集上验证了凸分析原理,即不同物种(家族)包含序列对应的自然向量构成凸包是互不相交的。基于凸分析原理,每个物种可以由自然向量构建的凸包中心点来表示,不同物种的相似性通过中心点之间的欧氏距离来衡量,凸分析方法结合自然向量方法为研究分子生物学中的物种间系统发育关系提供了新视角,也为在给定类别中寻找新基因或未知蛋白质数据提供了新手段。
禹昭敏[5](2020)在《蛋白质、RNA修饰位点预测的机器学习方法及应用研究》文中提出大数据的到来,使得生物数据库中的序列数量呈指数型增加。从序列出发,分析蕴含在数据中的规律,已成为生物信息学的研究热点。蛋白质、RNA修饰与许多生命过程密切相关,并且在病理学方面发挥十分重要的作用。传统识别修饰位点的实验方法具有成本高、耗时耗力等缺点,机器学习方法能够准确高效的预测蛋白质、RNA修饰位点,推动蛋白质组学和基因组学的发展,促进对疾病发生机理的了解。本文对蛋白质及RNA修饰位点使用机器学习方法进行相关研究,主要内容如下:1.提出DNNAce的蛋白质乙酰化位点预测新方法。首先,融合二元编码、伪氨基酸组成、AAindex、NMBroto、分组重量编码、多元互信息、BLOSUM62、KNN对应的特征向量,得到初始特征搜索空间。其次,首次运用Group Lasso去除对乙酰化位点分类无关的特征,筛选出有效特征构成最优子集,降低特征空间维度。最后,利用深度神经网络对9个原核生物的乙酰化位点进行预测,运用10折交叉验证得到评价指标并和其它预测方法进行比较。结果表明,本文提出的DNNAce方法能进一步提高现有研究成果的预测精度,可为其它的蛋白质翻译后修饰位点预测提供一种新方法。2.提出StackRAM的RNA N6-甲基腺苷位点预测新方法。首先,通过二进制编码、核苷酸化学性质、累积核苷酸频率、K-mer核苷酸频率、伪二核苷酸组成和位置特异性三核苷酸倾向等特征编码方式提取RNA序列特征,通过多信息融合得到原始特征集合。其次,首次利用弹性网剔除m6A位点识别的冗余及噪声信息,保留对模型分类的重要特征,得到最优特征子集。最后,将基分类器LightGBM和支持向量机关于最优特征子集的概率得分和最优特征子集进行组合,输入到第二阶段的元分类器支持向量机中。StackRAM关于独立测试集H.sapiens和A.thaliana的预测准确率分别达到92.30%和87.06%。结果表明,本文提出StackRAM方法在m6A位点识别方面有更强的竞争力,在跨物种预测方面具有很好的发展潜力,可成为鉴定m6A位点的有用工具。
赵祥[6](2019)在《活细胞的太赫兹波谱特征研究及无标记超材料传感芯片的构建》文中认为背景:作为构成生命体的基本结构单元,细胞的功能与结构解析是生命科学研究的关键。解析活细胞的检测技术可分为有标记检测和无标记检测技术。活细胞有标记检测技术主要以荧光素、核素等标记分子为基础,是细胞生物学研究的核心技术,可在分子层面揭示细胞和组织器官的病理生理特征。但其标记过程可能影响靶分子的结构和功能,且操作过程较为繁琐,难以还原细胞本征状态下的特征信息。以解析活细胞生物物理特征(力学、电学及光学特性)为代表的无标记检测技术可揭示细胞增殖、分裂、凋亡和相互作用等基本生命过程的特征信息,在临床检验诊断的血液细胞分析和循环肿瘤细胞检测、表型分析及药敏分析中具有巨大的应用价值。目前仍需拓展活细胞生物物理特性研究的深度和广度,完善和增加活细胞无标记检测的方法体系,从而为临床检验诊断、药物筛选、食品健康和环境毒性评估等成熟产业化应用场景提供多元、丰富的检测平台。太赫兹(Terahertz,THz,1 THz=1012 Hz)波技术是当前生物物理学交叉领域的研究热点,相比于力学、电化学和光学等传统活细胞无标记检测技术具备以下独特优势:(1)THz波可检测分子低频集体振动模式,特别是细胞基因组甲基化状态的特征振动模式位于THz波段内(1.6 THz);(2)THz波可获取胞内分子皮秒及亚皮秒尺度的水化动力学参数;(3)THz波检测速度快,可用于医学成像,特别是在体状态下无标记检测;(4)THz波是非电离探测,不会损伤待检细胞的生物活性。目前,THz衰减全反射(THz attenuated total reflection,THz-ATR)技术和超材料技术是检测活细胞的主流方法,可解决活细胞THz检测中面临的培养基吸收过强和尺度灵敏度失匹配问题,已用于无标记解析活细胞胞内水化动力学模式参数以及检测活细胞通透性改变过程、抗肿瘤药物诱导凋亡过程和氧化应激状态等活细胞的病理生理特征模式,显示出在细胞无标记检测领域的广阔前景。但现有活细胞THz-ATR研究平台需要将细胞接种于棱镜表面并贴壁生长,造成其检测通量低(单次仅能检测一个样本),检测周期长(细胞贴壁生长为单细胞层需要48 h),且需要在棱镜表面设置微型细胞培养室。THz超材料芯片具有高灵敏、便携小巧等优势,可反应细胞病理生理状态改变过程中相对复介电环境的变化。由于水对THz波的强烈吸收,目前透射式THz超材料芯片检测细胞时均需拭去细胞外培养基,可能对活细胞的生理状态产生影响。最后,恶性肿瘤细胞的代谢状态特征改变常发生于细胞形态学变化之前;细胞的葡萄糖代谢途径和胞内葡萄糖含量是区分肿瘤细胞和正常细胞代谢状态的重要特征。但由于水的强烈衰减作用,THz波尚无法特异检测液相环境中葡萄糖分子。本研究针对上述THz-ATR平台和超材料芯片用于活细胞检测所面临问题,首先探索在薄膜介质面(Transwell培养室薄膜下层)形成单细胞层的培养方式,并构建THz-ATR薄膜传感平台提取薄膜下层细胞复介电信息的算法模型,分离细胞培养生长和细胞检测过程,实现活细胞的无标记、快速检测。区别于既往研究中超材料透射模式下去除胞外水的测量方式,本研究采用高灵敏、便携的THz超材料构建液相细胞传感芯片,结合仿真模拟和实验测量探索反射模式和自参考信号处理方式用于活细胞检测的可行性;初步构建快速、便捷的THz活细胞无标记超材料传感芯片。同时,着力优化上述活细胞超材料传感芯片的偏振依赖性和反射峰强度,进一步设计基于超强光透射(Extraordinary optical transmission,EOT)效应的偏振不敏感型圆环狭缝超材料细胞芯片阵列,全方面评估该芯片阵列检测细胞密度分布、凝血酶刺激形态变化、不同恶性程度细胞和药物诱导肿瘤细胞凋亡的可行性。最后,针对THz液相检测葡萄糖溶液特异性匮乏问题,将THz技术的水敏感性和响应性水凝胶的水含量特异变化特性有机结合,构建水凝胶功能化THz超材料芯片。通过以上工作,本研究构建一套互补长短,灵活搭配的活细胞THz研究平台和检测方法,即全方位获取活细胞复介电信息的THz-ATR薄膜传感平台和高灵敏、便携化THz超材料细胞传感系统,并研发可特异定量检测葡萄糖溶液的水凝胶功能化的THz超材料芯片,为THz波技术走向临床检验诊断中循环肿瘤细胞分析及体液中靶分子特异检测提供一条切实可行的研究途径。方法:1.THz-ATR薄膜传感技术检测活细胞波谱特征及细胞迁移能力的研究:使用激光共聚焦显微镜获取人正常宫颈上皮细胞株HCer Epi C、宫颈癌前病变细胞株Ect1/E6E7、和宫颈癌细胞株Hela的厚度信息,构建THz-ATR薄膜传感平台,优化两界面模型获取薄膜下细胞层复介电信息的数据处理方法,提取并对比以上三种细胞的THz复介电常数信息差异。在Transwell小室中接种饥饿处理24 h的Hela细胞,使用不同体积分数胎牛血清(1%,2.5%,5%,10%)作为趋化因子,利用上述THz-ATR平台检测迁移进入小室下层的Hela细胞密度分布情况,并与结晶紫染色分析法进行方法学比对,从而评估细胞迁移能力。2.自参考模式的THz超材料细胞传感芯片的研究:在高阻硅基底上制备四开口方形谐振环的THz超材料芯片,使用时域有限差分(Finite difference time-domain,FDTD)分析液相环境中超材料上细胞层和培养基的响应波谱、超材料表面电场分布与细胞层厚度饱和响应关系以及细胞层水含量变化时的响应特征,通过实验获取超材料表面犬肾细胞MDCK密度变化和皂素诱导通透性改变时谐振峰的变化情况;并分析超材料芯片谐振峰幅值与谐振环上细胞数目的关系。3.偏振不敏感型THz超材料细胞传感阵列的研究:加工基于EOT效应的圆环狭缝型超材料芯片,结合自行设计的配套夹具模块组装成2×3孔型细胞传感阵列。使用FDTD仿真研究液相环境下细胞层水含量变化时的响应特征以及该芯片的敏感响应区域,并检测人脐静脉内皮细胞HUVEC密度分布、凝血酶诱导HUVEC细胞形态变化、不同恶性程度宫颈细胞和多西他赛诱导宫颈癌Hela细胞凋亡变化,并将CCK-8计数法作为细胞密度和凋亡检测的对比方法。4.葡萄糖敏感水凝胶的THz波谱特征及功能化THz超材料芯片的构建:采用紫外交联法制备葡萄糖敏感水凝胶,并用称重分析法优化3-丙烯酰胺基苯硼酸(3-(acrylamido)phenylboronic acid,AAPBA)含量,联合THz-ATR测量和称重分析法获取梯度浓度葡萄糖溶液中响应性水凝胶的THz吸收波谱和水含量变化情况,并拟合分析吸收波谱改变和水凝胶的水含量变化关系,获取该传感方法定量检测葡萄糖溶液的灵敏度、干扰度和重复性。使用铝箔垫片在THz圆环狭缝型超材料芯片表面制备20μm厚的水凝胶薄膜层,获取梯度浓度葡萄糖溶液环境中该超材料芯片的谐振峰响应特征,并进行性能评估。结果:1.获取了正常宫颈上皮细胞株HCer Epi C、宫颈癌前病变细胞株Ect1/E6E7、和宫颈癌细胞株Hela的THz吸收系数、折射率、复介电常数实部和虚部的频谱参数,三株细胞与培养基溶液差异集中在复介电常数虚部和吸收系数,且三株细胞间在0.5-1.2THz波段内存在吸收差异,呈现随细胞恶性程度增加介电损耗和吸收增强的趋势。Transwell迁移实验中不同体积分数胎牛血清作用的小室下层Hela细胞分布密度不同,对应THz吸收系数随细胞分布密度的升高而降低,其变化趋势与结晶紫染色分析结果线性相关性好,R2=0.99107。2.反射式自参考型THz超材料细胞传感芯片在液相环境下谐振峰响应信号与模拟信号吻合度较高,谐振峰位于0.9 THz附近,相对幅度变化约12%,相较无任何高阻硅结构的情况可获得约10倍信号增强。该传感方式中谐振峰不受溶液层厚度影响(厚度大于100μm时),在常见细胞厚度范围内(5–20μm)可有效检测细胞水含量改变引起介电损耗变化。该传感芯片无需参考芯片测量,可实现对皂素诱导细胞通透性变化过程的无标记、实时监测,可观察到皂素与细胞膜整合过程的平台期及浓度依赖性谐振峰幅度变化,在用于评估超材料芯片表面细胞密度分布情况时,谐振峰幅度变化与谐振环上细胞平均数目变化的线性相关性较好,R2=0.9914。3.构建的圆环狭缝型超材料芯片阵列谐振峰响应信号与模拟信号吻合度好,谐振峰位于0.5 THz附近,细胞和培养基的相对幅度变化约21%。模拟结果显示谐振峰可有效响应细胞水含量变化过程中介电损耗的改变,其幅度变化和水含量变化的线性相关性较好,R2=0.9995。同时,该超材料芯片的增强电场主要位于狭缝内部附近,在狭缝中心覆盖宽度在0–10μm间变化的细胞模拟层时,谐振峰幅值响应随之呈现指数变化趋势;且10μm宽度的细胞模拟层可引起超过90%的谐振峰幅值变化。与之对应,该传感芯片阵列可无标记实时监测具有浓度依赖特性的凝血酶诱导HUVEC细胞形态变化过程。不同恶性程度细胞的谐振峰幅值各不相同,幅值变化与THz-ATR所获得细胞消光系数变化趋势接近。同时该传感芯片阵列检测细胞密度变化状态和多西他赛诱导细胞凋亡变化中的信号响应趋势与CCK8细胞计数分析法的线性相关性较好。4.紫外交联法制备的葡萄糖敏感水凝胶中AAPBA最优质量分数为9%,该水凝胶的水含量(称重法测量)随葡萄糖浓度升高而上升,对应的THz吸收系数也依次升高。不同浓度葡萄糖溶液中水凝胶水含量变化程度与1 THz处吸收系数变化趋势间的线性相关性较好,整合响应性水凝胶的THz-ATR平台检测葡萄糖溶液的最低检测限为16.18mg/d L;在80 mg/d L葡萄糖溶液环境下,可明显排除生理浓度乳酸,果糖,半乳糖的干扰,重复性良好。构建的水凝胶功能化超材料芯片的谐振峰随葡萄糖溶液浓度的升高而逐渐上升,最低检测限为3.92 mg/d L,抗干扰能力和重复性均较好。结论:1.THz-ATR薄膜传感平台可高通量检测薄膜下层的活细胞,活细胞的复介电常数虚部与细胞恶性程度相关,即肿瘤细胞分子水化状态、代谢活性和水含量均有升高;这可为循环肿瘤细胞的无标记分析提供新思路。THz-ATR技术可在1 min内无标记评估Transwell小室下层细胞分布密度,有望开发出系列无标记分析Transwell侵袭和迁移实验的新方法。2.开发的反射模式下自参考型THz超材料细胞芯片可有效获取液相环境中活细胞的特征信号,并可有效检测细胞通透性改变和密度分布变化,全程无需参考信号测量,适宜于长程连续监测,可为构建整合入常规培养体系的THz超材料细胞芯片提供借鉴。3.圆环狭缝型THz超材料细胞传感芯片阵列对THz极化状态不敏感,有利于实际操作,可有效获取液相环境中细胞特征信号;敏感响应区域集中于圆环狭缝附近,有助于监测亚细胞尺度的形态变化,可用于无标记检测细胞密度分布、形态改变、恶性程度及凋亡变化,有望开发出一种无标记、便捷高效的循环肿瘤细胞检测和药敏分析装置。4.THz-ATR技术可无标记检测响应性水凝胶在葡萄糖溶液中特异溶胀变化过程。葡萄糖敏感水凝胶功能化的THz超材料芯片最低检测限为3.92 mg/d L,可整合入THz超材料细胞芯片阵列用于细胞葡萄糖代谢和含量分析;并具备开发出高生物相容性、高特异和高灵敏的THz生物传感器的巨大潜力;这为解决THz液相传感面临特异性匮乏问题提供一条行之有效的解决方式。
吴丰旭[7](2019)在《蛋白-蛋白/小分子相互作用的分子模拟新方法研究》文中研究说明药物在保障人类健康方面发挥着不可替代的作用。然而,随着时代的发展,开发一个高活性低毒抵抗性的新药越来越难,研发成本也越来越高,研发周期越来越长。计算机辅助药物分子设计在提高新药研发效率方面发挥着重要作用,其核心就是在于利用计算机技术帮助我们理解药物靶标(蛋白质)与药物分子之间的相互作用规律。因此,发展计算机辅助药物分子设计方法具有重要的理论与实际意义。本文将利用DFT、自由能微扰、分子动力学等理论计算方法研究分子间的相互作用,藉此发展分子模拟计算新方法,并应用于小分子结构设计、药物抗性预测以及蛋白-蛋白互作的热点氨基酸预测等方面研究,取得了较为理想的计算结果,进一步结合我们课题组独有的网络计算资源将这些计算工具开发成网络计算平台,便于更多的科研工作者使用这些新方法。首先,我们发展了一种基于DFT量化计算取代基Sterimol立体效应参数的新方法。对三个具体的体系构建了 DFT-QSAR模型,其中对PDK1抑制剂体系的r2达到了 0.890,比使用体积描述符构建的模型(r2=0.748)高了近0.15,显着优于使用体积描述符构建的模型,在其他两个体系中也有不同程度的提高。同时我们还对PDK1抑制剂小分子取代基与靶标局部口袋进行比较,结合QSAR方程,从小分子与受体活性腔相互匹配的层面上解释了方程中取代基的最大长度与活性成正相关的原因,也证明了我们的Sterimol参数在描述立体效应参数的时候比体积描述符更有优势。通过对Sterimol参数量化计算方法的开发和研究,在提高计算精度的同时,还克服了前期开发的体积描述符在描述取代基立体效应方面的不足。其次,开发了基于结构的Hit-to-Lead配体定向进化分子设计方法,用于从苗头化合物到先导化合物的优化。与此同时,我们构建了 44个取代基的片段库,在计算方法上,采用自由能微扰的策略,加上只需要针对苗头化合物-靶标蛋白复合物进行分子动力学模拟而不需要对所有的衍生化合物-靶标蛋白体系进行分子动力学模拟,并且我们在结构优化阶段添加了短时分子动力学模拟使得最后得到的小分子与蛋白的结合模式更加合理,拓展了该方法的使用范围。我们搜集了文献中有活性实验值的19个体系、157个小分子的数据作为数据集验证该方法的准确性,该方法在区分正负样本水平上的准确率达到了 93.6%,预测值与实验值的线性相关值R2达到了0.82,证明了该方法的准确性。最后我们将该方法发展成为AILDE网络服务http://chemvang.ccnu.edu.cn/ccb/server/AILDE/,用于快速精确的 Hit-to-Lead 优化,并且提供给用户提交任务和查看结果的功能,让更多对计算机辅助药物分子设计没有基础的研究者可以零基础方便快捷的使用我们的服务器实现从苗头化合物到先导化合物的优化。然后,我们将自由能微扰理论与分子动力学模拟相结合,构建了基于氨基酸突变扫描的药物抗性预测新方法,相比于传统的基于结构的抗性预测方法,它能模拟更多的突变体类型,而且由于对突变体系增加了短时分子动力学模拟,从而使得突变体与小分子的结合构象更加接近于真实结合构象,构象采样后的结合能计算更加准确。我们对文献中报道的有抗性实验数据的17个体系的突变类型分布广泛的311个突变体进行了计算,最后得到的计算结果显示,在预测样本有无抗性方面准确率接近90%。最后,为了使更多的研究者能使用我们的方法进行药物抗性预测方面的工作,我们构建了第一个基于结构的能够用于多体系从头预测药物抗性的网络计算工具 AIMMS,网址 http://chemyang.ccnu.edu.cn/ccb/server/AIMMS/,可供用户免费使用,并且提供两种提交任务的模式,而且结果输出丰富多样,相信可以给做抗性预测方面的研究者带来更多的便利。并且我们使用AIMMS对植物激素ABA与其靶标PYR复合物进行突变扫描计算,最终成功找到了 4种在实验上能使ABA与PYR结合更紧密的突变体。最后,我们将分子动力学结合自由能微扰的思想应用到蛋白-蛋白相互作用的研究,用于寻找蛋白-蛋白互作界面上的热点氨基酸残基及其突变效应的预测。首先通过丙氨酸扫描的方法寻找蛋白互作界面上的热点氨基酸残基,然后在此基础之上我们进一步的对热点氨基酸残基实施全突变扫描来设计更多的突变体,以期能获得更多对蛋白互作产生较大影响的突变体。基于该方法,我们对有蛋白-蛋白互作实验值的32个体系的758个突变体组成的样本集进行了计算验证,经过统计分析,我们的计算方法在区分正负样本的准确率上达到了 79.3%;计算值与实验值的线性拟合相关系数R2=0.64,比其它已发表的线性系数最高的预测方法要高出超过10%。为了使更多的研究者能够使用我们的方法,我们将蛋白计算突变扫描方法开发成第一个在蛋白-蛋白互作界面上判断热点氨基酸残基及其突变效应的网络计算工具PIIMS,网址http://chemyang.ccnu.edu.cn/ccb/server/PIIMS/,提供给用户免费使用,研究者可以通过服务器提交自己的任务并且获得丰富多样的任务输出展示结果。
吴雪[8](2019)在《基于多信息融合的蛋白质相互作用预测研究》文中认为大数据时代,由于测序技术的迅速发展,生物实验数据与信息呈指数形式增长,海量的生物学数据不断涌现。在蛋白质组学研究中,如何选择和使用合适高效的机器学习方法预测蛋白质相互作用是一项具有挑战性的任务。对蛋白质之间的相互作用进行预测研究,可以帮助人类探明生命活动的内在本质与规律,还对了解疾病作用机理和开发有效药物起到推动性的作用。围绕基于多信息融合的蛋白质相互作用预测研究,本文主要工作如下:1.提出一种基于PPIs-stacking的蛋白质相互作用预测新方法。首先,运用伪氨基酸组成(pseudo-amino acid composition,PseAAC)、自相关函数(auto-correlate function,ACF)、氨基酸组分位置特异性得分矩阵(AAC-PSSM)、二肽组分位置特异性得分矩阵(DPC-PSSM)和三联体编码方式(conjoint traid,CT)五种方法对H.pylori和S.cerevisiae数据集进行特征提取并串联融合五组特征向量。其次,运用Lasso方法对串联融合后的特征向量进行降维。最后结合5折交叉验证检验方法将最优特征向量输入到stacking集成分类器进行预测,并运用Celeg、Ecoli、Hsapi以及Mmusc四个独立测试集验证模型,均取得了较高的准确率。实验结果表明,本文提出的基于PPIs-stacking方法的蛋白质相互作用预测模型取得了较好的预测效果。2.提出一种基于PPIs-WDSVM的蛋白质相互作用预测新方法。首先,运用伪氨基酸组成(pseudo-amino acid composition,PseAAC)、自协方差(auto-covariance,AC)和分组重量编码(encoding based on grouped weight,EBGW)方法对蛋白质序列进行特征提取,并串联融合提取的三组特征向量。其次,运用二维小波方法对串联融合后的特征向量进行降噪。最后将降噪后的特征向量输入到SVM分类器进行预测。采用5折交叉进行检验,在H.pylori与S.cerevisiae数据集上取得了令人满意的结果,实验结果表明,本文提出的基于PPIs-WDSVM方法的蛋白质相互作用预测模型取得了很好的预测效果。
张颖婕[9](2019)在《基于支持向量机的蛋白质序列信息提取及亚细胞定位研究》文中指出随着大数据时代与后基因时代的到来,海量功能未知、结构复杂的蛋白质序列信息涌入生物数据库。探索这些蛋白质序列的相关信息己成为信息学与生物学的热门研究方向。蛋白质在生物体中发挥的功能与其所处的亚细胞位置具有非常密切的关联性,所以,对蛋白质亚细胞的定位预测进行研究已成为生物信息学的重点内容。在这样的背景下,随着“互联网+”的推进,传统的生物实验方法早己无法满足现代研究的需求,以机器学习算法为代表的信息提取与处理方法及智能定位预测发挥了不可替代的作用。本论文利用机器学习算法研究蛋白质亚细胞的定位,结合所学专业中信息处理部分的相关知识,论文主要针对信息特征的提取算法和分类预测模型两个方面的内容进行了研究:(1)在现有方法的基础上,本文提出了一种改进型的伪氨基酸组成方法:新增加了9种特征来表达蛋白质序列,重新构造了特征表达模型。在对序列信息进行特征提取时,基于多特征融合的思想,结合自相关系数、熵密度法和所提新方法构成一种新的蛋白质特征向量表达模型,更进一步丰富了序列信息的表达。选择机器学习中泛化能力较强的支持向量机作为分类器,最终采用留一法在Gram-positive和Gram-negative两个数据集上进行交叉检验,并与传统方法所取得的结果进行对比,证实了所提新方法的实用性。(2)引入PsePSSM矩阵提取特征信息以表征氨基酸在进化过程中发生突变的可能;根据氨基酸的物化性质将氨基酸划分为6个大类,为进一步挖掘氨基酸残基的局部位置信息对蛋白质序列总体的影响,引入了先对序列进行切分再输入分类器进行预测的思想。新方法采用改进型PseAAC、三肽组成和基于PsePSSM矩阵提取的信息三者融合,共同进行蛋白质序列特征提取。为了解决单一分类器在分类预测中不可避免的局限性,本文进一步优化了分类算法模型,通过并联多个支持向量机构建集成分类器,并选择了两个包含多位点蛋白的数据集进行验证。结果表明:与单一分类器相比较,通过构建集成分类器可更进一步提升预测性能。
常继伟[10](2018)在《一种基于深度神经网络模型及蛋白相互作用预测癌症相关蛋白及蛋白组合的新方法》文中提出如何从大量数据中挖掘出有意义的信息,如何把复杂的研究对象用精确而简明的模型描述出来一直是数据处理工作中的中心课题。针对这个问题有两种截然不同的方法:数据挖掘和复杂网络理论。复杂网络和数据挖掘方法不仅有着相似的研究目的,而且其分析对象在多数情况下也相同。但在实验数据分析中将两者协同应用解决同一问题的情况比较少,主要原因是两者在分析对象上有较多重叠,在多数情况下仅用一种方式就可以解决问题。但实际上,将数据挖掘和复杂网络很好的结合起来解决问题会给数据分析提供新的思路。本研究将复杂网络和数据挖掘相结合,同时用于分析癌症相关基因/蛋白,结果表明复杂网络和数据挖掘技术的协同应用可以为生物学数据的分析提供新的切入点。对癌症的研究积累了大量而且类型丰富的数据,利用这些数据发现癌细胞中关键的基因及其作用途径一直是重要的研究方向。得益于丰富的数据,癌症领域的数据分析方法也层出不穷,其中结合蛋白质相互作用网络分析基因及蛋白功能的方法是一个重要的类别。在癌症相关的信号传导,细胞定位和表达调控等过程中蛋白质相互作用扮演重要的角色,因此以蛋白质相互作用为基础整合其它组学数据的生物信息方法对分析参与这些过程的关键基因及蛋白至为重要。本研究不仅以人类蛋白质相互作用网络为基础,结合基因表达、基因重要性及基因突变数据优选并分析了癌症相关基因/蛋白和蛋白组合,还利用新的模型将生物网络与组学数据有效的结合起来,为后续分析提供帮助。本文的工作主要包含以下两个方面:(1)结合蛋白质相互作用网络和蛋白质、基因的表达数据预测新的癌症相关基因和蛋白质组合。蛋白质相互作用网络是典型的复杂网络,网络中每条边表示一对蛋白质的相互作用关系。表达数据包含基因或蛋白质在癌症组织、癌症细胞系和正常组织的样本中的表达量的信息,比较两类样本可以得到与癌症关联密切的基因或蛋白质。本研究将蛋白质相互作用网络用于构建稀疏的自动编码机,而后用癌症细胞系和正常组织的差异表达数据作为训练数据,训练后的自动编码机同时包含相互作用信息和差异表达信息。将训练得到的自动编码机用于构建一个深层模型,来模拟每个蛋白质/基因敲降对其它蛋白质/基因表达的影响,最后将这种影响关系表示为有向网络的形式。蛋白间相互影响的有向网络可以用于鉴定新的癌症相关蛋白。在本研究优选的TOP 500个高可信度的癌症相关蛋白中有211个为已知的癌症药物靶点,其余蛋白质的功能与癌症也密切相关。与其它方法相比较该方法有较高的AUC值(>0.8)。蛋白间相互影响的网络也可以用于预测蛋白组合。本文中提到的蛋白组合可以是合成致死组合,也可以是药物靶标的组合。这两类蛋白组合在蛋白相互影响网络中都与特定的蛋白存在密切联系。本研究利用已知的蛋白组合将这组蛋白质识别出来,并用于识别新的蛋白组合。交叉验证表明该策略有较高的准确度(>0.85),可以用于鉴别新的蛋白组合。进一步将该模型用于前列腺癌的单细胞测序数据集,单细胞测序可以检测病患体内癌细胞群体的演化,对临床治疗有重要意义。文中利用前列腺癌的数据集训练模型且计算了相应的蛋白影响网络,然后利用该网络识别了前列腺癌蛋白,其中包含已知的前列腺癌基因。这表明该模型适用于单细胞测序数据和小样本数据,具有良好的应用前景。(2)结合蛋白质相互作用网络和基因重要性数据寻找复杂的基因关联关系。在本研究中蛋白质相互作用网络依然表示两个蛋白质间的相互作用关系。基因重要性数据是通过CRISPR(Clustered regularly interspaced short palindromic repeats)试验方法随机突变细胞系基因组得到,简单来讲基因重要程度越高,可以承受的突变越少。通过比较初始CRISPR随机突变的细胞系和经过一段时间的培养的细胞系间基因组的差异可以得到基因重要性数据。本研究将基因的重要性数据通过新方法转换为蛋白质相互作用的重要性。相互作用的重要性可以用于筛选重要的互作,计算相互作用间的相关性以及重新评估基因的重要性。本研究利用蛋白相互作用的相关性发现了以细胞因子信号通路相关的蛋白互作为核心的网络,为理解细胞因子对其它生物学途径的调控提供了方向。另外用高重要性相互作用构建的子网络包含了关键蛋白质行使功能时的互作信息,为优选关键相互作用提供了新的工具。最后本文利用该方法发现了差异表达基因与高频突变基因之间的关联。本研究通过以上的实验表明复杂网络和数据挖掘技术的协同应用可以为生物学数据的分析提供新的切入点。两个方法都是以相互作用为基础,在模型构建时同时利用组学数据进行训练,因而可以将两种数据有机的结合在一起。对癌症相关基因/蛋白的分析表明这种结合对分析生物学数据是有帮助的。
二、一种预测蛋白质结构型的新方法(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、一种预测蛋白质结构型的新方法(论文提纲范文)
(1)蛋白质分子光谱的理论模拟与人工智能预测(论文提纲范文)
摘要 |
ABSTRACT |
第1章 绪论 |
1.1 引言 |
1.2 蛋白质的研究进展 |
1.2.1 蛋白质分子光谱的研究进展 |
1.2.2.1 机器学习的定义及分类 |
1.2.2.2 机器学习中的常见算法 |
1.2.2.3 机器学习中的描述符 |
1.2.2.4 机器学习在化学中的应用 |
参考文献 |
第2章 电子密度泛函理论 |
2.1 背景介绍 |
2.1.1 Born-Oppenheimer近似 |
2.1.2 Hartree-Fock近似 |
2.2 密度泛函理论 |
2.2.1 Hohenberg-Kohn定理 |
2.2.2 Kohn-Sham方程 |
2.3 近似密度泛函 |
2.3.1 局域密度近似泛函 |
2.3.2 非局域密度泛函 |
2.3.2.1 广义梯度近似泛函 |
2.3.2.2 杂化泛函 |
2.4 含时密度泛函理论 |
2.5 量化计算软件包 |
参考文献 |
第3章 分子动力学理论 |
3.1 背景介绍 |
3.2 分子动力学运动方程积分算法 |
3.3 分子力学与势能函数 |
3.3.1 非键项 |
3.3.2 成键项 |
3.5 周期性边界条件 |
3.6 系综 |
3.6.1 控温技术 |
3.6.2 控压技术 |
3.7 能量极小化算法 |
参考文献 |
第4章 机器学习预测蛋白质肽键紫外光谱 |
4.1 背景介绍 |
4.2 机器学习与蛋白质光学性质的研究 |
4.2.1 计算细节 |
4.2.2 机器学习的预测结果 |
4.2.2.1 肽键激发能的预测 |
4.2.2.2 基态偶极矩和跃迁偶极矩的预测 |
4.2.2.3 蛋白质肽键紫外光谱的预测 |
4.2.3 工作总结 |
参考文献 |
第5章 机器学习预测蛋白质红外光谱 |
5.1 背景介绍 |
5.2 机器学习与蛋白质红外光谱 |
5.2.1 计算细节 |
5.2.1.1 量子力学方法处理蛋白质酰胺I带振动 |
5.2.1.2 振动哈密顿矩阵的机器学习协议 |
5.2.1.3 量子化学计算产生初始数据 |
5.2.1.4 神经网络架构以及机器学习描述符 |
5.2.1.5 机器学习模型评估 |
5.2.2 机器学习预测蛋白质红外光谱流程 |
5.2.3 机器学习分辨蛋白质二级结构 |
5.2.4 机器学习追踪泛素蛋白红外光谱随温度的变化 |
5.2.5 机器学习追踪蛋白质折叠过程 |
5.2.6 工作总结 |
参考文献 |
第6章 总结和展望 |
致谢 |
在读期间发表的学术论文与取得的其他研究成果 |
(2)LC-MS辅助NMR信号归属的蛋白质高级结构表征方法研究(论文提纲范文)
摘要 |
Abstract |
符号说明 |
1 前言 |
1.1 蛋白质的结构表征 |
1.1.1 蛋白质结构概述 |
1.1.2 蛋白质的一级结构表征 |
1.1.3 蛋白质的高级结构表征 |
1.2 氨基酸特殊标记与质谱技术联用研究蛋白质结构与功能 |
1.2.1 氨基酸特殊标记与质谱技术联用的基础 |
1.2.2 精氨酸特殊标记技术及其应用 |
1.3 立题依据 |
1.4 本论文中研究的蛋白质 |
1.4.1 泛素 |
1.4.2 降钙素基因相关肽(CGRP)和靶向CGRP抗体 |
1.5 本论文的研究内容及创新点 |
1.5.1 研究内容 |
1.5.2 创新点 |
2 泛素蛋白的表达纯化及鉴定 |
2.1 实验仪器、实验材料 |
2.1.1 实验仪器 |
2.1.2 实验材料 |
2.1.3 质粒和感受态细胞 |
2.2 泛素蛋白的诱导表达和纯化 |
2.2.1 溶液配制 |
2.2.2 质粒转化 |
2.2.3 蛋白表达 |
2.2.4 蛋白纯化 |
2.2.5 实验结果 |
2.3 泛素~1H-~(15)N HSQC谱图 |
2.3.1 溶液配制 |
2.3.2 样品制备 |
2.3.3 谱图采集 |
2.3.4 实验结果 |
2.4 泛素蛋白的氨基酸序列 |
2.4.1 溶液配制 |
2.4.2 肽图样品制备(胰蛋白酶酶解) |
2.4.3 色谱条件 |
2.4.4 质谱条件 |
2.4.5 实验结果 |
2.5 泛素蛋白DSC考察 |
2.5.1 溶液配制 |
2.5.2 DSC检测 |
2.5.3 实验结果 |
2.6 讨论 |
2.7 本章小结 |
3 LC-MS定量分析蛋白质中精氨酸修饰速率的方法建立 |
3.1 实验仪器与实验材料 |
3.1.1 实验仪器 |
3.1.2 实验试剂 |
3.2 溶液配制 |
3.3 精氨酸的专属性化学修饰 |
3.3.1 精氨酸与苯乙二醛修饰反应原理 |
3.3.2 精氨酸与2,3-丁二酮修饰反应原理 |
3.4 酶切样品制备 |
3.4.1 未修饰蛋白样品的制备 |
3.4.2 苯乙二醛修饰蛋白样品的制备 |
3.4.3 2,3-丁二酮修饰蛋白样品的制备 |
3.5 Skyline软件预测酶切肽段及离子对的选择 |
3.5.1 Skyline软件参数设置 |
3.5.2 色谱条件 |
3.5.3 质谱条件 |
3.5.4 Skyline软件预测酶切肽段及筛选离子对结果 |
3.6 实验结果 |
3.6.1 目标肽段离子对的确认和内标肽段的初步筛选 |
3.6.2 修饰试剂的选择 |
3.6.3 定量结果 |
3.7 讨论 |
3.8 本章小结 |
4 NMR定量检测蛋白质中精氨酸修饰速率的方法建立 |
4.1 实验仪器、实验材料 |
4.1.1 实验仪器 |
4.1.2 实验材料 |
4.2 溶液配制 |
4.3 ~1H-~(15)N HSQC谱图采集和目标/内标信号的确定 |
4.3.1 低pH值蛋白样品的制备 |
4.3.2 谱图采集 |
4.3.3 目标信号和内标信号的确定 |
4.3.4 定量结果 |
4.4 利用H2BC谱归属~1H-~(15)N HSQC谱图中精氨酸信号 |
4.4.1 样品制备 |
4.4.2 H2BC谱的采集和谱图 |
4.4.3 实验结果 |
4.5 讨论 |
4.6 本章小结 |
5 MS辅助归属自然丰度泛素中精氨酸侧链NMR信号 |
5.1 实验仪器、实验材料 |
5.1.1 实验仪器 |
5.1.2 实验材料 |
5.2 溶液配制 |
5.3 精氨酸的专属性化学修饰 |
5.4 专属性修饰后LC-MS信号衰减的测量 |
5.4.1 专属性修饰后LC-MS样品的制备 |
5.4.2 泛素中精氨酸LC-MS/MS定量分析 |
5.5 专属性修饰后NMR信号的衰减 |
5.5.1 专属性修饰后NMR样品的制备 |
5.5.2 ~1H-~(15)N HSQC谱核磁信号的衰减 |
5.6 实验结果 |
5.6.1 专属性修饰后LC-MS和 NMR信号衰减的测量结果 |
5.6.2 LC-MS和 NMR结果比对归属NMR信号 |
5.7 讨论 |
5.8 本章小结 |
6 一种新的靶向CGRP抗体的制备研究 |
6.1 实验仪器、实验材料 |
6.1.1 实验仪器 |
6.1.2 实验材料 |
6.2 一种新的靶向CGRP抗体以及对照抗体的制备 |
6.2.1 CGRP抗体的瞬转表达 |
6.2.2 CGRP抗体原液纯化 |
6.2.3 CGRP抗体原液和注射液的制备 |
6.3 CGRP抗体的蛋白序列 |
6.3.1 理论序列 |
6.3.2 溶液配制 |
6.3.3 肽图样品制备 |
6.3.4 色谱条件 |
6.3.5 质谱条件 |
6.3.6 实验结果 |
6.4 CGRP抗体纯度检测 |
6.4.1 分子排阻色谱法(SEC-UPLC) |
6.4.2 毛细管凝胶电泳法(CE-SDS) |
6.5 CGRP抗体结合活性方法的建立和检测 |
6.5.1 方法原理 |
6.5.2 溶液配制 |
6.5.3 实验过程 |
6.5.4 方法建立 |
6.5.5 方法耐用性考察 |
6.5.6 实验结果 |
6.6 讨论 |
6.7 本章小结 |
7 靶向CGRP抗体的抗原表位研究 |
7.1 实验仪器、实验材料 |
7.1.1 实验仪器 |
7.1.2 实验材料 |
7.2 ELISA法研究CGRP抗体的抗原表位 |
7.2.1 CGRP(1-18)和CGRP(19-37)与CGRP抗体结合 |
7.2.2 CGRP(19-24)和CGRP(25-37)与CGRP抗体结合 |
7.2.3 CGRP(25-37,无C端酰胺)与CGRP抗体结合 |
7.2.4 结果与讨论 |
7.3 NMR法研究CGRP抗体的抗原表位 |
7.3.1 α-CGRP蛋白~1H-~(15)N HSQC谱图 |
7.3.2 α-CGRP与对照抗体结合后~1H-~(15)N HSQC谱图 |
7.3.3 α-CGRP与新抗体结合后的~1H-~(15)N HSQC谱图 |
7.3.4 结果与讨论 |
7.4 LC-MS辅助归属抗原中精氨酸MNR信号 |
7.4.1 溶液配制 |
7.4.2 LC-MS定量分析α-CGRP中精氨酸修饰速率的方法建立 |
7.4.3 专属性修饰后LC-MS信号衰减的测量 |
7.4.4 专属性修饰后NMR信号衰减的测量 |
7.4.5 结果与讨论 |
7.5 讨论 |
7.6 本章小结 |
8 总结与展望 |
8.1 总结 |
8.2 未来研究展望 |
参考文献 |
攻读学位期间的科研成果 |
致谢 |
(3)基于K-mer扭转角偏好的蛋白质结构类型预测(论文提纲范文)
1 研究方法 |
1.1 5-mer扭转角的统计分析与聚类 |
1.1.1 5-mer中间氨基酸扭转角的统计分析 |
1.1.2 拉氏图中扭转角的聚类分析 |
1.2 蛋白质序列结构类型的预测 |
1.2.1 序列分段与扭转角的聚类 |
(1)序列分段 |
(2) 聚类分析 |
1.2.2 结构类型的预测 |
(1)打分策略 |
(2)分组 |
(3)结构的拼接与筛选 |
(4) 结构的分类与准确率 |
2 结果分析 |
2.1 5-mer扭转角的偏好统计 |
2.2 蛋白质的结构类型预测 |
2.2.1 9组CATH数据的分类 |
2.2.2 60组CATH数据的分类 |
3 讨 论 |
4 结 论 |
(4)基于生物序列与结构大数据的分析方法及应用研究(论文提纲范文)
摘要 |
abstract |
主要符号对照表 |
第1章 引言 |
1.1 选题背景及意义 |
1.2 研究现状和趋势 |
1.3 研究方向和论文结构 |
第2章 自然向量方法及其应用 |
2.1 自然向量法与自助抽样方法 |
2.1.1 蛋白质序列的60维自然向量 |
2.1.2 Hausdorff距离 |
2.1.3 自然图形表示 |
2.1.4 自助抽样法方法的应用 |
2.2 原绿球藻的系统发育分析 |
2.2.1 背景介绍 |
2.2.2 改进的自然向量方法 |
2.2.3 序列的分类预测 |
2.2.4 原绿球藻的系统发育关系 |
2.2.5 分类结果 |
2.2.6 菌株SS120和MIT9211的特征分析 |
2.2.7 分析与讨论 |
2.3 DNA条形码数据的分类进化研究 |
2.3.1 背景介绍 |
2.3.2 数据集介绍 |
2.3.3 DNA条形码的遗传距离分析 |
2.3.4 DNA条形码的分类准确率 |
2.3.5 DNA条形码的系统发育分析 |
2.3.6 分析与讨论 |
2.4 型冠状病毒亚属的聚类分析 |
2.4.1 背景介绍 |
2.4.2 数据集介绍 |
2.4.3 型冠状病毒的聚类结果 |
第3章 凸分析原理及其应用 |
3.1 凸包是否相交的判定方法 |
3.1.1 投影直线法 |
3.1.2 法向量法 |
3.1.3 子集判定法 |
3.1.4 最小距离法 |
3.1.5 线性规划法 |
3.1.6 线性判别分析法 |
3.2 生物类别之间的进化和系统发育关系的凸分析研究 |
3.2.1 背景介绍 |
3.2.2 人鼻病毒病毒数据分析 |
3.2.3 人乳头瘤病毒数据分析 |
3.2.4 埃博拉病毒数据分析 |
3.2.5 蛋白激酶C数据分析 |
3.2.6 蛋白磷酸酶数据分析 |
3.2.7 DNA条形码数据分析 |
3.2.8 分析与讨论 |
3.3 凸分析原理及人类蛋白质数据的分类进化研究 |
3.3.1 凸分析原理 |
3.3.2 数据集介绍 |
3.3.3 关于蛋白质序列的凸分析原理 |
3.3.4 蛋白激酶数据的分类研究 |
3.3.5 交叉验证 |
3.3.6 人类蛋白激酶的系统发育分析 |
3.3.7 人类蛋白质数据的凸分析 |
3.3.8 分析与讨论 |
第4章 蛋白质结构比较 |
4.1 背景介绍 |
4.2 研究方法 |
4.3 分类结果 |
4.4 分析与讨论 |
第5章 总结与展望 |
5.1 本文结论 |
5.2 本文创新点 |
5.3 后续研究方向 |
参考文献 |
致谢 |
附录 A三维Yau-Hausdorff度量 |
附录 B关于旋转次数的选择 |
个人简历、在学期间发表的学术论文与研究成果 |
(5)蛋白质、RNA修饰位点预测的机器学习方法及应用研究(论文提纲范文)
摘要 |
abstract |
1 绪论 |
1.1 研究背景与意义 |
1.2 国内外研究现状 |
1.3 本文主要研究内容和结构安排 |
2 蛋白质、RNA修饰位点预测基本方法 |
2.1 引言 |
2.2 蛋白质特征提取方法 |
2.3 RNA特征提取方法 |
2.4 降维方法 |
2.5 机器学习方法 |
2.6 预测性能评估 |
2.7 小结 |
3 基于DNNAce的蛋白质乙酰化位点预测 |
3.1 引言 |
3.2 材料与方法 |
3.3 结果与讨论 |
3.4 小结 |
4 基于Stack RAM的RNA N~6-甲基腺苷位点预测 |
4.1 引言 |
4.2 材料与方法 |
4.3 结果与讨论 |
4.4 小结 |
5 总结与展望 |
参考文献 |
附录 |
致谢 |
攻读硕士学位期间的研究成果 |
(6)活细胞的太赫兹波谱特征研究及无标记超材料传感芯片的构建(论文提纲范文)
缩略语表 |
英文摘要 |
中文摘要 |
第一章 前言 |
1.1 细胞无标记检测的意义及研究现状 |
1.2 THz波技术无标记检测细胞的优势与现状 |
1.3 THz波技术与响应性水凝胶结合契机 |
1.4 本研究拟开展的工作 |
第二章 THz-ATR薄膜传感技术检测活细胞波谱特征及细胞迁移能力的研究 |
2.1 材料与方法 |
2.2 结果 |
2.3 讨论 |
2.4 小结 |
第三章 自参考模式的THz超材料细胞传感芯片的研究 |
3.1 材料与方法 |
3.2 结果 |
3.3 讨论 |
3.4 小结 |
第四章 偏振不敏感型THz超材料细胞传感阵列的研究 |
4.1 材料与方法 |
4.2 结果 |
4.3 讨论 |
4.4 小结 |
第五章 葡萄糖敏感水凝胶的THz波谱特征及功能化THz超材料芯片的构建 |
5.1 材料与方法 |
5.2 结果 |
5.3 讨论 |
5.4 小结 |
全文结论 |
参考文献 |
文献综述 太赫兹波成像技术的临床应用研究进展 |
参考文献 |
攻读学位期间研究成果 |
致谢 |
(7)蛋白-蛋白/小分子相互作用的分子模拟新方法研究(论文提纲范文)
摘要 |
ABSTRACT |
本文主要创新点 |
第一章 文献综述 |
1.1 引言 |
1.2 计算机辅助药物设计 |
1.2.1 基于配体的药物设计 |
1.2.2 基于结构的药物设计 |
1.3 DFT-QSAR的发展和立体效应参数 |
1.3.1 QSAR及其基本方法 |
1.3.2 DFT-QSAR的发展 |
1.3.3 立体效应参数 |
1.4 先导化合物的设计和发现 |
1.4.1 先导化合物的发现方法 |
1.4.2 计算机辅助先导发现研究进展 |
1.5 药物分子的抗性及抗性预测方法 |
1.5.1 基于数据的预测方法 |
1.5.2 基于结构的预测方法 |
1.5.3 药物抗性预测研究进展 |
1.6 蛋白-蛋白互作和热点氨基酸残基 |
1.6.1 蛋白质互作的测定方法和数据库 |
1.6.2 蛋白质互作研究对药物设计的意义 |
1.6.3 热点氨基酸残基的预测方法研究进展 |
1.7 课题的提出 |
参考文献 |
第二章 STERIMOL参数量化计算方法开发和DFT-QSAR研究 |
2.1 引言 |
2.2 DFT方法计算取代基STERIMOL参数和QSAR模型的构建 |
2.2.1 DFT方法计算取代基Sterimol参数 |
2.2.2 基于Sterimol参数的DFT-QSAR模型构建 |
2.3 计算结果与分析 |
2.4 本章小结 |
参考文献 |
第三章 基于配体定向进化模拟的分子设计方法及平台搭建 |
3.1 引言 |
3.2 配体定向进化计算方法的设计 |
3.2.1 取代基库的构建 |
3.2.2 配体定向进化计算程序设计 |
3.3 计算方法验证 |
3.3.1 数据收集 |
3.3.2 计算结果分析 |
3.3.3 计算结果举例 |
3.4 AILDE网络服务器的开发 |
3.5 本章小结 |
参考文献 |
第四章 基于氨基酸突变扫描的药物抗性预测方法开发及平台搭建 |
4.1 引言 |
4.2 氨基酸突变扫描方法的开发 |
4.2.1 氨基酸残基突变方法的选择 |
4.2.2 自动计算突变扫描计算方法的设计 |
4.3 自动氨基酸突变扫描方法验证 |
4.3.1 抗性数据的收集 |
4.3.2 计算结果分析与讨论 |
注释 |
4.4 AIMMS网络服务器的开发和应用 |
4.5 本章小结 |
参考文献 |
第五章 蛋白-蛋白互作的热点氨基酸识别方法开发及平台搭建 |
5.1 引言 |
5.2 蛋白-蛋白界面计算突变扫描方法的开发 |
5.2.1 界面氨基酸残基的识别 |
5.2.2 丙氨酸突变扫描识别热点氨基酸残基 |
5.2.3 热点氨基酸位点的突变体设计 |
5.3 计算方法验证与结果讨论 |
5.3.1 蛋白-蛋白互作突变体数据收集 |
5.3.2 计算结果讨论与分析 |
5.4 PIIMS服务器的开发和应用 |
5.5 本章小结 |
参考文献 |
全文总结 |
附录 |
附录一 主要名词英文全称、缩写对照表 |
附录二 AHAS、PDK1和CATHEPSIN K体系量子化学描述符计算结果 |
附录三 分子定向进化计算结果汇总 |
附录四 氨基酸突变扫描计算结果汇总 |
附录五 氨基酸突变扫描方法与CMS方法在四种抗性等级阈值下预测结果准确率比较 |
附录六 蛋白-蛋白互作计算结果汇总 |
攻读学位期间发表的SCI论文及软件着作权 |
致谢 |
(8)基于多信息融合的蛋白质相互作用预测研究(论文提纲范文)
摘要 |
abstract |
1 绪论 |
1.1 引言 |
1.2 蛋白质相互作用预测的生物学基础 |
1.3 蛋白质相互作用预测的国内外现状 |
1.4 论文主要研究内容及结构安排 |
1.4.1 论文主要研究内容 |
1.4.2 论文的结构安排 |
2 蛋白质相互作用预测的基本方法 |
2.1 引言 |
2.2 特征提取方法 |
2.2.1 氨基酸组分与伪氨基酸组分 |
2.2.2 自相关函数 |
2.2.3 位置特异性得分矩阵 |
2.2.4 三联体组合信息编码 |
2.2.5 自协方差 |
2.2.6 分组重量编码 |
2.2.7 二肽组成 |
2.3 降噪与降维方法 |
2.3.1 二维小波降噪 |
2.3.2 互信息 |
2.3.3 核主成分分析 |
2.3.4 Lasso降维 |
2.3.5 奇异值分解 |
2.3.6 局部流形嵌入 |
2.4 分类算法 |
2.4.1 逻辑回归 |
2.4.2 朴素贝叶斯 |
2.4.3 决策树 |
2.4.4 K近邻算法 |
2.4.5 Adaboost算法 |
2.4.6 Stacking集成分类器 |
2.4.7 支持向量机 |
2.5 预测评估指标 |
2.6 本章小结 |
3 基于PPIs-stacking的蛋白质相互作用预测 |
3.1 引言 |
3.2 材料与方法 |
3.2.1 数据集 |
3.2.2 特征提取 |
3.2.3 Lasso降维 |
3.2.4 Stacking集成分类器 |
3.2.5 模型构建 |
3.3 结果与讨论 |
3.3.1 特征提取方法的参数选择 |
3.3.2 降维方法的选择 |
3.3.3 Stacking与其它分类器的比较 |
3.3.4 与其它方法的比较 |
3.4 本章小结 |
4 基于PPIs-WDSVM的蛋白质相互作用预测 |
4.1 引言 |
4.2 材料与方法 |
4.2.1 数据集 |
4.2.2 特征提取 |
4.2.3 小波降噪 |
4.2.4 支持向量机 |
4.2.5 模型构建 |
4.3 结果与讨论 |
4.3.1 特征提取方法的参数选择 |
4.3.2 小波函数及尺度选择 |
4.3.3 核函数选择 |
4.3.4 特征提取算法对预测结果的影响 |
4.3.5 与其它算法的比较 |
4.3.6 预测模型的性能 |
4.3.7 与其它方法的比较 |
4.4 本章小结 |
总结与展望 |
参考文献 |
附录 |
致谢 |
攻读学位期间发表论文 |
(9)基于支持向量机的蛋白质序列信息提取及亚细胞定位研究(论文提纲范文)
摘要 |
Abstract |
第一章 绪论 |
1.1 研究背景及意义 |
1.2 国内外研究现状 |
1.3 论文研究内容与结构安排 |
第二章 蛋白质亚细胞定位研究的理论基础 |
2.1 引言 |
2.2 常用蛋白质数据库介绍 |
2.3 序列特征信息提取的基本方法 |
2.3.1 氨基酸组分 |
2.3.2 伪氨基酸组分 |
2.4 分类预测算法 |
2.4.1 K近邻算法 |
2.4.2 支持向量机与LIBSVM |
2.5 预测性能评估和评价指标 |
第三章 基于改进型PseAAC与特征融合的序列信息提取及亚细胞定位 |
3.1 引言 |
3.2 数据集的选取 |
3.3 构建蛋白质序列信息特征表达模型 |
3.3.1 信息数据处理 |
3.3.2 自相关系数 |
3.3.3 熵密度 |
3.3.4 改进型伪氨基酸组成模型 |
3.3.5 多信息融合特征表达模型 |
3.4 降维算法 |
3.5 实验结果与分析 |
3.6 小结 |
第四章 基于PsePSSM与三肽组成的多位点亚细胞定位研究 |
4.1 引言 |
4.2 数据集的选取 |
4.3 多位点蛋白特征提取模型 |
4.3.1 伪位置特异性得分矩阵PsePSSM |
4.3.2 三肽组成 |
4.3.3 多特征融合 |
4.4 多标签集成分类器 |
4.5 基于集成分类器的序列信息特征模型构建 |
4.6 实验结果与分析 |
4.6.1 评价指标 |
4.6.2 特征提取方法实验结果对比分析 |
4.6.3 分类器性能实验结果对比分析 |
4.7 小结 |
第五章 全文总结与展望 |
5.1 工作总结 |
5.2 研究展望 |
参考文献 |
攻读硕士学位期间完成的科研成果 |
致谢 |
(10)一种基于深度神经网络模型及蛋白相互作用预测癌症相关蛋白及蛋白组合的新方法(论文提纲范文)
摘要 |
Abstract |
缩略词表 |
第一章 前言 |
1.1 课题的提出 |
1.2 生物复杂网络的研究方法 |
1.2.1 复杂网络简介 |
1.2.2 蛋白质相互作用网络 |
1.3 生物复杂性的数据挖掘方法 |
1.3.1 数据挖掘简介 |
1.3.2 人工神经网络 |
1.3.3 自动编码机 |
1.3.4 深度学习 |
1.4 生物复杂性数据挖掘的主要类型 |
1.4.1 转录组 |
1.4.2 蛋白组 |
1.4.3 基因重要性 |
1.4.4 癌基因 |
1.5 本研究内容及意义 |
第二章 一种基于神经网络模型预测癌症相关蛋白质及蛋白质组合的方法 |
2.1 前言 |
2.2 材料与方法 |
2.2.1 数据收集 |
2.2.1.1 已知药物靶点数据集 |
2.2.1.2 基因和蛋白质表达数据集 |
2.2.1.3 蛋白质互作数据集 |
2.2.1.4 蛋白质组合数据集 |
2.2.2 研究方法 |
2.2.2.1 神经网络模型预测癌症相关蛋白质及蛋白质组合的流程概述 |
2.2.2.2 评价本模型对预测癌症相关蛋白质的表现 |
2.2.2.3 训练前列腺癌特异模型 |
2.2.2.4 基于蛋白质相互作用构建关键蛋白质的KD子网络 |
2.3 结果与分析 |
2.3.1 神经网络模型预测癌症相关蛋白质 |
2.3.1.1 癌症相关蛋白质的预测结果 |
2.3.1.2 预测的癌症相关蛋白质的功能分析 |
2.3.1.3 评估本模型对癌症相关蛋白质的预测表现 |
2.3.2 神经网络模型预测癌症相关蛋白质的组合 |
2.3.2.1 癌症相关蛋白质组合的预测结果 |
2.3.2.2 评估本模型对癌症相关蛋白质组合的预测表现 |
2.3.3 结合PPI数据的KD网络分析 |
2.3.3.1 靶点蛋白为核心的三个KD子网络分析 |
2.3.3.2 已知药物靶点为核心的KD子网络分析 |
2.3.4 前列腺癌神经网络模型的训练和预测结果 |
2.3.4.1 前列腺癌相关蛋白质预测 |
2.3.4.2 前列腺癌相关蛋白质的组合的预测 |
2.4 本章小结 |
第三章 利用蛋白质相互作用网络和基因重要性识别癌症基因 |
3.1 前言 |
3.2 材料与方法 |
3.2.1 数据收集 |
3.2.1.1 基因重要性数据 |
3.2.1.2 蛋白质相互作用网络 |
3.2.2 研究方法 |
3.2.2.1 预测癌症基因 |
3.2.2.2 计算相互作用的值 |
3.2.2.3 计算相互作用相关性 |
3.3 结果与讨论 |
3.3.1 蛋白质相互作用的相关性分析 |
3.3.2 筛选突变相关蛋白质 |
3.3.3 预测药物靶标 |
3.3.4 差异表达基因与突变基因 |
3.4 本章小结 |
第四章 总结与展望 |
参考文献 |
附录 已发表及在投论文 |
致谢 |
四、一种预测蛋白质结构型的新方法(论文参考文献)
- [1]蛋白质分子光谱的理论模拟与人工智能预测[D]. 叶盛. 中国科学技术大学, 2021(09)
- [2]LC-MS辅助NMR信号归属的蛋白质高级结构表征方法研究[D]. 路晶晶. 烟台大学, 2020(04)
- [3]基于K-mer扭转角偏好的蛋白质结构类型预测[J]. 万晓耕. 生物信息学, 2021(01)
- [4]基于生物序列与结构大数据的分析方法及应用研究[D]. 赵鑫. 清华大学, 2020(01)
- [5]蛋白质、RNA修饰位点预测的机器学习方法及应用研究[D]. 禹昭敏. 青岛科技大学, 2020(01)
- [6]活细胞的太赫兹波谱特征研究及无标记超材料传感芯片的构建[D]. 赵祥. 中国人民解放军陆军军医大学, 2019
- [7]蛋白-蛋白/小分子相互作用的分子模拟新方法研究[D]. 吴丰旭. 华中师范大学, 2019(01)
- [8]基于多信息融合的蛋白质相互作用预测研究[D]. 吴雪. 青岛科技大学, 2019(11)
- [9]基于支持向量机的蛋白质序列信息提取及亚细胞定位研究[D]. 张颖婕. 云南大学, 2019(03)
- [10]一种基于深度神经网络模型及蛋白相互作用预测癌症相关蛋白及蛋白组合的新方法[D]. 常继伟. 华中农业大学, 2018(01)