[TiMing]:AnJiSuanJiDanBaiZhiErJiJieGouDeTongJiFenXi
[作者]:刘鑫[ZuoZhe]:LiuZuo[专业]:理论物理[ZhuanYe]:LiLunWuLi
[导师]:郑伟谋[DaoShi]:ZhengWeiMou[学位]:博士[XueWei]:BoShi
[单位]:中国科学院理论物理研究所[DanWei]:ZhongGuoKeXueYuanLiLunWuLiYanJiuSuo
[关键词]:氨基酸;蛋白质二级结构;生物信息学
[时间]:20030702[页数]:73页[点击]:20041[分类号]:O414.2;Q518.1[语种]:中文文摘[来源]: 毕业论文
[文摘]:蛋白质是生命活动的一种基本物质.对氨基酸性质及蛋白质二级结构的研究是生物信息学中的基本问题.蛋白质是由十十种氨基酸构成的.实验表明,不同氨基酸之间存在程度不同的相似性.这为氨基酸字母集的约化提供了依据.另一方面,在进行序列分析时,我们希望从蛋白质的残基序列中提取信息,从而对蛋白质的结构和属性进行研究.但与DNA序列相比,蛋白质序列更短,并且字母集又是DNA序列的五倍.对氨基酸字母集进行适当的约化可以增加统计中的信噪比,提高分析能力.文中,我们根据条件概率与随机背景的对数似然比对氨基酸字母集进行了约化,并将我们的结果与其它约化方法的结果进行了比较.另外,氨基酸相似性是蛋白质序列联配、蛋白质设计和蛋白质结构预测的基础.目前常用的计分矩阵都是基于蛋白质库整体而没有区分残基所处的蛋白质二级结构.了解蛋白质二级结构对氨基酸间相似性的影响可以提高我们对序列分析的能力.为此,我们利用Kullback-Leibler距离计算了不同蛋白质二级结构中氨基酸间的差异性,并据此对不同蛋白质二级结构中的氨基酸字母集进行了约化.虽然蛋白质二级结构的预测方法已经发展了三十多年,单序列预测精度仍然只在65%左右.为将预测精度提高到一个新的水平,人们进行了很多探索.文中,我们通过考虑残基间的三阶关联将GOR方法进行了扩展.我们根据描述处于特定二级结构态的中心氨基酸对两侧各位置处残基出现概率的权重矩阵得到了中心氨基酸对处于该二级结构态的计分体系.应用该计分体系,我们建立了一种蛋白质二级结构预测方法.作为一种只使用了单一序列的预测方法,它达到了70%的高精度.
[上一条]:最大熵方法在生物大分子中的应用及结构蛋白力学性质研究
[下一条]:离散变分研究和数值方法

