您好, 访客   登录/注册

同源性\一致性和相似性的辨析

来源:用户上传      作者: 宋亚珍 南红梅 刘枫

  摘要:针对描述eDNA、DNA、氨基酸和蛋白质序列等亲缘关系的3个专用词语――同源性、一致性和相似性在生物类论文中交错使用的问题,对其具体含义和运用进行了分析,以明晰各词语在论文中的准确使用,提高编辑校对质量。
  关键词:同源性,一致性,相似性
  中图分类号:N04;Q7 文献标识码:A 文章编号:1673―8578(2011)02-0048-03
  
  随着分子生物学和生物技术的发展,有关基因工程及其应用的研究广泛展开,同时各种新的科技词语不断出现,但有些词语在具体使用中常出现混淆。笔者在论文编辑校对过程中,常遇到在eDNA、DNA、氨基酸、蛋白质等水平上分析物种亲缘关系的描述中,对同源性(homology)、一致性(identity)和相似性(similarity)的交错使用现象,在描述序列的相似程度时表达模糊。实际上homology、identity和similarity的具体含义以及它们所表达的亲缘关系程度是有区别的。因此,笔者依据文献对这几个词语进行辨析。
  
  一 homology,identity和similarity的基本概念
  
  homology:词根为homo,拉丁语,意为man(人)。homology意为同系、同源。一般科技论文将其译为同源性。《现代汉语规范词典》对同源性的解释为“泛指事物来源相同”。
  identity:与动词identify同根,identify解释为证明、鉴定、认为同一、视为同一等。identity意为同一性,而《现代高级英汉双解辞典》(英汉版)解释为“绝对相同,完全相同”,一般科技论文将其译为一致性。《现代汉语规范词典》对“同一性”解释为“指矛盾的统一性、一致性”。
  similarity:词根为similar,意为like,即类似的、相似的。similarity则解释为相似、类似,一般科技论文将其译为相似性。《现代汉语规范词典》对相似性解释为“相像、相近”。
  同源性、一致性、相似性分别来源于英文单词homology、identity和similarity,属于科技词语的舶来品,表达目的有相近之处,但实际含义又有不同。在编辑工作中,常常疏于深究它们的具体含义,这三个词语在分子生物学论文中的交错使用比较多见,因此有必要对这三个词语的含义进行具体分析:
  (1)词根及其词根词性不同
  homology词根为homo,拉丁语意为mail(人),名词。identity源自identify,identify为动词。simi―larity源自similar,其为形容词。
  (2)表达词义、程度不同
  homology表示有血缘关系上的同一性,含有源自天然的、客观无法改变的同一性,表示事物某种性质的“是”或“不”,“有”或“无”,其英文解释为quality 0f being homogeneous,formed 0f the samekind。
  identity表示身份等的同一,严格的匹配,是对鉴定行为的客观结论,表示事物某方面某种性质在客观评价指标上的高度同一性,其英文解释为state0f being identical,absolute sameness,exact likeness,who somebody is。
  similarity是一般名词,对事物外在表现同一性的大概描述,其英文解释为likeness,state 0f being similar。
  
  二 同源性、一致性和相似性的区别
  
  根据同源性、一致性、相似性概念的区别,在科技论文写作及编辑校对中应按照具体的表达目的选择合适的名词,确切地表述研究结果。
  (1)同源性的使用示例及辨析
  在生物学研究中,经常会通过寻找基因同源序列来探讨物种的进化关系。所谓同源序列,是指从某一共同祖先经趋异进化而形成的不同序列,序列间有共同的祖先。同源性用以描述物种亲缘关系的远近,一般应表述为“有”或“无”,“完全”或“部分”。对序列同源性进行分析时,一般是将待研究序列加入到一组来自不同物种的多序列中,以确定该序列与其他序列的同源关系。常用的分析工具是CLUSTAL等。
  例1 细胞遗传学中,染色体组成相同的染色体被称为同源染色体;染色体组成有部分相似性,则称为部分同源染色体。
  (2)一致性的使用示例及辨析
  序列间相同的程度即为一致性。当两条序列同源时,它们的氨基酸或核苷酸序列通常有显著的一致性。
  核苷酸(氨基酸)序列一致性表示所选序列核苷酸(本序列编码的氨基酸)残基的一致程度。分析位点一致程度,它的数值代表比对序列中相同位点残基完全一致的比例。
  例2研究结果表明,PtPPF-1与豌豆PPF-1、水稻PPF-1和拟南芥ALB3中编码叶绿体内膜蛋白的氨基酸残基的一致性分别为94%、91%和91%。
  例3苦荞CHS基因核苷酸序列与其他植物CHS基因序列的‘同源性’依次为水蓼84%、土沉香80%、红掌79%、大麦79%、黄芩79%、芸香80%、无茎糖芥79%、莲78%。
  例4对三七三萜皂苷合成关键酶法呢基焦磷酸合酶(FPS)的基因进行克隆,cDNA序列全长1 409 bp,开放阅读框共编码343个氨基酸残基,氨基酸序列与积雪草、银胶菊、青篙、山艾树的FPS氨基酸序列的‘同源性’分别为95%,87%,86%和86%,核酸序列‘同源性’则分别为81%,66%,68%和66%。
  例2的“一致性”是正确的说法,而例3、例4中的“同源性”应为“一致性”。
  (3)相似性的使用示例及辨析
  在生物学研究中,在对DNA或蛋白序列比对过程中,用来描述检测序列和目标序列之间相同DNA碱基或氨基酸残基序列所占比例的多少,即为该序列的相似性。相似性越高,说明序列功能越保守,进化变异越小。当序列相似性程度高于50%,可能推测检测序列和目的序列是同源序列;而当相似性低于20%时,就很难推断序列间的同源关系。
  序列比对的基本思想是找出检测序列和目标序列的相似性。从序列全长角度考虑序列的整体相似性,叫整体比对;只考虑序列部分区域的相似性是局部比对。实际应用中,多采用Blast和FastA等进行序列的局部比对。
  例5丹参迷迭香酸生物合成途径中苯丙氨酸支路上的肉桂酸-4一羟化酶SmC4H(einnamate-4-Hydorxyl-ase)基因,其cDNA序列全长1 800 bp,包含一个完整的1512bp的开放阅读框,编码504个氨基酸组成的前体蛋白,该基因与藿香的CAH基因相似性达到94.7%,一致性达到89.7%。
  例5的“相似性”和“一致性”说法正确。
  
  三 同源性与一致性、相似性的关联
  
  例6所谓基因家族,就是具有显著“相似性”的一组基因,编码相似的蛋白质产物。也就是具有类似结构,或功能相关的(保守的、同源的)一类基因。通过对同类基因的同源关系、进化历程的研究,进一步来研究基因的功能和调控机制。
  例7序列分析结果表明,甘肃牦牛与青海牦牛该序列的核苷酸“同源性”为98.13%,与云南牦牛该序列的核苷酸“同源性”为97.65%,青海牦牛与云南牦牛该基因片段的核苷酸序列“同源性”为99.45%。
  例7中的“同源性”应该为“相似性”或“一致性”。
  从以上分析可以看出,相似性(一致性)与同源性有一定关系(例5、6),一般来说序列相似性(一致性)越高,则它们是同源序列的可能性越高,所以经常可以通过相似性(一致性)来推测序列是否同源。正因为如此,经常出现将相似性(一致性)和同源性等价混合使用的现象(例3、4、7)。 一致性、相似性,均描述的是序列间亲缘关系上的同一性,属于量化的指标,由此可以反映物种间在某些方面的关系,而同源性属于质的判断(例1)。当序列同源时,它们的氨基酸或核苷酸序列通常有显著的一致性。如果两条序列有一个共同的进化祖先,那么它们是同源的。可以说,一致性、相似性是对同源性不同角度的量化指标,应根据分析结果确定不同的描述结论。所以,不能将相似性(一致性)和同源性混为一谈,所谓“具有50%的同源性”或“这些序列高度同源”等说法,都是不确切的。
  致谢:衷心感谢西北大学生命科学院徐子勤教授、西北农林科技大学农学院刘曙东教授对本文形成过程中的启发和指导。


转载注明来源:https://www.xzbu.com/8/view-1057672.htm