发表主题
论坛首页 推荐主题 主题专辑 爱医培训 爱医杂志 签约作者 荣誉勋章 排行榜 我的主页
查看: 2943|回复: 0
打印 上一主题 下一主题

【ZT】蛋白质组学的基本概念

[复制链接]
跳转到指定楼层
1# 楼主
发表于 2005-4-24 16:34 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有帐号?注册

x
天坛医院 康熙雄

人类对自身生命的追问以及对其所生存的环境中各种生命现象的探索从未停止过。20世纪是生命科学迅猛发展的100年,基因研究是20世纪生命科学的主线。遗传信息载体的DNA双螺旋结构的提出,基因**、转录、翻译及遗传密码的分析与破译,最终问世了“中心法则”随着全球性基因组计划尤其是人类基因组计划(HGP)的不断深入推进,基因研究已达到了前所未有的深度和广度。人类基因组计划的重大研究成果--人类基因组序列草图在2001年的完成,宣告了生命科学随着新世纪的到来也进入了一个新的纪元--"后基因组时代"(postgenome era)。功能基因组学(functional genomics)成为研究的重心,蛋白质组学(proteomics)又是功能基因组学的核心。对此,Nature和Science分别在人类基因草图公布的同时发表述评与展望[1][2],充分肯定了蛋白质组学在生命科学研究中的重要地位。下面就蛋白质组学几个主要概念加以讨论。

一、基因组(genome)
  
  基因组是指细胞或生物体的一套完整的单倍体遗传物质,是所有不同染色体上全部基因和基因间的DNA的总和。基因组是一个十分稳定的体系,同一种系不同个体之间的染色体数目是相同的,各染色体上有相同数量的基因和基因分布,也有基本相同的核苷酸顺序,即基因组是一个相对静态的概念,一个有机体从它的发生、发展到衰老、死亡,不同细胞、组织和器官的基因组是基本稳定不变的。

二、基因组学(genomics)

  基因组学是研究生物基因组的组成,组内各基因的精确结构、相互关系及表达调控的科学。任何一种生物的基因组计划的完成都标志有三套完整数据的获得:遗传图、物理图、全序列图。遗传图提供了各基因间的相对距离,物理图则给出了各基因间的实际物理距离,全序列图,顾名思义,提供的是全部基因的序列结构和基因的精确定位。因此理论上说,这三套数据将提供此生物所有基因在染色体上的精确定位、基因内部序列结构与所有基因间隔序列。由于真核生物中基因结构的复杂性以及现有基因识别理论与技术发展的严重不足,三套完整数据的获得只能在原核生物或低等真核生物中得以实现。由此,人类基因组计划的完成,并不表明人类对自身基因组的所有基因及其间隔序列已完全确定。真核生物尤其是高等真核生物已测定基因组中开放阅读框架(open read fragment,ORF) 的确定,仍是未解决的重大问题。而一个基因在ORF确定前很难从分子水平上进行实质性的功能分析。

  基因调控的研究表明,即使是简单的微生物,其基因组中也不是所有基因都同时表达。通常情况下,生物的基因组只表达其中的少部分基因,而且表达的基因类型以及表达的程度随生物生存环境和内在状态的变化而表现极大的差别,此差别存在严格时空特异性。基因及其编码产物蛋白的线性对应关系(所谓"一个基因,一种蛋白质")只存在于新生肽链而不是最终的功能蛋白中。1个基因生产的蛋白质可以多于一种。越是较高等的细胞,这种数量上的差异越明显。据估计在E.coli中1个基因平均可编码1.3个蛋白;在S.cerevisiae中1个基因平均可编码3个蛋白;人的1个基因大约可编码10种蛋白,这是由于1个基因可经过基因内重组或在转录中经过不同的剪接翻译成不同的蛋白质;而蛋白质在合成之后又可能进行不同的翻译后修饰,包括磷酸化、糖基化、硫基化、酰基化、甲基化等。即在基因表达过程中的不同水平(**、转录、翻译等)都可能因各生物大分子的不同相互作用而产生不同的蛋白质。人类基因组的3到4万个基因可能生产出几十万个蛋白。仅从这一个角度也可以看出,即使我们读出全部基因,仍然不足以对全部蛋白质的种类和数量加以描述和预测,更不足以对主要由蛋白质演绎的复杂生命活动加以描述和预测了。这也是基因组学研究的局限所在。
从上可见,基因虽是遗传信息的源头,而功能性蛋白是基因功能的执行体。基因组计划的实现为未来生命科学研究奠定了坚实的基础,但它并不能提供认识各种生命活动直接的分子基础。蛋白质是生命活动功能的直接执行者,只有通过对所有蛋白质的总和进行研究,即开展蛋白质组学研究,才能更加贴近地掌握生命的现象和本质,找到生命活动的规律,才是基因组学的核心。

三、蛋白质组(proteome)

  蛋白质组的概念是由澳大利亚学者Wilkins和Williams等人于1994年提出[3],根据他们的定义,"proteome"一词源于"protein"与"genome"杂合。另有学者认为, "proteome"代表一个完整生物全套蛋白质或反应不同细胞的组合。由此,有三种含义,指的是由一个细胞,一个组织或一种生物的基因组所表达的全部相应的蛋白质。作为基因表达产物的蛋白质,其种类和数量在不同的时间及环境下是不同的,同一时刻取得的蛋白质组的数据,由于所处不同的生理病理状态,是不同的,即蛋白质组是一个动态的概念。

四、蛋白质组学(proteomics)

  随着蛋白质组概念的提出,蛋白质组学的概念也应运而生。目前蛋白质组学尚无明确的定义,一般认为它是研究蛋白质组或应用大规模蛋白质分离和识别技术研究蛋白质组的一门学科,是对基因组所表达的整套蛋白质的分析。蛋白质组学的第一篇原始论著1995年发表于Electrophoresis。蛋白质组学研究内容包括对各种蛋白质的识别和定量化,确定它们的细胞内外的定位、修饰、相互反应、活性, 最终确定它们的功能。并对由此获取的数据进行数据库构建,以及推动这一学科进步的蛋白质组分析技术的研究。
  蛋白质组学研究有两条途径:一条是类似基因组学的研究,即力图"查清"人类大约3万到4万多基因编码的所有蛋白质,建立蛋白质组数据库,即组成蛋白质组学研究;另一条途径,则是着重于寻找和筛选引起2个样本之间的差异蛋白质谱产生的任何有意义的因素,揭示细胞生理和病理状态的进程与本质,对外界环境**的反应途径,以及细胞调控机制,同时获得对某些关键蛋白的定性和功能分析,即比较蛋白质组学研究。

  1.组成蛋白质组学研究(结构蛋白质组学)
  这是一种针对有基因组或转录组数据库的生物体或组织、细胞,建立其蛋白质或亚蛋白质组(或蛋白质表达谱)及其蛋白质组连锁群的一种全景式的蛋白组学研究,从而获得对有机体生命活动的全景式认识。
  应该认识到,全基因组研究的发端和升温,是由于大规模基因组测序技术的实现和其后高通量的基因芯片技术的发展所推动的。而蛋白质组迄今还不具备相应的技术基础,且大规模的高通量DNA研究是建立在4种碱基及其配对性质的相对单一和简单的原则基础上的,而对蛋白质的识别和鉴定的原则要复杂得多。随着对蛋白质组学的深入理解和具体工作的开展,人们逐渐认识到在短时间内建立人类蛋白质组学"完整的"数据库和实现网络资源共享的条件尚未成熟。在没有弄清楚具体蛋白质的结构、功能、表达调控和亚细胞定位之前,其应用前景也不是十分的明确和直接,其可操作性也因此大打折扣。

  2.比较蛋白质组学研究(差异蛋白组学、功能蛋白质组学)
  以重要生命过程或人类重大疾病为对象,进行重要生理、病理体系过程的比较蛋白质组学研究,是比较蛋白质组学研究的核心。
以分子生物学为代表的生命科学的不断发展与相应技术的急剧进步是分不开的,可以说目前生命科学每一步重大突破都是基于相应技术的突破。虽然蛋白质组学研究的支撑技术(双向凝胶电泳、质谱技术、生物信息学技术等)已经取得了巨大的进步并在蛋白质组学研究中发挥着决定性的作用,但不可否认,无论是蛋白分离技术--2-DE存在的对低丰度蛋白、碱性蛋白、疏水性蛋白的低检测力,还是酵母双杂交系统的缺乏快速、高效的手段获取复杂蛋白质相互作用的多维信息,以及蛋白质的生物信息学研究的应用范围与准确率所需的进一步提高,各种数据的整理和算法的规范,更复杂的信息综合能力,蛋白质相互作用的准确分析,界定相互作用连锁群等方面,都需要新的突破性技术的进一步开发。虽然在微生物中,基因组、转录组基础上的蛋白质全谱研究已有成功报道,但在高等生物尤其是哺乳动物中未见报道,人类组织或细胞的蛋白质组全谱基本未涉及。比照基因组测序式的对人类"完全"蛋白质组进行扫描和建档的研究途径,优先开展筛选特定情况(疾病、农业新品种等)下的蛋白质组中特殊标志蛋白与关键蛋白的研究("差异蛋白质组学"),并迅速运用到满足我国有重大需求的实际应用中去,是一种更符合中国国情的切实可行的研究途径。可以说差异蛋白质组学是功能蛋白质组学研究的一个分支,通过参与不同生理病理过程蛋白质种类和数量的比较,寻找重要生理过程中的关键蛋白和导致疾病发生的标志性蛋白的这类研究,现在正获得国内外众多蛋白质组学研究者日益增多的关注,中国的科学工作者就此提出了一种全新的研究策略:功能蛋白质组学[4],它是位于对个别蛋白质的传统蛋白质研究和以全部蛋白质为研究对象的蛋白质组研究之间的层次的一个概念,指研究特定时间、特定环境和实验条件下基因组所表达的蛋白质。

五、临床蛋白质组学(clinical proteomics)

  任何研究的目的都是要服务于人类,蛋白质组学的研究也不例外。蛋白质组学的研究已涉及到临床的各个方面:  

  1.诊断:
  如疾病筛查、疾病分期分型等。因为不同病理过程中蛋白质的种类和数量会有不同的变化,有的蛋白质呈现明显的上调,有的则较正常生理过程出现缺失或明显下调,把这些疾病特异和疾病相关的蛋白质作为生物标志物(biomarker)。对于特定蛋白质在特定疾病中的作用的深入研究,为最终找到疾病的病因、发病机制提供了客观依据,也是疾病临床分期分型的分子基础。   

  2.指导治疗:
  如病程分析、用药、手术时机的选择等。  

  3.提供药物开发的临床依据:
  如确定药物靶点、新药开发(某些药物本身就是蛋白质)等。  

  4.预后判断:
  如根据生物标志物在不同疾病中的变化,从而判断疾病的性质和严重程度等。




转自好医生.


edited by pathology on 2005-10-19 at 01:14 AM
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|关于我们|隐私保护|版权保护|小黑屋|爱爱医 ( 粤ICP备2023094852号 )

GMT+8, 2024-5-23 01:16

Powered by Discuz! X3.1

© 2001-2013 Comsenz Inc.