撰文
春晓
责编
兮
早期对人类基因组序列的预测,发现超过10万个蛋白编码基因,但是随后的研究发现,其中大部分基因是并不编码蛋白,而是负责生成非编码RNA(noncodingRNA)等。
如今,在人类蛋白质组学项目(HumanProteomeProject)NeXtProt数据库中,有大约17,个蛋白编码基因的翻译产物已经有蛋白质谱数据作为佐证,同时还有大约2,个未经质谱验证的蛋白编码基因。近年来,在对核糖体结合RNA的高通量分析中,发现了一些过去被认为是非编码RNA或假基因(pseudogene)的基因片段中存在很多非经典翻译产物。但是,迄今为止,对于这些非经典翻译产物是否能够稳定地翻译成蛋白质以及这些蛋白产物具有什么生物学功能,还缺乏系统性研究。
年1月28日,来自哈佛-麻省理工Broad研究所等多家研究机构的研究团队合作,由ToddR.Golub领衔在NatureBiotechnology杂志上发表题为Noncanonicalopenreadingframesencodefunctionalproteinsessentialforcancercellsurvival的研究论文,对非经典开放阅读框ORF进行系统分析及生物学功能探索。
这篇论文中,作者从众多的非经典ORF中选取了个高优先级别的候选ORF进行分析,发现其中57个ORF在被敲除后,会降低肿瘤细胞活力。而在过表达条件下,其中个ORF能够检测到蛋白表达产物;同时,个ORF过表达能够改变细胞基因表达。通过CRISPR敲除和起始密码子突变实验,作者进一步验证这些ORF是通过其蛋白质翻译产物,而非其RNA转录产物实现生物学功能。最后作者以其中的一个ORF——G(重命名为富含甘氨酸的细胞外蛋白1,GREP1)为例,证明该ORF编码了一种在乳腺癌中高度表达的分泌蛋白,并且它可以作为乳腺癌的预后指标和临床治疗靶点。
首先,作者从大约1万种ORF中筛选出个备选ORF,并对它们可能的蛋白翻译产物\蛋白质生物活性\以及对细胞活力的影响3个方面进行分析(图1)。第一步,作者对公共数据库中的蛋白质谱数据进行筛选,发现其中个ORF(31%)的多肽片段已有质谱检测数据。然后,作者构建了个ORF的library,并采用V5标签融合蛋白及免疫荧光方法进行检测,发现以LINC为代表的个(46%)蛋白质翻译产物。
图1.非经典ORF筛选及鉴定流程。在确定了这些非经典ORF确实存在蛋白翻译产物后,作者进一步探索这些翻译产物是否有生物学活性。通过在4种不同的细胞系中(MCF7,A,A,HA1E)表达这个ORF,然后使用L0平台,同时对种RNA转录产物进行测定,作者发现,其中个ORF(73%)在过表达后会引起转录水平的变化,其中个具有显著性(图2)。相同条件下,过表达经典ORF大致有(81%)会引起细胞转录的变化。为了排除这些非经典ORF通过RNA转录产物发挥作用的可能性,作者进一步突变了其中51个非经典ORF的蛋白翻译起点并重复以上转录分析,发现突变这些ORF的蛋白翻译起点后,其中48个ORF对细胞转录的影响便消失了,证明它们是通过蛋白翻译产物而非RNA转录产物发挥作用。
图2.通过基因表达分析鉴定具有生物学功能的ORF。由于过表达实验通常可能引起artificialeffect,因此,作者进一步在8个细胞系中(MCF7、A、A、HA1E、PC3、HEPG2、A、HT29),通过CRISPR/Cas9对这些ORF进行了敲除实验,发现敲除其中57个ORF(10%)会引起显著的生长抑制效应,其中31个ORF对8种细胞系都影响,而另外26个仅对部分细胞有影响(图3)。
图3.通过CRISPR敲除验证非经典ORF对肿瘤细胞活性的影响。最后,通过以上3种高通量筛选(翻译产物,生物活性,细胞活力),作者发现了13个ORF可能具有重要的生物学功能。从中作者选择了GREP1进行进一步深入研究,因为GREP1只对8种细胞中的一种所必需,而且在多种肿瘤中高表达(图4)。进一步通过在种肿瘤细胞系中进行CRISPR敲除实验,发现GREP1主要为乳腺癌细胞所必需。而且,乳腺癌患者临床样品中GREP1的表达也比正常组织高,且表现为更差的临床预后。通过一系列生化和细胞实验,作者发现GREP1通过影响肿瘤细胞分泌促癌因子如GDF-15发挥作用,即表达GREP1的肿瘤细胞分泌更多的致癌细胞因子GDF15,而且补充GDF15也可以逆转GREP1敲除造成的的生长抑制。
综上所述,本文中,作者发现非经典ORF的确可以表达具有生物活性的蛋白,而且这些蛋白可以成为潜在的肿瘤治疗靶点。
原文链接: