lincrnas中转录蛋白编码序列残留的鉴定

长基因间非编码RNA(lincrbepaly买球nas)是长度大于200个核苷酸的非编码转录物,不与蛋白质编码序列重叠。重要的是,这些元素被认为是特定组织表达的,并在数千个基因组位点的基因调控中发挥广泛作用。然而,对这些RNA分子的进化生物发生机制知之甚少,尤其是考虑到它们在物种间的保护不善。有人提出,lincrnas可能来自假基因。为了系统地测试这一点,研究人员在美因茨大学开发了一种新的方法,在lincrna转录物中搜索蛋白质编码序列的残余物;假设我们可以从蛋白质编码基因或后转座子/后转座子插入追溯它们的生源。运用这种方法,他们发现203个人类lincrna基因的区域与蛋白质编码序列显著相似。该方法提供了一个可视化的工具,通过序列发散来跟踪Lincrnas在蛋白质编码基因方面的进化过程。随后,研究人员利用公共的RNA序列库显示了lincrnas和他们识别的亲本蛋白质编码基因之间的表达相关性。暗示新的基因调控关系。综上所述,他们开发了一种新的计算方法来研究非编码基因序列,bepaly买球可用于鉴定Lincrnas的进化生物发生和功能。

在lincrna中寻找蛋白质编码序列残留的方法学

RNA序列

蛋白质编码基因(氨基酸序列)与非编码基因(DNA序列)的比对流程图,步骤如下:确定最长的常见子串,bepaly买球然后向两个方向延伸,直到找到零概率事件。进程在未对齐的区域上迭代。然后,选择一个单独的块,其长度不超过10个氨基酸和/或不匹配。最后,优化了不同帧之间的边界,根据我们的评分矩阵定义最大化校准分数。

可利用性–用于获取Lincrna集预测的开放式软件(一级和二级,在下一个Github存储库中可以找到413个lincrnas),并将每个lincrna与其相应的蛋白质编码基因进行比对。https://github.com/swttalyan/protsinlincrna

塔利安马英九,穆罗EM.(2018) lincrnas中转录蛋白编码序列残留的鉴定. 核酸研究[印刷前电子版]。[ 文章]

留下答复

您的电子邮件地址将不会发布。已标记必需字段*

*