lncfinder–一个用于长非编码RNA识别的集成平台bepaly买球

发现新的长非编码RNA(lncrnas)已bepaly买球成为lncrna相关研究的一个基本bepaly买球步骤。如今,许多基于机器学习的工具已经被开发出来用于识别lncrna。然而,许多方法仅使用序列衍生特征预测lncrnabepaly买球,在不同物种上表现不稳定。此外,大多数工具不能由用户重新培训或定制,也不能根据研究人员的要求定制或集成功能。

在这项研究中,研究人员来自吉林大学对从序列固有成分中提取的特征进行了综合评价。二级结构和理化性质。开发了一个集成平台lncfinder,提高了lncRNA识别的性能,促进了对lncRNA识别的研究。lncfinder包括一个新的lncrna预测因子,使用研究人员设计的异种特征。实验结果表明,该方法在多个物种上优于多个最先进的工具,结果更为稳健和令人满意。研究人员还可以利用lncfinder提取各种经典特征,利用多种机器学习算法建立分类器,并有效地评估分类器的性能。lncfinder可以从不同的角度揭示lncRNA和mRNa的性质,进一步激发lncRNA蛋白相互作用预测和lncRNA进化分析。预计lncfinder能显著促进lncRNA相关研究,尤其是对于那些勘探得不好的物种。

本研究的框架

RNA序列

实验中使用的数据集是从gencode和ensembl收集的。每个基因只使用一个转录本。除了序列固有成分外,利用两种特征选择方案,从多尺度二次结构和基于EIIP的理化性质中提取特征。用10倍cv和roc曲线进行评估,得到了最优特征组合和机器学习算法,开发了一种新的低噪声低噪声低噪声编码识别方法。这种方法是以五种常用工具为基准的。最终包含在lncfinder中,这是一个高度灵活的包,用于识别和分析lncrna。lncfinder作为r包和Web服务器发布。

可利用性–lncfinder作为r包发布(https://cran.r-project.org/package=lncfinder)Web服务器(Web服务器)http://bmbl.sdstate.edu/lncfinder/)也是为了最大化其可用性而开发的。

汉斯Liang YMa QXu YZhang Y杜伟王丙李毅。(2018) lncfinder:利用序列固有成分进行长非编码RNA识别的集成平台,bepaly买球结构信息及理化性质. 简讯生物通知[印刷前电子版]。[ 文章]

留下答复

您的电子邮件地址将不会发布。已标记必需字段*

*