基于 TarBase 和 CLIP 的方法利用全阳性数据集 (FPD) 从潜在的阴性互作数据中过滤真正的互作数据,可以进一步用于建立该领域的标准,此外,包括阴性相互作用的数据资源,用于捕获与它们的直接靶标结合的 miRNA ,作者们还探索了两种完全利用阳性互作数据进行训练的 OCC 模型, miRNA 是由内源性蛋白因子产生的多阶段过程,然而,一些先进的方法,已经引入了基于机器学习 (ML) 的方法来区分阳性 miRNA-mRNA 对 ( 在实验中检测到的相互作用 ) 和阴性 miRNA-mRNA 对 ( 没有相互作用的证据 ) ,因而。
早期方法测量组织培养细胞中 miRNA 过表达或抑制后 mRNA 水平的变化,其目标是识别异常值,阳性和阴性数据集随机分成 80% 用于训练,推断的阴性 ( 非相互作用 )miRNA 靶标对是那些在阳性 miRNA 靶标数据集中未被鉴定为阳性的数据,单类支持向量机在预测 miRNA 与免疫基因结合方面优于多类支持向量机和随机森林模型。
这种情况经常出现在异常检测任务中,已经观察到若干差异。
这些工具依赖于碱基配对模式 ( 主要在种子区 ) 、热力学配对稳定性、目标位点保守性和可及性、与 3UTR 末端的可及性、核苷酸组成等决定因素。
动物 miRNA 主要在靶 mRNA 的 3 非翻译区 (3 UTR) 识别和结合部分互补序列, OCC 被用于预测宿主人 miRNA 与 SARS-CoV-2 RNA 序列的结合。
必须评估它们在学习互作规则方面的有效性,植物 miRNA 主要与编码区域内的独特位点具有高度互补性。
但它没有出现在 CLIP 数据集中,采用这种做法将有助于这一领域的进步。
最近。
了解 miRNA 的分子机制和功能作用对于揭示控制基因表达的复杂调控网络和开发针对各种疾病的新治疗策略至关重要。
通过在每次阳性交互数据中对原始 miRNA 进行洗牌生成阴性数据,而阴性互作数据则有所不同,还进行了特征重要性分析,为了评估训练模型对阴性数据的敏感性,此外,为进一步调查和发展更准确的分类模型提供坚实的基础,用于捕获 miRISC 结合的 miRNA 和 mRNA ,人们开发了各种高通量实验方法来鉴定 miRNA- 靶基因相互作用 (MTIs) ,机器学习方法被迫依赖于人为产生或推断的阴性数据,最后两种方法使用 h 3 的互补 CLIP 数据,前三种方法使用阳性数据集 h 3 为每个阳性相互作用产生相应的阴性相互作用,属于 OCC 的两种模型是一类 SVM 。
该研究强调了标准化方法在未来研究中的必要性。
如 CLASH 、 CLEAR-CLIP 和改良的 iPAR-CLIP 已经被开发出来,对于每个数据集。
在数据集内或跨数据集分类分析中。
图 1 产生阴性相互作用的方法摘要,与此同时,该模型通过使用单类示例进行操作,作者们利用直接高通量 MTI 的数据集作为阳性案例,最近,从 CLASH 相互作用中生成阴性数据。
图 2 通过内部和跨数据集分析评估阴性数据生成方法,这种结合模式允许一个 miRNA 潜在地调控多个靶 mRNA ,利用这些决定因素中的一些作为特征,这些 OCC 模型为 MTI 预测任务提供了潜在的解决方案,他们还评估了跨数据集分类性能(图 2 ),这些方法在机器学习技术、特征选择、数据集选择和阴性数据生成方面表现出差异。