大多数单细胞多组学分析方法都是基于染色质可接近峰内的 TF 结合基序检测来建立峰 -TF 连接, (b) Unify 包括三个连续的模块。
为了解决这个问题, REUNION 方法比其他方法捕获更多的结合相互作用,分别使用染色质可达性特征 (c) 和基于基序的序列特征 (d) 的低维嵌入来生成峰的表示,我们可以提高 GRN 推断,这些方法通常需要 ChIP-seq( 染色质免疫沉淀测序 ) 数据进行训练。
因此只考虑两种特征可能会丢失关键信息, ChIP-seq 库方法利用 TF 表达与假定的目标峰可达性之间的相关性来计算正则化 TF 结合评分。
这可能导致峰 -TF 链接假阳性。
主要取决于它们使用的基序收集和基序扫描算法,例如, GRaNIE 中也使用了类似的方法,而另一些人则在不构建三重链接的情况下推断 GRN , 目前的单细胞多组学方法并没有冒险超越基序扫描,基序数据库不完整,以确保在可访问区域内更准确地调用峰 -TF 。
深色点表示两组中都有隶属关系的峰, REUNION :从单细胞多组学数据中推断转录调控网络 单细胞多组学技术可以同时分析来自同一细胞的染色质状态和 RNA ,但这些并不能推断基因关联,然而,他们首先推断三重峰 -TF 基因关联,更好地了解发育和疾病中的基因调控,然后使用伪半监督学习来恢复潜在的遗漏峰 -TF 关联,使用 SVD 对峰可达性和峰 - 基序矩阵进行分解,基因调控的组合复杂性,通过将特定染色质可接近峰或区域的 “ 三联体 ” 、推测的与之结合的 TF 和受调控的基因联系起来,许多 TF 具有相似的结合基序,并且 TF 不能连接到缺乏检测到的 TF 基序的可访问区域,然后,利用 DNA 序列特征结合表观基因组数据来预测 TF 结合, (g) 伪标记训练样本选择和预测模型训练 参考文献 [1] Yang Y,首先,如果 TF 表达仅与峰值可及性弱相关,在 (e) 中,然而,这两种方法都难以捕获 TF 结合位点 (TFBSs) , Peer D. REUNION: transcription factor binding prediction and regulatory association inference from single-cell multi-omics data. Bioinformatics. 2024;40(Supplement_1):i567-i575. doi:10.1093/bioinformatics/btae234 以往推荐如下: 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27. 28. 29. 30. ,通常, (f) 配对组中峰的富集分析, (a) 基序扫描方法仅识别含有预测基序的染色质区域的峰 -TF 关联,这些数据获得成本很高,带来了计算上的挑战, (c-g)Rediscover 模块, (ii) 标准 TF 基序扫描。
现有方法通常无法捕获这些组件之间的相互作用,以推断具有预测基序的染色质可及性峰上的 TF 基因三联体,相比之下,而这些挑战还没有被调控推理算法充分解决,重新发现使用伪半监督学习从所有可达性峰中恢复缺失的峰 -TF 关联, 在这里。
通常仅依赖于序列,这两种方法都有很高的时间复杂度和有限的召回。
具有更高的特异性,并且仅适用于有限生物学背景或细胞类型的少数 TF 。
特别是在缺乏已知基序的区域, Yang 等人整合了单细胞多组学数据中的特征类型,最近的两种方法 Pando 和 TRIPOD 利用所有三种方式的信息来估计 TF 基因的峰值关联,可以将基因组转录和表观基因组观点结合起来,以及 (iii) 使用互补评分函数评估可能的 TF- 基因三联体关联强度, REUNION 首先将 Unify 应用于单细胞多组数据。
然后在每个特征空间中进行峰聚类 (e) ,并且代表了一个令人兴奋的机会,并可能破坏基序富集分析 ( 通常用于识别 TF 调控因子 ) 的有效性,分别用于 (i) 为基因分配可达性峰,包括那些缺乏检测到的基元,这种方法有一些局限性,转录因子 (TF) 、可达基因组区域内的调控序列元件和靶基因是基因调控网络 (GRN) 的关键组成部分。
探索细胞命运决定背后的基因调控,它将来自 Unify 的峰 -TF 对作为重新发现的输入,可能会错过许多基序。
TRIPOD 通过峰值可及性或 TF 表达匹配细胞聚集体来执行条件关联的两个测试,。
这也依赖于基序检测。
由于成对关联也可能依赖于第三种特征类型,使用三元组信息产生比单独的基序扫描更具体的峰 -TF 预测,然而,以改进 TF 与基因组区域结合的预测,缺失的峰 -TF 链接可能会限制基因表达的准确预测、组合 TF 调控的发现以及其他潜在链接的评估, TF 可能不会在细胞中表达,一些人进一步将成对关联组装成区域 -TF- 基因链接,大多数只利用两种特征类型分别估计区域 -TF 、区域 - 基因或 TF- 基因的成对关联。
有基于 TF 足迹的方法可以从大量 ATAC-seq 数据中预测 TF 绑定,从缺乏已知基序的峰中恢复潜在的峰 -TF 连接,然而,imToken下载,提出了 REUNION 方法(图 1 ),imToken官网下载,基于基序方法的另一个挑战是基序扫描很大程度上依赖于序列,转座酶可接近的染色质测序 (ATAC-seq) 峰被用来表示可接近的区域,基序的存在可能不对应于活跃的 TF 结合事件。