用于全基因组关联研究的统计显著子图

Sese Jun, Terada Aika, Saito Yuki, Tsuda Koji
统计上可靠的数据挖掘研讨会论文集 (ECML/PKDD), PMLR 47:29-36, 2015.

摘要

全基因组关联研究 (GWAS) 已被广泛用于理解单核苷酸多态性 (SNP) 与疾病之间的关联。GWAS 数据通常与已知的生物网络结合,并使用图挖掘技术进行分析,以系统地理解 SNP 引起的生物变化。为了确定哪些子图与疾病相关,需要对每个子图进行统计检验。然而,由于多重检验校正导致校正后的显著性水平极小,因此没有发现统计上显著的结果。我们引入了一种名为 gLAMP 的方法,用于枚举与诊断具有统计显著关联的子图。gLAMP 将无限制项多重检验程序 (LAMP) 与一种名为 COmmon Itemset Network mining (COIN) 的图挖掘算法相结合。LAMP 为我们提供了最小可能的 Bonferroni 系数,而 COIN 则为我们提供了对可检验子图进行有效枚举的能力。它们组合的理论结果表明,有潜力枚举与疾病统计上显著相关的子图。

引用本文


BibTeX
@InProceedings{pmlr-v47-sese14a, title = {用于全基因组关联研究的统计显著子图}, author = {Sese, Jun and Terada, Aika and Saito, Yuki and Tsuda, Koji}, booktitle = {统计上可靠的数据挖掘研讨会论文集 (ECML/PKDD)}, pages = {29--36}, year = {2015}, editor = {Hämäläinen, Wilhelmiina and Petitjean, François and Webb, I.}, volume = {47}, series = {机器学习研究论文集}, address = {法国南锡}, month = {15 Sep}, publisher = {PMLR}, pdf = {https://pmlr.com.cn/v47/sese14a.pdf}, url = {https://pmlr.com.cn/v47/sese14a.html}, abstract = {全基因组关联研究 (GWAS) 已被广泛用于理解单核苷酸多态性 (SNP) 与疾病之间的关联。GWAS 数据通常与已知的生物网络结合,并使用图挖掘技术进行分析,以系统地理解 SNP 引起的生物变化。为了确定哪些子图与疾病相关,需要对每个子图进行统计检验。然而,由于多重检验校正导致校正后的显著性水平极小,因此没有发现统计上显著的结果。我们引入了一种名为 gLAMP 的方法,用于枚举与诊断具有统计显著关联的子图。gLAMP 将无限制项多重检验程序 (LAMP) 与一种名为 COmmon Itemset Network mining (COIN) 的图挖掘算法相结合。LAMP 为我们提供了最小可能的 Bonferroni 系数,而 COIN 则为我们提供了对可检验子图进行有效枚举的能力。它们组合的理论结果表明,有潜力枚举与疾病统计上显著相关的子图。} }
Endnote
%0 会议论文 %T 用于全基因组关联研究的统计显著子图 %A Jun Sese %A Aika Terada %A Yuki Saito %A Koji Tsuda %B 统计上可靠的数据挖掘研讨会论文集 (ECML/PKDD) %C 机器学习研究论文集 %D 2015 %E Wilhelmiina Hämäläinen %E François Petitjean %E I. Webb %F pmlr-v47-sese14a %I PMLR %P 29--36 %U https://pmlr.com.cn/v47/sese14a.html %V 47 %X 全基因组关联研究 (GWAS) 已被广泛用于理解单核苷酸多态性 (SNP) 与疾病之间的关联。GWAS 数据通常与已知的生物网络结合,并使用图挖掘技术进行分析,以系统地理解 SNP 引起的生物变化。为了确定哪些子图与疾病相关,需要对每个子图进行统计检验。然而,由于多重检验校正导致校正后的显著性水平极小,因此没有发现统计上显著的结果。我们引入了一种名为 gLAMP 的方法,用于枚举与诊断具有统计显著关联的子图。gLAMP 将无限制项多重检验程序 (LAMP) 与一种名为 COmmon Itemset Network mining (COIN) 的图挖掘算法相结合。LAMP 为我们提供了最小可能的 Bonferroni 系数,而 COIN 则为我们提供了对可检验子图进行有效枚举的能力。它们组合的理论结果表明,有潜力枚举与疾病统计上显著相关的子图。
RIS
TY - CPAPER TI - 用于全基因组关联研究的统计显著子图 AU - Jun Sese AU - Aika Terada AU - Yuki Saito AU - Koji Tsuda BT - 统计上可靠的数据挖掘研讨会论文集 (ECML/PKDD) DA - 2015/11/27 ED - Wilhelmiina Hämäläinen ED - François Petitjean ED - I. Webb ID - pmlr-v47-sese14a PB - PMLR DP - 机器学习研究论文集 VL - 47 SP - 29 EP - 36 L1 - https://pmlr.com.cn/v47/sese14a.pdf UR - https://pmlr.com.cn/v47/sese14a.html AB - 全基因组关联研究 (GWAS) 已被广泛用于理解单核苷酸多态性 (SNP) 与疾病之间的关联。GWAS 数据通常与已知的生物网络结合,并使用图挖掘技术进行分析,以系统地理解 SNP 引起的生物变化。为了确定哪些子图与疾病相关,需要对每个子图进行统计检验。然而,由于多重检验校正导致校正后的显著性水平极小,因此没有发现统计上显著的结果。我们引入了一种名为 gLAMP 的方法,用于枚举与诊断具有统计显著关联的子图。gLAMP 将无限制项多重检验程序 (LAMP) 与一种名为 COmmon Itemset Network mining (COIN) 的图挖掘算法相结合。LAMP 为我们提供了最小可能的 Bonferroni 系数,而 COIN 则为我们提供了对可检验子图进行有效枚举的能力。它们组合的理论结果表明,有潜力枚举与疾病统计上显著相关的子图。 ER -
APA
Sese, J., Terada, A., Saito, Y. & Tsuda, K.. (2015). 用于全基因组关联研究的统计显著子图. 统计上可靠的数据挖掘研讨会论文集 (ECML/PKDD), in 机器学习研究论文集 47:29-36 可从 https://pmlr.com.cn/v47/sese14a.html 获取.

相关材料