Frontiers of Data and Computing ›› 2023, Vol. 5 ›› Issue (6): 104-114.
CSTR: 32002.14.jfdc.CN10-1649/TP.2023.06.010
doi: 10.11871/jfdc.issn.2096-742X.2023.06.010
Previous Articles Next Articles
YANG Chenliu(),FANG An,WANG Lei,WANG Qian,QIAN Qing*()
Received:
2023-06-19
Online:
2023-12-20
Published:
2023-12-25
YANG Chenliu, FANG An, WANG Lei, WANG Qian, QIAN Qing. Development Analysis and Suggestions for High Performance Computing in Biomedical Field in China[J]. Frontiers of Data and Computing, 2023, 5(6): 104-114, https://cstr.cn/32002.14.jfdc.CN10-1649/TP.2023.06.010.
Table 1
Construction of High Performance Computing Cluster in NIH and Domestic Institutions (Up to June 2023)"
序号 | 高性能计算集群 | 所属国家 | 建设机构 | 理论算力 (PFlops) | 处理 核心(颗) | 使用范围 | 计算内容 |
---|---|---|---|---|---|---|---|
1 | Biowulf高性能计算集群 | 美国 | 国立卫生研究院 | 2.49 | 91,024 | 机构内部 | 基因组学、分子和结构生物学、数学和图形分析、图像分析和其他科学领域的计算应用等 |
2 | 生物医学高性能计算平台 | 中国 | 中国医学科学院 | 1.02 | 2,520 | 机构内部 | 数据存储,分子对接、基因测序、蛋白质预测等 |
3 | 国家基因组科学数据中心生物大数据云计算平台 | 中国 | 中国科学院北京基因组研究所 | 0.26 | 8,300 | 机构内部 | 解决计算生物学和生物信息学中的基本科学问题,大型组学数据转换成重大发现等 |
4 | 华西生物医学大数据中心科研平台 | 中国 | 四川大学华西医院 | 1.17 | 7,200+ | 机构内部 | 基因组学分析、大型科学工程计算,数值模拟等计算密集型应用场景 |
5 | 国家神经系统疾病临床医学研究大数据中心生物信息高性能计算集群 | 中国 | 首都医科大学天坛医院 | 0.42 | 2,930+ | 机构内部 | 全基因测序、GATK国际标准免费应用、Sentieon等收费应用、IGV序列比对、AI影像分析等 |
Table 2
Software Resources Development of Biomedical High Performance Computing and Application Service Platform (Up to June 2023)"
序号 | 软件资源社区 | 建设机构 | 软件数量 | 软件构成 | 服务形式 |
---|---|---|---|---|---|
1 | Biowulf应用程序 | 美国国立卫生研究院(NIH) | 近千款 | NIH支持开发/维护的共14类近千款开源与商业软件 | 提供软件列表,灵活配置软件运行环境 |
2 | ELIXIR工具平台 | 欧洲生命科学大数据联盟(ELIXIR) | 上万款 | 集成bio.tools(17,247款)、BioContainers(23,748款)、OpenEBench(8,982款)、UseGalaxy.eu(7,851款)平台的核心软件 | 提供软件列表,搭建软件测试与应用环境 |
3 | 生物医药应用服务社区 | 中国科学院计算机网络信息中心 | 50余款 | 6类生物医药研究常用软件,生物信息类全部为国产化软件(6款),其他类为国外软件 | 提供软件列表 |
4 | 生物医学高性能计算平台资源库 | 中国医学科学院 | 上百款 | 生物医学研究常用的国外开源软件 | 提供软件列表,集成部分软件 |
[1] | 魏嘉, 陈默, 王龙翔, 等. 数据密集型超算现状、挑战以及未来发展趋势[J]. 数据与计算发展前沿, 2023, 5(3): 66-91. |
[2] | 常金凤, 李宁东, 江畅. 我国超算产业发展研究[J]. 信息通信技术与政策, 2022(3): 64-68. |
[3] | TOP500. TOP500 LIST-JUNE 2023[EB/OL]. [2023-7-24]. https://www.top500.org/lists/top500/list/2023/06/. |
[4] | 历军. 中国超算产业发展现状分析[J]. 中国科学院院刊, 2019, 34(6): 617-624. |
[5] | 中华人民共和国中央人民政府. 年增长率近30% 我国算力总规模全球第二[EB/OL]. [2023-7-24]. https://www.gov.cn/lianbo/2023-04/11/content_5750947.htm. |
[6] | 张国庆, 李亦学, 王泽峰, 等. 生物医学大数据发展的新挑战与趋势. 中国科学院院刊, 2018, 33(8): 853-860. |
[7] | 中华人民共和国工业和信息化部. “十四五”医药工业发展规划[EB/OL]. [2023-7-24]. https://www.miit.gov.cn/jgsj/ghs/zlygh/art/2022/art_5d5e4f4a945346c7ab261a9fd2669cb5.html. |
[8] | 栗蔚, 王雨萌, 立言, 等. “东数西算”背景下算力服务对算力经济发展影响分析[J]. 数据与计算发展前沿, 2022, 4(6): 13-19. |
[9] | 马瑞婕. 国家超级计算广州中心主任卢宇彤: 从“跟跑”“并跑”到“领跑”中国超算实现跨越式发展[N]. 南方日报, 2022-09-06( A02). |
[10] | BIOWULF. NIH HPC Systems[EB/OL]. [2023-7-24]. https://hpc.nih.gov/systems/hardware.html. |
[11] | 王流芳, 贾晓峰, 胡志民. “中心+节点”分布式生命科学数据平台构建模式研究——基于欧洲ELIXIR的案例分析[J]. 医学信息学杂志, 2023, 44(5): 27-33. |
[12] | ELIXIR. About us[EB/OL]. [2023-7-24]. https://elixir-europe.org/. |
[13] | 搜狐. 数据驱动现代医学技术突破, 中国医学科学院打造HPDA平台样板点[EB/OL]. [2023-7-24]. https://www.sohu.com/a/636998592_615309. |
[14] | 国家基因组科学数据中心. 基础设施[EB/OL]. [2023-7-24]. https://ngdc.cncb.ac.cn/?_blank |
[15] | 中科曙光. 首都医科大学附属北京天坛医院[EB/OL]. [2023-7-24]. https://www.sugon.com/case?id=139. |
[16] | 四川大学华西生物医学大数据中心. 专病库. 计算资源[EB/OL]. [2023-7-24]. http://www.cd120.com/resources/computer.html. |
[17] |
LEE J, YOON W, KIM S, KIM D, et al. BioBERT: A pre-trained biomedical language representation model for biomedical text mining[J]. Bioinformatics, 2020, 36(4): 1234-1240.
doi: 10.1093/bioinformatics/btz682 pmid: 31501885 |
[18] |
WEISFELD-ADAMS J D. The Abyss[J]. New England Journal of Medicine. 2016, 375(8): 713-715.
doi: 10.1056/NEJMp1507437 |
[19] |
李茹姣, 张欣, 宋述慧, 等. 基因组科学数据的安全管理与应用[J]. 大数据, 2022, 8(1): 37-45.
doi: 10.11959/j.issn.2096-0271.2022004 |
[20] | ELIXIR. Tools Platform[EB/OL]. [2023-7-24]. https://elixir-europe.org/platforms/tools. |
[21] | 中国医学科学院. 生物医学高性能计算平台[EB/OL]. [2023-7-24]. https://hpc.cams.cn/login. |
[22] | 金钟, 刘倩, 肖景发, 等. 计算预知未来——基于国家高性能计算环境的生物医药应用服务社区[J]. 科研信息化技术与应用, 2016, 7(4): 89-92. |
[23] |
ZAIB S, AKRAM F, LIAQAT S T, et al. Bioinformatics approach for the construction of multiple epitope vaccine against omicron variant of SARS-CoV-2[J]. Scientific Reports, 2022, 12(1): 19087.
doi: 10.1038/s41598-022-23550-w pmid: 36352060 |
[24] |
GHOSE A K, ABDULLAH S N A, HATTA M A, et al. DNA Free CRISPR/DCAS9 Based Transcriptional Activation System for UGT76G1 Gene in Stevia rebaudiana Bertoni Protoplasts[J]. Plants, 2022, 11(18): 2393.
doi: 10.3390/plants11182393 |
[25] | Schordinger. Materials Science[EB/OL]. [2023-7-24]. https://www.schrodinger.com/platform/materials-science. |
[26] |
COUSINS K R. Computer review of ChemDraw Ultra 12.0[J]. Journal of the American Chemical Society, 2011, 133(21): 8388.
doi: 10.1021/ja204075s pmid: 21561109 |
[27] |
YUAN L, YU Y, ZHU Y, et al. GAAP: Genome-organization-framework-Assisted Assembly Pipeline for prokaryotic genomes[J]. BMC Genomics, 2017, 18(Suppl 1):952.
doi: 10.1186/s12864-016-3267-0 pmid: 28198678 |
[28] |
ZHANG Z, LI J, ZHAO X Q, et al. KaKs_Calculator: calculating Ka and Ks through model selection and model averaging[J]. Genomics Proteomics Bioinformatics. 2006, 4(4): 259-63.
doi: 10.1016/S1672-0229(07)60007-2 |
[29] |
LIANG F, HAO L, WANG J, et al. BS-RNA: An efficient mapping and annotation tool for RNA bisulfite sequencing data[J]. Computational Biology and Chemistry, 2016, 65: 173-177.
doi: S1476-9271(16)30429-7 pmid: 27647160 |
[30] |
BAO H, CHEN M, CHEN H, et al. Transcriptome-wide identification of miRNA targets and a TAS3-homologous gene in Populus by degradome sequencing[J]. Genes Genomics, 2019, 41(7): 849-861.
doi: 10.1007/s13258-019-00797-8 |
[31] | Biowulf. Papers that used NIH HPC (Biowulf) resources[EB/OL]. [2023-7-24]. https://hpc.nih.gov/Research/. |
[32] | ELIXIR. ELIXIR's scientific legacy as a research infrastructure[EB/OL]. [2023-7-24]. https://elixir-europe.org/about-us/impact/publications. |
[33] | ELIXIR. Training Platform[EB/OL]. [2023-7-24]. https://elixir-europe.org/platforms/training. |
[34] | 河北政法干部网络学院. 生物医药与高性能计算[EB/OL]. [2023-7-24]. https://wy.helc.edu.cn/portal/course_detail.do?courseId=10018&menu=rcourse. |
[35] | 清华大学生命科学学院. 蛋白质制备与鉴定平台高通量蛋白质稳定分析表征和互作筛选系统培训通知[EB/OL]. [2023-7-24]. https://life.tsinghua.edu.cn/info/1003/4320.htm. |
[36] |
RAHAMAN T. Open Data and the 2023 NIH Data Management and Sharing Policy[J]. Medical Reference Services Quarterly, 2023, 42(1): 71-78.
doi: 10.1080/02763869.2023.2168103 pmid: 36862609 |
[37] | EMBL. Internal Policy No. 68 on General Data Protection[EB/OL]. [2023-7-24]. https://www.embl.org/documents/document/internal-policy-no-68-on-general-data-protection/. |
[38] | 吕明元, 弓亚男. 我国数据安全治理发展趋势、问题与国外数据安全治理经验借鉴[J]. 科技管理研究, 2023, 43(2): 21-27. |
[39] | 中央网络安全和信息化委员会办公室. 国家互联网信息办公室关于《网络数据安全管理条例(征求意见稿)》公开征求意见的通知[EB/OL]. http://www.cac.gov.cn/2021-11/14/c_1638501991577898.htm. |
[40] | 中华人民共和国工业和信息化部. 公开征求对《工业和信息化领域数据安全管理办法(试行)(征求意见稿)》的意见[EB/OL]. [2023-7-24]. https://wap.miit.gov.cn/gzcy/yjzj/art/2021/art_dcb6cc8d9f5c414eabd7070871996525.html. |
[41] | 四川大学华西生物医学大数据中心. 华西生物医学大数据中心数据管理办法(试行)[EB/OL]. [2023-7-24]. http://www.cd120.com/resources/work/service/71375.html. |
[42] |
HALLINAN D. Broad consent under the GDPR: an optimistic perspective on a bright future[J]. Life Sci Soc Policy. 2020, 16(1): 1.
doi: 10.1186/s40504-019-0096-3 pmid: 31903508 |
[43] | 王晶. 上海超算中心机房基础设施建设与管理[J]. 建筑电气, 2011, 30(9): 69-72. |
[44] | 中国政府采购网. 四川大学华西医院信息中心大数据及超算平台采购项目中标公告[EB/OL]. [2023-7-24]. http://www.ccgp.gov.cn/cggg/zygg/zbgg/202004/t20200416_14157402.htm. |
[45] | 中国政府采购网. 中国医学科学院医学科技创新高性能计算中心建设项目中标公告[EB/OL]. [2023-7-24]. http://www.ccgp.gov.cn/cggg/zygg/zbgg/202109/t20210930_16969338.htm. |
[46] | 贵重, 李云翔, 王光涛. GPT-4带来的变化与挑战[J]. 电信工程技术与标准化, 2023, 36(4): 17-19. |
[47] | 王正青, 阿衣布恩·别尔力克. ChatGPT升级: GPT-4应用于未来大学教学的可能价值与陷阱[J]. 现代远距离教育, 2023(3): 1-13. |
[48] | FASI M, HIGHAM N J, MIKAITIS M, et al. Numerical behavior of NVIDIA tensor cores[J]. Peer J Computer Science, 2021, 7:330. |
[49] | 严翠. 大模型火热GPU供不应求 AI服务器价格水涨船高[N]. 证券时报, 2023-05-17( A06). |
[50] | TechWeb. NVIDIA最强显卡H100刷新AI跑分记录: 近30倍领先[EB/OL]. [2023-7-24]. http://www.techweb.com.cn/news/2023-06-28/2929410.shtml. |
[51] | 马晓光, 封桂荣, 孙睿, 等. 自主可控软件性能需求与关键技术研究[J]. 工业控制计算机, 2022, 35(3): 1-3. |
[52] | 搜狐. 要数据还是要环境?数据中心能耗未来将突破全球电力近10%[EB/OL]. [2023-7-24]. https://www.sohu.com/a/482144802_121124375. |
[53] | 张策, 吴驰, 龙涛. 华中大高性能计算云平台设计与实现[J]. 中国教育网络, 2023, 284(1): 54-56. |
[54] | 李国杰. 发展高性能计算需要思考的几个战略性问题[J]. 科学中国人, 2019, 421(13): 44-46. |
[55] | 卢宇彤, 陈志广. 协同构建国产超算应用生态环境[J]. 中国科学基金, 2021, 35(S1): 219-226. |
[56] | GNCB-NGDC BioCode. Top Ranked Organization[EB/OL]. [2023-7-24]. https://ngdc.cncb.ac.cn/biocode/home/stats. |
[57] | Stanford Bioengineering Schools of Engineering &Medicine. BS Biomedical Computation[EB/OL]. [2023-7-24]. https://bioengineering.stanford.edu/academics-admission/undergraduate-degrees/bs-biomedical-computation. |
[58] | Queen's University Computing. BIOMEDICAL COMPUTING[EB/OL]. [2023-7-24]. https://www.cs.queensu.ca/undergraduate/programs/specializations/biomedical-computing.php. |
[59] | Technical University Munich. Biomedical Computing[EB/OL]. [2023-7-24]. https://www.tum.de/en/studies/degree-programs/detail/bioinformatics-master-of-science-msc. |
[60] | Imperial College London. Biomedical Engineering (Biomaterials)[EB/OL]. [2023-7-24]. https://www.imperial.ac.uk/study/courses/postgraduate-taught/biomedical-engineering-biomaterials/. |
[61] | 卢宇彤, 吴迪, 陈志广. 面向“三种思维、四种能力”的高性能计算人才培养体系建设[J]. 计算机教育, 2022(4): 5-8. |
[62] | 贺红, 程雨芊, 袁胜忠, 等. 面向交叉学科人才培养的高性能计算课程建设[J]. 中国多媒体与网络教学学报(上旬刊), 2022(12): 79-83. |
[63] | 李劲松. 生物医学信息学[M]. 北京: 人民卫生出版社, 2018. |
[64] | 蔡雷, 李炜桓, 师咏勇, 等. 医学大数据使用安全及伦理问题探讨[J]. 中国医学伦理学, 2019, 32(8): 1004-1009. |
[65] | 李忠民, 王思慧, 陈先来, 等. 国内医学数据安全治理法律法规建设探析[J]. 图书馆, 2022(3): 70-76. |
[66] | 张泽丹, 王斌, 陈婷, 等. 我国中医药临床数据存储与共享存在的问题及建议[J]. 中国中医药图书情报杂志, 2023, 47(4): 1-5. |
[67] | 李全权. 大数据时代生物医学信息安全与隐私保护管控研究[J]. 现代信息科技, 2018, 2(10): 156-157. |
[68] | 北京市人民政府. 北京市经济和信息化局关于印发《北京市推动软件和信息服务业高质量发展的若干政策措施》的通知[EB/OL]. [2023-7-24]. https://www.beijing.gov.cn/zhengce/zhengcefagui/202208/t20220803_2785023.html. |
[69] | 浙江政务服务网. 杭州市人民政府办公厅关于印发杭州市推进软件和信息技术服务业高质量发展若干政策的通知[EB/OL]. [2023-7-24]. https://www.hangzhou.gov.cn/art/2022/10/27/art_1229694840_7531.html. |
[70] | 深圳市工业和信息化局. 深圳市推动软件产业高质量发展的若干措施[EB/OL]. [2023-7-24]. http://gxj.sz.gov.cn/gkmlpt/content/10/10189/mpost_10189927.html#3129. |
[71] | 中国电子报. 软件成本度量: 让软件价值从“无形”变“有形”[EB/OL]. [2023-7-24]. http://epaper.cena.com.cn/content/2018-11/16/content_676307.htm. |
[1] | KOU Dazhi, WEI Jianwen, TANG Xiaoyong. Application-Aware Method for Optimized Computing Power Scheduling [J]. Frontiers of Data and Computing, 2022, 4(5): 3-10. |
[2] | SHI Jingyan,HUANG Qiulan,Wang Lu,LI Haibo,DU Ran,JIANG Xiaowei,HU Qingbao,ZHENG Wei,Yan Xiaofei,ZHANG Xuantong. Distributed Data Processing Platform of National High Energy Physics Data Center [J]. Frontiers of Data and Computing, 2022, 4(1): 97-112. |
[3] | HE Lianhua,ZHAO Lian,JIANG jinrong,JIN Zhong. Progress in High Performance Computing Numerical Simulation Framework Software [J]. Frontiers of Data and Computing, 2021, 3(6): 108-117. |
[4] | LU Shasha,XIAO Haili,WANG Xiaoning. Application of Container Technology in High Performance Computing Environment [J]. Frontiers of Data and Computing, 2021, 3(6): 118-126. |
[5] | Zhang Liuying,Wang Pengfei,Zhang Feng,Liu Hailong,Lin Pengfei,Wang Tao,Wei Junlin,Tian Shaobo,Jiang Jinrong,Chi Xuebin. The Implementation and Optimization of LICOM on GPUs [J]. Frontiers of Data and Computing, 2020, 2(4): 92-104. |
[6] | Qian Depei. Building the New Generation of Computing Infrastructure Supporting Technology Innovation [J]. Frontiers of Data and Computing, 2020, 2(1): 1-17. |
Viewed | ||||||
Full text |
|
|||||
Abstract |
|
|||||