NKCorpus:利用海量网络数据构建大型高质量中文数据集
李东闻,钟震宇,申峻宇,王昊天,孙羽菲,张玉志
NKCorpus: Extracting High Quality Large Chinese Dataset from Web Data
LI Dongwen,ZHONG Zhenyu,SHEN Junyu,WANG Haotian,SUN Yufei,ZHANG Yuzhi
数据与计算发展前沿 . 2022, (3): 30 -45 .  DOI: 10.11871/jfdc.issn.2096-742X.2022.03.003