NKCorpus:利用海量网络数据构建大型高质量中文数据集
李东闻,钟震宇,申峻宇,王昊天,孙羽菲,张玉志
NKCorpus: Extracting High Quality Large Chinese Dataset from Web Data
LI Dongwen,ZHONG Zhenyu,SHEN Junyu,WANG Haotian,SUN Yufei,ZHANG Yuzhi
数据与计算发展前沿
.
2022, (3): 30
-45
.
DOI: 10.11871/jfdc.issn.2096-742X.2022.03.003
|
|
|