大规模精加工通用语料库建设的范例——《大规模现代汉语分词语料库构建及应用 》书评
后印本
An Example of Large-scale Refi nement Teneral Corpus Construction: Comments on Construction and Application of Large-scale Modern Chinese Word Segmentation Corpus
-
作者:
曲维光
1;2
-
作者单位:
-
提交时间:2024-03-28 14:24:35
摘要: [目的 / 意义]指出《大规模现代汉语分词语料库构建及应用》一书的主要价值与贡献,旨在为中文语料库的构建提供借鉴,以促进大语言模型下中文自然语言处理的快速发展。[方法 / 过程]从宏观和微观的视角,对新时代人民日报分词语料库的构建和语料库相关研究综述进行了基于语料库计量语言学的分析,并对深度学习下的人民日报知识组织等内容进行了评介。[结果 / 结论]《大规模现代汉语分词语料库构建及应用》一书基于新时代人民日报分词语料库构建及应用进行研究,不仅传承了北京大学人民日报语料库的体系和理念,而且在一定程度上为解决领域化自然语言处理的任务提供了相应的方案。
版本历史
[V1] |
2024-03-28 14:24:35 |
ChinaXiv:202403.00397V1
|
下载全文 |