LSICC(Large Scale Informal Chinese)
收藏OpenDataLab2026-05-24 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/LSICC
下载链接
链接失效反馈官方服务:
资源简介:
大型非正式中文语料库 (LSICC) 是非正式中文的大型语料库。该语料库包含大约3700万篇书评和50,000网民对新闻的评论。
The Large-scale Informal Chinese Corpus (LSICC) is a large-scale corpus targeting informal Chinese language. It comprises approximately 37 million book reviews and 50,000 netizen comments on news reports.
提供机构:
OpenDataLab
创建时间:
2022-11-02
搜集汇总
数据集介绍

背景与挑战
背景概述
LSICC是一个由复旦大学2018年发布的大型非正式中文语料库,包含约3700万篇书评和5万条网民新闻评论,适用于中文文本预训练任务。
以上内容由遇见数据集搜集并总结生成



