8,200万条粤语剧本文本数据【数据堂】
收藏OpenDataLab2024-05-22 更新2024-05-25 收录
下载链接:
https://opendatalab.org.cn/shujutang/shujutang--188
下载链接
链接失效反馈官方服务:
资源简介:
粤语剧本文本数据总计8,200万条;数据内容采集自粤语剧本文本;数据可用于自然语言理解,知识库构建等任务
The total number of Cantonese drama script text datasets amounts to 82 million entries. The data is collected from original Cantonese drama script texts, and can be applied to tasks such as natural language understanding and knowledge base construction.
提供机构:
shujutang
创建时间:
2024-05-22
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集包含8200万条粤语剧本文本,采集于2015年,以txt格式存储,适用于自然语言理解和知识库构建等任务。作为商业数据,仅面向企业合作购买。
以上内容由遇见数据集搜集并总结生成



