five

hatakeyama-llm-team/japanese2010

收藏
Hugging Face2024-03-21 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/hatakeyama-llm-team/japanese2010
下载链接
链接失效反馈
官方服务:
资源简介:
--- language: - ja --- # 日本語ウェブコーパス2010 - [こちら](https://www.s-yata.jp/corpus/nwc2010/)のデータをhuggingfaceにアップロードしたものです。 - 2009 年度における著作権法の改正(平成21年通常国会 著作権法改正等について | 文化庁)に基づき,情報解析研究への利用に限って利用可能です。 - 形態素解析を用いて、自動で句点をつけました。 - 変換コード - [変換スクリプト](./load_jap.py) - [形態素解析など](./Touten.py)
提供机构:
hatakeyama-llm-team
原始信息汇总

日本語ウェブコーパス2010

数据来源

  • 数据来源于こちら,并已上传至huggingface平台。

使用许可

  • 根据2009年度著作权法的修改,该数据集仅限于信息解析研究使用。

数据处理

  • 使用形态素解析技术自动添加了句点。

相关工具

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作