five

AWeirdDev/confucius

收藏
Hugging Face2024-04-12 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/AWeirdDev/confucius
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: features: - name: chapter dtype: string - name: content dtype: string - name: translation dtype: string splits: - name: train num_bytes: 163063 num_examples: 503 download_size: 100365 dataset_size: 163063 configs: - config_name: default data_files: - split: train path: data/train-* license: mit task_categories: - translation - text-generation language: - zh tags: - chinese - analect - confucius - language pretty_name: Confucius Analects size_categories: - n<1K --- # confucius Confucius for real. See all [analects](https://ctext.org/analects). ```python from datasets import load_dataset dataset = load_dataset("AWeirdDev/confucius") ``` ## Format ```python { "chapter": "學而", # Chapter name "content": "子曰:「學而時習之,不亦說乎?…", # Content "translation": "孔子說:「經常學習,不也喜悅嗎?…" # Translated (zh-TW) } ``` <div align="center"> <figure> <img src="https://cdn-uploads.huggingface.co/production/uploads/640739e3a5e2ff2832ead08b/Ks3e4yFB5v9jN4F19rQ6v.png" alt="Confucius lore" width="300" /> <figcaption>Confucius, confused.</figcaption> </figure> </div>

数据集信息: 特征字段: - 名称:chapter 数据类型:字符串(string) - 名称:content 数据类型:字符串(string) - 名称:translation 数据类型:字符串(string) 拆分集: - 名称:train 字节数:163063 样本数:503 下载大小:100365 数据集占用大小:163063 配置项: - 配置名称:default 数据文件: - 拆分集:train 路径:data/train-* 许可证:mit(MIT许可证) 任务类别: - translation(机器翻译) - text-generation(文本生成) 语言: - zh(中文) 标签: - chinese(中文) - analect(语录集) - confucius(孔子) - language(语言) 友好展示名称:Confucius Analects(孔子语录) 样本规模类别: - n<1K(样本数少于1000) --- # 孔子数据集 真实还原孔子相关语录。可查看完整[语录集(analect)](https://ctext.org/analects)。 python from datasets import load_dataset dataset = load_dataset("AWeirdDev/confucius") ## 数据格式 python { "chapter": "學而", # 章节名称 "content": "子曰:「學而時習之,不亦說乎?…", # 原文内容 "translation": "孔子說:「經常學習,不也喜悅嗎?…" # 译文(繁体中文) } <div align="center"> <figure> <img src="https://cdn-uploads.huggingface.co/production/uploads/640739e3a5e2ff2832ead08b/Ks3e4yFB5v9jN4F19rQ6v.png" alt="Confucius lore(孔子轶事)" width="300" /> <figcaption>困惑的孔子。</figcaption> </figure> </div>
提供机构:
AWeirdDev
原始信息汇总

数据集概述

数据集基本信息

  • 名称: Confucius Analects
  • 大小类别: n<1K
  • 语言: 中文 (zh)
  • 标签: 中文, 论语, 孔子, 语言
  • 任务类别: 翻译, 文本生成
  • 许可证: MIT

数据集特征

  • chapter: 字符串类型
  • content: 字符串类型
  • translation: 字符串类型

数据集分割

  • train:
    • 示例数量: 503
    • 数据大小: 163063字节
    • 下载大小: 100365字节

数据集配置

  • 默认配置:
    • 数据文件路径: data/train-*

数据集示例

json { "chapter": "學而", "content": "子曰:「學而時習之,不亦說乎?…", "translation": "孔子說:「經常學習,不也喜悅嗎?…" }

搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集包含《论语》的原文及其翻译,适用于中文文本生成和翻译任务。数据集规模较小,共503行,以parquet格式存储,适合用于小型研究或教学目的。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作