AWeirdDev/confucius
收藏Hugging Face2024-04-12 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/AWeirdDev/confucius
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: chapter
dtype: string
- name: content
dtype: string
- name: translation
dtype: string
splits:
- name: train
num_bytes: 163063
num_examples: 503
download_size: 100365
dataset_size: 163063
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
license: mit
task_categories:
- translation
- text-generation
language:
- zh
tags:
- chinese
- analect
- confucius
- language
pretty_name: Confucius Analects
size_categories:
- n<1K
---
# confucius
Confucius for real. See all [analects](https://ctext.org/analects).
```python
from datasets import load_dataset
dataset = load_dataset("AWeirdDev/confucius")
```
## Format
```python
{
"chapter": "學而", # Chapter name
"content": "子曰:「學而時習之,不亦說乎?…", # Content
"translation": "孔子說:「經常學習,不也喜悅嗎?…" # Translated (zh-TW)
}
```
<div align="center">
<figure>
<img
src="https://cdn-uploads.huggingface.co/production/uploads/640739e3a5e2ff2832ead08b/Ks3e4yFB5v9jN4F19rQ6v.png"
alt="Confucius lore"
width="300"
/>
<figcaption>Confucius, confused.</figcaption>
</figure>
</div>
数据集信息:
特征字段:
- 名称:chapter
数据类型:字符串(string)
- 名称:content
数据类型:字符串(string)
- 名称:translation
数据类型:字符串(string)
拆分集:
- 名称:train
字节数:163063
样本数:503
下载大小:100365
数据集占用大小:163063
配置项:
- 配置名称:default
数据文件:
- 拆分集:train
路径:data/train-*
许可证:mit(MIT许可证)
任务类别:
- translation(机器翻译)
- text-generation(文本生成)
语言:
- zh(中文)
标签:
- chinese(中文)
- analect(语录集)
- confucius(孔子)
- language(语言)
友好展示名称:Confucius Analects(孔子语录)
样本规模类别:
- n<1K(样本数少于1000)
---
# 孔子数据集
真实还原孔子相关语录。可查看完整[语录集(analect)](https://ctext.org/analects)。
python
from datasets import load_dataset
dataset = load_dataset("AWeirdDev/confucius")
## 数据格式
python
{
"chapter": "學而", # 章节名称
"content": "子曰:「學而時習之,不亦說乎?…", # 原文内容
"translation": "孔子說:「經常學習,不也喜悅嗎?…" # 译文(繁体中文)
}
<div align="center">
<figure>
<img
src="https://cdn-uploads.huggingface.co/production/uploads/640739e3a5e2ff2832ead08b/Ks3e4yFB5v9jN4F19rQ6v.png"
alt="Confucius lore(孔子轶事)"
width="300"
/>
<figcaption>困惑的孔子。</figcaption>
</figure>
</div>
提供机构:
AWeirdDev
原始信息汇总
数据集概述
数据集基本信息
- 名称: Confucius Analects
- 大小类别: n<1K
- 语言: 中文 (zh)
- 标签: 中文, 论语, 孔子, 语言
- 任务类别: 翻译, 文本生成
- 许可证: MIT
数据集特征
- chapter: 字符串类型
- content: 字符串类型
- translation: 字符串类型
数据集分割
- train:
- 示例数量: 503
- 数据大小: 163063字节
- 下载大小: 100365字节
数据集配置
- 默认配置:
- 数据文件路径: data/train-*
数据集示例
json { "chapter": "學而", "content": "子曰:「學而時習之,不亦說乎?…", "translation": "孔子說:「經常學習,不也喜悅嗎?…" }
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集包含《论语》的原文及其翻译,适用于中文文本生成和翻译任务。数据集规模较小,共503行,以parquet格式存储,适合用于小型研究或教学目的。
以上内容由遇见数据集搜集并总结生成



