hac541309/basic_korean_dict
收藏Hugging Face2023-07-26 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/hac541309/basic_korean_dict
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: text
dtype: string
splits:
- name: train
num_bytes: 198591964
num_examples: 74936
download_size: 88466367
dataset_size: 198591964
license: cc-by-sa-3.0
task_categories:
- table-question-answering
- text-generation
- text-classification
- question-answering
language:
- ko
- mn
- vi
- th
- id
- ru
- ja
- en
- fr
- es
- ar
- zh
pretty_name: 한국어기초사전
size_categories:
- 1M<n<10M
tags:
- dictionary
---
# Dataset Card for "basic_korean_dict"
This dataset is a NLP learnable form of [Korean Basic Dictionary(한국어기초사전)](https://krdict.korean.go.kr/).
It follows the [original copyright policy (cc-by-sa-2.0)](https://krdict.korean.go.kr/kboardPolicy/copyRightTermsInfo)
Some words have usage examples in other languages, effectively rendering this into a parallel corpus.
This version is built from xls_20230601
[한국어 기초 사전](https://krdict.korean.go.kr/)을 학습 가능한 형태로 처리한 데이터입니다.
[한국어 기초 사전](https://krdict.korean.go.kr/kboardPolicy/copyRightTermsInfo)의 저작권을 따릅니다.
여러 언어로 이루어진 표제어들이 있어 병렬 말뭉치의 기능이 있습니다.
xls_20230601으로부터 생성되었습니다.
提供机构:
hac541309
原始信息汇总
数据集概述
基本信息
- 数据集名称: 한국어기초사전
- 数据集大小: 198591964 字节
- 下载大小: 88466367 字节
- 训练集大小: 198591964 字节
- 训练集样本数: 74936
特征
- text: 字符串类型
许可
- 许可证: cc-by-sa-3.0
任务类别
- 表格问答
- 文本生成
- 文本分类
- 问答
语言
- 韩语
- 蒙古语
- 越南语
- 泰语
- 印尼语
- 俄语
- 日语
- 英语
- 法语
- 西班牙语
- 阿拉伯语
- 中文
数据集类别
- 大小类别: 1M<n<10M
标签
- 字典



