five

hac541309/basic_korean_dict

收藏
Hugging Face2023-07-26 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/hac541309/basic_korean_dict
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: features: - name: text dtype: string splits: - name: train num_bytes: 198591964 num_examples: 74936 download_size: 88466367 dataset_size: 198591964 license: cc-by-sa-3.0 task_categories: - table-question-answering - text-generation - text-classification - question-answering language: - ko - mn - vi - th - id - ru - ja - en - fr - es - ar - zh pretty_name: 한국어기초사전 size_categories: - 1M<n<10M tags: - dictionary --- # Dataset Card for "basic_korean_dict" This dataset is a NLP learnable form of [Korean Basic Dictionary(한국어기초사전)](https://krdict.korean.go.kr/). It follows the [original copyright policy (cc-by-sa-2.0)](https://krdict.korean.go.kr/kboardPolicy/copyRightTermsInfo) Some words have usage examples in other languages, effectively rendering this into a parallel corpus. This version is built from xls_20230601 [한국어 기초 사전](https://krdict.korean.go.kr/)을 학습 가능한 형태로 처리한 데이터입니다. [한국어 기초 사전](https://krdict.korean.go.kr/kboardPolicy/copyRightTermsInfo)의 저작권을 따릅니다. 여러 언어로 이루어진 표제어들이 있어 병렬 말뭉치의 기능이 있습니다. xls_20230601으로부터 생성되었습니다.
提供机构:
hac541309
原始信息汇总

数据集概述

基本信息

  • 数据集名称: 한국어기초사전
  • 数据集大小: 198591964 字节
  • 下载大小: 88466367 字节
  • 训练集大小: 198591964 字节
  • 训练集样本数: 74936

特征

  • text: 字符串类型

许可

  • 许可证: cc-by-sa-3.0

任务类别

  • 表格问答
  • 文本生成
  • 文本分类
  • 问答

语言

  • 韩语
  • 蒙古语
  • 越南语
  • 泰语
  • 印尼语
  • 俄语
  • 日语
  • 英语
  • 法语
  • 西班牙语
  • 阿拉伯语
  • 中文

数据集类别

  • 大小类别: 1M<n<10M

标签

  • 字典
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作