airesearch/UD_Thai-PUD
收藏Hugging Face2024-03-08 更新2024-06-22 收录
下载链接:
https://hf-mirror.com/datasets/airesearch/UD_Thai-PUD
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: words
sequence: string
- name: pos_tags
sequence:
class_label:
names:
'0': PUNCT
'1': ADP
'2': VERB
'3': PART
'4': NOUN
'5': ADJ
'6': AUX
'7': DET
'8': ADV
'9': PROPN
'10': CCONJ
'11': PRON
'12': NUM
'13': SYM
'14': SCONJ
'15': X
splits:
- name: test
num_bytes: 561336
num_examples: 1000
download_size: 92891
dataset_size: 561336
configs:
- config_name: default
data_files:
- split: test
path: data/test-*
---
提供机构:
airesearch
原始信息汇总
数据集概述
数据特征
- words: 字符串序列
- pos_tags: 序列,包含类别标签,具体标签如下:
- 0: PUNCT
- 1: ADP
- 2: VERB
- 3: PART
- 4: NOUN
- 5: ADJ
- 6: AUX
- 7: DET
- 8: ADV
- 9: PROPN
- 10: CCONJ
- 11: PRON
- 12: NUM
- 13: SYM
- 14: SCONJ
- 15: X
数据分割
- test: 包含1000个样本,数据大小为561336字节
数据集大小
- 下载大小: 92891字节
- 数据集大小: 561336字节
配置
- default: 包含测试数据文件,路径为
data/test-*



