VISAI-AI/tourism-facts-FDA-aggregated
收藏Hugging Face2026-04-10 更新2026-04-12 收录
下载链接:
https://hf-mirror.com/datasets/VISAI-AI/tourism-facts-FDA-aggregated
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: fact_id
dtype: string
- name: text
dtype: string
- name: source_id
dtype: string
- name: validation
struct:
- name: grounded
dtype: bool
- name: subfacts
list:
- name: supporting_lines
list: string
- name: text
dtype: string
- name: usage
struct:
- name: completion_tokens
dtype: int64
- name: prompt_tokens
dtype: int64
- name: reasoning_tokens
dtype: int64
- name: total_tokens
dtype: int64
- name: usage
struct:
- name: completion_tokens
dtype: int64
- name: prompt_tokens
dtype: int64
- name: reasoning_tokens
dtype: int64
- name: total_tokens
dtype: int64
splits:
- name: train
num_bytes: 282509
num_examples: 158
download_size: 76278
dataset_size: 282509
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
---
数据集信息(dataset_info):
特征字段(features):
- 名称:事实标识符(fact_id),数据类型:字符串(string)
- 名称:文本(text),数据类型:字符串(string)
- 名称:来源标识符(source_id),数据类型:字符串(string)
- 名称:验证集信息(validation),结构体类型:
- 锚定状态(grounded),数据类型:布尔型(bool)
- 子事实列表(subfacts):每个元素为结构体,包含:
- 支撑文本行(supporting_lines):字符串列表
- 文本(text),数据类型:字符串(string)
- 使用统计(usage),结构体类型:
- 补全Token数(completion_tokens),数据类型:64位整数(int64)
- 提示Token数(prompt_tokens),数据类型:64位整数(int64)
- 推理Token数(reasoning_tokens),数据类型:64位整数(int64)
- 总Token数(total_tokens),数据类型:64位整数(int64)
- 名称:使用统计(usage),结构体类型:
- 补全Token数(completion_tokens),数据类型:64位整数(int64)
- 提示Token数(prompt_tokens),数据类型:64位整数(int64)
- 推理Token数(reasoning_tokens),数据类型:64位整数(int64)
- 总Token数(total_tokens),数据类型:64位整数(int64)
数据划分(splits):
- 名称:训练集(train),字节数:282509,样本数量:158
下载大小:76278
数据集总大小:282509
配置项(configs):
- 配置名称:默认(default),数据文件(data_files):
- 划分:训练集(train),路径:data/train-*
提供机构:
VISAI-AI



