sonasimon/LoFTI
收藏数据集概述
数据集名称
- LoFTI
别名
- sonasimon/LoFTI
描述
LoFTI是一个用于评估大型语言模型(LLM)本地化和事实文本传输能力的基准数据集。该数据集包含关于源和目标位置实体的事实陈述;源位置遍布全球,而目标位置均位于印度,具有不同程度的超本地化(国家、州、城市)。实体涵盖广泛的类别。
创建者
- Sona Elza Simon
- URL: https://hf-mirror.com/sonasimon
关键词
- text-generation
- English
- apache-2.0
- 1K - 10K
- json
- Text
- Datasets
- pandas
- Croissant
- arxiv:2407.11833
- 🇺🇸 Region: US
许可证
URL
数据集结构
分布
-
类型: cr:FileObject
-
ID: repo
-
名称: repo
-
描述: HF Mirror git 仓库。
-
内容URL: https://hf-mirror.com/datasets/sonasimon/LoFTI/tree/refs%2Fconvert%2Fparquet
-
编码格式: git+https
-
类型: cr:FileSet
-
ID: parquet-files-for-config-default
-
名称: parquet-files-for-config-default
-
描述: HF Mirror 转换的底层 Parquet 文件(参见:https://hf-mirror.com/docs/datasets-server/parquet)。
-
包含于: repo
-
编码格式: application/x-parquet
-
包含: default//.parquet
记录集
- 类型: cr:RecordSet
- ID: default
- 名称: default
- 描述: sonasimon/LoFTI - default 子集
- 1 个跳过的列: common_questions_mixtral
字段
-
ID: default/id
- 名称: default/id
- 描述: HF Mirror Parquet 文件中的列 id。
- 数据类型: sc:Text
- 来源: parquet-files-for-config-default, 提取列 id
-
ID: default/region
- 名称: default/region
- 描述: HF Mirror Parquet 文件中的列 region。
- 数据类型: sc:Text
- 来源: parquet-files-for-config-default, 提取列 region
-
ID: default/category
- 名称: default/category
- 描述: HF Mirror Parquet 文件中的列 category。
- 数据类型: sc:Text
- 来源: parquet-files-for-config-default, 提取列 category
-
ID: default/reference_location
- 名称: default/reference_location
- 描述: HF Mirror Parquet 文件中的列 reference_location。
- 数据类型: sc:Text
- 来源: parquet-files-for-config-default, 提取列 reference_location
-
ID: default/reference_entity
- 名称: default/reference_entity
- 描述: HF Mirror Parquet 文件中的列 reference_entity。
- 数据类型: sc:Text
- 来源: parquet-files-for-config-default, 提取列 reference_entity
-
ID: default/target_location
- 名称: default/target_location
- 描述: HF Mirror Parquet 文件中的列 target_location。
- 数据类型: sc:Text
- 来源: parquet-files-for-config-default, 提取列 target_location
-
ID: default/true_target_entity
- 名称: default/true_target_entity
- 描述: HF Mirror Parquet 文件中的列 true_target_entity。
- 数据类型: sc:Text
- 来源: parquet-files-for-config-default, 提取列 true_target_entity
-
ID: default/high_cardinality
- 名称: default/high_cardinality
- 描述: HF Mirror Parquet 文件中的列 high_cardinality。
- 数据类型: sc:Text
- 来源: parquet-files-for-config-default, 提取列 high_cardinality
-
ID: default/hyperlocal_score
- 名称: default/hyperlocal_score
- 描述: HF Mirror Parquet 文件中的列 hyperlocal_score。
- 数据类型: sc:Text
- 来源: parquet-files-for-config-default, 提取列 hyperlocal_score
-
ID: default/reference_sentence
- 名称: default/reference_sentence
- 描述: HF Mirror Parquet 文件中的列 reference_sentence。
- 数据类型: sc:Text
- 来源: parquet-files-for-config-default, 提取列 reference_sentence
-
ID: default/true_target_sentence
- 名称: default/true_target_sentence
- 描述: HF Mirror Parquet 文件中的列 true_target_sentence。
- 数据类型: sc:Text
- 来源: parquet-files-for-config-default, 提取列 true_target_sentence



