Q1652
收藏数据集概述
数据集基本信息
- 数据集名称:Q1652
- 数据集大小分类:小于1K
- 标签:rlfh、argilla、human-feedback
数据集结构
字段(Fields)
| 字段名称 | 标题 | 类型 | 必需 | 支持Markdown |
|---|---|---|---|---|
| text | Text | text | True | True |
问题(Questions)
| 问题名称 | 标题 | 类型 | 必需 | 描述 | 值/标签 |
|---|---|---|---|---|---|
| entities | entities | span | True | N/A | N/A |
数据实例示例
数据实例包含文本内容和相关元数据,如下所示:
json { "server_id": "4026704f-0659-4939-b886-904d6e239dd1", "fields": { "text": "26 Central Statistical Agency. "Ethiopia 2013 Labour Force Survey Addis Ababa. Last modified 2014. https://www.ilo.org/surveyLib/index.php/ catalog/7142/download/43668..." }, "id": "997ca298-0bad-41d5-a9b4-6b68343bf39e", "metadata": { "coords": [[322, 479], [539, 479], [539, 616], [322, 616]], "document_content_type": "application/pdf", "document_id": "UNFCCC.party.1745.0", "document_metadata": { "author": ["Ethiopia"], "author_is_party": true, "collection_id": "nan", "date": "2023-06-21", "family_id": "nan", "family_name": "Ethiopias long term low emission and climate resilient development strategy (2020-2050)", "family_slug": "nan", "geography_iso": "ETH", "role": "MAIN", "source": "GST", "status": "nan", "types": ["Long-Term Low-Emission Development Strategy"], "variant": "nan" }, "document_name": "Ethiopias long term low emission and climate resilient development strategy (2020-2050)", "document_source_url": "t/sites/default/files/resource/ETHIOPIA%20LONG%20TERM%20LOW%20EMISSION%20AND%20CLIMATE%20RESILIENT%20DEVELOPMENT%20STRATEGY.pdf", "has_valid_text": true, "language": "en", "languages": ["en"], "page_number": 91, "text_block_id": "p_91_b_0", "translated": false, "type": "Text", "type_confidence": 0.9975045323371887 }, "responses": { "entities": [ { "user_id": "19cc536b-c98d-4033-9880-b40477b55515", "value": [ { "end": 963, "label": "Q1652", "score": null, "start": 904 } ] } ] }, "status": "completed", "suggestions": {}, "vectors": {} }
数据拆分
数据集包含单一拆分,即train。
数据集创建
创建动机
[需要更多信息]
源数据
初始数据收集和规范化
[需要更多信息]
数据源语言生产者
[需要更多信息]
注释
注释指南
如果实体存在于文本中,则高亮显示
注释过程
[需要更多信息]
注释者
[需要更多信息]
个人和敏感信息
[需要更多信息]
使用数据的考虑
社会影响
[需要更多信息]
偏见讨论
[需要更多信息]
其他已知局限性
[需要更多信息]
额外信息
数据集编纂者
[需要更多信息]
许可信息
[需要更多信息]
引用信息
[需要更多信息]
贡献
[需要更多信息]




