zeusfsx/ukrainian-stackexchange
收藏Hugging Face2023-04-03 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/zeusfsx/ukrainian-stackexchange
下载链接
链接失效反馈官方服务:
资源简介:
Ukrainian StackExchange数据集是一个丰富的文本数据源,适用于乌克兰语的自然语言处理、机器学习和数据挖掘任务。数据集包含从乌克兰StackExchange网站收集的问题、答案、评论和相关元数据。数据集以JSON格式存储,包含问题的唯一标识、标题、文本内容、点赞数、标签等信息,以及答案的文本内容、点赞数和是否被接受等信息。
提供机构:
zeusfsx
原始信息汇总
Ukrainian StackExchange Dataset 概述
数据集基本信息
- 许可证: Creative Commons Attribution-ShareAlike 4.0 International (CC BY-SA 4.0)
- 任务类别: 问答
- 语言: 乌克兰语
- 数据集大小: 1K<n<10K
数据集描述
- 来源: 从乌克兰StackExchange网站收集
- 格式: JSON
- 内容: 包含问题、答案、评论及相关的元数据
- 收集部分: 问题、答案、标签、投票
数据集结构
- 问题:
id: 唯一标识符title: 问题标题text: 问题内容upvoteCount: 问题净赞数tags: 相关标签列表
- 答案:
id: 唯一标识符text: 答案内容upvoteCount: 答案净赞数isAccepted: 是否为接受答案的布尔值
- URL: 问题在乌克兰StackExchange网站的链接
使用方法
- 通过Hugging Face Hub加载数据集: python from datasets import load_dataset dataset = load_dataset("zeusfsx/ukrainian-stackexchange")



