five

zeusfsx/ukrainian-stackexchange

收藏
Hugging Face2023-04-03 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/zeusfsx/ukrainian-stackexchange
下载链接
链接失效反馈
官方服务:
资源简介:
Ukrainian StackExchange数据集是一个丰富的文本数据源,适用于乌克兰语的自然语言处理、机器学习和数据挖掘任务。数据集包含从乌克兰StackExchange网站收集的问题、答案、评论和相关元数据。数据集以JSON格式存储,包含问题的唯一标识、标题、文本内容、点赞数、标签等信息,以及答案的文本内容、点赞数和是否被接受等信息。
提供机构:
zeusfsx
原始信息汇总

Ukrainian StackExchange Dataset 概述

数据集基本信息

  • 许可证: Creative Commons Attribution-ShareAlike 4.0 International (CC BY-SA 4.0)
  • 任务类别: 问答
  • 语言: 乌克兰语
  • 数据集大小: 1K<n<10K

数据集描述

  • 来源: 从乌克兰StackExchange网站收集
  • 格式: JSON
  • 内容: 包含问题、答案、评论及相关的元数据
  • 收集部分: 问题、答案、标签、投票

数据集结构

  • 问题:
    • id: 唯一标识符
    • title: 问题标题
    • text: 问题内容
    • upvoteCount: 问题净赞数
    • tags: 相关标签列表
  • 答案:
    • id: 唯一标识符
    • text: 答案内容
    • upvoteCount: 答案净赞数
    • isAccepted: 是否为接受答案的布尔值
  • URL: 问题在乌克兰StackExchange网站的链接

使用方法

  • 通过Hugging Face Hub加载数据集: python from datasets import load_dataset dataset = load_dataset("zeusfsx/ukrainian-stackexchange")
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作