five

Ti-Ma/TiMaGPT2-2016

收藏
Hugging Face2024-04-26 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/Ti-Ma/TiMaGPT2-2016
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集基于截止日期为2016年12月31日的历史数据构建,数据来源包括WMT新闻数据集和Wikipedia。该数据集用于训练基于GPT-2-small的模型,并遵循WMT新闻数据集的许可证。引用该数据集时应参考相关论文。

该数据集基于截止日期为2016年12月31日的历史数据构建,数据来源包括WMT新闻数据集和Wikipedia。该数据集用于训练基于GPT-2-small的模型,并遵循WMT新闻数据集的许可证。引用该数据集时应参考相关论文。
提供机构:
Ti-Ma
原始信息汇总

数据集概述

数据来源

  • WMT News 数据集:来自 https://data.statmt.org/news-crawl/en/
  • Wikipedia

数据时间范围

  • 数据截止日期:2016年12月31日

数据用途

  • 用于训练基于 GPT-2-small 的模型

数据集位置

  • 在 Huggingface 上的位置:TiMa/TiMaGPT2-2016

许可证

  • 许可证名称:paracrawl-license
  • 许可证详情:参考 LICENSE 文件

引用信息

  • 论文引用:

    @inproceedings{drinkall-tima-2024, title = "Time Machine GPT", author = "Drinkall, Felix and Zohren, Stefan and Pierrehumbert, Janet", booktitle = "Findings of the Association for Computational Linguistics: NAACL 2024", month = june, year = "2024", publisher = "Association for Computational Linguistics" }

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作