evilfreelancer/toxicator-ru
收藏Hugging Face2024-04-25 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/evilfreelancer/toxicator-ru
下载链接
链接失效反馈官方服务:
资源简介:
一个小型数据集,包含俄语文本的平行语料库,每对文本包含有毒和去毒版本。
一个小型数据集,包含俄语文本的平行语料库,每对文本包含有毒和去毒版本。
提供机构:
evilfreelancer
原始信息汇总
数据集概述
数据集特征
- instruction: 数据类型为字符串。
- input: 数据类型为字符串。
- output: 数据类型为字符串。
数据集分割
- dev: 包含800个示例,占用353576字节。
- test: 包含875个示例,占用305698字节。
- train: 包含6948个示例,占用3068516字节。
数据集大小
- 下载大小: 1100019字节。
- 数据集总大小: 3727790字节。
数据文件配置
- 配置名称: default
- 数据文件路径:
- dev: data/dev-*
- test: data/test-*
- train: data/train-*
许可证
- 许可证类型: MIT
语言
- 主要语言: 俄语



