five

ai2-adapt-dev/tulu_v3.8_unused_wildchat_conversations

收藏
Hugging Face2024-10-29 更新2024-12-14 收录
下载链接:
https://hf-mirror.com/datasets/ai2-adapt-dev/tulu_v3.8_unused_wildchat_conversations
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集主要包含对话信息,每个对话包含多个字段,如内容、国家、IP地址哈希、语言、角色、时间戳、是否含有毒性内容等。此外,数据集还包含对话的毒性评分,涵盖了多种毒性类别,如身份攻击、侮辱、淫秽、严重毒性、性暗示、威胁等。数据集还提供了OpenAI的审核结果,包括各类别的评分和是否被标记为有害。数据集分为训练集,包含137,885个样本,总大小为3,386,220,494字节。

The dataset includes various features such as message content, country, hashed IP, language, timestamp, and also includes toxicity scores and OpenAI moderation information. The dataset is divided into a training set containing 137885 samples.
提供机构:
ai2-adapt-dev
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作