recursal/Europarl-Conversation
收藏Hugging Face2024-06-20 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/recursal/Europarl-Conversation
下载链接
链接失效反馈官方服务:
资源简介:
europarl-conversation是一个基于欧洲议会数据构建的正式对话数据集。经过过滤,数据集包含约1.64B(llama-2-7b-chat-tokenizer)或1.48B(RWKV Tokenizer)个令牌,涵盖了多种语言。数据集以JSONL格式存储,每条记录代表一个对话。数据集的创建者为M8than,资金来源为Recursal.ai,共享者为M8than,主要语言为英语,许可证为cc-by-sa-4.0。
europarl-conversation是一个基于欧洲议会数据构建的正式对话数据集。经过过滤,数据集包含约1.64B(llama-2-7b-chat-tokenizer)或1.48B(RWKV Tokenizer)个令牌,涵盖了多种语言。数据集以JSONL格式存储,每条记录代表一个对话。数据集的创建者为M8than,资金来源为Recursal.ai,共享者为M8than,主要语言为英语,许可证为cc-by-sa-4.0。
提供机构:
recursal



