five

marcuscedricridia/FineTome-100k-deepclean-sharegpt

收藏
Hugging Face2025-04-03 更新2025-04-12 收录
下载链接:
https://hf-mirror.com/datasets/marcuscedricridia/FineTome-100k-deepclean-sharegpt
下载链接
链接失效反馈
官方服务:
资源简介:
mlabonne/FineTome-100k数据集包含约10万条对话记录,数据清洗后保留了98366条,经过一系列过滤和处理步骤,如去重、长度和语言过滤等,最终形成了包含96919条记录的数据集。该数据集适用于对话系统的训练和评估。

The mlabonne/FineTome-100k dataset consists of approximately 100,000 conversation records. After cleaning, it retained 98,366 entries, and through a series of filtering and processing steps such as deduplication, length and language filtering, it eventually formed a dataset with 96,919 records. This dataset is suitable for training and evaluating conversational systems.
提供机构:
marcuscedricridia
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作