five

CCRss/chatgpt-paraphrases-kz

收藏
Hugging Face2023-12-21 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/CCRss/chatgpt-paraphrases-kz
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集专为哈萨克语的释义任务设计,包含5.44百万对句子及其释义。通过Google Translate翻译并由专家审核,确保哈萨克语的准确性和上下文相关性。适用于训练和评估哈萨克语的释义模型,有助于哈萨克语言技术的进步。

该数据集专为哈萨克语的释义任务设计,包含5.44百万对句子及其释义。通过Google Translate翻译并由专家审核,确保哈萨克语的准确性和上下文相关性。适用于训练和评估哈萨克语的释义模型,有助于哈萨克语言技术的进步。
提供机构:
CCRss
原始信息汇总

哈萨克语释义数据集

数据集概述

该数据集专门用于哈萨克语的释义任务。它为自然语言处理应用提供了一个独特的资源,专注于释义模型的开发和评估。

来源与翻译过程

数据集最初来源于humarin/chatgpt-paraphrases,经过Google Translate翻译后,由人类专家仔细审查,以确保哈萨克语中的准确性和上下文相关性。

数据集内容与结构

数据集包含544万条短语或句子对,每对由一个原始句子和其哈萨克语的释义组成。这种结构特别有利于训练算法理解和生成释义内容,同时保持原始句子的意义。

使用与应用

该数据集适用于计算语言学领域的研究人员和开发者,是训练和评估哈萨克语释义模型的强大工具。它对哈萨克语的语言技术进步有重要贡献。

致谢与参考

我们感谢humarin/chatgpt-paraphrases的原始数据集提供者以及参与该数据集哈萨克语改编的语言学家和翻译团队。

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作