five

csariyildiz/turkish-wordlist

收藏
Hugging Face2024-12-26 更新2025-02-15 收录
下载链接:
https://hf-mirror.com/datasets/csariyildiz/turkish-wordlist
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个由维基百科文本处理得到的土耳其语单词列表,包含了2,510,327个单词。这个列表是一个UTF-8编码的csv文件,包含标题行。列表中的单词通过处理大约50万篇维基百科文章的文本获得,包括土耳其字母和引号字符,不包含英文字母,且已将旧式土耳其字符进行替换。所有单词都由小写字母组成,最多包含30个字符。

This is a Turkish word list derived from Wikipedia text processing, containing 2,510,327 words. The list is a UTF-8 encoded csv file with headers. The words were obtained by processing the text of approximately 500 thousand articles on Wikipedia, including Turkish letters and quotation marks, without English letters, and with the replacement of older Turkish characters. All words consist of lowercase letters and a maximum of 30 characters.
提供机构:
csariyildiz
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作