wonabru-org/simple_test_predictable_llm_tokens
收藏Hugging Face2025-02-03 更新2025-02-15 收录
下载链接:
https://hf-mirror.com/datasets/wonabru-org/simple_test_predictable_llm_tokens
下载链接
链接失效反馈官方服务:
资源简介:
这是一个由正弦函数生成的模拟数据集,包含16k词汇大小。该数据集用于模型的有效性测试,确保模型能够进行预测。数据集的振幅和频率是随机化的。
Artificial data generated from a simple sinus function with a vocab size of 16k tokens. This dataset is used for sanity testing to ensure that the model is able to make predictions, with amplitudes and frequencies randomized.
提供机构:
wonabru-org



