Kannada-LLM-Labs/Wikipedia-Kn
收藏数据集概述
数据集名称
- Wikipedia-Kn
数据集描述
- 该数据集是Wikipedia数据集的过滤版本,仅包含卡纳达语样本。
- 数据集包含总共31437个样本。
数据结构
特征
id: 字符串类型url: 字符串类型title: 字符串类型text: 字符串类型
分割
train: 包含31437个样本,总字节数为402848197
数据集大小
- 下载大小: 147074910字节
- 数据集大小: 402848197字节
许可
- MIT许可证
任务类别
- 文本生成
语言
- 卡纳达语
样本大小
- 10K<n<100K
数据样本
python {id: 832, url: https://kn.wikipedia.org/wiki/%E0%B2%A1%E0%B2%BF.%E0%B2%B5%E0%B2%BF.%E0%B2%97%E0%B3%81%E0%B2%82%E0%B2%A1%E0%B2%AA%E0%B3%8D%E0%B2%AA, title: ಡಿ.ವಿ.ಗುಂಡಪ್ಪ, text: ಡಿ ವಿ ಜಿ(ಮಾರ್ಚ್ ೧೭, ೧೮೮೭ - ಅಕ್ಟೋಬರ್ ೭, ೧೯೭೫) ಎಂಬ ಹೆಸರಿನಿಂದ ಪ್ರಸಿದ್ಧರಾದ ಡಾ. ದೇವನಹಳ್ಳಿ ವೆಂಕಟರಮಣಯ್ಯ ಗುಂಡಪ್ಪನವರು ಕರ್ನಾಟಕದ ಪ್ರಸಿದ್ಧ ಸಾಹಿತಿ, ಪತ್ರಕರ್ತರು. ಹಲವು ಕ್ಷೇತ್ರಗಳಲ್ಲಿ ಸೇವೆ ಸಲ್ಲಿಸಿದ ಇವರು ಕನ್ನಡದ ಆಧುನಿಕ ಸರ್ವಜ್ಞ ಎಂದೇ ಪ್ರಸಿದ್ಧರಾದವರು.
ಬಾಲ್ಯ ಜೀವನ ಡಿ.ವಿ.ಜಿ ಅವರು ೧೮೮೭, ಮಾರ್ಚ್ ೧೭ರಂದು ಕೋಲಾರ ಜಿಲ್ಲೆಯ ಮುಳಬಾಗಿಲು ತಾಲೂಕಿನ ದೇವನಹಳ್ಳಿಯಲ್ಲಿ ಜನಿಸಿದರು.
ವೃತ್ತಿ ಜೀವನ ಪ್ರೌಢಶಾಲೆಯಲ್ಲಿ
ಸಾಹಿತ್ಯ ಕೃಷಿ ದಿವಾನ್ ರಂಗಾಚಾರ್ಯ ಅವರ ಬಗ್ಗೆ ಇಂಗ್ಲಿಷಿನಲ್ಲಿ ಬರೆದ ಲೇಖನ ಡಿ.ವಿ.ಜಿ ಅವರ ಬದುಕಲ್ಲಿ ಹೊಸ ತಿರುವು ಪಡೆಯಿತು. ಮುಂದೆ ಪುಸ್ತಕ ರೂಪಕ್ಕೆ ತರಲು ಹಲವು ಮಾರ್ಪಾಡು ಮಾಡಿದರು. ಇದು ಪ್ರಕಟವಾಗುತ್ತಿದ್ದಂ....." }
使用示例
python from datasets import load_dataset
ds = load_dataset("Kannada-LLM-Labs/Wikipedia-Kn")



