Corpus_aligned_sentences_zh-pt
收藏Figshare2025-09-18 更新2026-04-08 收录
下载链接:
https://figshare.com/articles/dataset/Corpus_aligned_sentences_zh-pt/30157789/1
下载链接
链接失效反馈官方服务:
资源简介:
O corpus alinhado resulta do alinhamento automático entre os repositórios "Corpus_leis_pt" e "Corpus_leis_zh", utilizando o Bertalign - uma ferramenta de alinhamento multilíngue baseada em embeddings de frases que mapeia as frases semanticamente similares em diferentes idiomas através de um algoritmo de duas etapas com programação dinâmica. O processo gera 100 planilhas Excel estruturadas com frases correspondentes em português e chinês, organizadas na pasta "Corpus_aligned_sentences_zh-pt" seguindo a nomenclatura padronizada "aligned_sentences_Lei_XX-YYYY_zh-pt.xlsx".
提供机构:
Miroir, Jean-Claude
创建时间:
2025-09-18



