據(jù) HuggingFace 頁(yè)面顯示,來(lái)自荷蘭馬斯特里赫特大學(xué)的一個(gè)研究團(tuán)隊(duì)近日發(fā)布一款可用于大模型研究的伊特魯里亞語(yǔ)數(shù)據(jù)集。
品玩報(bào)道,伊特魯里亞語(yǔ)是一種被用于公元前7世紀(jì)至公元1世紀(jì)的語(yǔ)言,被用在意大利地區(qū)。目前沒(méi)有公開(kāi)的伊特魯里亞語(yǔ)語(yǔ)料庫(kù)可用于自然語(yǔ)言處理。
因此,該研究團(tuán)隊(duì)出了一個(gè)從伊特魯里亞語(yǔ)到英語(yǔ)的機(jī)器翻譯數(shù)據(jù)集,其中包含來(lái)自現(xiàn)有學(xué)術(shù)資源的 2891 個(gè)翻譯示例。其中一些例子是人工提取的,另一些則是自動(dòng)獲取的。
據(jù)研究團(tuán)隊(duì)表示,發(fā)布該數(shù)據(jù)集有助于未來(lái)對(duì)該語(yǔ)言、類似語(yǔ)言或其他資源稀缺語(yǔ)言的研究。
評(píng)論 {{userinfo.comments}}
{{c.content}}
{{child.content}}
{{question.question}}
提交