このサイトについて

tunciは、アイヌ語↔日本語の双方向翻訳を行うWebアプリです。現在、アイヌ語学習者に向けて試験的に公開しています。

当然ながら、誤った翻訳を生成することがあります。アイヌ語初学者の方は、結果を鵜呑みにせず、かならず講師や上級者に確認してください。

このWebサイトのソースコードは、GitHubで公開されています。自然言語処理のためのモデルはHugging Face Hubに公開しています。

作者に連絡したい場合は、Xを使ってください。@TheGodOfNeet

スコア

2024年7月時点で、アイヌ語↔日本語の翻訳において以下のBLEUスコアを達成しています。

翻訳元翻訳先BLEUスコア
日本語アイヌ語39.06
アイヌ語日本語31.83

AI活用について

tunciの翻訳は機械学習によって実現されており、アイヌ語および日本語の教師データを利用して訓練されています。

教師データに関しては、著作権法第30条の4、および文化庁『AIと著作権に関するチェックリスト&ガイダンス』に基づいて利用しています。

著作者の意図に反する利用を行わないよう細心の注意を払っておりますが、万が一問題がある場合はご連絡ください。

データ名形式単語数文字数
アイヌ語アーカイブWeb600,7702,107,984
アイヌタイムズ書籍148,843519,040
アイヌ語口承文芸コーパスPDF135,649492,484
AA研アイヌ語資料公開プロジェクトWeb95,379299,630
アイヌ語口承文芸コーパスWeb76,550243,696
アイヌ語鵡川方言 日本語-アイヌ語辞典Web66,386247,637
アイヌ語テキストPDF25,06784,905
北海道立アイヌ文化研究センター研究紀要PDF14,72448,092
アイヌ語会話辞典Web13,83149,776
アイヌ神謡集書籍10,36438,153
ニューエクスプレスプラス アイヌ語書籍4,41814,812
カムイユカㇻを聞いてアイヌ語を学ぶ書籍3,02811,177
アコㇿイタㇰ書籍2,0055,903
その他論文など---

関連プロジェクト

  • kampisos:アイヌ語コーパス検索アプリ