このサイトについて

概要

tunciは、アイヌ語↔日本語の双方向翻訳を行うWebアプリです。現在、アイヌ語学習者に向けて試験的に公開しています。

このWebサイトのソースコードは、GitHubで公開されています。自然言語処理のためのモデルはHugging Face Hubに公開しています。

作者に連絡したい場合は、Xを使ってください。@TheGodOfNeet

注意事項

本サイトのアイヌ語翻訳は、学習用・研究用に提供されています。

現在のモデルは、限られたアイヌ語資料を元に訓練されたものであり、アイヌ語の全てのニュアンスや文化的背景を網羅しているわけではありません。

したがって、特に公式文書・宣伝物・商業作品・創作物などでのご使用は、絶対にお控えください。特に、アイヌ語を学んだことがない方に誤ったアイヌ語表現が広まってしまうと、アイヌ語の普及に悪影響を及ぼす恐れがあります。

本翻訳結果の利用によるトラブルについて、当方は責任を負いかねますので、あらかじめご了承ください

スコア

2024年7月時点で、アイヌ語↔日本語の翻訳において以下のBLEUスコアを達成しています。

翻訳元翻訳先BLEUスコア
日本語アイヌ語39.06
アイヌ語日本語31.83

AI活用について

tunciの翻訳は機械学習によって実現されており、アイヌ語および日本語の教師データを利用して訓練されています。

教師データに関しては、著作権法第30条の4、および文化庁『AIと著作権に関するチェックリスト&ガイダンス』に基づいて利用しています。

著作者の意図に反する利用を行わないよう細心の注意を払っておりますが、万が一問題がある場合はご連絡ください。

用例機能について

著作権法47条の5に基づき、元資料のうちキーワードに一致した部分のみを表示しています。(参考:情報検索サービス提供に関する注意点 | IT法務.COM

著作者の意図に反する利用を行わないよう細心の注意を払っておりますが、万が一問題がある場合はご連絡ください。

データ出典

tunciの翻訳モデルは、以下のデータを利用して訓練されています。

データ名形式単語数文字数
アイヌ語アーカイブWeb600,7702,107,984
アイヌタイムズ書籍148,843519,040
アイヌ語口承文芸コーパスPDF135,649492,484

AA研アイヌ語資料公開プロジェクト

Web95,379299,630
アイヌ語口承文芸コーパスWeb76,550243,696

アイヌ語鵡川方言 日本語-アイヌ語辞典

Web66,386247,637
アイヌ語テキストPDF25,06784,905

北海道立アイヌ文化研究センター研究紀要

PDF14,72448,092
アイヌ語会話辞典Web13,83149,776
アイヌ神謡集書籍10,36438,153

ニューエクスプレスプラス アイヌ語

書籍4,41814,812

カムイユカㇻを聞いてアイヌ語を学ぶ

書籍3,02811,177
アコㇿイタㇰ書籍2,0055,903
その他論文など---

関連プロジェクト

  • kampisos:アイヌ語コーパス検索アプリ