tunciは、アイヌ語↔日本語の双方向翻訳を行うWebアプリです。現在、アイヌ語学習者に向けて試験的に公開しています。
このWebサイトのソースコードは、GitHubで公開されています。自然言語処理のためのモデルはHugging Face Hubに公開しています。
作者に連絡したい場合は、Xを使ってください。@TheGodOfNeet
注意事項
本サイトのアイヌ語翻訳は、学習用・研究用に提供されています。
現在のモデルは、限られたアイヌ語資料を元に訓練されたものであり、アイヌ語の全てのニュアンスや文化的背景を網羅しているわけではありません。
したがって、特に公式文書・宣伝物・商業作品・創作物などでのご使用は、絶対にお控えください。特に、アイヌ語を学んだことがない方に誤ったアイヌ語表現が広まってしまうと、アイヌ語の普及に悪影響を及ぼす恐れがあります。
本翻訳結果の利用によるトラブルについて、当方は責任を負いかねますので、あらかじめご了承ください
論文
- Ryo Igarashi and So Miyagawa. 2024. Enhancing Neural Machine Translation for Ainu-Japanese: A Comprehensive Study on the Impact of Domain and Dialect Integration. In Proceedings of the 4th International Conference on Natural Language Processing for Digital Humanities, pages 413–422, Miami, USA. Association for Computational Linguistics.
品質
2024年7月時点で、アイヌ語↔日本語の翻訳において以下のBLEUスコアを達成しています。
データ出典
tunciの翻訳モデルは、以下のデータを利用して訓練されています。
AI活用について
tunciの翻訳は機械学習によって実現されており、アイヌ語および日本語の教師データを利用して訓練されています。
教師データに関しては、著作権法第30条の4、および文化庁『AIと著作権に関するチェックリスト&ガイダンス』に基づいて利用しています。
著作者の意図に反する利用を行わないよう細心の注意を払っておりますが、万が一問題がある場合はご連絡ください。
用例機能について
著作権法47条の5に基づき、元資料のうちキーワードに一致した部分のみを表示しています。(参考:情報検索サービス提供に関する注意点 | IT法務.COM)
著作者の意図に反する利用を行わないよう細心の注意を払っておりますが、万が一問題がある場合はご連絡ください。
関連プロジェクト
- kampisos:アイヌ語コーパス検索アプリ