LangAIセミナー「Scaling Multilingual Speech Recognition: From a Handful to Thousands of Languages」

イベント概要:

 この講演では、多言語音声認識の研究の歩みを紹介します。2017年に開発した最初の多言語ASRは10言語対応でしたが、音声と文字起こしのペアデータを活用し、約100言語に拡大しました。さらに、Multilingual SUPERBを提案し研究促進を図りました。しかし、7000以上の言語を網羅するにはペアデータの不足が課題です。ASR2Kプロジェクトでは、音素ベースの普遍的ASRを提案し一歩前進しました。最近では自己教師あり学習(SSL)で多言語対応が進んでいますが、データの偏りや不均衡が依然として課題です。我々は18Bパラメータモデルの拡大により偏りの軽減への取り組み等についてお話します。

 

 

イベント概要

関連サイト  https://langai.tohoku.ac.jp/cate-talk/20250715-seminar03-watanabe/
日  時

2025年7月15日 (火) 16:30~17:30

開催場所

〒980-8576 仙台市青葉区川内41 マルティメディア教育研究棟2階マルチメディアホール 

開 催 方 法 現地開催+オンライン
申込フォーム https://forms.gle/okCB8erSM3oTPUc36    
問い合わせ先 言語AI研究センター事務局
TEL:022-795-7685 
メールアドレス:is-failab-sc*grp.tohoku.ac.jp
※*を@に変換してご連絡ください。