株式会社聴覚研究所が、2026年4月13日に新しいリアルタイム音声認識システム「TeamLog」をリリースする。本システムは、複数のマイクを使用する独自の仕組みで最大9名の同時文字起こしに対応したほか、80dBの騒音環境下でも精度の落ちない文字起こしを実現、さらに多言語が入り混じる会話の同時翻訳にも対応している。
現在は、PC要約筆記と組み合わせた難聴者へのより確実な情報支援、翻訳精度向上による日本語未収得の外国籍児童への修学支援などに取り組んでいる。
コロナをキッカケとした初めての音声認識研究
株式会社聴覚研究所は、「岐阜県難聴児を持つ親の会」を前身に1993年に設立された法人だ。難聴の子を持つ親たちが我が子のために発達や聞こえ、補聴器の研究などを行ってきたことがルーツになっている。
そんな同社が音声認識の研究を始めたのは新型コロナの時期だ。多くの人が苦労したコロナ禍だが、難聴者の方たちは皆がマスクをするようになったことで深刻なコミュニケーション不全に陥った。相手の口の形を聞き取りの補助としている難聴者にとって、マスクで口が隠れることは致命的ともいえるほどの大問題だったからだ。
「会話がまったく聞き取れない」「買い物をするのも一苦労」「マスクを外してなんて言えないしどうしたらいいかわからない」
同社の元にも多くの声が届き、なんとかできないだろうか、というところから声を文字に変換できる音声認識の研究に取り組み始めることとなった。
今までの音声認識の深刻な課題

そのような経緯で始めた音声認識の研究だったが、取り組めば取り組むほどその難しさが浮き彫りになっていった。音声認識には誤認識がつきものだが、難聴者は誤認識を自分の耳で確認できないため、少しでも間違いがあると会話がわからなくなってしまう。
また、ほとんどの文字起こしツールはスマホなどの内蔵マイクで文字起こしを行っているため、難聴者が困ることが多い「周囲が騒がしい環境」や「話す人が多い場面」などでは、他の音の影響を受けて音声認識がうまく機能しないことも多くあった。
特許申請中の独自機構
TeamLogでは、複数の指向性マイクを使用する独自構造で今までの課題を解決している。


Ⅰ 最大9名の同時文字起こし
マイクを複数使用することで、最大9名の同時文字起こしに対応。発言が重なったり、会話の割り込みが発生してもすべての発言を文字起こしできるほか、マイクに名前を付けることで「誰が何を話したか」が一目でわかるデザインを実現した。
Ⅱ 高い認識率と専門用語への対応
高精度の音声認識エンジンを採用したことで高い精度を実現したことに加え、単語辞書を作成することで専門用語や人名にも対応する。さらに医療や金融などの専用エンジンも搭載しており、専門性の高い会議などでも高精度の文字起こしが行える。
Ⅲ 80dBを超える騒音環境下でも精度低下なし
強い指向性を持つマイクを採用したことで、騒音や周囲の人の声の影響も限りなく抑えることに成功した。騒音が鳴り響く工事現場でも、隣で誰かが大きな音で話すカフェや居酒屋のような場所でも、文字起こし精度にはほとんど影響がない。
現在は外国人児童の支援にも注力

現在は国内に急増する「日本語未収得の外国人児童」への修学支援にも力を入れている。既存の文字起こしツールでは、教室という様々な声が飛び交う環境では認識精度がどうしても低くなってしまうが、TeamLogであれば高い精度で文字起こしが可能だ。
その高い認識率を活かし、様々な国の言語にリアルタイムで翻訳できるよう、現在も開発及び検証を続けている。
議事録や同時通訳にも

元々難聴者の情報支援を目的として開発したTeamLogだが、より多くの方にとって便利な議事録や同時翻訳ツールとしての機能も持たせている。難聴者にとってのみ便利なものであっては、「難聴者がお願いして導入してもらうもの」になってしまうからだ。
今の時代は合理的配慮の義務化により、障害者の要望が企業等にも受け入れられやすくなった。しかし、音声認識はコストやセキュリティの面でハードルが高く、障害者支援のみを目的とする場合、なかなか導入が難しいケースも多くある。
そこで企業などにとっても便利な機能と高いセキュリティ性を両立することで、企業や組織にとっても効果的なものになるようなサービスとなるように様々な工夫を行っている。
機能一覧
◇ 認識結果はすべてローカル保存でセキュリティ性を確保
◇ 議事録としても利用可能なcsvやpdfで出力
◇ 記録や通信を行わないオフライン認識機能(開発予定)
◇ 複数の言語を同時に認識、翻訳する同時通訳機能
◇ リアルタイム修正で文字起こし精度100%の実現
◇ 共有機能で他端末にもリアルタイム表示
◇ 共有先端末で好きな言語に翻訳
これらの機能を通して、より多くの方に使ってもらえるシステムを目指した。
料金設定
TeamLog音声認識システムの料金設定は以下のようになっている。
〇 法人向けプラン
初期費用:なし
基本料金:10,000円/月 + 音声認識エンジン利用料(従量)
〇 個人向けプラン
初期費用:なし
基本料金:1,000円/月 + 音声認識エンジン利用料(従量)
〇 サポートプラン
障害者手帳を持つ難聴者や難聴者支援を行う団体向け
初期費用:なし
個人・法人プランの料金を一定額割引
※現在はiOS版のみ提供(Android、PC版を現在開発中)
※音声認識エンジン利用料(従量)は3時間で平均100円程度
※別途マイク等の購入が必要(汎用品が使用可能)
今後の展望
TeamLogはリリース前から多くの反響があり、難聴者が所属する就労施設や学校での試用テストを現在も実施している。近年では、先述した日本語未収得の外国籍児童への修学支援や、付属の編集ソフトを活用したリアルタイム修正システムの構築等を行っており、今後も更なる精度向上、機能改善、幅広い分野への適応を目指していくとのこと。
出典元:https://prtimes.jp/main/html/rd/p/000000001.000171531.html




