強みはエンジンの汎用性
多分野で導入進む
音声認識とは、人間が話した声をコンピュータが読み取り、文字にする技術のこと。煩雑な書類作成や記入業務などが省力化される上、タイプミスや記入漏れも軽減されることから、近年様々な分野での導入が進んでいる。
音声認識市場は2019年に804億円、24年には6800億円に伸びると予測される成長分野※だ。グーグルやIBM、マイクロソフトなど大手が対象とするのはBtoCだが、アドバンスト・メディアの主戦場はBtoB。コールセンターや医療、建設といった業界向けに書き起こしサービスなどを提供する。
同社の取締役・大柳伸也氏はその仕組みについて、こう説明する。
「音声認識ではコンピュータが音声をひとつひとつ音素に分解し、音の並びと前後の脈絡から検索エンジンが一番適切な言葉を判断し、文字に変換します。そのため、音声を書き起こしたデータをまず機械に学習させる必要があります」
同社が展開するサービスの核となるのが、独自の音声認識エンジン「AmiVoice」だ。同エンジンにそれぞれの業界に合わせた専門用語を入れ込むことで、業界に特化したエンジンを作り上げる。また、コールセンターであれば電話の音声に特化したチューニングを行う、工場向けのエンジンであれば騒音に強い音響モデルを使う、など音声以外での調整も加えている。
他にも、取引先からの声を活かした使い勝手の良さや、リーズナブルな価格などを実現。国内シェアは業界トップの51.4%を誇る。
有料会員限定
続きを閲覧するには会員登録が必要です。
すでに会員の方は
ログインして閲覧してください。