独自の音声認識エンジンと生成AIの組み合わせで会話の価値を向上させる

今回は、日本語に特化した独自の音声認識エンジンと生成AIを組み合わせた議事録AIツール「YOMEL」を提供する、株式会社PKSHA Infinityの取締役 執行役員 兼松さんにお話を伺いました。「ビジネスにおける対話の価値を最大化する」というビジョンのもと、プロダクト開発の背景から導入効果、そして今後の展望まで、詳しく語っていただきました。

独自開発の音声認識エンジンを核に、マーケットを創出した議事録AIツール「YOMEL」

Q. まず、兼松さんの自己紹介と、貴社の事業内容についてお聞かせください。

兼松さん: 株式会社PKSHA Infinityで取締役と、セールス・マーケティングチームの責任者を務めております兼松です。2021年、社名がまだアーニーMLGだった頃にジョインし、議事録AIツール「YOMEL」が誕生する前から、その開発とグロースまでを一貫して見てきました。

現在の当社の事業は、この「YOMEL」が売上の約9割を占める主力事業となっています。その他には、もともと自社で保有していた音声認識エンジン「Olaris」の単体販売や、他社様のサービスに組み込むOEM提供などで売上を構成しています。基本的には、音声認識技術をベースとしたサービスを展開している会社です。

Q. 議事録AIツール「YOMEL」の概要と、開発の背景について教えてください。

兼松さん: 「YOMEL」は、ビジネスにおける様々な対話を文字起こしし、その内容を要約して議事録としてアウトプットする、シンプルな議事録AIツールです。今でこそ多くのツールが登場し、メジャーな市場になりましたが、我々がサービスをローンチした2023年2月当時は、まだ海外製のツールも日本に入ってきておらず、競合もほとんどいない状況でした。いわば、マーケットが生まれる前から参入し、市場の成長と共に我々も成長してきたという経緯があります。

プロダクトに生成AIを掛け合わせ、新しい顧客価値を生み出す

Q. 「YOMEL」開発のきっかけとなった、独自の音声認識エンジンはどのようにして生まれたのでしょうか?

兼松さん: もともと弊社は、お客様の課題解決を行う受託開発を主な事業としていました。その中で、あるお客様から「音声認識エンジンを作れないか」というご相談をいただいたのが始まりです。当時、2020年頃は世の中に日本語に特化した高性能な音声認識エンジンが少なかったため、これを開発すればビジネスになるのでは、という考えもありました。

しかし、試行錯誤の末に開発したものの、結局そのお客様のプロジェクトでは採用されず、非常に精度の高いエンジンだけが我々の手元に残ったのです。「このエンジンを何とかして社会の課題解決に役立てる形で事業化したい」という思いが、全てのスタートでした。壮大なビジョンがあったというよりは、手元に残ったこの優れた技術をどうにか世の中に届けたい、というところから始まっています。

Q. そのエンジンを「YOMEL」としてプロダクト化するにあたり、どのような経緯があったのでしょうか?

兼松さん: まずは音声認識エンジン単体での販売を試みましたが、なかなか売れませんでした。そこでプロダクト化が必要だと考え、「YOMEL」の開発に着手しました。2022年頃に、まず話した内容を書き起こすだけのテスト版を作り、様々な方に試していただいたのですが、「ただ文字にするだけでは、お客様の『議事録作成の手間を減らす』という根本的な課題解決には至らない」というフィードバックを数多くいただきました。そこで、話した内容をきちんと要約し、まとめてあげることの重要性に気づきました。

自社で要約エンジンを開発しようと試行錯誤したものの、なかなかうまくいかなかった、まさにそのタイミングで登場したのがChatGPTでした。2022年12月頃のことです。このGPTに書き起こしたテキストを投入して要約させてみたところ、非常に綺麗なアウトプットが生成できたのです。「これだ」と確信し、GPTをプロダクトに組み込んで要約機能として提供する、現在の「YOMEL」の原型が完成しました。そして2023年2月にサービスをローンチして以降は、市場の拡大に合わせて順調に成長を続けています。

高精度な独自エンジンと辞書登録機能で、専門用語や固有名詞も正確にテキスト化

Q. 独自の音声認識エンジンとChatGPTは、具体的にどのように連携して動いているのでしょうか?

兼松さん: お客様にはPCアプリやスマホアプリをご利用いただきます。アプリを起動すると、まず弊社の音声認識エンジン「Olaris」が会話をリアルタイムで書き起こし、そのテキストデータがブラウザ画面で確認できる状態になります。その後、ユーザーがブラウザ画面の要約ボタンを押すと、書き起こされたテキストがLLM(大規模言語モデル)に送られ、要約が生成されてアウトプットされる、という流れです。

特徴的なのは、単一のLLMではなく、複数のLLMを最適に組み合わせることで、アウトプットの精度や読みやすさを高めている点です。お客様側でプロンプトをカスタマイズすることも可能ですが、基本的にはボタン一つで、一般的なビジネスシーンで通用する分かりやすい議事録が自動で生成される点が、高く評価されています。

Q. 議事録ツールでは、数字や業界特有の専門用語の認識精度が重要視されます。その点における「YOMEL」の強みは何でしょうか?

兼松さん: まさにそこが我々の強みです。「YOMEL」の裏側で動いている音声認識エンジン「Olaris」は、日本語の数字を正確に認識することを得意としています。また、このエンジンの開発には専門のエンジニアがおり、常に改善を続けているため、認識精度は日々向上しています。これが、高い音声認識精度を実現できている大きな理由です。

一方で、業界用語や社内用語といった固有名詞は、音声認識エンジンだけではどうしても限界があります。そこは「YOMEL」側の機能でカバーしており、お客様が専門用語をあらかじめ「辞書登録」しておくことで、それらの単語も精度高くテキスト化することが可能です。高性能なエンジン「Olaris」の力と、プロダクト「YOMEL」の機能性を組み合わせることで、お客様の満足度を高めています。

議事録作成が1.5時間→30分へ。工数削減に留まらない「会議の質の向上」という価値

Q. 実際に「YOMEL」を導入された企業では、どのような成果が生まれていますか?具体的な事例を教えてください。

兼松さん: 例えば、カナデビア株式会社(旧・日立造船株式会社)様の事例があります。同社は、会議の決定事項やネクストアクションをエビデンスとしてしっかり残す文化が根付いています。従来は、議事録担当者が必死にメモを取るか、録音データを後から聞き起こすという多大な労力をかけていました。

「YOMEL」導入後は、会話の全てが話者分離された状態で書き起こされ、要約まで自動で作成されるため、1時間半かかっていた議事録作成が30分程度に短縮された、というお声をいただいています。このように、業務工数削減という分かりやすい費用対効果を実感いただき、導入に至るケースが最も多いです。また、カナデビア様のように海外拠点を持つ企業様にとっては、英語の会議にも対応している点が大きな価値となっているようです。

また、工数削減という定量的な効果に加え、「会議の質そのものが上がった」というお声も非常に多くいただきます。これまでメモを取ることに必死になっていた参加者が、メモから解放され、目の前の議論に集中できるようになった、という定性的な効果です。これも「YOMEL」が提供する重要な価値だと考えています。

目指すは「対話の価値」の最大化。現場の声を経営に届け、対話の質そのものを向上させる

Q. 「YOMEL」と貴社の今後の展望についてお聞かせください。

兼松さん: 現在、「YOMEL」は議事録AIツールと位置付けていますが、今後はその範囲をさらに広げていきたいと考えています。我々が今、最も大切にしているキーワードは「ビジネスはほとんど対話で成り立っている」という考え方です。そして、この「対話」をもっと価値あるものに変えていきたい。これが、プロダクトの向かうべき方向性です。

例えば、現場で交わされているリアルな対話が、経営層に届くまでに人のバイアスがかかり、内容が変わったり削られたりしてしまうことは往々にしてあります。現場で本当に起こっていることを正しく経営層に届けることができれば、経営判断の質も向上するはずです。こうした「現場の対話」を「経営の価値」に変えるような仕組みを「YOMEL」で実現したいと考えています。

さらに言えば、蓄積された対話データを活用し、対話の質そのものを向上させる支援も構想しています。例えば、インタビューの場面で「次はこういった質問をすると深掘りできますよ」とサジェストしてくれるような機能があれば、対話の質が上がり、結果として残る情報の価値も高まっていくはずです。単に記録するだけでなく、対話の質を高めていく。そこまで見据えて開発を進めています。

Q. 最後に、この記事の読者に向けてPRやメッセージをお願いします。

兼松さん: 「YOMEL」は、現状提供できている価値に満足することなく、さらにその先を目指して開発を進めています。ユーザーの皆様の声に耳を傾け、スピード感を持ってプロダクトに反映させていくことが我々の強みです。導入後も皆様の課題解決に貢献し続けられるよう尽力しますので、ぜひ一度お気軽にお試しいただき、皆様の声を聞かせていただけると嬉しいです。

YOMEL公式サイト:https://ai.yomel.co/gijiroku

無料トライアルのお申し込みはこちらから:https://ai.yomel.co/gijiroku/trial