← デモに戻る 1 / 6 技術詳細 →
Overview

AIアバター会話デモ
「物量アバター方式」とは

AIが「その場で考えて話す」のではなく、
あらかじめ用意した正確な回答AIが選んで話す仕組みです。

高速応答

約1.5〜2.5秒で回答

🎯

正確さ

嘘をつかない・事実のみ

🗣️

自然な音声

事前に丁寧に生成した
高品質な音声で回答

Slide 02

AIアバターの3つの方式

現在のAI音声対話は大きく3つのアプローチに分かれます。

方式仕組み速度正確性
① 従来型
RAG + TTS
質問のたびにAIが文章を考え、音声を合成して返す 🐌 遅い
3〜8秒
△ やや不安
② 最新型
End-to-End
音声を直接AIが聞いて直接声で返す(GPT-4o等) 🚀 超速い
<0.5秒
✕ 嘘つく
③ 本デモ
物量アバター
AIが「どの回答を再生すべきか」を選ぶ指揮者として機能 ⚡ 速い
1.5〜2.5秒
◎ 完璧

①は遅い、②は速いけど嘘をつく。本デモの「物量アバター方式」
その両方の弱点を克服したビジネス向けの最適解です。

Slide 03

仕組み:AIは「選ぶ」だけ

ポイントは、AIがその場で文章を作るのではなく、事前に用意した正確な回答音声の中から最適なものを選ぶこと。

🎤
質問を
音声認識
🔍
似た回答を
高速検索
🧠
AIが最適な
回答を選択
🔊
事前生成の
音声を再生
👤
アバターが
口パクで話す
📚

回答プール(事前準備)

想定されるあらゆる質問に対する回答を事前に作成。AIの自己対話で網羅率94%以上まで拡充。音声も事前に合成済み。

正確さ担保
🎯

AI指揮者(リアルタイム)

お客様の質問に対し、プールの中から最も適切な回答を瞬時に選びます。自分では文章を作らないので嘘をつきません。

高速 & 安全
Slide 04

回答プールの作り方:AI同士の自己対話

人間が一つ一つ想定Q&Aを書くのではなく、AI同士をロールプレイさせて自動的に回答を増やします。

📝
基礎情報を
整理
🤖↔🤖
AI同士が
模擬面談
🛡️
品質チェック
AIが検証
📊
カバレッジ
測定
🔊
合格した回答
を音声化
🎭

模擬面談AI

10種類のペルソナ(就活生、投資家、記者…)がそれぞれの視点で社長に質問

🛡️

品質ゲートAI

生成された回答に嘘や不適切な内容がないかAIが自動検証

📈

網羅率94%超

想定される質問のほぼ全てをカバー。足りない部分も自動検知

Slide 05

アバター表現:軽量でリアルな口パク

高価なサーバーを使わず、ブラウザだけでリアルタイムの口パクを実現しています。

🎵

音声から口の形を推定

再生中の音声をリアルタイムで周波数分析し、
「あ・い・う・え・お」のどの口の形に近いかを判定。
すべてブラウザ内で完結するため追加コストゼロ

クライアント処理
👤

VRMアバター

3Dキャラクター標準規格「VRM」を採用。
まばたき・呼吸アニメーションも自動再生。
アバターの差し替えも容易です。

Web標準技術

💡 一般的な高精度リップシンクはGPU搭載サーバーが必要でコストが高い。
本デモはブラウザの音声解析APIだけで自然に見せる工夫をしています。

Slide 06

今後のブラッシュアップ計画

現在のデモをさらに進化させるための改善プランです。

🚀

先読み応答

話し終わる前から裏で回答候補を検索開始。応答速度を1秒未満に短縮。

速度改善
🔄

回答プールの自己学習

実際の会話ログから「足りない回答」を自動検知し、プールを自動拡張する仕組み。

自動成長

大規模検索の高速化

回答プールが膨大になった場合に、ベクトル検索をさらに高速化するインデックス技術。

スケール対応
💬

より自然な会話UI

「はい」「なるほど」等の相槌や、話し始めの一言を入れることで、より人間らしい会話に。

自然さ向上
🧠

会話の文脈理解

前の質問を踏まえた受け答え。「それについて詳しく」等の文脈依存の質問にも対応。

賢さ向上
🔁

リピーター対応

2回目以降の来訪者に「前回の続き」や別の話題を提案し、飽きさせない工夫。

体験向上