AIが「その場で考えて話す」のではなく、
あらかじめ用意した正確な回答を
AIが選んで話す仕組みです。
約1.5〜2.5秒で回答
嘘をつかない・事実のみ
事前に丁寧に生成した
高品質な音声で回答
現在のAI音声対話は大きく3つのアプローチに分かれます。
①は遅い、②は速いけど嘘をつく。本デモの「物量アバター方式」は
その両方の弱点を克服したビジネス向けの最適解です。
ポイントは、AIがその場で文章を作るのではなく、事前に用意した正確な回答音声の中から最適なものを選ぶこと。
想定されるあらゆる質問に対する回答を事前に作成。AIの自己対話で網羅率94%以上まで拡充。音声も事前に合成済み。
正確さ担保お客様の質問に対し、プールの中から最も適切な回答を瞬時に選びます。自分では文章を作らないので嘘をつきません。
高速 & 安全人間が一つ一つ想定Q&Aを書くのではなく、AI同士をロールプレイさせて自動的に回答を増やします。
10種類のペルソナ(就活生、投資家、記者…)がそれぞれの視点で社長に質問
生成された回答に嘘や不適切な内容がないかAIが自動検証
想定される質問のほぼ全てをカバー。足りない部分も自動検知
高価なサーバーを使わず、ブラウザだけでリアルタイムの口パクを実現しています。
再生中の音声をリアルタイムで周波数分析し、
「あ・い・う・え・お」のどの口の形に近いかを判定。
すべてブラウザ内で完結するため追加コストゼロ。
3Dキャラクター標準規格「VRM」を採用。
まばたき・呼吸アニメーションも自動再生。
アバターの差し替えも容易です。
💡 一般的な高精度リップシンクはGPU搭載サーバーが必要でコストが高い。
本デモはブラウザの音声解析APIだけで自然に見せる工夫をしています。
現在のデモをさらに進化させるための改善プランです。
話し終わる前から裏で回答候補を検索開始。応答速度を1秒未満に短縮。
速度改善実際の会話ログから「足りない回答」を自動検知し、プールを自動拡張する仕組み。
自動成長回答プールが膨大になった場合に、ベクトル検索をさらに高速化するインデックス技術。
スケール対応「はい」「なるほど」等の相槌や、話し始めの一言を入れることで、より人間らしい会話に。
自然さ向上前の質問を踏まえた受け答え。「それについて詳しく」等の文脈依存の質問にも対応。
賢さ向上2回目以降の来訪者に「前回の続き」や別の話題を提案し、飽きさせない工夫。
体験向上