■ 背景 ~ChatBrid,
ChatBridは、2023年4月18日の初版リリース以来、知識ジャンルごとに分けたデータセット、数10~数100を使い分け、アクセス権制御(https://metadata.co.jp/blog/2024/09/04/3735)を行うことで、複数の部門、多種多様な目的のRAG(Retrieval Augmented Generation)を、高精度なまま1本に統合してまいりました。必要十分な質と量の「影プロンプト(ユーザーに見えない隠しプロンプト)」だけを選択して、関連する知識レコード(チャンク)とともに、LLMへ送信する設計により、精度・速度・コストの最適化を実現しています。

■ 完全スケールアウト化の概要
「ChatBrid」のサーバーを、Kubernetes、Amazon EKS対応の完全スケールアウト化しました。これにより、アクセスの急増時に数百、数千のサーバーインスタンスが自動生成されて動作するスケールアウトを実現。アクセス量が減少すればサーバー規模が自動的に縮小してコストを抑えることができます。ピークトラフィック時の応答遅延を抑えつつ、平常時は必要最小限のリソースで運用することで、TCOの低減とユーザー体験の安定化を両立します。
■ 完全スケールアウト化のユースケース例
・全社横断のRAG一本化
事業部ごとの規程・製品マニュアル・営業資料など、権限の異なるナレッジを統合。社内横断の問い合わせが集中する時間帯でも、自動スケールにより応答品質、応答速度を維持。
・大規模キャンペーン/新製品発表時のアクセス急増
プレスリリース直後や大型施策で数万の同時アクセスが発生しても、インスタンスが自動増設されタイムアウトや順番待ちを抑制。離脱率の上昇を防ぎ、顧客体験を守ります。
・コールセンター・カスタマーサポートのSLA強化
チャットボット/オペレーター支援のRAGが問い合わせピーク(昼休み・就業直後)に集中しても、応答時間を一定に保ち、初回解決率とCSの向上に寄与。
・社内イベント・人事手続きシーズンの一斉アクセス
期初の人事異動・評価・福利厚生申請等、時期偏在する問い合わせが一時的に増えても、必要な時間だけ自動的に拡張。終了後は縮小してコスト最適化。
・パートナー/代理店向けポータルの同時接続増
共同販促やトレーニング開催日など、外部ユーザーが一斉にアクセスする場面で、外部公開RAGの可用性と速度を確保。
・BCP/障害時のレジリエンス向上
部分障害やクラスタメンテナンス時でも、健全ノードへワークロードを自動再配置。業務継続性を高め、復旧までのダウンタイムを最小化。
・大規模ドキュメント更新の波に耐える運用
規程類や製品仕様の大量更新で再インデックスが発生しても、データ更新系と対話系を分離スケール可能。運用時間内の応答遅延を抑えます。
・マルチテナントSaaS提供
テナントごとに隔離したワークロードを必要に応じて増減。ピークが重なる時間帯でも、各テナントの体感性能とデータ分離を両立。
■ 受注開始時期
2025年10月21日
配信元企業:メタデータ株式会社
プレスリリース詳細へ
ドリームニューストップへ