高速で高精度な特化AIのオンプレミス運用を低コストで実現可能社会実装に最適化されたドキュメント読解AI基盤を公開

～データ主権保護と企業毎の容易なファインチューニングを両立した中型モデル～

　国産生成AI基盤の独自開発およびビジネス向け生成AIサービスを提供するストックマーク株式会社(本社：東京都港区、代表取締役CEO：林達、以下：当社)は、経済産業省とNEDOが実施する国内の生成AI開発力強化を目的としたプロジェクト「GENIAC」第3期の支援を受けて開発した、ドキュメント読解基盤モデル「Stockmark-DocReasoner-Qwen2.5-VL-32B」を公開しました。

　今回開発したモデルは、これまで当社が独自開発したAI基盤モデルの開発ノウハウを活用し、ハルシネーション抑止・日本語/ビジネスに精通といった特徴を32B(320億パラメータ)という中型モデルで実現しました。

　これにより、汎用AIでは困難なオンプレミス運用を低コストで実現でき、秘匿性の高い企業データを外部に送ることなく安全に処理可能なため、企業の「データ主権」を完全に保護しながら、高速高精度な生成AI環境を実現する、社会実装に最適化された基盤モデルです。

モデル公開先
Stockmark-DocReasoner-Qwen2.5-VL-32B
https://huggingface.co/stockmark/Stockmark-DocReasoner-Qwen2.5-VL-32B

「Stockmark-DocReasoner-Qwen2.5-VL-32B」について

　「Stockmark-DocReasoner-Qwen2.5-VL-32B」は、オープンモデルである「Qwen2.5-VL-32B-Instruct」に、図表や画像を含む複雑なビジネスドキュメントや、製造業に代表される、より複雑性の高いドキュメントを豊富に学習させたマルチモーダル基盤モデルです。

　当モデルは、ビジネスシーンで多く用いられる複雑性の高いドキュメントの読解で高い性能を有していることに加え、化学式や図面など製造業特有の専門的な知識が含まれるドキュメントの読解が可能です。

　その性能はベースモデルとして採用した「Qwen2.5-VL-32B-Instruct」や、国内でも広く活用されている「Qwen3-VL-32B-Instruct」を上回る性能を有します。また、生成AIが複雑な質問に回答する際に、最終的な回答を一度に出力するのではなく、回答に至るまでの中間的な思考過程を段階的に生成する「チェーンオブソート(Chain of Thought、CoT)」を実現することで、ビジネスシーンでも信頼して活用することが可能です。

「Stockmark-DocReasoner-Qwen2.5-VL-32B」の特徴
　当モデルの特徴として、従来の大規模モデルが抱えていた「運用コストの肥大化」と、軽量モデルの「精度の限界」という二律背反を打破すべく、32B(320億パラメータ)という戦略的サイズを採用しました。

　32Bという中型サイズに、当社の基盤モデル独自開発ノウハウを掛け合わせることで、ビジネスシーンでも信頼して使える「精度」と業務を停滞させない「速度」の両立に加え、汎用AIでは困難なオンプレミス運用を低コストで実現可能な「社会実装に最適化」された基盤モデルです。

■オンプレミス運用の実現とデータ主権の保護
　高いドキュメント読解性能を維持しつつ、大規模な汎用モデルとは異なり、限られたインフラ環境下でもその真価を十分に発揮します。
　更に特許情報、未公開の技術ノウハウといった極めて秘匿性の高いデータを、外部クラウドに送ることなく自社設備内で安全に処理可能なため、企業の「データ主権」を完全に保護しながら、最高水準の知能を導入可能です。
■業務を止めない「高速レスポンス」
　高度な論理推論能力を維持しながら、大規模モデルの課題であった生成速度を大幅に改善しました。これにより、熟練工の作業解析や、設計支援におけるリアルタイムなフィードバックなど、精度に加え速度も求められる現場業務において「ストレスフリーなAI環境」を提供します。

「Stockmark-DocReasoner-Qwen2.5-VL-32B」性能評価
　「Stockmark-DocReasoner-Qwen2.5-VL-32B」の性能評価は、日本語のビジネスドキュメント読解と、当社独自に構築した専門性の高い製造業に関するドキュメントの読解の2方向で性能を比較しました。
1：日本語ビジネスドキュメント読解の性能評価
　日本語ビジネスドキュメントの読解能力に関しては、日本語の図表を含む質問応答データセット「JDocQA」を用いて性能を比較したところ、ベースモデルとして採用した「Qwen2.5-VL-32B-Instruct」を大きく上回ることが出来ました。
　また、国内でも広く活用されている「Qwen3-VL-32B-Instruct」と同等の結果となり、世界的に高い性能を有していることが分かりました。

2：製造業におけるドキュメント読解性能評価
　当社が独自に作成した、製造業を中心としたドキュメント対象に質問応答ベンチマークJA-Business-Doc-RQ-Bench(https://huggingface.co/datasets/stockmark/JA-Business-Doc-RQ-Bench)で評価を行い、ベースモデルからの性能向上および高い性能を確認しました。
　更に、当モデルに企業が保有する社内データなどを継続的に学習させることで、企業のドメインに精通した高精度な特化モデルの構築が可能なことを示唆しております。

【参考】専門領域への特化による圧倒的な専門タスク読解能力
　本モデルをベースに、当社が「化学・機械ドメイン」へ特化させたカスタマイズモデルでは、一般的なフロンティアモデルでは到達できない極めて専門的なタスクを完遂できることを確認しています。
・知識に基づく高度なリーズニング(知識と読解)

　複雑な化学構造式から脂質の炭素原子数を特定するタスクにおいて、フロンティアモデル(GPT-5.2)が誤読する中、本モデルは構造式の細部と専門知識を正確に組み合わせて正解を導き出します。
・技術情報の正確なデジタル化(SMILES変換)

　化学構造式をテキスト形式の符号(SMILES)へ変換する際、手書きを含む複雑な図面からでも正確な符号化を実現。フロンティアモデルを凌駕する精度で技術資産のデータベース化を支援します。

今後の展開
　現在、複数の製造業パートナーとPoCを開始しており、特に「化学・機械ドメイン」における以下の課題解決を優先的に進めています。

・R&D(研究開発)
　過去レポートから化学パラメータを自動抽出し、構造式のSMILES化や電子実験ノート(ELN)連携による研究加速。

・生産技術・製造
　仕様書やPDFマニュアルの情報をステップ形式の手順書へ自動再編し、円滑な技術伝承を支援。

・コンプライアンス・知財
　SDSや国際規格、法令の複雑な要件を構造化抽出し、人手による読解コストとリスクを大幅に削減。

　当社は本モデルを通じて、日本の製造業を「文書を処理する業務」から解放し、本来の強みである「知識を活用する業務」へとシフトさせることで、生成AIの社会実装を強力に推進してまいります。

取締役CTO 有馬幸介のコメント

　GENIACを通じ、日本の製造現場が直面する『実務の壁』を突破するモデルを開発しました。
　32Bというサイズは、高速かつ高精度な推論とオンプレミス運用を両立する社会実装の黄金比です。

　化学式や図表をマルチモーダルに読解し、確かな思考過程を示すことで、現場での信頼性を担保しました。

　深刻な労働力不足や技術継承という課題に対し、データ主権を守りつつAIが『熟練の知』を即戦力化します。現場を単純な文書処理から解放し『知識を活用する業務』へとシフトさせる変革こそが、日本のモノづくりの競争力を再び世界へ押し上げる鍵になると確信しています。

GENIACについて
　「GENIAC」は、経済産業省とNEDOが実施する、日本国内の基盤モデル開発力を底上げし、また企業等の創意工夫を促すためのプロジェクトです。
　計算資源の提供、利活用企業やデータホルダーとのマッチング支援、グローバルテック企業との連携支援やコミュニティイベントの開催、開発される基盤モデルの性能評価など、生成AIによって世界の変革がもたらされようとしている中、国内外の関係者の知見を結集し、日本の開発力向上を目指します。

ストックマークのソリューションについて
　AI活用は競争力維持のために不可欠な要素となっています。しかし、多くの企業が「データが整備されていない」「現場への定着が進まない」「具体的な成果に繋がらない」といった課題に直面しています。ストックマークは、こうした課題を包括的に解決するため、以下の6つソリューションを提供しています。

ストックマーク株式会社について
　ストックマーク株式会社は「価値創造の仕組みを再発明し、人類を前進させる」をミッションに掲げ、最先端の生成AI技術を活用し、多くの企業の企業変革を支援しています。
　製造業向けAIエージェント「Aconnect」及び、あらゆるデータを構造化し企業の資産に変える「SAT」を運営しています。さらに、企業特化生成AIの開発や、独自システムの構築も支援しています。

会社名　：ストックマーク株式会社
所在地　：東京都港区南青山一丁目12番3号 LIFORK MINAMI AOYAMA S209
設立　　：2016年11月15日
代表者　：代表取締役CEO　林達
事業内容：最先端の生成AI技術を活用した、
　　　　　企業のナレッジマネジメント・生成AIの業務適用を支援するサービスの開発・運営
URL　　：https://stockmark.co.jp/

企業プレスリリース詳細へ
PRTIMESトップへ