#32 | AI Platform Comparison

AI Platform Comparison

LLMは単体のモデルではなく、プラットフォームとして提供されています。
本ページでは GPT / Gemini / Claude の構造と実務適性を比較します。

#1から主に構造的に説明してきましたが、分かりにくいとお声を多くいただき、あらためて#28からは、より実務的、技術的な説明をするようにさせていただいております。また、前回 #31 では「LLMとは？」について説明しましたが、今回の #32 では「統合型LLMとは？」について、その構造と実務への影響を詳しく解説します。

1. From #31 LLM

前回の #31「LLMとは？」 では、 Large Language Model の基本構造について説明しました。

LLMは、大量のテキストデータを学習し、自然言語を理解・生成するAIモデルです。

しかし、私たちが実際に利用しているAIサービスは、 LLM単体ではなく、その上に構築された AIプラットフォーム として提供されています。

次に、その構造を見ていきます。

2. LLM Platforms

現在の生成AIは、単一のモデルではなくプラットフォームとして提供されています。

ユーザーは通常、以下の2つのインターフェースを通して AIを利用します。

UI（ChatGPT / Gemini App / Claude）
API（OpenAI API / Gemini API / Claude API）

このように、AIサービスは LLMを中心としたプラットフォームとして構築されています。

3. Major LLM Services

現在の主要なLLMサービスは主に以下の3つに分類されます。

GPT（OpenAI）
Gemini（Google）
Claude（Anthropic）

これらは同じLLM技術を基盤としていますが、それぞれ異なるアーキテクチャとサービス戦略を持っています。

4. Comparison Perspective

AIサービスを比較する際、単純な性能比較だけでは実際の利用価値は見えてきません。

本ページでは、以下の観点から比較を行います。

AI機能
対応ファイルフォーマット
実務作業適性

これらの要素を比較することで、実際の利用環境における AIの特性を明らかにします。

5. GPT / Gemini / Claude Comparison

現在の主要なLLMサービスには GPT（OpenAI）、 Gemini（Google）、 Claude（Anthropic） の3つが存在します。

これらは同じLLM技術を基盤としていますが、実際のサービス構造や機能には大きな違いがあります。

本ページでは、実際の利用環境における機能と 作業適性 の観点から、3つのAIを比較します。

6. Hard User Perspective

AIを日常的な会話用途ではなく、実務レベルの作業に利用するユーザーは ハードユーザーと呼ばれることがあります。

ハードユーザーの作業は、主に以下のような内容になります。

大規模なコード生成
HTML / Web構造の生成
データ処理や分析
システム設計
長時間の対話による作業継続

このような用途では、 AIの対応機能や処理範囲が非常に重要な要素になります。

7. File Ingestion & Context Window

ドキュメント解析能力とコンテキスト窓の規格

File Format Strategy (RAG & Token Focus)

Geminiの100万トークンを超える圧倒的なコンテキスト窓は、数千ページのPDFや膨大な技術ドキュメントを「一括で」読み込む実務において無類の強さを発揮します。

対してGPTは、ファイルの「検索（Search）」と「抽出」のバランスに優れており、必要な箇所をピンポイントで特定する精度が高いのが特徴です。用途によって、全量を流し込むか、検索させるかの使い分けが重要になります。

8. Legacy Code Context & Analysis

レガシーコード解析におけるロジック抽出の信頼性比較

Legacy Code Context

COBOLやAssemblyといったレガシー言語の解析において、GPTの学習モデルの厚みは他を圧倒します。Geminiは長大なソースコードを一気に読み込めますが、ロジックの抽出精度ではGPTに分があります。

一方のClaudeは、複雑な構造解析において指示を勝手に「端折る」傾向が観測されます。特にレガシー特有の『泥臭い例外処理』や『複雑な条件分岐』を、最適化の名の下に省略・簡略化してしまうリスクがあり、これは変換後のシステムで原因不明の不整合を引き起こすトリガーとなります。一文字の欠落も許されない基幹系移行の実務において、たとえ無骨であっても全てのロジックを律儀に追い続けるGPTの『保守の誠実さ』こそが、信頼の差となっています。

9. Professional Workload Aptitude

実務における完走能力と出力の安定性検証

Hard User Insight: なぜClaudeは実務で「△」なのか

長時間の連続作業や大規模プロンプトの処理において、Claudeは一貫性の欠如や「指示の省略（Omission）」が顕著になります。特にHTML生成やAI設計といった、厳密な構造維持が求められるタスクにおいて、この不確実性は致命的なリスクとなります。

特に、セッションが長引くほど『初期の制約条件』を維持できなくなる傾向があります。1,000行単位のコードを非破壊で保守し続けるには、文脈全体を統制する『一貫性のスタミナ』が不可欠ですが、Claudeは途中で独自の最適化（＝構造破壊）を差し込んでしまうため、プロフェッショナルの現場での『完走』には適していません。

10. Limitations for Hard Users

ハードユーザーの作業環境では、 Claudeは必ずしも最適とは言えないケースがあります。

筆者自身もClaudeを利用して複数の検証を行いましたが、特に以下のような作業では制約が見られる場面がありました。

大規模コード生成
複雑な構造設計
長時間の作業継続

作業の途中で「この作業はできません」という回答が出るケースもあり、実務用途では制約を感じる場面がありました。

11. Strengths of Claude

一方で、Claudeにも多くの利点があります。

文章生成能力が非常に高い
長いテキストの理解が得意
既存コードの解析や説明に強い
自然な文章生成が可能

特に、長文の読解や文章生成では Claudeは非常に高い性能を持っています。

そのため、用途によっては Claudeが最適なAIとなる場合もあります。

12. Conclusion

以上の比較から、 GPT と Gemini は統合型AIプラットフォーム として設計されています。

一方で Claude は高性能LLMサービス ではあるものの、統合型AIプラットフォームという観点では GPT / Gemini と同じ構造ではありません。

13. Summary

以上の比較から、現在の主要LLMサービスには GPT（OpenAI）、 Gemini（Google）、 Claude（Anthropic） の3つが存在します。

しかし、その機能構造や対応範囲には大きな違いがあります。

GPT / Gemini
統合型AIプラットフォームとして設計されており、マルチモーダル機能や幅広いファイル対応、実務レベルの開発作業にも適しています。
Claude
高性能な文章生成能力を持つLLMですが、現時点ではテキスト中心のLLMサービスという位置づけになります。

そのため本シリーズでは、 GPT / Gemini を統合型LLMとして扱い、 ClaudeはLLMサービスとして整理しています。

14. Fatal Issues: The "Unintended Modification" Across All Source Code & API

全言語・API共通：指示外の箇所を勝手に書き換える「制御不能な挙動」

ここ数ヶ月、Gemini（およびそのAPI）において、プロフェッショナルの作業を根本から破壊する深刻な挙動が頻繁に発生しています。それは、「指示していない箇所を勝手に書き換える、あるいはロジックや数値を微変動させる」という、言語やインターフェースを問わない制御不能なクセです。

C / C++ / C#: ポインタ操作や厳密な型定義を「一般的」な記述に勝手に上書き。コンパイルエラーや実行時のメモリ破壊を誘発する。
Python: インデント構造に対し、指示外の空白を勝手に調整。予期せぬスコープエラーや論理崩壊を招く。
JS / PHP / TS: 変数名の勝手なリネームや、不可欠な例外処理を「最適化」の名目で削除・改変。
HTML / CSS / JSON: 数値（px等）や階層構造をモデル内部の標準パターンに吸い寄せ、サイレントに構造を破壊する。

GPTでは、指示された範囲外を「触らない（Non-destructive）」という制御が極めて高い精度で保たれています。対してGeminiは、Google特有の「情報の最適化」という思想が仇となり、実務において不可欠な「現状維持の誠実さ」が欠落しています。

さらに、これらはチャットUIユーザーだけではなく、APIユーザーにも同様に起こる症状として確認されています。APIパラメータで temperature: 0 を指定しても、この確率的な「勝手な修正」というモデル固有のバイアスは抑制できず、自動化プロセスにおいてデバッグ不能な毒を混入させる致命的な欠陥となっています。

15. Claude's Fatal Flaw: The Disease of "Omission"

「最適化」の名の下にロジックを端折る、実務上の不確実性

Geminiが「勝手な上書き」に走るのに対し、Claudeは「指示の省略（Omission）」という別の致命的な問題を抱えています。特に大規模なプロンプトや長時間のセッションにおいて、この傾向は顕著になります。

ロジックの中抜き: 修正箇所以外を「// ... 既存のコード ...」と勝手に省略し、完全なソースの出力を放棄する。
「泥臭い」処理の削除: レガシー言語や複雑なシステムで不可欠な例外処理を、独自の判断で「簡潔な記述」に統合・削除し、動作不全を招く。
スタミナ切れ: セッションが長引くほど、初期に設定した厳密な制約を維持できなくなり、独自の「最適化（＝構造破壊）」を差し込み始める。

文章生成能力は高いものの、1文字の欠落も許されない基幹系移行や大規模開発において、Claudeの「横着」はサイレントな不整合を引き起こすトリガーとなります。完走能力と出力の安定性において、依然としてGPTとの間には越えられない壁が存在します。

Design Series：関連ページ

本ページは AI構造シリーズの一部です。
AIの理解は、以下のページを順に読むことでより体系的に理解できます。

design28 AI Entry Problem design29 AI Platform Comparison design30 AI Infrastructure