Apimart
LLM 料金ガイド — 500+ の AI モデルを比較

LLM 料金ガイド — 500+ の AI モデルを比較

OpenAI、Anthropic、Google、Meta、xAI、Mistral など 500+ モデルの LLM・メディア API 料金を、トークン・画像・動画コスト別に比較。

モデル解説

AI への支出は一気に膨らみやすく、米国企業の AI 支出は今や月平均 $85,500 に達しています。 私の一番の結論はシンプルです。紙の上で最も安いモデルが、出力の長さ、コンテキストサイズ、リトライ、ツール料金、プランの上限を加味すると、必ずしも最も低コストな選択肢とは限りません。

このガイドから選ぶなら、まず 4 つのこと を確認します。

  • 単価: トークン、画像、または動画の秒数
  • 上限: RPM、TPM、コンテキストウィンドウ、プランの上限
  • モダリティ: テキスト、画像、音声、動画、ビジョン対応
  • 完成した出力あたりのコスト: 表示価格だけではない

本記事では APIMart OpenAI Anthropic Google AI Meta xAI、Mistral、 Cohere Runway Stability AI Black Forest Labs、そして Kling AI を比較します。

いくつかの明確なパターンが浮かび上がります。

  • テキスト料金は大きく変動する。 OpenAI は 入力 100 万トークンあたり $0.05 から $30.00 まで幅があります。
  • 出力は入力よりはるかに高いことが多い。 場合によっては、出力は 4 倍から 6 倍 も高くなります。
  • ロングコンテキストは請求額を変える。 OpenAI は 270,000 トークン を超えると料金が上がり、Google は 200,000 トークン を超えるとレートが変わります。
  • バッチジョブでコストを削減できる。 OpenAI、Anthropic、Mistral は非同期処理で 50% の割引 を用意しています。
  • 動画コストはリトライで積み重なる。 秒単価が安くても、完成クリップあたりのコストははるかに高くなり得ます。
  • 多くのフォーマットを使うチームには統合請求が重要。 APIMart の売りは 500+ モデル を横断する 1 つの API と 1 枚の請求書です。

短くまとめると
大量のテキストには低予算モデル本番アプリには中位モデル出力品質がビジネス成果を左右する場合のみプレミアムモデル、そして 最終レンダリングに課金する前に低解像度で下書き動画を作る ことです。

LLM のトークンと API 料金とは?(初心者向け)

クイック比較

AI モデル料金比較:プロバイダ別 100 万トークンあたりのコスト(2026)
AI モデル料金比較:プロバイダ別 100 万トークンあたりのコスト(2026)
プロバイダ主な強み注意点最適な用途
APIMartテキスト・画像・動画・音声を横断する 500+ モデルを 1 つの API で使用コストは依然としてボリュームに応じて増える請求を 1 つにまとめたいチーム
OpenAI幅広いモデル群と わかりやすいトークン料金、コストのヒントトップモデルは一気に高額になる汎用テキスト、画像、音声、動画
Anthropicコーディングとロングコンテキストに強い出力レートが高いエージェント、コーディング、長いプロンプト
Google AI低コストの Flash オプションと大きなコンテキスト200K トークン超で料金が上がる大量テキストとマルチモーダルアプリ
Meta非常に低価格なホスト型/セルフホスト型 Llama 料金料金と上限はホストに依存ホスティング環境を持つコスト重視のチーム
xAI入力と出力の料金差が小さいツール呼び出しに追加料金長い応答やツール利用のアプリ
Mistral低いトークン料金とバッチ割引一部ツールは追加料金実用テキスト、コーディング、EU ベースの利用
CohereRAG、埋め込み、リランクに好適メディア生成には不向き検索、リトリーバル、ナレッジベース
Runway動画特化でクレジット計算が明快リトライで完成コストが上がる動画制作と編集
Stability AI低い画像料金と編集ツールテキストベンダーより範囲が狭い大量の画像・音声作業
Black Forest Labsサイズごとにきめ細かい画像料金リトライと参照でコストが上がる画像生成と編集
Kling AI低コストな短尺動画生成クリップ長と同時実行に制限ショート動画

つまり、価格を 1 行ずつ比較する前に、私はまず 1 つの問いから始めます。自分は何に最も多く支払っているのか — トークン、画像、秒数、それともリトライか?

1. APIMart

GccAi

APIMart は従量課金制で、月額の最低料金なし隠れた手数料なし です。料金はモダリティによって変わるため、テキスト、画像、動画、音声はそれぞれ異なる方法で課金されます。

単価

以下の表のとおり、料金はモダリティによって変わります。

モダリティ課金単位例となるモデルAPIMart 価格
テキスト100 万トークンあたりQwen2.5-VL-72B$20.00
画像1 コールあたりGPT Image 2$0.006
画像1 コールあたりWan 2.7 Image$0.0216
動画1 秒あたりSora 2$0.08
動画1 秒あたりKling V3 (720p)$0.0672

画像生成のコストは品質ティアによって大きく変わります。たとえば、1024×1024 の GPT-Image-2-Official コールは、Low 品質で約 $0.00488、Medium で $0.04232、High で $0.16872 です。その差は一気に積み上がります。最高品質の出力が不要なら、下位ティアを使うことで 1 コールあたりの支出を削減できます。

含まれる上限

デフォルトのアカウントには RPM と TPM の上限が付いています。エンタープライズアカウントはより高スループットなチャネルを申請できます。

モデルの対応範囲

APIMart は 1 つの API を通じてテキスト、画像、動画、音声のモデルに対応します。GPT-5、ClaudeSora 2Midjourney、Kling V3 などのモデルが含まれます。

コスト対出力

ここでの主な利点は、モダリティを横断した請求の一本化です。テキスト、画像、動画の請求を別々にやりくりする代わりに、支出管理を容易にする 1 つの仕組みが手に入ります。

次に、本ガイドでは主要プロバイダがテキスト、画像、動画モデルでどのように料金を構成しているかを比較します。

2. OpenAI

OpenAI

OpenAI はテキストに トークン従量制 の料金モデルを採用しています。そしてモデル間の差は非常に大きいです。

2026 年 6 月時点で、料金は GPT-5 nano の 入力 100 万トークンあたり $0.05 から始まり、GPT-5.5 Pro では 入力 100 万トークンあたり $30.00 にまで達します [3][5]。OpenAI の料金を読み解く最も簡単な方法はモデルティア別に見ることです。なぜなら、入力・出力・キャッシュ済みトークンのレートはモデルごとに大きく異なるからです。

単価

モデル入力(100 万あたり)キャッシュ入力出力(100 万あたり)
GPT-5.5 Pro$30.00-$180.00
GPT-5.5 (Standard)$5.00$0.50$30.00
GPT-5.4$2.50$0.25$15.00
GPT-5.4 mini$0.75$0.075$4.50
GPT-5.4 nano$0.20$0.02$1.25
GPT-5 nano$0.05$0.005$0.40

OpenAI のモデル全体で、出力トークンは入力トークンの 4 倍から 6 倍 のコストがかかります [6]。これは、アプリが長い回答、要約、エージェント型の応答を生成する場合に大きく効いてきます。OpenAI は全モデルに一律 50% 割引BatchFlex ティアも提供しており、GPT-5.5 の入力は 100 万トークンあたり $5.00 から $2.50 に下がります [5]

ロングコンテキストの利用が追加料金の対象になると、コストは再び上昇します。

含まれる上限

OpenAI は合計コンテキストが 270,000 トークン を超えると入力・出力の両レートを 2 倍にします [3][5]。長い文書のレビューやマルチターンのエージェントループを扱っているなら、ローリング要約はその線を超えないための最もシンプルな方法の 1 つです。

OpenAI は画像、音声、動画のモデルにも同じ料金体系を使っています。

モデルの対応範囲

OpenAI は画像、音声、動画の生成を個別に課金します。Sora-2 は 720p 動画で 1 秒あたり $0.10Sora-2-pro は 1080p で標準レート 1 秒あたり $0.70 です [5]

その他のメディア:

  • 画像料金は 100 万トークンあたり $2.50 から $8.00
  • Whisper の文字起こしは 1 分あたり $0.006
  • TTS(tts-1)は 1,000 文字あたり $0.015 [3][4]

コスト対出力

支出を削減する最速の方法の 1 つはシンプルです。価値の低い作業は安いモデルに送ることです。10,000 件のサポートチケット を処理するコストは、GPT-4.1 で約 $16、GPT-4.1 mini で $3.20、GPT-4.1 nano で $0.80 です [4]

3. Anthropic

Anthropic

Anthropic は Claude API のラインナップ を 4 つの料金ティアに分けています。Frontier/Research(Claude Fable 5 / Mythos 5)、Flagship(Claude Opus 4.5–4.8)、Mid-tier(Claude Sonnet 4.5–4.6)、Budget(Claude Haiku 4.5)です [9][10]。パターンは非常に明確です。ティアを上げるほど推論の深さと出力品質が向上しますが、請求額も急速に膨らみます。多くの購入者にとって、選択はこうまとまります。Haiku は低コスト、Sonnet は中間、Opus/Fable は重いジョブ向け です。

単価

Anthropic は現行のティア構成全体で、出力トークンを 入力レートの 5 倍 で課金します [7][6]。以下の価格は 100 万トークンあたり USD です [13][15]

モデル入力(100 万あたり)キャッシュ読取(100 万あたり)出力(100 万あたり)
Claude Fable 5 / Mythos 5$10.00$1.00$50.00
Claude Opus 4.8$5.00$0.50$25.00
Claude Sonnet 4.6$3.00$0.30$15.00
Claude Haiku 4.5$1.00$0.10$5.00

プロンプトキャッシングは、同じプレフィックスを何度も再利用する場合にコストを削減できます。キャッシュ書き込みは 5 分の TTL で基本入力レートの 1.25 倍、1 時間の TTL で 2 倍 のコストがかかります。キャッシュ読み取りは 標準入力の 10% です。実際には、同じプレフィックスを 4 回以上 使うとキャッシングが意味を持ち始めます [3][9][12]

含まれる上限

現行のフラッグシップおよび中位の Anthropic モデルのほとんど — Fable 5、Mythos 5、Opus 4.6–4.8、Sonnet 4.6 を含む — は、標準料金で 100 万トークンのコンテキストウィンドウ を備えています [9][11]。Claude Haiku 4.5 は最大 200,000 トークン です。レート制限は Tier 1 からエンタープライズ までの段階構成に従い、RPM と TPM の上限はプランごとに設定されます [13][15]

モデルの対応範囲

Anthropic のモデルは テキストとビジョンの入力 を扱い、Computer Use は追加のトークンオーバーヘッドを加えます。一部のアドオンは別途課金されます。

  • Web 検索は 1,000 検索あたり $10
  • マネージドエージェントは アクティブなセッション時間あたり $0.08、加えてトークン料金

Batch API24 時間のターンアラウンド の非同期ジョブでトークンコストを 50% 削減します [8][9][11]

コスト対出力

ここで料金の話が実用的になります。繰り返しのタスク、ロングコンテキスト作業、エージェントフローで、どのティアが費用対効果を保つのでしょうか?

Claude Opus 4.8 での 1 時間のコーディングセッションでは、50,000 入力トークン(うち 40,000 はキャッシュ読み取り)と 15,000 出力トークン を使った場合、$0.08 のエージェントセッション料金 を含めて約 $0.525 です [9][12]。これは、料金表だけでなく実際の利用で Anthropic の料金がどう振る舞うかを、しっかり示してくれます。

コーディングアシスタントやマルチステップのエージェントのような本番ジョブでは、Claude Sonnet 4.6 がコストと能力の最良のバランスを提供する傾向があります [6][3]

次に、Gemini のテキストおよびマルチモーダルモデルにわたる Google AI の料金を比較します。

4. Google AI

Google AI

Google は選択するモデルとコンテキストウィンドウのサイズに基づいてモデルを価格設定します。1 つの料金ルールがすぐに重要になります。より高いレートを避けたいなら、プロンプトを 200,000 トークン未満に抑える ことです [14][3]

単価

モデル入力(100 万あたり)出力(100 万あたり)コンテキストウィンドウ
Gemini 3.1 Pro (≤200K)$2.00$12.001M–2M
Gemini 3.1 Pro (>200K)$4.00$18.001M–2M
Gemini 2.5 Pro (≤200K)$1.25$10.002M
Gemini 3.5 Flash$1.50$9.001M
Gemini 3 Flash$0.50$3.001M
Gemini 2.5 Flash$0.30$2.501M
Gemini 3.1 Flash-Lite$0.25$1.501M
Gemini 2.5 Flash-Lite$0.10$0.401M
Gemini 3 4B$0.04$0.08131K

画像生成では、Imagen 4 Fast が 1 枚あたり $0.01–$0.02 から始まり、Imagen 4 Ultra は 1 枚あたり $0.06 です。Veo 3.1 の動画は秒単位で課金されます。Standard は 720p と 1080p で 1 秒あたり $0.40、Light は 1 秒あたり $0.05–$0.08 です [17]

含まれる上限

モデル価格は物語の一部にすぎません。スループットの上限とデータ設定は、総支出を大きく左右します。

Google の主なトレードオフは非常に明確です。一方には 低いモデル料金、もう一方には スループット制限とデータ制約 があります。Google AI Studio では、無料ティアは約 15 RPM、無料トークン、製品改善のためのデータ利用が付きます。有料ティアは約 1,000–2,000 RPM に跳ね上がり、製品改善のためのデータ利用をオフにし、コンテキストキャッシングと Batch API を加えます。エンタープライズプランはプロビジョンドスループット、ボリューム割引、コンプライアンス機能を追加します [17][18]

コンテキストキャッシングはここで最大のコストレバーの 1 つです。キャッシュへの書き込みは無料で、読み取りは 標準入力レートの 25% のコストがかかります [18]

モデルの対応範囲

Google のラインナップはテキスト、マルチモーダル、画像、動画のモデルにわたります。また 1 枚あたり $0.0025 から画像入力にも対応します [3]

コスト対出力

チャットボット、要約、分類には、Gemini 2.5 Flash または Gemini 3.1 Flash-Lite がたいてい最も理にかなっています。安価で、多くの日常的なワークロードによく合います。Gemini 3.1 Pro は、より大きなコンテキストウィンドウが必要なケースのために取っておき、ローリング要約を使って 200,000 トークン の区切りを下回るようにします [3][6]

注目に値するシンプルな価格面もあります。入力 100 万トークンあたり $2.00 で、標準的な長さのプロンプトでは、Gemini 3.1 Pro は GPT-5.5($5.00)や Claude Opus 4.8($5.00)といったフラッグシップモデルより安価です [2]

次に、Meta の料金とモデルの対応範囲を比較します。

5. Meta

Meta は、上記のクローズドモデルのプロバイダとは少し異なる動き方をします。Llama モデルはオープンウェイトなので、コストはどこでホストまたはアクセスするかに依存します。実際には、これはまったく同じモデルでもプロバイダごとに料金が大きく異なることを意味します。たとえば、Llama 3.3 70B は 入力 100 万トークンあたり $0.10 という低さで掲載されてきました。Meta はファーストパーティの API 料金表を公開していないため、ホスト間で料金が大きく振れることがあります [1][19][20]

単価

現行の料金は Llama 4 ScoutLlama 4 Maverick を中心にしています [21][22]

モデル入力(100 万あたり)出力(100 万あたり)コンテキストウィンドウ
Llama 4 Scout$0.08 – $0.17$0.15 – $0.66最大 10,000,000 トークン
Llama 4 Maverick$0.15 – $0.24$0.60 – $0.971,000,000 トークン
Llama 3.3 70B$0.10 – $0.72$0.32 – $0.72128K – 131K トークン
Llama 3.2 1B Instruct$0.01 – $0.02$0.01 – $0.0260K – 131K トークン
Llama 3.1 405B Instruct$0.90 – $3.00$0.90 – $3.00128K – 131K トークン

その低い表示価格は紙の上ではとても魅力的に見えます。しかし、それが役立つのは、ホストのコンテキスト制限とスループット上限がワークロードに合致する場合だけです。

含まれる上限

共有のレート制限や組み込みの無料ティアを備えた標準的な Meta プランは 1 つも存在しません。ホストが独自のスループット制限、コンテキスト上限、キャッシングルールを設定します。したがって、Llama 4 Scout でロングコンテキストの作業を計画しているなら、宣伝された範囲をフルで得られると仮定せず、まずホストのコンテキスト上限を確認してください。

モデルの対応範囲

Llama 4 ScoutLlama 4 Maverick はどちらもテキストとビジョンの入力に対応し、主要プロバイダ全体でツール呼び出しと JSON モードにも対応します [21][22]。旧来の選択肢にもまだ出番があります。Llama 3.2 11B Vision はビジョン中心のジョブを依然として扱え、Llama 3.2 1B Instruct は低レイテンシと軽量な計算利用が最も重要なエッジ展開を狙っています [21][22]

コスト対出力

長いプロンプトの大量ジョブを実行しているなら、Scout が際立ちます40K 入力8K 出力トークン のコーディングタスクは 1 タスクあたり約 $0.005 で、おおよそ $1 あたり 200 タスク に相当します。同じタスクを GPT-5.5 で実行すると約 $0.44、つまり $1 あたりわずか 2.3 タスク です [6]

顧客向けの利用やマルチモーダル作業には、Llama 4 Maverick がたいていより良い選択です。GPT-4o を上回るベンチマークを示しつつ、入力料金ははるかに安く、入力 $0.15/M入力 $2.50/M です [6]。入力と出力の料金差が小さいため、長い応答が予想される場合にも好適です。

次に、xAI の料金とモデルの対応範囲を比較します。

6. xAI

xAI

xAI は入力と出力の料金を低く抑えており、応答が長くなるときに役立ちます。Grok 4.3 は 入力 100 万トークンあたり $1.25出力 100 万トークンあたり $2.50 を課金します。この 2 倍の差は、モデルが多くの文字を返してくるときに効いてきます [6][24]

単価

モデル入力(100 万あたり)キャッシュ入力出力(100 万あたり)コンテキストウィンドウ
Grok 4.3 (Flagship)$1.25$0.20$2.501M トークン
Grok 4.20 (Reasoning)$1.25$0.20$2.502M トークン
Grok Build 0.1 (Coding)$1.00$0.20$2.00256K トークン
Grok 4.1 Fast (Budget)$0.20$0.05$0.502M トークン

画像作業では、Grok Imagine 1.5 Edit1 コールあたり $0.01875 です [23]。Imagine API を通じた動画生成は、解像度に応じて 1 秒あたり $0.08 から $0.25 です [24]

含まれる上限

xAI は使用量ベースのレート制限を備えた 従量課金制 を採用しています。エンタープライズプランはカスタムのレート制限と専用インフラを追加できます [25][26]

1 つ注意すべき点があります。ツール利用は一気に積み上がり得ます。検索とコード実行は別途課金されるため、低いトークン価格が必ずしも低い最終請求額を意味するわけではありません。Web SearchX SearchCode Execution はそれぞれ 1,000 コールあたり $5.00 です [24]

ジョブが急ぎでなければ、Batch API は 24 時間以内に処理されるタスクでコストを 20% から 50% 削減できます [24]

モデルの対応範囲

xAI は テキスト、画像、動画 のユースケースに対応します [24][16]Grok 4.20 は高速なツール利用向けに作られており、Grok Build 0.1 はコーディング中心の作業を狙っています [6][2]

コスト対出力

40K 入力トークン8K 出力トークン の標準的なコーディングタスクでは、Grok 4.3 は 1 タスクあたり約 $0.07 です。これはおおよそ $1 あたり 14 タスク に相当します [6]

次に、本ガイドでは別のプロバイダの料金構造を比較します。あるいは、統合 LLM API を使って、これらのモデルに単一の統合でアクセスすることもできます。

7. Mistral AI

Mistral AI

Mistral Large 3 は 入力 100 万トークンあたり $0.50出力 100 万トークンあたり $1.50 です。これは低価格のフラッグシップ勢に位置づけられます。見出しのレートは強力に見えますが、ツール料金と Mistral の課金ティアを加味すると最終請求額は変わり得ます。

現行のラインナップは以下のとおりです。

単価

モデル入力(100 万あたり)キャッシュ入力出力(100 万あたり)
Mistral Large 3 (Flagship)$0.50$0.05$1.50
Mistral Medium 3.5 (Balanced)$1.50-$7.50
Mistral Small 4 (Efficient)$0.10$0.01$0.30
Magistral Medium (Reasoning)$2.00-$5.00
Codestral (Coding)$0.30$0.03$0.90
Devstral 2 (Coding)$0.40$0.04$2.00
Pixtral Large (Multimodal)$2.00-$6.00

Mistral は OCR を 1,000 ページあたり $4.00、埋め込みを 100 万トークンあたり $0.10、Web 検索とコード実行を 1,000 コールあたり $30 で別途課金します [27]

含まれる上限

Mistral は従量課金制を採用し、累計支出が $20$100$500 に達すると開放される 4 つのレート制限ティアがあります [31]Team プランには 月額 $50 の最低コミットメントが付きます [27]

ここにはコストを一気に削減できる 2 つのレバーがあります。

  • Batch API は非同期ジョブで全モデルの料金を 50% 引き下げます [27][31]
  • プロンプトキャッシングは、共有プレフィックスが少なくとも 64 トークン の長さであれば、キャッシュ済みトークンのコストを最大 90% 削減できます [31]

これらの料金ルールは、大量または非同期のワークロードを実行しているときに最も重要になります。

モデルの対応範囲

Mistral はテキスト、推論、コーディング、マルチモーダル、エッジのユースケースに対応します。Codestral は fill-in-the-middle(FIM)に対応しており、IDE ワークフローに好適です。Ministral シリーズ — 3B、8B、14B — は低コストまたはオンデバイスの展開を狙っています [30][32]

Mistral は EU ホスト型のエンドポイントと GDPR に配慮したデータ処理も追加料金なしで提供します [29][31]

コスト対出力

エンティティ抽出、分類、要約のような大量の実用作業には、Mistral Small 4 が最も強い選択です [28][31]。より高い推論力が必要でも低いトークン料金を保ちたいなら、Mistral Large 3 がより理にかなっています [28][31]

推論負荷の高いタスクには、Magistral Medium出力 100 万トークンあたり $5.00 で、OpenAI の o3 より出力で 37% 安い です [29]

次に、エンタープライズのテキストおよびリトリーバルのワークロードに対する Cohere の料金を比較します。

8. Cohere

Cohere

Cohere は主にリトリーバルとエンタープライズ検索向けに作られています。その料金はそれを反映しています。テキスト中心のリトリーバル作業には低コストな選択肢、マルチモーダルやより要求の高いジョブには高価格なモデルです。

単価

Cohere はラインナップを 3 つの区分に分けています。低コストのリトリーバルモデル、エンタープライズのマルチモーダルモデル、そして埋め込みとリランク用の個別ツールです。

モデル入力(100 万あたり)出力(100 万あたり)コンテキストウィンドウ
Command R7B$0.0375$0.15128K
Command R$0.15$0.60128K
Command R+$2.50$10.00128K
Command A (Multimodal)$2.50$10.00256K
Aya Expanse (8B/32B)$0.50$1.50128K
Embed v3$0.10--
Rerank v3$2.00--

リランクは検索ユニットで課金されます。1 クエリと最大 100 件の文書です。チャンクが 500 トークンを超える場合は個別にカウントされます [33][35]

含まれる上限

Cohere はテスト用に無料のトライアルキーを提供しており、月あたり 1,000 コールと 20 RPM が上限です [37]。本番用キーは従量課金制で、標準モデルは最大 500 RPM です。請求は月末、または残高が $250 に達した時点で発生します [33][37]

Cohere の一部の最上位モデルは、本番でのフル利用の前に営業承認が必要です。これには Command A+、A Reasoning、A Vision が含まれます。その承認が下りるまで、セルフサーブアクセスはトライアル相当の上限にとどまります [37]

チームに専用のスループットが必要なら、Cohere は Model Vault も提供します。料金は Embed 4 Small インスタンスで 月額 $2,500 から始まります [33]

モデルの対応範囲

Cohere はメディア生成ではなく、テキスト優先のエンタープライズワークフローに合致します。

同社はラインナップを画像や動画の生成ではなく、テキスト、リトリーバル、エンタープライズ検索を中心に据えています。主な例外は Command A で、画像入力とマルチモーダルタスクに対応します。256,000 トークンのコンテキストウィンドウも備え、Cohere のラインナップで最大です [34][36]

Aya Expanse は 49 言語に対応しており、グローバル展開に確かな選択肢となります [37]

コスト対出力

RAG パイプラインを構築しているなら、Cohere の低い入力料金が大きな魅力です。こうしたワークフローは通常、出力トークンよりはるかに多くの入力トークンを消費するため、入力 100 万トークンあたり $0.15 の Command R は、文書中心のプロンプトが高くなりすぎるのを防ぐのに役立ちます。

シンプルな例が差を明確にします。100,000 件のサポートチャットボットのやり取りを Command R で実行すると 月額約 $123、同じ量を Command R+ で実行するとおよそ 月額 $2,050 になります [39]

大規模な純粋な分類と要約には、Command R7B がラインナップで最も低コストな選択肢です [34][38]

実用的な考え方は次のとおりです。

  • 大量の分類と要約には Command R7B を使う。
  • RAG とチャットボットには Command R を使う。
  • 追加のモデル性能が必要なときだけ Command R+ を使う。

次に、Runway の料金を比較するか、シネマティックな AI 動画生成 の代替を検討します。

9. Runway

Runway

Runway は動画を中心に作られているため、その料金は 生成または編集された秒数 に紐づいています。動画と画像の作業にはクレジット制を使います。クレジットはサブスクリプションで得るか、$10 の最低額1 クレジットあたり $0.01 のトップアップパックを購入して得ます。API クレジットは個別に課金されます。主に注意すべきは、モデルによってクレジットの消費がどう変わるかです。

単価

モデルAPI レート(クレジット/秒)USD コスト/秒
Gen-4.5 (Flagship)12 /秒$0.12
Gen-4 Video12 /秒$0.12
Gen-4 Turbo5 /秒$0.05
Aleph 2.0 (Video Editing)28 /秒$0.28
Act-Two (Animation)5 /秒$0.05
Gen-4 Image (1080p)8 /img$0.08

含まれる上限

年間プランでは [40][43]、Runway は以下の月間クレジット上限を含みます。

プラン月額コスト(年間)クレジット/月繰り越し
Free$0125(1 回限り)なし
Standard$12625なし
Pro$282,250なし
Max$769,5001 か月

Free プランにはウォーターマークが付き、商用利用は許可されません。有料プランは両方の制限を解除します [40][44]。Standard と Pro のクレジットは繰り越されず、未使用のクレジットは次の請求日の 24 時間以内に失効します [40][43][46]1 か月の繰り越し が付くのは Max だけです [40][43][46]

モデルの対応範囲

Runway は テキストから動画、画像から動画、動画編集、テキストから画像、画像から画像、加えて音声とポストプロセスのツール に対応します [42]。この幅広さは、生成しかできないツールよりも大きな到達範囲を与えます。しかし価格だけでは全容はわかりません。出力品質が、実際に支払う金額を左右します。

コスト対出力

ここが、最初に見えるよりも高くつくところです。リトライは一気に積み上がります。完成クリップのほとんどは 3 回から 5 回の生成 を要し、これが Gen-4.5 を 完成秒あたり約 $0.50 から $0.80 に押し上げます [43][44][47]

支出を抑える一般的な方法は、ラフな下書きやコンセプトテストには $0.05/秒Gen-4 Turbo を使い、最終レンダリングには $0.12/秒Gen-4.5 に移行することです [41][45]。この構成は、モーション、フレーミング、タイミングをまだ検討している間にプレミアムクレジットを浪費したくない場合に理にかなっています。

下位プランには厳しい上限もあります。Standard の 625 クレジット は、月あたり約 52 秒の Gen-4.5 動画 しかカバーしません [40][44]。これは磨き上げた数本のクリップには十分ですが、安定した制作ワークフローを支えるには足りません。

あるいは、高一貫性の動画生成のために MiniMax Hailuo 2.3 を検討できます。次に、Stability AI の画像と動画の料金を比較します。

10. Stability AI

Stability AI

Stability AI は画像と音声のワークフローで際立っており、そこではアセットごとの料金が月額プランより重要になることが多いです。クレジット制を採用し、1 クレジット = $0.01 です。新規ユーザーは 25 の無料クレジット を得られ、これはフラッグシップの生成で約 3 回、または SD 3.5 Large の画像 8 枚 に十分です。API アクセスには商用利用権も含まれます [48]

サービスごとの料金は以下のとおりです。

単価

サービスクレジットUSD
Stable Image Ultra8$0.08
Stable Diffusion 3.5 Large6.5$0.065
Stable Diffusion 3.5 Large Turbo4$0.04
Stable Image Core3$0.03
Stable Diffusion 3.5 Flash2.5$0.025
SDXL 1.00.9 から$0.009 から
Replace Background & Relight8$0.08
Erase / Inpaint / Remove Background5$0.05
Creative Upscaler (to 4K)60$0.60
Fast Upscaler2$0.02
Stable Fast 3D10$0.10
Stable Audio 3.0 (最大 6 分)26$0.26

含まれる上限

API 料金は 従量課金制 で、大量利用のチームにはカスタム料金と一括割引があります [49]

モデルの対応範囲

Stability AI は テキストから画像、画像編集、3D アセット生成、音声生成 に対応します [48]。平たく言えば、本番作業向けに作られています。いくつものツールを行き来することなく、画像を生成し、編集し、アセットを 3D 出力に変え、音声クリップを作成できます。

編集スイートには アウトペインティング、背景置換、リライティング、スタイル転送 が含まれます [48]。Stable Fast 3D は 3D アセット生成を扱い、Stable Audio 3.0 は最大 6 分 の音声クリップに対応します [48]。つまり、これはチャットというより、メディア作業を仕上げることに重きを置いています。

その料金差は、スケールで作業しているとき、特に編集とアップスケールのジョブで最も顕著に現れます。

コスト対出力

Creative Upscaler は 1 枚あたり 60 クレジット($0.60) です。これは 2 クレジット($0.02)Fast Upscaler30 倍 の価格です。ですから、主な目的が単純な解像度の引き上げなら、Fast Upscaler が低コストな選択です [48]

Stable Image Core は 1,000 枚で月額約 $30 になります [48]。そして SD 3.5 Large月 10,000 枚 にスケールすると、コストは約 $650 になります [48]

他の高性能モデルを使って 画像を生成・編集 することもできます。次に、Black Forest Labs の画像料金を比較します。

11. Black Forest Labs

Black Forest Labs

Black Forest Labs は画像生成の便利な料金ベンチマークです。なぜなら、請求額が出力サイズと参照画像を使うかどうかで変わるからです。そのシステムはクレジットベースで、1 クレジット = $0.01 です。FLUX.2 の料金はメガピクセルに紐づいており、参照画像はその上に課金されます。1 つ注意すべき点として、各画像と各参照画像は 1,024 × 1,024 px を基準に、次のメガピクセルへ切り上げられます。

単価

FLUX.2 のラインナップは 4 つのティア、Max、Pro、Klein、Flex で提供されます。それぞれが画像品質、速度、価格の間で異なるトレードオフをします。

モデル1 番目の MP(ベース)追加 MP参照画像(MP あたり)生成モード
FLUX.2 [max]$0.07$0.03$0.03Text-to-Image / Edit
FLUX.2 [pro] (Text-to-Image)$0.03$0.015$0.015Text-to-Image
FLUX.2 [pro] (Edit)$0.045$0.015$0.015Image Editing
FLUX.2 [klein] 9B$0.015$0.002$0.002Text-to-Image / Edit
FLUX.2 [klein] 4B$0.014$0.001$0.001Text-to-Image / Edit
FLUX.2 [flex]$0.05$0.05$0.05Text-to-Image / Edit

旧来の FLUX1.1 と FLUX.1 のモデルは、代わりに画像ごとの定額料金を使います。

モデル画像あたりの価格説明
FLUX1.1 [pro]$0.04標準の高速生成
FLUX1.1 [pro] Ultra$0.06超高解像度
FLUX1.1 [pro] Raw$0.06素の写真的な美学
FLUX.1 Kontext [max]$0.08最高品質のインコンテキスト編集
FLUX.1 Kontext [pro]$0.04商用対応のインコンテキスト編集
FLUX.1 Fill [pro]$0.05ターゲット指定の画像インペインティング
FLUX.1 [schnell]$0.003最高速度に蒸留

含まれる上限

API アクセスは従量課金制ですが、Black Forest Labs には月間画像上限付きのサブスクリプションティアもあります [50]

プラン月間上限主な機能
Builder月 10,000 枚Klein モデル、10 ユーザー、ファインチューニング権
Platform月 100,000 枚Klein 9B + Dev モデル、10 ユーザー
Professional月 100,000 枚Dev モデル、3 ドメイン、10 ユーザー
Enterpriseカスタム全モデル、カスタムボリューム、API とウェイトへのアクセス

モデルの対応範囲

Black Forest Labs は 画像生成と編集 に重点を置いています。FLUX.2 モデルは最大 4 MP の出力サイズに対応し、それを超えるものは自動的にリサイズされます [50]。速度が最も重要なら、FLUX.2 [klein] 4B がサブ秒の推論で際立ち、ほぼリアルタイムのユースケースに好適です [52]

編集作業には、ラインナップに明確な選択肢がいくつかあります。FLUX.1 Fill [pro]1 枚あたり $0.05 でターゲット指定のインペインティングを扱い、FLUX.1 Kontext [pro] は商用対応のインコンテキスト編集向けに 1 枚あたり $0.04 で価格設定されています [51]

コスト対出力

完成した 4 MP FLUX.2 [max] の画像は、生成、アップスケール、2 回のリトライを加味すると約 $0.30 です。参照画像は同じメガピクセル単価で別途課金されます [50][51]。コンセプトアートや初期段階のプロトタイピングをしているなら、1 枚あたり $0.014FLUX.2 [klein] 4B は、最終レンダリングに移る前にアイデアを試す低コストな方法です [50]

次は、Kling AI の動画料金です。

12. Kling AI

Kling AI

Kling AI は料金を 2 つのレーンに分けています。Web アプリはクレジットを使い、API は秒単位で課金します。API 側では、コストはクリップ長、解像度、同期音声をオンにするかどうかで変わります。

単価

標準のサイレント動画では、料金は 720p で $0.0672/秒 から始まり、1080p で $0.0896/秒 まで上がります。テキスト+画像の入力と動画から動画のワークフローを扱う Kling V3 Omni は、1080p で $0.1792/秒 です。

構成解像度価格/秒10 秒クリップの推定コスト
Kling V3 – Silent720p$0.0672$0.67
Kling V3 – Silent1080p$0.0896$0.90
Kling V3 – With Audio1080p$0.1120$1.12
Kling V3 Omni (Ref)1080p$0.1792$1.79
Kling V3 – Silent4K$0.4286$4.29

というわけで、Kling は動画 API の中では低価格側に位置します。

含まれる上限

Kling は Web アプリと API の料金を分けており、プランを選ぶ前に両方を確認する必要があります。API レートは計算の一部にすぎません。クレジットと同時実行数が、どれだけの作業を通せるかに大きく影響します。

無料ティアには 1 日あたり 66 クレジット が付き、これらのクレジットは 24 時間ごとにリセットされ、繰り越しはありません。有料プランは Standard の 月額 $6.99 で 660 クレジット から始まり、Ultra の 月額 $180 で 26,000 クレジット まであります。Ultra を年払いにすると、実効レートが 34% 下がります [54]

API ユーザーの場合、標準の同時実行数は 10 並列ジョブ が上限です。トライアルティアのアカウントはわずか 3 です。その差は、クリップを 1 本ずつ待つ代わりにレンダリングをバッチ処理しようとしているときに大きく効いてきます。

モデルの対応範囲

Kling V3 と Kling V3 Omni は最大 15 秒 のクリップに対応しており、シネマティックや物語性のある作業に合います。V2.6 はクリップ長を 10 秒に制限し、同期音声を追加します。V2.5 Turbo は Master ティアより約 30% 安い です。

コスト対出力

支出を抑える一般的な方法は、720p のサイレントモード で下書きし、最終レンダリングのときだけ 1080p または 4K に上げることです。このアプローチが役立つのは、多くのユーザーが使えるクリップを得るのに 2〜4 回の生成試行 を要し、それが完成動画のコストを押し上げるからです [53]

前払いのリソースパッケージは、バンドルサイズに応じて実効単価を 10% から 30% 削減できます [53]

次に、これらのモデルを単価、プラン上限、モダリティの対応範囲、出力あたりのコストで比較します。

比較基準ごとの料金内訳

以下の表は、プロバイダごとの詳細を 4 つの購入フィルターに凝縮します。単価、プラン上限、モダリティの対応範囲、出力コストです。

テキスト・画像・動画 API にわたる単価

モデルプロバイダ入力($/100 万トークン)出力($/100 万トークン)ティア
GPT-5 NanoOpenAI$0.05$0.40Budget
Gemini 2.5 ProGoogle$1.25$10.00Mid-range
GPT-5.5OpenAI$5.00$30.00Premium

画像生成では、FLUX.1 [schnell] が 1 枚あたり $0.003 で低コストの基準となり、Stable Image Ultra が 1 枚あたり $0.08 で上限側に位置します。動画では、Kling V3 が低い側で 720p の $0.0672/秒、Veo 3.1 が高い側で $0.40/秒 です。

素のレートは重要です。しかし実際には、プランの上限が実際に支払う額を決めることが多いです。

サブスクリプションとプラットフォームプランに含まれる上限

月あたり約 500 万入力トークン未満では、カジュアルな利用において $20 のチャットプランが API 課金を上回ることがあります。

プロバイダプラン月額含まれる利用量主な上限チームプラン
OpenAIChatGPT Plus$20上限あり(動的)動的なメッセージ上限、API アクセスなしあり
AnthropicClaude Pro$20上限あり(動的)利用上限は需要により変動、API アクセスなしあり
GoogleGemini Advanced$20上限あり(動的)Google One に紐づく、API アクセスなしあり(Workspace)

推論モデルにはもう 1 つのひねりがあります。隠れた推論トークンは出力レートで課金され、総コストを 2 倍から 7 倍に押し上げることがあります。[3]

モダリティ別のモデル対応範囲

料金が意味を持つのは、モデルのモダリティがジョブに合致したときだけです。

プロバイダテキストマルチモーダル入力画像生成ビジョン動画生成API アクセス
APIMart-統合 API
OpenAI直接
Google直接
Anthropic直接
Meta統合/ホスト型
Mistral AI直接
Stability AI直接

安いモデルも、必要なフォーマットを扱えなければお得ではありません。たとえばテキスト専用のベンダーは、ワークフローが画像や動画の出力に依存している場合はあまり役に立ちません。

一般的なユースケースごとのコスト対出力

これらは、本番に入るとチームが実感しがちなコストです。

テキストワークロード(出力 100 万トークンあたり):

ユースケースモデル出力コストティア主なトレードオフ
大量チャットボットGPT-5 Nano$0.40Budget推論の深さが低い
文書抽出Gemini Flash Lite$0.30Budgetクリエイティブライティングに制限
コード生成Gemini 2.5 Pro$10.00Mid-range200K コンテキスト超で追加料金 [3]
エージェント型ワークフローClaude Sonnet 4.6$15.00Mid-rangeROI にプロンプトキャッシングが必要 [3]
複雑な推論Claude Opus 4.8$25.00Premium高コスト、レイテンシが遅い

動画ワークロード(10 秒クリップあたり):

ユースケースモデル出力コストティア主なトレードオフ
ショート動画(下書き)Kling V3約 $0.67Budget720p、15 秒クリップに制限
ショート動画(最終)Sora 2$1.00Mid-range品質とコストのバランス
シネマティック動画Veo 3.1$4.00Premium最高品質、最大支出

シンプルに言えば、トークンあたりや秒あたりの価格は物語の一部にすぎません。より大きな要因は、多くの場合、モデルを どう 使うかです。一日中稼働するチャットボット、文書パイプライン、動画スタジオは、紙の上では安く見えても、出力量が効いてくると一気に高くつき得ます。

実用的な目安として、バッチ処理 は 24 時間のターンアラウンドを許容できるワークロードに対して、OpenAI、Anthropic、Mistral でコストを 50% 削減します。[3] 動画では、低解像度で下書きし、最終レンダリングだけをアップグレードするのが、出力あたりの支出を管理する最も確実な方法です。

長所と短所

以下の表は、通常、意思決定を左右する要素にトレードオフを凝縮します。コストモダリティワークロードの適合性 です。プロバイダを選んでいるなら、これがすべての料金セクションを掘り返すことなく、要点を短くまとめてくれます。

対象長所短所最適な用途
APIMart1 つの API で 500+ モデル、テキスト・画像・動画を 1 枚の請求書で使用量ベースの料金なのでコストは出力量とともに増える統合されたマルチモーダルアクセスを求めるチーム
OpenAI明快なトークン課金フラッグシップモデルが高価汎用テキストワークロード
Anthropicプロンプトキャッシングが繰り返し作業のコストを下げる最上位モデルは出力レートが高いコーディングとロングコンテキストのワークフロー
Google AIFlash-Lite が安いPro は 200K トークン超で高くつく大量テキストとロングコンテキストのワークロード
Meta (Llama)セルフホストできれば低コストファーストパーティ API がないためホスティングと稼働率を自分で担うセルフホスト能力があるコスト重視のワークロード
xAI (Grok)競争力のある中位料金モデルのラインナップが小さいリアルタイムの Web・ソーシャルデータのアプリケーション
Mistral AI低コストな小型モデルと多言語対応マルチモーダル機能が少ない多言語テキストアプリ
CohereEmbed、Rerank、Command R7B が RAG に合うCommand R+ はティアの割に高価検索拡張生成とナレッジベース
Stability AI非常に低い画像生成料金画像のみの範囲が広いワークフローを制限する大量の画像生成
Kling AI低コストなショート動画ベース料金では 15 秒動画に制限ショート動画生成

シンプルな読み方は次のとおりです。

  • 多くのモデルタイプを 1 つの API で 使いたいなら、APIMart が際立ちます。
  • 素のテキスト利用とわかりやすい課金 を最も重視するなら、OpenAI か Google AI がより手軽に合うかもしれません。
  • 作業が コーディング、長いプロンプト、繰り返しのコンテキスト に寄っているなら、Anthropic が理にかなうことがあります。
  • コストを抑えつつ自分で運用できるなら、Meta (Llama) は無視しがたい存在です。
  • スタックが RAG を中心に組まれているなら、Cohere にはその構成にうまく合うツールがあります。

画像中心の利用には、Stability AI が低コストな選択です。短い動画クリップには、Kling AI が導入コストを抑えますが、ベースプランは 15 秒の出力に縛られたままです。

まとめ

上記の料金内訳を見ると、最良のモデルは最も高価なものでも最も安いものでもありません。あなたの ワークロード、モダリティ、ボリューム に合うものです。

大量・低複雑度のタスクは、許される限り最も低コストなモデルで実行すべきです。

複雑度が上がるにつれて、出力がそれに見合うときだけ支出を上げるべきです。中位モデルは、最上位の価格タグなしで安定した性能を必要とする本番アプリに好適です。

プレミアムな推論やメディア生成の領域に入ると、素のトークン料金よりも 出力あたりのコスト の方が重要になってきます。プレミアムモデルは、品質が成果に直接影響する場合に理にかなっています。そして動画では、料金の仕組みが異なります。WAN 2.7、Sora 2($0.08/秒)、Kling V3720p で $0.0672/秒)のような API は、トークンではなく秒単位で課金します。

テキスト、画像、動画のモデルを一緒に使うチームには、APIMart が単一の API を通じて 500+ モデル へのアクセスを提供します。つまり、マルチモーダル作業を 1 つの API と 1 枚の請求書の下に収められます。

FAQ

出力あたりの総コストはどう見積もればよいですか?

モデルがどう課金されるかに基づいて総コストを見積もります。

テキストモデルでは、料金は通常 100 万トークン あたりの 入力トークン出力トークン に分かれます。出力トークンはより高くつくことが多いので、想定する応答の長さが総支出に最も大きく影響します。

テキスト以外のユースケースでは、画像モデルはしばしば 1 コールあたり、動画モデルは 生成された 1 秒あたり で価格設定されます。

コストを見積もるシンプルな方法は次のとおりです。

  • トークンカウンターを使ってプロンプト量を測る
  • 各課金単位に対するモデルのレートを確認する
  • そのレートを想定利用量に適用する

これで、スケールアップする前に実用的なコスト見積もりが得られます。

プロンプトキャッシングはいつお金を節約しますか?

プロンプトキャッシングは、アプリが同じプロンプトのプレフィックスを何度も送るときにコストを削減します。それはたいてい、長いシステム指示、大きな文書セット、または多数のリクエストで再利用される共有の会話履歴を意味します。

毎回入力トークンの全額を払う代わりに、繰り返し部分に対してより少なく払います。多くの場合、それにより入力コストを 50% から 90% 削減できます。

これは、ボリュームが大きく、コンテキストがほぼ変わらないときに最もうまく機能します。カスタマーサポートのチャットボットが良い例です。ボットは同じルール、ブランド情報、ヘルプ文書を何千ものチャットで再利用するかもしれません。

コンテキストが常に変わる場合には不向きです。アプリがリクエストごとにプロンプトを一から書き直し続けるなら、キャッシュすべき繰り返しテキストが少なく、節約は一気に減ります。

サブスクリプションと API 料金のどちらを使うべきですか?

ほとんどの開発者や企業にとって、API 料金 の方が理にかなっています。従量課金制なら、使ったトークンに対して支払います。月額の最低料金なし、不意の手数料なし、トラフィックが少ないときにのしかかる固定料金もありません。コストは利用量とともに動き、これは定額の定期請求よりも遥かに良く合うことが多いです。

APIMart は、明快なトークン単位の料金と、利用量が増えるにつれ自動的に適用されるボリューム割引とともに、500+ の AI モデル に接続する 1 つの API を提供します。

関連ブログ記事

次は試してみましょう

モデルマーケットで使いたいモデルを選ぶ

APIMart のモデルマーケットでチャット、画像、動画モデルを試し、統一 API でモデルの能力をすばやく体験できます。

チャットモデル画像モデル動画モデル
モデルマーケットを見る