はじめに
「画像生成AI」と一口に言っても、FLUX、Stable Diffusion、DALL-E、Midjourneyなど多くの名前が飛び交い、さらにPollinations、Replicate、puter.jsといったサービス名も登場する。
これらは何が違うの?どれを使えばいいの?
この混乱は、AI画像生成が3つのレイヤーで構成されていることを理解すると解消する。
本記事では、ソロ開発者が画像生成AIを選ぶ際に必要な「地図」を提供する。
🗺️ AI画像生成の3レイヤー構造
┌─────────────────────────────────────────────────┐
│ Layer 3: サービス/アプリケーション層 │
│ (ChatGPT, Midjourney, Pollinations, puter.js) │
├─────────────────────────────────────────────────┤
│ Layer 2: API/プロバイダー層 │
│ (OpenAI API, Replicate, fal.ai, BFL API) │
├─────────────────────────────────────────────────┤
│ Layer 1: モデル層 │
│ (FLUX, Stable Diffusion, DALL-E, Imagen) │
└─────────────────────────────────────────────────┘
🧠 Layer 1: モデル層
モデル層はAI画像生成の「頭脳」。テキストから画像を生成する数学的な仕組み(ニューラルネットワーク)そのもの。
主要モデル一覧(2026年3月時点)
| モデル | 開発元 | ライセンス | 特徴 |
|---|---|---|---|
| FLUX | Black Forest Labs | Apache 2.0(schnell) | 高品質・高速、商用利用可 |
| Stable Diffusion 3.5 | Stability AI | オープン(制限あり) | 大規模コミュニティ、LoRA豊富 |
| DALL-E 3 | OpenAI | プロプライエタリ | ChatGPT統合、プロンプト理解力高 |
| Midjourney v7 | Midjourney | プロプライエタリ | アート表現に強い |
| Imagen 3 | プロプライエタリ | テキスト描画が正確 | |
| Gemini(画像生成) | プロプライエタリ | マルチモーダル、高速 | |
| Ideogram 2.0 | Ideogram | プロプライエタリ | 文字入り画像に特化 |
| Adobe Firefly 3 | Adobe | プロプライエタリ | 商用安全(学習データがクリア) |
モデル選びのポイント
- オープンソース重視 → FLUX schnell, Stable Diffusion
- 品質最優先 → FLUX.1 Pro, Midjourney
- 文字を含む画像 → Ideogram, Imagen
- 商用利用の安全性 → Adobe Firefly
- 高速生成 → Gemini Flash, FLUX schnell
🔌 Layer 2: API/プロバイダー層
API/プロバイダー層は、モデルを動かすためのインフラを提供する。
モデルを自分のGPUで動かすこともできるが、多くの開発者はAPIプロバイダー経由で利用する。
主要プロバイダー一覧
| プロバイダー | 特徴 | 対応モデル例 | 料金目安 |
|---|---|---|---|
| OpenAI API | 公式、安定性◎ | DALL-E 3 | $0.04〜/枚 |
| Black Forest Labs API | FLUX公式 | FLUX Pro/Dev | $0.03〜/枚 |
| Stability AI API | SD公式 | SD 3.5 | $0.02〜/枚 |
| Google AI API | Gemini/Imagen公式 | Gemini, Imagen 3 | 無料枠あり |
| Replicate | 多数モデル対応 | FLUX, SD, etc. | $0.003〜/秒 |
| fal.ai | 高速推論 | FLUX, SD | $0.001〜/秒 |
| Together AI | 低コスト | FLUX, SD | 競争力ある価格 |
| Hugging Face Inference | OSS親和性高 | FLUX, SD | 無料枠あり |
プロバイダー選びのポイント
- 最新FLUXを使いたい → Black Forest Labs API, Replicate
- コスト最優先 → fal.ai, Together AI
- 多様なモデルを試したい → Replicate, Hugging Face
- エンタープライズ品質 → OpenAI API
🎨 Layer 3: サービス/アプリケーション層
サービス層は、エンドユーザーやフロントエンド開発者が直接触れるインターフェース。
サービスの種類
1. エンドユーザー向けアプリ
| サービス | モデル | 料金 | 特徴 |
|---|---|---|---|
| ChatGPT | DALL-E 3 | 月額$20(Plus) | 対話型、簡単 |
| Midjourney | 独自 | 月額$10〜 | Discord経由、高品質 |
| Leonardo.ai | 複数 | 無料枠あり | ゲーム素材に強い |
| Canva AI | 独自 | Canva Pro内 | デザインツール統合 |
2. 開発者向けサービス(フロントエンド統合)
| サービス | モデル | 料金モデル | 特徴 |
|---|---|---|---|
| Pollinations.ai | FLUX, Gemini, etc. | 基本無料 | FLUX無制限無料、APIキー不要 |
| puter.js | 複数 | User-Pays | バックエンド不要、ユーザー課金 |
🍌 サービス独自のモデル名(ラッピング)
サービス層では、内部で使っているモデルに独自の名前を付けて提供することがある。
Pollinations.aiの例
| サービス上の名前 | 実体(モデル層) | 特徴 |
|---|---|---|
| flux | FLUX.1 schnell | 無料・無制限 |
| nanobanana | Gemini 3.1 Flash | 高速・軽量 |
| nanobanana-pro | Gemini(上位版) | より高品質 |
| turbo | SDXL Turbo系 | 高速 |
| gptimage | DALL-E系 | OpenAI品質 |
| kontext | Kontext | 編集特化 |
→ 「nanobanana」はPollinationsの呼び方で、実体はGoogle Gemini
この構造を理解すると:
- 同じ「Gemini画像生成」でも、Google AI Studio経由とPollinations経由で料金が違う
- Pollinationsは複数のモデルを統一APIで提供している
🆓 無料で使えるオプション
ソロ開発者にとって重要な「無料で使えるか」を整理。
完全無料
| サービス | 無料内容 | 制限 |
|---|---|---|
| Pollinations.ai(FLUX) | 無制限 | レート制限のみ |
| Hugging Face Spaces | 一部モデル | 遅い場合あり |
| Google AI Studio | Imagen 3 | 日次制限 |
無料枠あり
| サービス | 無料枠 | 超過後 |
|---|---|---|
| Leonardo.ai | 150枚/日 | 課金 |
| Ideogram | 25枚/日 | 課金 |
| Adobe Firefly | 25枚/月 | Adobe契約 |
Pollinations.ai 料金早見表
| モデル名 | 1 Pollenあたり | 備考 |
|---|---|---|
| flux | ∞(無料) | 完全無料 |
| turbo | 約333枚 | 高速 |
| kontext | 約200枚 | 編集向け |
| gptimage | 約77枚 | DALL-E系 |
| nanobanana | 約50枚 | Gemini Flash |
| nanobanana-pro | 要確認 | Gemini上位 |
※ 1 Pollen ≈ $1
🎯 目的別おすすめ
「とにかく無料で試したい」
→ Pollinations.ai + FLUX
// 1行で画像生成(APIキー不要)
fetch('https://image.pollinations.ai/prompt/A+cute+robot')
.then(res => res.blob())
.then(blob => /* 画像表示 */);
「Gemini系を試したい」
→ Pollinations.ai + nanobanana
fetch('https://image.pollinations.ai/prompt/A+cute+robot?model=nanobanana')
.then(res => res.blob())
.then(blob => /* 画像表示 */);
「プロダクトに組み込みたい」
| 要件 | おすすめ |
|---|---|
| ユーザーに課金させたくない | Pollinations.ai + 自分でPollen購入 |
| バックエンド書きたくない | puter.js(ユーザー課金) |
| 高品質・安定性重視 | OpenAI API / Replicate |
| コスト最優先 | fal.ai / Together AI |
「ローカルで動かしたい」
→ Stable Diffusion + ComfyUI または FLUX + ローカル推論
必要スペック:
- VRAM 8GB以上(FLUX schnell)
- VRAM 16GB以上(FLUX dev/pro相当の品質)
📊 レイヤー理解のメリット
| 理解前 | 理解後 |
|---|---|
| 「FLUXとPollinationsって何が違うの?」 | 「FLUXはモデル、Pollinationsはサービス」 |
| 「nanobananaって何?」 | 「PollinationsでのGeminiの呼び名」 |
| 「Replicateで何ができるの?」 | 「様々なモデルをAPI経由で使える」 |
| 「無料で使うにはどうすれば?」 | 「Pollinations経由でFLUX schnellを使う」 |
まとめ
AI画像生成の3レイヤー:
- モデル層: FLUX, Stable Diffusion, DALL-E, Gemini(頭脳)
- API層: Replicate, fal.ai, BFL API, Google AI API(インフラ)
- サービス層: Pollinations, puter.js, ChatGPT(UI)
サービス独自名の例:
- nanobanana = Gemini Flash(Pollinations呼称)
- gptimage = DALL-E系(Pollinations呼称)
ソロ開発者の最初の一歩:
- 無料で試す → Pollinations.ai(flux or nanobanana)
- 品質重視で有料 → Replicate + FLUX Pro
- ユーザー課金モデル → puter.js
レイヤー構造を理解すれば、用途に応じて最適な組み合わせを選べるようになる。