AIの大分類
AIと呼ばれるサービスや技術は、その役割から大きく3つに分類できます。
分類 | 役割 | 例え | 具体例 |
AIモデル | 特定タスクを実行する中核的な「頭脳」 | エンジン | GPT-4, Stable Diffusion, Llama 3 |
AIアプリケーション | モデルを一般ユーザーが使えるようにした「道具」 | 車 | ChatGPT, SeaArt, Midjourney, DeepL |
AIエージェント | 目標達成のため自律的に行動する「存在」 | 自動運転車 | Auto-GPT, AgentGPT |
- AIモデル (The Engine / Brain):
特定のタスク(文章生成、画像認識など)を遂行するために、データからパターンを学習した「頭脳」や「エンジン」そのもの。通常はAPIなどを通じて利用されます。
- AIアプリケーション (The Application / Tool):
AIモデルを一般ユーザーが簡単に使えるようにした「乗り物」や「道具」。分かりやすいUIを提供し、ユーザーの指示をモデルに伝えて結果を返します。SeaArtやChatGPTはここに分類されます。
- AIエージェント (The Agent / Autonomous Actor):
与えられた目標に対し、自律的に計画を立て、複数のタスク(情報収集、ツール利用など)を連続して実行する存在。AIモデルを頭脳として利用します。
AIモデルの中分類
多種多様なAIモデルは、その「特性」や「能力」によって、以下のような様々な軸で分類できます。
2.1. 基本的な分類軸
※注意:
AIモデルの進化は非常に速く、多くのモデルがマルチモーダル化(複数の種類のデータを扱えるように)しています。そのため、ここに記載されている具体例は将来的に変わる可能性があります。(2025年7月時点)
分類軸 | カテゴリ | 説明 | 具体例 |
扱うデータの種類 (モーダル) | シングルモーダル | テキストのみ、画像のみなど、単一の種類のデータだけを扱う。 | 初期のGPTモデル (テキスト) |
| マルチモーダル | テキスト、画像、音声など、複数の種類のデータを同時に扱える。 | Gemini, GPT-4V, Stable Diffusion (テキスト→画像) |
主なタスク | 生成 | 新しいコンテンツ(文章、画像、コードなど)を創造する。 | ChatGPT, Midjourney, Stable Diffusion |
| 識別・予測 | データが何であるかを識別したり、将来の数値を予測したりする。 | 画像認識システム、迷惑メールフィルタ |
学習方法 | 教師あり学習 | 正解ラベル付きのデータで学習する。 | 画像分類、翻訳 |
| 教師なし学習 | 正解ラベルのないデータから、パターンや構造を自ら見つけ出す。 | クラスタリング、異常検知 |
| 強化学習 | 試行錯誤を通じて、報酬が最大化されるような行動を学習する。 | ゲームAI (AlphaGo)、ロボット制御 |
2.2. 実践的な分類軸
分類軸 | カテゴリ | 説明 | 具体例 |
専門分野 (何ができるか?) | 言語 | テキスト関連のタスクに特化。 | Llama 3, Claude 3 Sonnet |
| 画像 | 画像の生成や解析に特化。 | Stable Diffusion, Midjourney |
| 音声 | 音声の認識や合成に特化。 | Whisper, ElevenLabs |
| コード | プログラミング支援に特化。 | Code Llama, GitHub Copilot |
| 3D | テキストや画像から3Dモデルを生成。 | Shap-E, TripoSR |
| 汎用 / 基盤 |
複数の分野を横断的に扱う能力を持つ、応用の基盤となるモデル。
| Gemini, GPT-4 |
規模と公開性 (どう使えるか?) | フロンティアモデル | 世界最高峰の性能を持つ、API経由で利用される超大規模モデル。 | GPT-4, Gemini 1.5 Pro, Claude 3 Opus |
| オープンソースモデル | モデル自体が公開され、誰でも自由に利用・改造できる。 | Llama 3, Mixtral, Stable Diffusion |
| 特定用途特化モデル |
特定の目的に絞って作られた、比較的小さく効率的なモデル。
| 翻訳専用モデルなど |
技術アーキテクチャ (どう動いているか?) | Transformer | 現在の多くの言語・マルチモーダルモデルの基礎となっているアーキテクチャ。 | GPTシリーズ, Gemini |
| 拡散モデル | ノイズから画像を復元する手法で、高品質な画像生成の主流。 | Stable Diffusion, Midjourney |
| GAN | 生成AIと識別AIを競わせて学習する仕組み。一世代前の画像生成で主流。 | StyleGAN |
AIサービスリスト
具体的なAIサービスを、以下の統一されたフォーマットで記録・紹介していきます。
特定の国のサービス利用に関する注意喚起
本サイトで紹介するAIサービスの中には、特定の国(例:中国など)で開発されたものが含まれます。これらの国のサービスを利用する際には、データセキュリティやプライバシーに関する法制度が日本や欧米と異なる場合がある点にご留意ください。
個人情報や機密情報の入力は慎重に行い、利用規約をよく確認するなど、ご自身の判断と責任においてご利用いただくことを推奨します。該当するサービスには、備考欄にこの注意喚起へのリンクを設置しています。
特に注意の必要なサイト(サービス)については、こちらのページで理由を確認してください。 サービス名
基本情報 開発元・国: 開発元 (国)
URL: 公式サイトへ
分類 大分類: AIアプリケーション
モデルの専門分野: 分野1, 分野2
料金体系 概要: フリーミアム
無料プラン: 無料プランの詳細
有料プラン: 有料プランの詳細
課金単位: 課金単位
利用情報 登録方法: 登録方法
主な利用者層: 利用者層
機能・特徴 インプット→アウトプット: 入力 → 出力
得意なこと: サービスが得意なこと