2.1. 基本的な分類軸
※注意: AIモデルの進化は非常に速く、多くのモデルがマルチモーダル化(複数の種類のデータを扱えるように)しています。そのため、ここに記載されている具体例は将来的に変わる可能性があります。(2025年7月時点)
分類軸 | カテゴリ | 説明 | 具体例 |
---|---|---|---|
扱うデータの種類 (モーダル) |
シングルモーダル | テキストのみ、画像のみなど、単一の種類のデータだけを扱う。 | 初期のGPTモデル (テキスト) |
マルチモーダル | テキスト、画像、音声など、複数の種類のデータを同時に扱える。 | Gemini, GPT-4V, Stable Diffusion (テキスト→画像) | |
主なタスク | 生成 | 新しいコンテンツ(文章、画像、コードなど)を創造する。 | ChatGPT, Midjourney, Stable Diffusion |
識別・予測 | データが何であるかを識別したり、将来の数値を予測したりする。 | 画像認識システム、迷惑メールフィルタ | |
学習方法 | 教師あり学習 | 正解ラベル付きのデータで学習する。 | 画像分類、翻訳 |
教師なし学習 | 正解ラベルのないデータから、パターンや構造を自ら見つけ出す。 | クラスタリング、異常検知 | |
強化学習 | 試行錯誤を通じて、報酬が最大化されるような行動を学習する。 | ゲームAI (AlphaGo)、ロボット制御 |