AIエージェントとは何か — 生成AIとの違い・できること・構成要素(AIエージェント勉強記 第1回)

リード

こんにちは、ぽまらのです。

AIエージェント勉強記第1回 です。

索引 「AIエージェントを自分で作る — 勉強記シリーズ」 とあわせて読んでください。

この回では AIエージェントとは何か を整理します。業界でよく言われる定義をベースに、次の4つを扱います。

  • 生成AIとの違い — 受け身か、能動的か
  • AIエージェントができること — どんなワークフロー向きか
  • 主要な構成要素と仕組み — 頭脳・まとめ役・道具
  • 導入するメリットと課題 — 期待できることとリスク

個人ブログ運用の具体例(X投稿の文案+校正2体)は 第2回以降 です。ここでは 考え方の土台 を置きます。


1. 生成AIとの違い

1-1. 「受け身」と「能動的」

Gartner などでは、生成AIとエージェントの違いを 受け身か能動的か で説明することがあります。

  • 生成AI(ジェネレーティブAI) — 質問や指示に 答える・文章や画像を作る のが中心。受け身 に近い
  • AIエージェント — 環境を 観察 し、次に何をするか 判断 して 実行 する。能動的 に近い

ChatGPT や Claude のチャットで「この文を直して」と頼むのは前者。
「毎朝、仕様書どおりに下書きを作ってファイルに保存して」と ゴールを渡して手順まで任せる のが後者、というイメージです。

1-2. 生成AIが得意なこと

NTTドコモビジネス などの説明では、生成AIは 人間のプロンプト(指示)に応じて、テキストや画像を生成して返す存在、と整理されます。

  • 質問に答える、文章を推敲する、コード片を直す
  • その場の文脈で柔軟にやり取りする
  • 人間が毎回、何をしてほしいかを言葉で伝える

一回一回の相談・作成 に強いツールです。

1-3. AIエージェントが違うところ

同じく NTTドコモビジネスなどの整理では、AIエージェントは ゴール(目的) を与えると、必要なステップを 自分で分解 し、Web検索・API連携・ファイル操作などのタスクを 自動で実行 し、結果の評価まで進める、と説明されます。

本シリーズで使う言い方に寄せると、次のような違いです。

観点生成AI(チャット)AIエージェント
姿勢受け身 — 指示に応答能動的 — 目的に向けて手順を進める
指示都度プロンプトゴール + spec / prompt を固定
作業範囲主にテキスト生成検索・ファイル操作・ツール呼び出しまで
成果物会話テキストが中心ファイルなど 残る出力
繰り返し毎回説明し直しがち同じ型を 日次・週次 で回せる
人間対話のたびに関与半自動 — 出力後に確認(本シリーズ)

チャットとエージェントは 対立ではなく使い分け です。相談はチャット、ルーティンはエージェント、と割り切ると設計しやすくなります。


2. AIエージェントができること

エージェントは、単発の返答ではなく 複雑なワークフローを自律的に実行 できる、と説明されることが多いです(NTTドコモビジネス など)。代表的な領域は次の4つです。

2-1. 業務の自動化・効率化

  • 定型メールの作成・送信
  • 経費精算やカレンダー調整などのバックオフィス作業

人間が毎回同じ手順を踏んでいた 反復作業 を任せる領域です。

2-2. リサーチと分析

  • 大量データ・社内文書・Web情報の 検索と分析
  • その結果をもとにした レポートや提案書の作成

調べてまとめる、という一連の流れを1つのゴールとして渡せます。

2-3. カスタマーサポート

  • 問い合わせに対し、データベースから回答を検索
  • 解決策の提示から必要手続きの完了まで 一連の対応

企業のFAQボットや手続き案内が典型例です。

2-4. パーソナライズされた提案

  • ユーザーの嗜好や購買履歴を分析
  • 最適な旅行プランや商品を 提案・予約まで代行

「おすすめを出す」だけでなく、ゴール達成まで進める イメージです。

2-5. 個人ブログ運用での例(本シリーズ)

大企業向けの例は規模が違いますが、仕組みは同じ です。個人のブログ・X運用では、たとえば次のように当てはまります。

領域個人運用での例
自動化・効率化毎朝の X 文案下書きを1本生成
リサーチと分析仏教テーマの調査と140字への要約
(サポートに近い)仕様書に沿った 校正 — ルール違反の検出と修正
パーソナライズ曜日ローテーション・過去30日との重複回避

本シリーズの 文案エージェント は「リサーチ+文案作成」、校正エージェント は「ルールに沿った品質チェック」に相当します。
いずれも X への自動投稿はしない 半自動です(第2回で設計します)。


3. 主要な構成要素と仕組み

AIエージェントが高度なタスクをこなせるのは、主に次の 3つの仕組みが連携 しているため、と GartnerNTTドコモビジネス などでは説明されます。

3-1. AIモデル(頭脳)

LLM(大規模言語モデル) などを活用し、

  • 状況の理解
  • 計画の立案
  • コードや文案の生成

を担います。ChatGPT / Claude / Cursor のモデルがここに入ります。

3-2. オーケストレーション(まとめ役)

実行状態の管理ツールの呼び出しタスクの順序制御 などを一手に担う層です。

  • いま何ステップ目か
  • 次にファイルを読むか、検索するか
  • 文案のあと校正を呼ぶか

といった 進行管理 がオーケストレーションです。Cursor Agent や GitHub Actions + Cursor SDK は、この層に近い役割を持ちます。

3-3. 外部ツール(道具)

タスク完了のために AI が操作する システム群 です。

  • Web検索
  • API
  • カレンダー・データベース
  • ファイルの読み書き(本シリーズでは md の保存が中心)

「頭脳だけ」ではフォルダに保存できません。道具 がエージェントの実用性を決めます。

3-4. 3要素の関係(図)

flowchart TB
  G["ゴール<br/>例: 今日のX文案1本"]
  M["AIモデル<br/>頭脳"]
  O["オーケストレーション<br/>まとめ役"]
  T["外部ツール<br/>検索・ファイル操作"]
  OUT["成果物<br/>下書き md"]
  H["人間<br/>確認・投稿"]

  G --> O
  O --> M
  O --> T
  M --> O
  T --> O
  O --> OUT
  OUT --> H

  classDef concept fill:#e8f4fc,stroke:#3d7ea6,stroke-width:2px,color:#1a1a1a
  classDef agent fill:#e8f5e9,stroke:#2e7d32,stroke-width:2px,color:#1a1a1a
  classDef human fill:#fff3e0,stroke:#e65100,stroke-width:2px,color:#1a1a1a
  class G concept
  class OUT concept
  class M agent
  class O agent
  class T agent
  class H human

3-5. 個人運用で足す「ルール層」

業界説明にはあまり出てきませんが、個人で安定させるには ルールを外に出す のが有効です。

要素役割本シリーズでの例
spec(仕様書)目的・フォーマット・禁止事項の正本x-shuuchaku-agent-spec.md
prompt(起動文)「spec に従い今日の作業を実行」automation/x-daily/prompt.md
人間の確認最終判断・投稿メール確認後に X へコピペ

ハーネス記事 で書いた「お願いではなく検証可能な手順」や、第2回以降の 校正エージェント も、このルール層を厚くする工夫です。


4. 導入するメリットと課題

4-1. メリット

IBM や NTTドコモビジネスなどでは、おおよそ次のメリットが挙げられます。

メリット内容
生産性の向上人間が時間をかけていた 反復作業(データ収集、定型処理)の自動化
24時間365日の稼働人間の勤務時間に依存せず、処理・対応が可能

個人ブログでも、

  • 毎朝の「何を書くか」から解放される
  • 下書き md が 記録として残る
  • 2体目・3体目を同じ型(spec + prompt)で増やせる

といった効果があります。

4-2. 課題・リスク

課題内容
情報漏洩・セキュリティ社内機密や個人情報にアクセスさせる場合、厳格な権限管理 が必要(NTTドコモビジネス
予測不能なエラーAIが自律的に判断・行動するため、想定外の出力 が起きうる。人間による最終確認 が必要(NTTドコモビジネス

個人運用でも、次は日常的に起きます。

課題内容
品質のばらつき同じ spec でも文字数超過などが起きる(第3回で実測)
幻覚・不適切表現教養系テーマでは特に人間の目が必要
運用コストspec の保守、失敗時の手直し
規約・リスクSNS の完全自動投稿はアカウントリスクもゼロではない

本シリーズは 半自動(作るまで AI、決めるのは人間)を前提に、リスクと生産性のバランスを取っています。

4-3. ハーネス・校正の位置づけ

「人間の最終確認」だけに頼ると、毎回の手直しが重くなります。
そこで次の2つを足します。

  • ハーネス — 出力を検証し、ダメならやり直す(ハーネス実測記事
  • 校正エージェント — 別体がチェックリストを実行(第2・3回)

ルールを書くだけでは足りない、というのが 第3回 の比較実験の動機です。


まとめ

  • 生成AI は指示に応じて生成する 受け身 に近く、エージェント はゴールに向けて手順を進める 能動的 な構成
  • できることは 業務自動化・リサーチ・サポート・提案 など幅広い — 個人では日次文案や校正に縮小できる
  • 仕組みは AIモデル・オーケストレーション・外部ツール の連携。個人運用では spec / prompt / 人間確認 を足す
  • メリットは 生産性と24時間稼働、課題は セキュリティと予測不能なエラー — 半自動と校正で現実的に運用する
  • 次回は 文案+校正の2体設計 を具体的に書く

コメント