AIエージェントとは何か — 生成AIとの違い・できること・構成要素（AIエージェント勉強記第1回）

リード

こんにちは、ぽまらのです。

AIエージェント勉強記 の 第1回 です。

索引 「AIエージェントを自分で作る — 勉強記シリーズ」 とあわせて読んでください。

この回では AIエージェントとは何か を整理します。業界でよく言われる定義をベースに、次の4つを扱います。

生成AIとの違い — 受け身か、能動的か
AIエージェントができること — どんなワークフロー向きか
主要な構成要素と仕組み — 頭脳・まとめ役・道具
導入するメリットと課題 — 期待できることとリスク

個人ブログ運用の具体例（X投稿の文案＋校正2体）は 第2回以降 です。ここでは 考え方の土台 を置きます。

1. 生成AIとの違い

1-1. 「受け身」と「能動的」

Gartner などでは、生成AIとエージェントの違いを 受け身か能動的か で説明することがあります。

生成AI（ジェネレーティブAI） — 質問や指示に 答える・文章や画像を作る のが中心。受け身 に近い
AIエージェント — 環境を観察し、次に何をするか判断して実行する。能動的 に近い

ChatGPT や Claude のチャットで「この文を直して」と頼むのは前者。
「毎朝、仕様書どおりに下書きを作ってファイルに保存して」と ゴールを渡して手順まで任せる のが後者、というイメージです。

1-2. 生成AIが得意なこと

NTTドコモビジネスなどの説明では、生成AIは 人間のプロンプト（指示）に応じて、テキストや画像を生成して返す存在、と整理されます。

質問に答える、文章を推敲する、コード片を直す
その場の文脈で柔軟にやり取りする
人間が毎回、何をしてほしいかを言葉で伝える

一回一回の相談・作成 に強いツールです。

1-3. AIエージェントが違うところ

同じく NTTドコモビジネスなどの整理では、AIエージェントは ゴール（目的） を与えると、必要なステップを 自分で分解 し、Web検索・API連携・ファイル操作などのタスクを 自動で実行 し、結果の評価まで進める、と説明されます。

本シリーズで使う言い方に寄せると、次のような違いです。

観点	生成AI（チャット）	AIエージェント
姿勢	受け身 — 指示に応答	能動的 — 目的に向けて手順を進める
指示	都度プロンプト	ゴール + spec / prompt を固定
作業範囲	主にテキスト生成	検索・ファイル操作・ツール呼び出しまで
成果物	会話テキストが中心	ファイルなど残る出力
繰り返し	毎回説明し直しがち	同じ型を日次・週次で回せる
人間	対話のたびに関与	半自動 — 出力後に確認（本シリーズ）

チャットとエージェントは 対立ではなく使い分け です。相談はチャット、ルーティンはエージェント、と割り切ると設計しやすくなります。

2. AIエージェントができること

エージェントは、単発の返答ではなく 複雑なワークフローを自律的に実行 できる、と説明されることが多いです（NTTドコモビジネスなど）。代表的な領域は次の4つです。

2-1. 業務の自動化・効率化

定型メールの作成・送信
経費精算やカレンダー調整などのバックオフィス作業

人間が毎回同じ手順を踏んでいた 反復作業 を任せる領域です。

2-2. リサーチと分析

大量データ・社内文書・Web情報の 検索と分析
その結果をもとにした レポートや提案書の作成

調べてまとめる、という一連の流れを1つのゴールとして渡せます。

2-3. カスタマーサポート

問い合わせに対し、データベースから回答を検索
解決策の提示から必要手続きの完了まで 一連の対応

企業のFAQボットや手続き案内が典型例です。

2-4. パーソナライズされた提案

ユーザーの嗜好や購買履歴を分析
最適な旅行プランや商品を 提案・予約まで代行

「おすすめを出す」だけでなく、ゴール達成まで進める イメージです。

2-5. 個人ブログ運用での例（本シリーズ）

大企業向けの例は規模が違いますが、仕組みは同じ です。個人のブログ・X運用では、たとえば次のように当てはまります。

領域	個人運用での例
自動化・効率化	毎朝の X 文案下書きを1本生成
リサーチと分析	仏教テーマの調査と140字への要約
（サポートに近い）	仕様書に沿った校正 — ルール違反の検出と修正
パーソナライズ	曜日ローテーション・過去30日との重複回避

本シリーズの 文案エージェント は「リサーチ＋文案作成」、校正エージェント は「ルールに沿った品質チェック」に相当します。
いずれも X への自動投稿はしない 半自動です（第2回で設計します）。

3. 主要な構成要素と仕組み

AIエージェントが高度なタスクをこなせるのは、主に次の 3つの仕組みが連携 しているため、と Gartner や NTTドコモビジネスなどでは説明されます。

3-1. AIモデル（頭脳）

LLM（大規模言語モデル） などを活用し、

状況の理解
計画の立案
コードや文案の生成

を担います。ChatGPT / Claude / Cursor のモデルがここに入ります。

3-2. オーケストレーション（まとめ役）

実行状態の管理、ツールの呼び出し、タスクの順序制御 などを一手に担う層です。

いま何ステップ目か
次にファイルを読むか、検索するか
文案のあと校正を呼ぶか

といった 進行管理 がオーケストレーションです。Cursor Agent や GitHub Actions + Cursor SDK は、この層に近い役割を持ちます。

3-3. 外部ツール（道具）

タスク完了のために AI が操作する システム群 です。

Web検索
API
カレンダー・データベース
ファイルの読み書き（本シリーズでは md の保存が中心）

「頭脳だけ」ではフォルダに保存できません。道具がエージェントの実用性を決めます。

3-4. 3要素の関係（図）

flowchart TB
  G["ゴール<br/>例: 今日のX文案1本"]
  M["AIモデル<br/>頭脳"]
  O["オーケストレーション<br/>まとめ役"]
  T["外部ツール<br/>検索・ファイル操作"]
  OUT["成果物<br/>下書き md"]
  H["人間<br/>確認・投稿"]

  G --> O
  O --> M
  O --> T
  M --> O
  T --> O
  O --> OUT
  OUT --> H

  classDef concept fill:#e8f4fc,stroke:#3d7ea6,stroke-width:2px,color:#1a1a1a
  classDef agent fill:#e8f5e9,stroke:#2e7d32,stroke-width:2px,color:#1a1a1a
  classDef human fill:#fff3e0,stroke:#e65100,stroke-width:2px,color:#1a1a1a
  class G concept
  class OUT concept
  class M agent
  class O agent
  class T agent
  class H human

3-5. 個人運用で足す「ルール層」

業界説明にはあまり出てきませんが、個人で安定させるには ルールを外に出す のが有効です。

要素	役割	本シリーズでの例
spec（仕様書）	目的・フォーマット・禁止事項の正本	`x-shuuchaku-agent-spec.md`
prompt（起動文）	「spec に従い今日の作業を実行」	`automation/x-daily/prompt.md`
人間の確認	最終判断・投稿	メール確認後に X へコピペ

ハーネス記事で書いた「お願いではなく検証可能な手順」や、第2回以降の 校正エージェント も、このルール層を厚くする工夫です。

4. 導入するメリットと課題

4-1. メリット

IBM や NTTドコモビジネスなどでは、おおよそ次のメリットが挙げられます。

メリット	内容
生産性の向上	人間が時間をかけていた反復作業（データ収集、定型処理）の自動化
24時間365日の稼働	人間の勤務時間に依存せず、処理・対応が可能

個人ブログでも、

毎朝の「何を書くか」から解放される
下書き md が 記録として残る
2体目・3体目を同じ型（spec + prompt）で増やせる

といった効果があります。

4-2. 課題・リスク

課題	内容
情報漏洩・セキュリティ	社内機密や個人情報にアクセスさせる場合、厳格な権限管理が必要（NTTドコモビジネス）
予測不能なエラー	AIが自律的に判断・行動するため、想定外の出力が起きうる。人間による最終確認が必要（NTTドコモビジネス）

個人運用でも、次は日常的に起きます。

課題	内容
品質のばらつき	同じ spec でも文字数超過などが起きる（第3回で実測）
幻覚・不適切表現	教養系テーマでは特に人間の目が必要
運用コスト	spec の保守、失敗時の手直し
規約・リスク	SNS の完全自動投稿はアカウントリスクもゼロではない

本シリーズは 半自動（作るまで AI、決めるのは人間）を前提に、リスクと生産性のバランスを取っています。

4-3. ハーネス・校正の位置づけ

「人間の最終確認」だけに頼ると、毎回の手直しが重くなります。
そこで次の2つを足します。

ハーネス — 出力を検証し、ダメならやり直す（ハーネス実測記事）
校正エージェント — 別体がチェックリストを実行（第2・3回）

ルールを書くだけでは足りない、というのが第3回の比較実験の動機です。

まとめ

生成AI は指示に応じて生成する 受け身 に近く、エージェント はゴールに向けて手順を進める 能動的 な構成
できることは 業務自動化・リサーチ・サポート・提案 など幅広い — 個人では日次文案や校正に縮小できる
仕組みは AIモデル・オーケストレーション・外部ツール の連携。個人運用では spec / prompt / 人間確認 を足す
メリットは 生産性と24時間稼働、課題は セキュリティと予測不能なエラー — 半自動と校正で現実的に運用する
次回は 文案＋校正の2体設計 を具体的に書く