リード
こんにちは、ぽまらのです。
AIエージェント勉強記 の 第1回 です。
索引 「AIエージェントを自分で作る — 勉強記シリーズ」 とあわせて読んでください。
この回では AIエージェントとは何か を整理します。業界でよく言われる定義をベースに、次の4つを扱います。
- 生成AIとの違い — 受け身か、能動的か
- AIエージェントができること — どんなワークフロー向きか
- 主要な構成要素と仕組み — 頭脳・まとめ役・道具
- 導入するメリットと課題 — 期待できることとリスク
個人ブログ運用の具体例(X投稿の文案+校正2体)は 第2回以降 です。ここでは 考え方の土台 を置きます。
1. 生成AIとの違い
1-1. 「受け身」と「能動的」
Gartner などでは、生成AIとエージェントの違いを 受け身か能動的か で説明することがあります。
- 生成AI(ジェネレーティブAI) — 質問や指示に 答える・文章や画像を作る のが中心。受け身 に近い
- AIエージェント — 環境を 観察 し、次に何をするか 判断 して 実行 する。能動的 に近い
ChatGPT や Claude のチャットで「この文を直して」と頼むのは前者。
「毎朝、仕様書どおりに下書きを作ってファイルに保存して」と ゴールを渡して手順まで任せる のが後者、というイメージです。
1-2. 生成AIが得意なこと
NTTドコモビジネス などの説明では、生成AIは 人間のプロンプト(指示)に応じて、テキストや画像を生成して返す存在、と整理されます。
- 質問に答える、文章を推敲する、コード片を直す
- その場の文脈で柔軟にやり取りする
- 人間が毎回、何をしてほしいかを言葉で伝える
一回一回の相談・作成 に強いツールです。
1-3. AIエージェントが違うところ
同じく NTTドコモビジネスなどの整理では、AIエージェントは ゴール(目的) を与えると、必要なステップを 自分で分解 し、Web検索・API連携・ファイル操作などのタスクを 自動で実行 し、結果の評価まで進める、と説明されます。
本シリーズで使う言い方に寄せると、次のような違いです。
| 観点 | 生成AI(チャット) | AIエージェント |
|---|---|---|
| 姿勢 | 受け身 — 指示に応答 | 能動的 — 目的に向けて手順を進める |
| 指示 | 都度プロンプト | ゴール + spec / prompt を固定 |
| 作業範囲 | 主にテキスト生成 | 検索・ファイル操作・ツール呼び出しまで |
| 成果物 | 会話テキストが中心 | ファイルなど 残る出力 |
| 繰り返し | 毎回説明し直しがち | 同じ型を 日次・週次 で回せる |
| 人間 | 対話のたびに関与 | 半自動 — 出力後に確認(本シリーズ) |
チャットとエージェントは 対立ではなく使い分け です。相談はチャット、ルーティンはエージェント、と割り切ると設計しやすくなります。
2. AIエージェントができること
エージェントは、単発の返答ではなく 複雑なワークフローを自律的に実行 できる、と説明されることが多いです(NTTドコモビジネス など)。代表的な領域は次の4つです。
2-1. 業務の自動化・効率化
- 定型メールの作成・送信
- 経費精算やカレンダー調整などのバックオフィス作業
人間が毎回同じ手順を踏んでいた 反復作業 を任せる領域です。
2-2. リサーチと分析
- 大量データ・社内文書・Web情報の 検索と分析
- その結果をもとにした レポートや提案書の作成
調べてまとめる、という一連の流れを1つのゴールとして渡せます。
2-3. カスタマーサポート
- 問い合わせに対し、データベースから回答を検索
- 解決策の提示から必要手続きの完了まで 一連の対応
企業のFAQボットや手続き案内が典型例です。
2-4. パーソナライズされた提案
- ユーザーの嗜好や購買履歴を分析
- 最適な旅行プランや商品を 提案・予約まで代行
「おすすめを出す」だけでなく、ゴール達成まで進める イメージです。
2-5. 個人ブログ運用での例(本シリーズ)
大企業向けの例は規模が違いますが、仕組みは同じ です。個人のブログ・X運用では、たとえば次のように当てはまります。
| 領域 | 個人運用での例 |
|---|---|
| 自動化・効率化 | 毎朝の X 文案下書きを1本生成 |
| リサーチと分析 | 仏教テーマの調査と140字への要約 |
| (サポートに近い) | 仕様書に沿った 校正 — ルール違反の検出と修正 |
| パーソナライズ | 曜日ローテーション・過去30日との重複回避 |
本シリーズの 文案エージェント は「リサーチ+文案作成」、校正エージェント は「ルールに沿った品質チェック」に相当します。
いずれも X への自動投稿はしない 半自動です(第2回で設計します)。
3. 主要な構成要素と仕組み
AIエージェントが高度なタスクをこなせるのは、主に次の 3つの仕組みが連携 しているため、と Gartner や NTTドコモビジネス などでは説明されます。
3-1. AIモデル(頭脳)
LLM(大規模言語モデル) などを活用し、
- 状況の理解
- 計画の立案
- コードや文案の生成
を担います。ChatGPT / Claude / Cursor のモデルがここに入ります。
3-2. オーケストレーション(まとめ役)
実行状態の管理、ツールの呼び出し、タスクの順序制御 などを一手に担う層です。
- いま何ステップ目か
- 次にファイルを読むか、検索するか
- 文案のあと校正を呼ぶか
といった 進行管理 がオーケストレーションです。Cursor Agent や GitHub Actions + Cursor SDK は、この層に近い役割を持ちます。
3-3. 外部ツール(道具)
タスク完了のために AI が操作する システム群 です。
- Web検索
- API
- カレンダー・データベース
- ファイルの読み書き(本シリーズでは md の保存が中心)
「頭脳だけ」ではフォルダに保存できません。道具 がエージェントの実用性を決めます。
3-4. 3要素の関係(図)
flowchart TB G["ゴール<br/>例: 今日のX文案1本"] M["AIモデル<br/>頭脳"] O["オーケストレーション<br/>まとめ役"] T["外部ツール<br/>検索・ファイル操作"] OUT["成果物<br/>下書き md"] H["人間<br/>確認・投稿"] G --> O O --> M O --> T M --> O T --> O O --> OUT OUT --> H classDef concept fill:#e8f4fc,stroke:#3d7ea6,stroke-width:2px,color:#1a1a1a classDef agent fill:#e8f5e9,stroke:#2e7d32,stroke-width:2px,color:#1a1a1a classDef human fill:#fff3e0,stroke:#e65100,stroke-width:2px,color:#1a1a1a class G concept class OUT concept class M agent class O agent class T agent class H human

3-5. 個人運用で足す「ルール層」
業界説明にはあまり出てきませんが、個人で安定させるには ルールを外に出す のが有効です。
| 要素 | 役割 | 本シリーズでの例 |
|---|---|---|
| spec(仕様書) | 目的・フォーマット・禁止事項の正本 | x-shuuchaku-agent-spec.md |
| prompt(起動文) | 「spec に従い今日の作業を実行」 | automation/x-daily/prompt.md |
| 人間の確認 | 最終判断・投稿 | メール確認後に X へコピペ |
ハーネス記事 で書いた「お願いではなく検証可能な手順」や、第2回以降の 校正エージェント も、このルール層を厚くする工夫です。
4. 導入するメリットと課題
4-1. メリット
IBM や NTTドコモビジネスなどでは、おおよそ次のメリットが挙げられます。
| メリット | 内容 |
|---|---|
| 生産性の向上 | 人間が時間をかけていた 反復作業(データ収集、定型処理)の自動化 |
| 24時間365日の稼働 | 人間の勤務時間に依存せず、処理・対応が可能 |
個人ブログでも、
- 毎朝の「何を書くか」から解放される
- 下書き md が 記録として残る
- 2体目・3体目を同じ型(spec + prompt)で増やせる
といった効果があります。
4-2. 課題・リスク
| 課題 | 内容 |
|---|---|
| 情報漏洩・セキュリティ | 社内機密や個人情報にアクセスさせる場合、厳格な権限管理 が必要(NTTドコモビジネス) |
| 予測不能なエラー | AIが自律的に判断・行動するため、想定外の出力 が起きうる。人間による最終確認 が必要(NTTドコモビジネス) |
個人運用でも、次は日常的に起きます。
| 課題 | 内容 |
|---|---|
| 品質のばらつき | 同じ spec でも文字数超過などが起きる(第3回で実測) |
| 幻覚・不適切表現 | 教養系テーマでは特に人間の目が必要 |
| 運用コスト | spec の保守、失敗時の手直し |
| 規約・リスク | SNS の完全自動投稿はアカウントリスクもゼロではない |
本シリーズは 半自動(作るまで AI、決めるのは人間)を前提に、リスクと生産性のバランスを取っています。
4-3. ハーネス・校正の位置づけ
「人間の最終確認」だけに頼ると、毎回の手直しが重くなります。
そこで次の2つを足します。
- ハーネス — 出力を検証し、ダメならやり直す(ハーネス実測記事)
- 校正エージェント — 別体がチェックリストを実行(第2・3回)
ルールを書くだけでは足りない、というのが 第3回 の比較実験の動機です。
まとめ
- 生成AI は指示に応じて生成する 受け身 に近く、エージェント はゴールに向けて手順を進める 能動的 な構成
- できることは 業務自動化・リサーチ・サポート・提案 など幅広い — 個人では日次文案や校正に縮小できる
- 仕組みは AIモデル・オーケストレーション・外部ツール の連携。個人運用では spec / prompt / 人間確認 を足す
- メリットは 生産性と24時間稼働、課題は セキュリティと予測不能なエラー — 半自動と校正で現実的に運用する
- 次回は 文案+校正の2体設計 を具体的に書く

コメント