リード
こんにちは、ぽまらのです。
AIエージェント勉強記 の 第4回 — 最終回 です。
索引 「AIエージェントを自分で作る — 勉強記シリーズ」 · 第1回 · 第2回 · 第3回
第1回 で概念、第2回 で2体の設計、第3回 で校正あり/なしの比較まで扱いました。
この回は シリーズ全体の振り返り と、個人ブログで 続けるための勘所 をまとめます。
コードや spec は pomarano/x_auto_writing に置いています。勉強記を読んだあと、自分用の小さなパイプラインを始めるときの地図として使ってください。
この回の全体像
flowchart LR P1["第1回<br/>概念"] P2["第2回<br/>2体設計"] P3["第3回<br/>比較実測"] P4["第4回<br/>まとめ"] OPS["本番運用<br/>日次パイプライン"] P1 --> P2 --> P3 --> P4 --> OPS classDef meta fill:#eceff1,stroke:#607d8b,stroke-width:2px,color:#1a1a1a classDef concept fill:#e8f4fc,stroke:#3d7ea6,stroke-width:2px,color:#1a1a1a classDef agent fill:#e8f5e9,stroke:#2e7d32,stroke-width:2px,color:#1a1a1a classDef output fill:#f3e5f5,stroke:#7b1fa2,stroke-width:2px,color:#1a1a1a class P1 concept class P2 concept class P3 agent class P4 meta class OPS output

シリーズで扱ったこと — 4ブロックのおさらい
題材は一貫して X(日本語)投稿文案の半自動 です。
文案エージェント が下書きを作り、校正エージェント がルールに照らして直す — 投稿は 人間が確認してから X に貼る。この線を4回通して崩していません。
シリーズを通じて得られた3つの学び
2-1. チャットとエージェントは使い分ける
第1回 で整理したとおり、生成AI(チャット) は都度の相談・推敲向き、エージェント はゴールと spec を固定した ルーティン 向きです。
| 用途 | 向いているツール |
|---|---|
| 記事の構成相談、壁打ち | チャット |
| 毎朝1本の X 文案、同じチェックを繰り返す | エージェント |
「全部エージェント化」ではなく、反復する型 だけ載せるのが個人運用では現実的です。
2-2. ルールは spec に、検証は別レイヤに
文案 spec に「140字以内」と書いても、第3回 の条件Aでは 5回中5回 文字数超過しました。
ハーネス記事 と同じで、お願いだけでは守られにくい です。
本シリーズでは次の3層で対処しました。
| レイヤ | 役割 | ファイル例 |
|---|---|---|
| spec | ルールの正本 | x-shuuchaku-agent-spec.md / x-proofread-agent-spec.md |
| prompt | 「spec に従い今日の作業を実行」 | automation/x-daily/prompt.md など |
| 校正(検証) | 出力をチェックし、違反を修正 | 校正エージェント |
ルール変更は spec だけ を直し、prompt は薄く保つ — この型が第2回から一貫しています。
2-3. 2体に分けると「測れる」
文案だけのときは、失敗の原因が「書き方」「ルール理解」「モデルの癖」に混ざります。
文案 と 校正 を分けると、第3回 のように条件A/B で比較でき、どのレイヤが効いたか を説明できます。
| 指標 | 文案のみ | 文案 + 校正 |
|---|---|---|
| チェックリスト合格率 | 40% | 93% |
| 人間の手直し | 約8分 | 約2分 |
| そのまま投稿可 | 0 / 5 | 4 / 5 |
校正は万能ではありません。概念の重複 や 事実・教えの正確さ は人間が残る — 半自動の前提です。
エージェント導入の実務的な勘所
3-1. 小さく始め、測れる形にする
| 勘所 | 説明 |
|---|---|
| 1体からでもよいが、検証は別レイヤ | 文案だけでも動く。ルール遵守は校正・ハーネスで測る |
| spec を正本にする | ルール変更は spec のみ。prompt は薄く |
| 半自動を前提にする | 完全自動より、確認可能な運用の方が個人には続く |
| 数値で比較する | 条件A/B、チェックリスト合格率、手直し時間を記録する |
3-2. 複数エージェントに分ける目安
次のときは 2体以上 を検討します。
- 1つのプロンプトに 「書く」と「直す」 が混ざって品質が不安定
- チェック項目が 6個以上 で、毎回人間が直している
- 失敗時に どの役割が悪いか を切り分けたい
本シリーズでは「文案」と「校正」に分けたことで、第3回の比較が可能になりました。
3-3. つまずきと対処
| つまずき | 対処 |
|---|---|
| 文字数・形式違反が続く | 校正エージェント or ハーネス |
| 内容の誤り・不適切表現 | 人間の最終確認(半自動の前提) |
| 毎回手動起動が面倒 | GitHub Actions(X半自動記事) |
| spec と実態のズレ | 週1で spec を1行だけ直す |
| 2体目以降を増やしすぎ | まず1本のパイプラインを安定させる |
本番運用 — 日次パイプライン
勉強記で設計・比較した 2体 を、毎日回す形が本番です。
flowchart TB
T["朝(決まった時刻)"]
A1["① 文案エージェント<br/>調査・下書き作成"]
A2["② 下書き md 保存"]
A3["③ 校正エージェント<br/>6項目チェック・修正"]
H1["④ 人間が確認"]
H2{⑤ 手直し?}
H3["⑥ X に投稿"]
H4["⑦ status: posted(任意)"]
T --> A1 --> A2 --> A3 --> H1 --> H2
H2 -->|必要なら| H1
H2 -->|OK| H3 --> H4
classDef agent fill:#e8f5e9,stroke:#2e7d32,stroke-width:2px,color:#1a1a1a
classDef human fill:#fff3e0,stroke:#e65100,stroke-width:2px,color:#1a1a1a
class A1 agent
class A2 agent
class A3 agent
class H1 human
class H2 human
class H3 human
class H4 human
| 段階 | 担当 | 内容 |
|---|---|---|
| 文案 | 文案エージェント | 曜日ローテーションに沿って1本生成 |
| 校正 | 校正エージェント | 140字・2文型など6項目を検査 |
| 確認 | 人間 | メール or GitHub で本文を見て投稿 |
| 記録 | 人間(任意) | status: posted に更新 |
文案だけを GitHub Actions + Cursor SDK で毎朝自動化しても、校正と投稿は人間 のまま — 設計は第2回と同じです。Actions は「いつ起動するか」の話であり、2体の分業とは独立しています。
自分用に始める最小セット
別テーマでも、本シリーズと同型で始められます。
| 順 | やること |
|---|---|
| 1 | ゴールを1文 — 例:「毎朝 X 文案1本を md に保存する」 |
| 2 | spec を書く — フォーマット・禁止事項・やらないこと |
| 3 | prompt を薄く — 「spec に従い今日の作業を実行」 |
| 4 | 手動で5回 — 失敗パターンをメモする |
| 5 | 検証レイヤを足す — 校正エージェント or ハーネス |
| 6 | 条件A/B で測る — 改善が数値で見えるまで回す |
| 7 | 必要なら Actions — 運用が回り始めてから |
リポジトリの構成は pomarano/x_auto_writing をそのままテンプレートにできます。
個人ブログでの次の一歩
| 優先 | 内容 |
|---|---|
| 高 | 日次 — 文案 → 校正 → 人間確認 → X 投稿のリズムを維持 |
| 高 | 校正ログを見て、違反の多い項目 だけ文案 spec に追記 |
| 中 | Actions で文案まで自動化(校正は手動 or 連鎖) |
| 低 | 別テーマの2体目(ブログ下書きなど)— 同じ型で増やす |
ブログ再開 のとき決めた「AIの勉強を記録として残す」方針は、エージェント運用そのものが ネタと教材 になっています。
無理にエージェント数を増やすより、1本のパイプラインを安定させる 方が先です。
関連記事
| 記事 | 内容 |
|---|---|
| 索引 — AIエージェント勉強記 | 読む順・2体の概要 |
| 第1回 — AIエージェントとは | 概念 |
| 第2回 — 2体の設計 | 設計 |
| 第3回 — 校正比較 | 実測 |
| AIハーネス実測 | JSON整形での検証比較 |
| X半自動運用 | GitHub Actions・メール |
まとめ
- 生成AI は相談向き、エージェント は型の固定されたルーティン向き
- spec + prompt + 校正 の3層で、ルール遵守を現実的な水準にできる
- 文案+校正2体 で、チェックリスト合格率 40% → 93%、手直し 約8分 → 約2分(第3回)
- 個人運用では 半自動・spec 正本・測定可能な比較 が続けるコツ
- 勉強記はここで一区切り。次は 同じ2体を毎日回す運用 が本番
第1回 の「ルーティンに AI を載せたい」という動機から、設計・実装・比較まで一通り書きました。
索引 ai/437 からいつでも読み返せます。自分用の小さなエージェントを、ぜひ1本だけ作ってみてください。

コメント