まとめ — 個人運用でエージェントを続けるために(AIエージェント勉強記 第4回)

リード

こんにちは、ぽまらのです。

AIエージェント勉強記第4回最終回 です。

索引 「AIエージェントを自分で作る — 勉強記シリーズ」 · 第1回 · 第2回 · 第3回

第1回 で概念、第2回 で2体の設計、第3回 で校正あり/なしの比較まで扱いました。
この回は シリーズ全体の振り返り と、個人ブログで 続けるための勘所 をまとめます。

コードや spec は pomarano/x_auto_writing に置いています。勉強記を読んだあと、自分用の小さなパイプラインを始めるときの地図として使ってください。


この回の全体像

flowchart LR
  P1["第1回<br/>概念"]
  P2["第2回<br/>2体設計"]
  P3["第3回<br/>比較実測"]
  P4["第4回<br/>まとめ"]
  OPS["本番運用<br/>日次パイプライン"]

  P1 --> P2 --> P3 --> P4 --> OPS

  classDef meta fill:#eceff1,stroke:#607d8b,stroke-width:2px,color:#1a1a1a
  classDef concept fill:#e8f4fc,stroke:#3d7ea6,stroke-width:2px,color:#1a1a1a
  classDef agent fill:#e8f5e9,stroke:#2e7d32,stroke-width:2px,color:#1a1a1a
  classDef output fill:#f3e5f5,stroke:#7b1fa2,stroke-width:2px,color:#1a1a1a
  class P1 concept
  class P2 concept
  class P3 agent
  class P4 meta
  class OPS output

シリーズで扱ったこと — 4ブロックのおさらい

ブロック要点記事
AIエージェントについて第1回チャットとの違い、3要素(頭脳・まとめ役・道具)、半自動第1回
サンプル設計(複数体)第2回文案+校正の責務分離、6項目チェックリスト第2回
作成と比較第3回校正なし40% → あり93%、手直し8分→2分第3回
まとめ本記事運用の勘所と次の一歩

題材は一貫して X(日本語)投稿文案の半自動 です。
文案エージェント が下書きを作り、校正エージェント がルールに照らして直す — 投稿は 人間が確認してから X に貼る。この線を4回通して崩していません。


シリーズを通じて得られた3つの学び

2-1. チャットとエージェントは使い分ける

第1回 で整理したとおり、生成AI(チャット) は都度の相談・推敲向き、エージェント はゴールと spec を固定した ルーティン 向きです。

用途向いているツール
記事の構成相談、壁打ちチャット
毎朝1本の X 文案、同じチェックを繰り返すエージェント

「全部エージェント化」ではなく、反復する型 だけ載せるのが個人運用では現実的です。

2-2. ルールは spec に、検証は別レイヤに

文案 spec に「140字以内」と書いても、第3回 の条件Aでは 5回中5回 文字数超過しました。
ハーネス記事 と同じで、お願いだけでは守られにくい です。

本シリーズでは次の3層で対処しました。

レイヤ役割ファイル例
specルールの正本x-shuuchaku-agent-spec.md / x-proofread-agent-spec.md
prompt「spec に従い今日の作業を実行」automation/x-daily/prompt.md など
校正(検証)出力をチェックし、違反を修正校正エージェント

ルール変更は spec だけ を直し、prompt は薄く保つ — この型が第2回から一貫しています。

2-3. 2体に分けると「測れる」

文案だけのときは、失敗の原因が「書き方」「ルール理解」「モデルの癖」に混ざります。
文案校正 を分けると、第3回 のように条件A/B で比較でき、どのレイヤが効いたか を説明できます。

指標文案のみ文案 + 校正
チェックリスト合格率40%93%
人間の手直し約8分約2分
そのまま投稿可0 / 54 / 5

校正は万能ではありません。概念の重複事実・教えの正確さ は人間が残る — 半自動の前提です。


エージェント導入の実務的な勘所

3-1. 小さく始め、測れる形にする

勘所説明
1体からでもよいが、検証は別レイヤ文案だけでも動く。ルール遵守は校正・ハーネスで測る
spec を正本にするルール変更は spec のみ。prompt は薄く
半自動を前提にする完全自動より、確認可能な運用の方が個人には続く
数値で比較する条件A/B、チェックリスト合格率、手直し時間を記録する

3-2. 複数エージェントに分ける目安

次のときは 2体以上 を検討します。

  • 1つのプロンプトに 「書く」と「直す」 が混ざって品質が不安定
  • チェック項目が 6個以上 で、毎回人間が直している
  • 失敗時に どの役割が悪いか を切り分けたい

本シリーズでは「文案」と「校正」に分けたことで、第3回の比較が可能になりました。

3-3. つまずきと対処

つまずき対処
文字数・形式違反が続く校正エージェント or ハーネス
内容の誤り・不適切表現人間の最終確認(半自動の前提)
毎回手動起動が面倒GitHub Actions(X半自動記事
spec と実態のズレ週1で spec を1行だけ直す
2体目以降を増やしすぎまず1本のパイプラインを安定させる

本番運用 — 日次パイプライン

勉強記で設計・比較した 2体 を、毎日回す形が本番です。

flowchart TB
  T["朝(決まった時刻)"]
  A1["① 文案エージェント<br/>調査・下書き作成"]
  A2["② 下書き md 保存"]
  A3["③ 校正エージェント<br/>6項目チェック・修正"]
  H1["④ 人間が確認"]
  H2{⑤ 手直し?}
  H3["⑥ X に投稿"]
  H4["⑦ status: posted(任意)"]

  T --> A1 --> A2 --> A3 --> H1 --> H2
  H2 -->|必要なら| H1
  H2 -->|OK| H3 --> H4

  classDef agent fill:#e8f5e9,stroke:#2e7d32,stroke-width:2px,color:#1a1a1a
  classDef human fill:#fff3e0,stroke:#e65100,stroke-width:2px,color:#1a1a1a
  class A1 agent
  class A2 agent
  class A3 agent
  class H1 human
  class H2 human
  class H3 human
  class H4 human
段階担当内容
文案文案エージェント曜日ローテーションに沿って1本生成
校正校正エージェント140字・2文型など6項目を検査
確認人間メール or GitHub で本文を見て投稿
記録人間(任意)status: posted に更新

文案だけを GitHub Actions + Cursor SDK で毎朝自動化しても、校正と投稿は人間 のまま — 設計は第2回と同じです。Actions は「いつ起動するか」の話であり、2体の分業とは独立しています。


自分用に始める最小セット

別テーマでも、本シリーズと同型で始められます。

やること
1ゴールを1文 — 例:「毎朝 X 文案1本を md に保存する」
2spec を書く — フォーマット・禁止事項・やらないこと
3prompt を薄く — 「spec に従い今日の作業を実行」
4手動で5回 — 失敗パターンをメモする
5検証レイヤを足す — 校正エージェント or ハーネス
6条件A/B で測る — 改善が数値で見えるまで回す
7必要なら Actions — 運用が回り始めてから

リポジトリの構成は pomarano/x_auto_writing をそのままテンプレートにできます。


個人ブログでの次の一歩

優先内容
日次 — 文案 → 校正 → 人間確認 → X 投稿のリズムを維持
校正ログを見て、違反の多い項目 だけ文案 spec に追記
Actions で文案まで自動化(校正は手動 or 連鎖)
別テーマの2体目(ブログ下書きなど)— 同じ型で増やす

ブログ再開 のとき決めた「AIの勉強を記録として残す」方針は、エージェント運用そのものが ネタと教材 になっています。
無理にエージェント数を増やすより、1本のパイプラインを安定させる 方が先です。


関連記事

記事内容
索引 — AIエージェント勉強記読む順・2体の概要
第1回 — AIエージェントとは概念
第2回 — 2体の設計設計
第3回 — 校正比較実測
AIハーネス実測JSON整形での検証比較
X半自動運用GitHub Actions・メール

まとめ

  • 生成AI は相談向き、エージェント は型の固定されたルーティン向き
  • spec + prompt + 校正 の3層で、ルール遵守を現実的な水準にできる
  • 文案+校正2体 で、チェックリスト合格率 40% → 93%、手直し 約8分 → 約2分第3回
  • 個人運用では 半自動・spec 正本・測定可能な比較 が続けるコツ
  • 勉強記はここで一区切り。次は 同じ2体を毎日回す運用 が本番

第1回 の「ルーティンに AI を載せたい」という動機から、設計・実装・比較まで一通り書きました。
索引 ai/437 からいつでも読み返せます。自分用の小さなエージェントを、ぜひ1本だけ作ってみてください。


コメント