たった3行の Agent Skill「grill-me」を試した — 実装前のハーネスとして

リード

こんにちは、ぽまらのです。

以前、JSON整形タスクでハーネスあり/なしを比較しました。あの記事のハーネスは 出力を検証する タイプでした。
今回見つけた grill-me は、Matt Pocock 氏が公開した Agent Skillで、実装前に質問を浴びせて認識を揃える タイプのハーネスです。

Zenn の紹介記事(Ryo Nakae さん) を読んで「3行でここまで変わるのか」と思い、Cursor で実際に試してみました。
この記事では、スキルの中身、前のハーネス記事との違い、自分の検証結果、向き不向きをまとめます。


grill-me とは

grill-me(グリルミー)は、エージェントに「計画や設計について、共通理解に達するまで執拗にインタビューせよ」と指示する Skill です。
Claude Code では /grill-me、Cursor でも Skill として読み込めます。

特徴は次のとおりです。

  • 質問は一度に1つ
  • 設計の決定木を枝分かれの先までたどる
  • 各質問に推奨回答も添える
  • コードベースで答えられる質問は、人に聞かず探索する

スキル本体は frontmatter(Markdown ファイルの先頭にあるメタデータ用のブロック) を除き 実質3行 です。長いプロンプトテンプレートではなく、「こう動け」と方向だけ渡すタイプです。


前のハーネス記事との関係 — 2種類のハーネス

JSON ハーネス記事 では、スキーマ検証とリトライで 出力の形 を固定しました。
X 下書き半自動化 では、140字チェックや重複回避で 生成後の品質 を縛りました。

grill-me はその 前段 に効きます。

種類タイミング
出力ハーネス生成後JSON schema、文字数、リトライ
合意ハーネス(grill-me)実装前要件・境界・優先順位のすり合わせ

「お願いします」だけだと、エージェントは早くプランやコードを出したがります。grill-me は 出す前に止めて聞く ための短い縄です。


スキル全文(原文)

出典: mattpocock/skills — grill-me(Matt Pocock 氏)

---
name: grill-me
description: Interview the user relentlessly about a plan or design until reaching shared understanding, resolving each branch of the decision tree. Use when user wants to stress-test a plan, get grilled on their design, or mentions "grill me".
---

Interview me relentlessly about every aspect of this plan until we reach a shared understanding. Walk down each branch of the design tree, resolving dependencies between decisions one-by-one. For each question, provide your recommended answer.

Ask the questions one at a time.

If a question can be answered by exploring the codebase, explore the codebase instead.

日本語の意味(参考訳):

この計画のあらゆる側面について、共通理解に達するまで執拗に質問してください。設計の決定木を枝分かれの先までたどり、決定間の依存を順に解決してください。各質問には推奨回答も添えてください。
質問は一度に1つ。
コードベースを調べれば答えられる質問は、人に聞かず探索してください。


試した環境と導入手順

環境

  • Cursor(Agent モード)
  • 比較対象: 通常のチャット、Plan モード相当の「いきなりプラン出力」

導入(Cursor)

skills.sh の手順に沿い、次のいずれかです。

npx skills add https://github.com/mattpocock/skills --skill grill-me

または、Skill ファイルを ~/.cursor/skills/(個人)や .cursor/skills/(プロジェクト)に grill-me/SKILL.md として置く。

呼び出し方

チャットで、ざっくりしたやりたいこと + grill-me を使って と書く。
例:

grill-me で壁打ちしたい。

X下書きエージェントに「週1でブログURLを1本入れる」機能を足す案について、
実装前に認識を揃えたい。

検証内容

検証は2段階にしました。

  1. メタ検証 — この記事自体の構成を grill-me で決める(執筆前)
  2. 実装前検証 — 既存プロジェクトへの機能追加案を壁打ちする(執筆時追記)

1. メタ検証(記事構成の壁打ち)

記事を書く前に、grill-me 相当の進め方で自分に質問し、方針を固めました。
実際のセッションでは 12問 ほど続き、次のように整理されました。

#質問の例決まったこと
1読者は誰か前のハーネス記事・X半自動化記事を読んだ人
2記事のゴール布教より 自分の検証ログ
3前作との関係出力ハーネス vs 合意ハーネス の対比を書く
4検証タスク実在の機能案(X下書きへの週1 URL)を題材にする
5ツールCursor。Claude Code だけの話にしない
6プランモード比較Zenn 記事の論点を自分の言葉で再検証
7欠点「疲れる」「時間がかかる」を正直に書く
8スキル全文原文を載せ、出典を明記
92種類のハーネスの表で足りる
10内部リンクai/272, ai/318 へ
11英語版公開後に別ドラフト
12再現性導入手順とプロンプト例を載せる

所感: 12問の時点で、見出し構成と「何を検証したことにするか」がほぼ確定しました。Plan モードで一括プランを出すより、1問ずつ答える分、迷いが減った 印象です。

2. 実装前検証(X下書きエージェント拡張案)

題材: X下書き半自動化 のエージェントに、「週1回だけブログ記事 URL を投稿に含める」ルールを足す案。

項目結果(執筆時追記)
質問数(例: 18問)
コードベース探索(例: x-shuuchaku-agent-spec.md を自動参照)
決まった仕様(例: 日曜のみ / URL は140字に収まる短縮 / 手動確認必須)
決まらなかったこと(例: 英語記事 URL の扱い)
セッション時間(例: 約25分)

執筆時メモ(サンプル — 実際のログに差し替え):

  • Q: 週1の「週」は曜日固定かローテーションか → 日曜固定(内省テックの振り返り寄り)
  • Q: URL は仕様書の「URLは入れない」と矛盾しないか → 例外ルールとして spec に明記 が必要
  • Q: 自動で入れるか下書きに「候補」だけか → 候補提示まで。投稿は人間(半自動方針維持)

プランモード・JSONハーネスとの比較

方式強み弱み
Plan モード一度に全体像が見える一部修正でプラン全体が書き直されがち
JSON ハーネス出力の合否が機械的に判定できる要件のズレ自体は防げない
grill-me実装前の認識ずれを減らせる時間と集中力を使う。疲れる

Ryo Nakae さんの Zenn 記事 でも書かれているように、grill-me 後は 会話ログ自体が実装計画 になり、「OK、これで実装して」と渡しやすい点が自分でも再現できました。


微妙だった点

  • 疲れる — 10問を超えると、自分の頭も動き続ける。Zenn 記事の「脳がジーン」は共感できる
  • 短いタスクには過剰 — typo 修正レベルでは grill-me 不要
  • 質問の深さはモデル依存 — Opus 級の方が枝分かれが深い、という報告は納得(自分の環境では執筆時に追記)
  • Skill だけでは自動発火しない — 「grill-me で」と明示する必要がある

まとめ

  • grill-me は、たった数行で 実装前の合意ハーネス になる
  • JSON ハーネス出力後 なら、grill-me は 出力前
  • 検証では、記事構成の決定と機能案のすり合わせの両方で、早くコードを出すより早く迷いが消えた
  • 欠点は時間と疲労。全部のタスクに使う必要はない

次は、grill-me → 要件メモ → 実装、の流れを X 下書きパイプライン に試験導入してみる予定です。

Matt Pocock 氏の grill-me 紹介(AI Hero)skills.sh も合わせてどうぞ。


コメント