たった3行の Agent Skill「grill-me」を試した — 実装前のハーネスとして

リード
grill-me とは
前のハーネス記事との関係 — 2種類のハーネス
スキル全文（原文）
試した環境と導入手順
検証内容
1. 1. メタ検証（記事構成の壁打ち）
2. 2. 実装前検証（X下書きエージェント拡張案）
プランモード・JSONハーネスとの比較
微妙だった点
まとめ

リード

こんにちは、ぽまらのです。

以前、JSON整形タスクでハーネスあり/なしを比較しました。あの記事のハーネスは 出力を検証する タイプでした。
今回見つけた grill-me は、Matt Pocock 氏が公開した Agent Skillで、実装前に質問を浴びせて認識を揃える タイプのハーネスです。

Zenn の紹介記事（Ryo Nakae さん）を読んで「3行でここまで変わるのか」と思い、Cursor で実際に試してみました。
この記事では、スキルの中身、前のハーネス記事との違い、自分の検証結果、向き不向きをまとめます。

grill-me とは

grill-me（グリルミー）は、エージェントに「計画や設計について、共通理解に達するまで執拗にインタビューせよ」と指示する Skill です。
Claude Code では /grill-me、Cursor でも Skill として読み込めます。

特徴は次のとおりです。

質問は一度に1つ
設計の決定木を枝分かれの先までたどる
各質問に推奨回答も添える
コードベースで答えられる質問は、人に聞かず探索する

スキル本体は frontmatter(Markdown ファイルの先頭にあるメタデータ用のブロック) を除き 実質3行 です。長いプロンプトテンプレートではなく、「こう動け」と方向だけ渡すタイプです。

前のハーネス記事との関係 — 2種類のハーネス

JSON ハーネス記事では、スキーマ検証とリトライで 出力の形 を固定しました。
X 下書き半自動化では、140字チェックや重複回避で 生成後の品質 を縛りました。

grill-me はその前段に効きます。

種類	タイミング	例
出力ハーネス	生成後	JSON schema、文字数、リトライ
合意ハーネス（grill-me）	実装前	要件・境界・優先順位のすり合わせ

「お願いします」だけだと、エージェントは早くプランやコードを出したがります。grill-me は 出す前に止めて聞く ための短い縄です。

スキル全文（原文）

出典: mattpocock/skills — grill-me（Matt Pocock 氏）

---
name: grill-me
description: Interview the user relentlessly about a plan or design until reaching shared understanding, resolving each branch of the decision tree. Use when user wants to stress-test a plan, get grilled on their design, or mentions "grill me".
---

Interview me relentlessly about every aspect of this plan until we reach a shared understanding. Walk down each branch of the design tree, resolving dependencies between decisions one-by-one. For each question, provide your recommended answer.

Ask the questions one at a time.

If a question can be answered by exploring the codebase, explore the codebase instead.

日本語の意味（参考訳）:

この計画のあらゆる側面について、共通理解に達するまで執拗に質問してください。設計の決定木を枝分かれの先までたどり、決定間の依存を順に解決してください。各質問には推奨回答も添えてください。
質問は一度に1つ。
コードベースを調べれば答えられる質問は、人に聞かず探索してください。

試した環境と導入手順

環境

Cursor（Agent モード）
比較対象: 通常のチャット、Plan モード相当の「いきなりプラン出力」

導入（Cursor）

skills.sh の手順に沿い、次のいずれかです。

npx skills add https://github.com/mattpocock/skills --skill grill-me

または、Skill ファイルを ~/.cursor/skills/（個人）や .cursor/skills/（プロジェクト）に grill-me/SKILL.md として置く。

呼び出し方

チャットで、ざっくりしたやりたいこと + grill-me を使って と書く。
例:

grill-me で壁打ちしたい。

X下書きエージェントに「週1でブログURLを1本入れる」機能を足す案について、
実装前に認識を揃えたい。

検証内容

検証は2段階にしました。

メタ検証 — この記事自体の構成を grill-me で決める（執筆前）
実装前検証 — 既存プロジェクトへの機能追加案を壁打ちする（執筆時追記）

1. メタ検証（記事構成の壁打ち）

記事を書く前に、grill-me 相当の進め方で自分に質問し、方針を固めました。
実際のセッションでは 12問 ほど続き、次のように整理されました。

#	質問の例	決まったこと
1	読者は誰か	前のハーネス記事・X半自動化記事を読んだ人
2	記事のゴール	布教より自分の検証ログ
3	前作との関係	出力ハーネス vs 合意ハーネスの対比を書く
4	検証タスク	実在の機能案（X下書きへの週1 URL）を題材にする
5	ツール	Cursor。Claude Code だけの話にしない
6	プランモード比較	Zenn 記事の論点を自分の言葉で再検証
7	欠点	「疲れる」「時間がかかる」を正直に書く
8	スキル全文	原文を載せ、出典を明記
9	図	2種類のハーネスの表で足りる
10	内部リンク	ai/272, ai/318 へ
11	英語版	公開後に別ドラフト
12	再現性	導入手順とプロンプト例を載せる

所感: 12問の時点で、見出し構成と「何を検証したことにするか」がほぼ確定しました。Plan モードで一括プランを出すより、1問ずつ答える分、迷いが減った 印象です。

2. 実装前検証（X下書きエージェント拡張案）

題材: X下書き半自動化のエージェントに、「週1回だけブログ記事 URL を投稿に含める」ルールを足す案。

項目	結果（執筆時追記）
質問数	（例: 18問）
コードベース探索	（例: `x-shuuchaku-agent-spec.md` を自動参照）
決まった仕様	（例: 日曜のみ / URL は140字に収まる短縮 / 手動確認必須）
決まらなかったこと	（例: 英語記事 URL の扱い）
セッション時間	（例: 約25分）

執筆時メモ（サンプル — 実際のログに差し替え）:

Q: 週1の「週」は曜日固定かローテーションか → 日曜固定（内省テックの振り返り寄り）
Q: URL は仕様書の「URLは入れない」と矛盾しないか → 例外ルールとして spec に明記 が必要
Q: 自動で入れるか下書きに「候補」だけか → 候補提示まで。投稿は人間（半自動方針維持）

プランモード・JSONハーネスとの比較

方式	強み	弱み
Plan モード	一度に全体像が見える	一部修正でプラン全体が書き直されがち
JSON ハーネス	出力の合否が機械的に判定できる	要件のズレ自体は防げない
grill-me	実装前の認識ずれを減らせる	時間と集中力を使う。疲れる

Ryo Nakae さんの Zenn 記事でも書かれているように、grill-me 後は 会話ログ自体が実装計画 になり、「OK、これで実装して」と渡しやすい点が自分でも再現できました。

微妙だった点

疲れる — 10問を超えると、自分の頭も動き続ける。Zenn 記事の「脳がジーン」は共感できる
短いタスクには過剰 — typo 修正レベルでは grill-me 不要
質問の深さはモデル依存 — Opus 級の方が枝分かれが深い、という報告は納得（自分の環境では執筆時に追記）
Skill だけでは自動発火しない — 「grill-me で」と明示する必要がある

まとめ

grill-me は、たった数行で 実装前の合意ハーネス になる
JSON ハーネスが 出力後 なら、grill-me は 出力前
検証では、記事構成の決定と機能案のすり合わせの両方で、早くコードを出すより早く迷いが消えた
欠点は時間と疲労。全部のタスクに使う必要はない

次は、grill-me → 要件メモ → 実装、の流れを X 下書きパイプラインに試験導入してみる予定です。

Matt Pocock 氏の grill-me 紹介（AI Hero）や skills.sh も合わせてどうぞ。