sessionpad / AI Agentic 化プロジェクト
Phase 0: 学習と基盤整備
Next.js 16 + shadcn/ui + Vercel AI SDK + Anthropic SDK + Supabase + Inngest + Langfuse + MCP + Promptfoo の最小素振り。
Next.js 16 + shadcn/ui スキャフォールド
✅ 完了App Router / TypeScript / Tailwind v4 / shadcn (base-nova)
Anthropic Hello World
✅ 完了AI SDK v6 + claude-haiku-4-5 で 1 往復生成
契約書 PDF 抽出 (Phase 0 完了条件 #1)
✅ 完了Anthropic SDK 直叩きで PDF Native 入力 → 厳密 JSON。 2026-05-05 発注書で全項目抽出成功
Inngest cron + event 素振り (Phase 0 完了条件 #4)
✅ 完了helloCron / helloEvent — Strategy C 厳守。 2026-05-05 dev server で完走
MCP server 5 Tools (Phase 1 連動)
✅ 完了2026-05-06 達成 + 拡張: listContracts / listInvoices / listCustomers / listReportEmails / listStaff の Read-only 5 Tool。 sessionpad PR #2 (feature/phase1-dual-auth) merge で 200 + 自社データが返る。 cross-tenant 防御は MCP 層 + Laravel Service 層の二重
検算 Agent skeleton (Phase 1 #1)
✅ 完了請求書 vs 報告メール の整合性を Sonnet 4.6 で検算 → warning 配列 + confidence 出力。 Phase 1 完了条件 Recall ≥ 90% は Eval 拡充 (Task #15) で別途達成
鮮度 Agent skeleton (Phase 1 #2)
✅ 完了契約期限切れ・期限近い (≤30日)・請求書未送信 (issued 後 7日)・未入金超過 (sent 後 60日) の 4 カテゴリを検知。 Phase 1 完了条件 Recall ≥ 80% は Eval 拡充 (Task #15) で達成
督促 Agent skeleton (Phase 1 #3)
✅ 完了機械的に未提出 staff を抽出 + LLM で個別ドラフト生成 (口調・関係性反映)。 全員提出済なら LLM スキップ。 承認カード UI は Phase 2 で接続
Cockpit (Today's Tasks) UI (Phase 1 #4)
✅ 完了shadcn Table / Card / Badge で 3 Agent の alert を一望。 Phase 1 段階は dummy fixture、 Supabase 接続後に agent_alert table から real-time read に切替
Supabase schema (Phase 1 並行)
✅ 完了agent_alert / audit_log / approval_history / embedding の 4 テーブル + pgvector + RLS enable + immutable audit_log + updated_at 自動トリガー。 適用は Supabase project 作成後
Inngest cron + event 接続 (Phase 1 #5)
✅ 完了freshnessCron (毎日 9:00 JST) + reminderCron (毎月 25日) + reconcileEvent (sessionpad/report.received)。 Strategy C 厳守 (step.run のみ)、 Laravel API は SESSIONPAD_JWT 経由
Agent Eval 11 cases (Phase 1 #6)
✅ 完了2026-05-06 実測: 検算 5/5 (100%、 threshold 90%) / 鮮度 3/3 (100%、 80%) / 督促 3/3 (100%、 100%)。 Phase 1 完了条件 全 Agent threshold 突破
Eval 16件 (Phase 0 完了条件 #2)
✅ 完了2026-05-06 達成: 自前 runner で 29/32=90.6% (Sonnet 87.5% / Haiku 93.8%)、 90% threshold 突破。 Promptfoo は Node engine 不一致で自前 runner に切替
Langfuse trace (Phase 0 完了条件 #3)
✅ 完了JP リージョン jp.cloud.langfuse.com で trace 受信確認 (2026-05-05)。 v3 SDK で配線、 LLM の prompt/response 詳細記録は Phase 1 で v4 OTel 移行で強化予定
Laravel JWT 発行 endpoint (Phase 0 完了条件 #6)
✅ 完了sessionpad PR #1 で実装、 2026-05-06 merge 済。 ローカル sessionpad の /api/issue-token で JWT 発行 → develop の /api/test-jwt で claims verify 確認済。 HS256 / 15分 TTL