loading
loading
Tag
このタグに関連する記事一覧です。まずは新しい記事から読むのがおすすめです。
ベクトル検索だけだとIDや短いクエリで外す。BM25+ベクトルのハイブリッド検索、reranker、クエリ書き換え、top-k調整、評価指標まで、RAGのretrievalを底上げする実務チェックリスト。
RAGの品質はchunkingとindexingで決まる。構造ベース分割、chunkサイズ/overlap、メタデータとフィルタ、重複除去、再インデックス方針まで、取り回せるチェックリストに落とし込む。
RAGの信頼性は「根拠が見えるか」で決まる。引用を必須化し、doc_id/chunk_idで検証可能にし、矛盾ソースの扱いとログ設計まで含めて実務チェックリスト化。
LLMアプリはプロンプトやモデル、RAGやツール権限の変更で静かに劣化する。小さな評価データ、バージョニング、品質/安全/コスト指標、リリースゲートで回帰を止める実務チェックリスト。
LLMの費用は変動費。トークン上限、ツール実行上限、ユーザー/テナント予算、スパイク検知アラート、劣化モードをチェックリスト化して、請求事故と信頼性劣化を同時に防ぐ。
LLMの429や一時障害は前提。タイムアウト、バックオフ、冪等性、フォールバック、コスト制御を最小のチェックリストに落とし込み、信頼性と請求事故を両方防ぐ。
RAGのデータ汚染は「プロンプト」ではなく「取り込みパイプライン」で防ぐ。取り込み元、検証と隔離、doc_idの証跡、ツール権限を30分で点検する実務チェックリスト。
AIアプリ/自動化のための「最小で効くログ」をチェックリスト化。デバッグ、コスト管理、インシデント対応に必要な証跡を残しつつ、秘密情報や機密データをログに残さない。
プロンプトインジェクションは“プロンプトの書き方”だけでは防げない。入力経路(入口)、ツール権限、アウトバウンド、ログを30分で点検する実務チェックリスト。
ログインがあるのに情報が抜ける原因はほぼ「認可」。AI生成コードで頻発するIDOR(オブジェクト単位の認可ミス)を、30分で潰すための実務チェックリストと判断基準をまとめる。
AI実装は速いが、そのぶん「認可(authorization)」が抜けやすい。IDOR(オブジェクト単位の認可ミス)を最短で見つけて直すための実務手順、判断基準、回帰テスト、運用の型をまとめる。
AIに実装させるときの失敗は、コード生成より「意思決定の欠落」で起きる。入力/出力、制約、例外、受け入れ条件、分割手順を強制的に埋めるテンプレで、手戻りを減らす。
LLMで書いた文章が“AIっぽい”と判断される原因はだいたい決まっている。意図への即答、具体例、判断基準、そして機械的なノイズ除去の4点で、公開できる品質に整える。
AI(LLM)に実装を任せる前に、曖昧な依頼を“拘束力のある仕様”に変えるための質問リスト。スコープ、制約、失敗時の挙動、受け入れ条件、運用を先に確定して手戻りを減らす。