loading
loading
Tag
このタグに関連する記事一覧です。まずは新しい記事から読むのがおすすめです。
ベクトル検索だけだとIDや短いクエリで外す。BM25+ベクトルのハイブリッド検索、reranker、クエリ書き換え、top-k調整、評価指標まで、RAGのretrievalを底上げする実務チェックリスト。
RAGの品質はchunkingとindexingで決まる。構造ベース分割、chunkサイズ/overlap、メタデータとフィルタ、重複除去、再インデックス方針まで、取り回せるチェックリストに落とし込む。
RAGの信頼性は「根拠が見えるか」で決まる。引用を必須化し、doc_id/chunk_idで検証可能にし、矛盾ソースの扱いとログ設計まで含めて実務チェックリスト化。
LLMアプリはプロンプトやモデル、RAGやツール権限の変更で静かに劣化する。小さな評価データ、バージョニング、品質/安全/コスト指標、リリースゲートで回帰を止める実務チェックリスト。
LLMの費用は変動費。トークン上限、ツール実行上限、ユーザー/テナント予算、スパイク検知アラート、劣化モードをチェックリスト化して、請求事故と信頼性劣化を同時に防ぐ。
LLMの429や一時障害は前提。タイムアウト、バックオフ、冪等性、フォールバック、コスト制御を最小のチェックリストに落とし込み、信頼性と請求事故を両方防ぐ。
RAGのデータ汚染は「プロンプト」ではなく「取り込みパイプライン」で防ぐ。取り込み元、検証と隔離、doc_idの証跡、ツール権限を30分で点検する実務チェックリスト。
AIアプリ/自動化のための「最小で効くログ」をチェックリスト化。デバッグ、コスト管理、インシデント対応に必要な証跡を残しつつ、秘密情報や機密データをログに残さない。
プロンプトインジェクションは“プロンプトの書き方”だけでは防げない。入力経路(入口)、ツール権限、アウトバウンド、ログを30分で点検する実務チェックリスト。