操作
バグ #781
未完了[P2-5] ドキュメント埋め込み処理
ステータス:
新規
優先度:
急いで
担当者:
-
開始日:
2025-06-26
期日:
進捗率:
0%
予定工数:
説明
ドキュメント埋め込み処理¶
【AI開発見積もり】¶
予想トークン量: 約18,000トークン
基準作業時間: 12時間 (トークン量ベース)
作業種別係数: 1.4 (複雑なアルゴリズム)
技術スタック係数: 1.3 (AI・ベクトル処理)
調整後見積: 21.8時間
バッファ込み最終: 26.2時間 (3.3人日)
作業内容¶
- テキストチャンク化アルゴリズム実装
- 埋め込みベクトル生成機能
- バッチ処理システム
- 処理状況管理・進捗表示
- エラー時再試行機能
技術要件¶
- LangChain テキスト分割
- OpenAI Embeddings API
- 非同期バッチ処理
依存チケット¶
- [P2-1] OpenAI API連携基盤
- [P1-7] pgvectorベクトルDB設定
成果物¶
- ドキュメント処理パイプライン
- 埋め込み生成エンジン
- バッチ処理管理システム
- 処理状況監視機能
設計承認必要¶
- チャンク化戦略(サイズ・重複度)
- バッチ処理アーキテクチャ
- ベクトル保存形式
完了条件¶
- 大量ドキュメントが効率的に処理される
- 埋め込み品質が基準をクリア
- バッチ処理が安定動作
表示するデータがありません
操作