プロジェクト

全般

プロフィール

バグ #781

未完了

[P2-5] ドキュメント埋め込み処理

Redmine Admin さんが3ヶ月前に追加.

ステータス:
新規
優先度:
急いで
担当者:
-
開始日:
2025-06-26
期日:
進捗率:

0%

予定工数:

説明

ドキュメント埋め込み処理

【AI開発見積もり】

予想トークン量: 約18,000トークン
基準作業時間: 12時間 (トークン量ベース)
作業種別係数: 1.4 (複雑なアルゴリズム)
技術スタック係数: 1.3 (AI・ベクトル処理)
調整後見積: 21.8時間
バッファ込み最終: 26.2時間 (3.3人日)

作業内容

  • テキストチャンク化アルゴリズム実装
  • 埋め込みベクトル生成機能
  • バッチ処理システム
  • 処理状況管理・進捗表示
  • エラー時再試行機能

技術要件

  • LangChain テキスト分割
  • OpenAI Embeddings API
  • 非同期バッチ処理

依存チケット

  • [P2-1] OpenAI API連携基盤
  • [P1-7] pgvectorベクトルDB設定

成果物

  • ドキュメント処理パイプライン
  • 埋め込み生成エンジン
  • バッチ処理管理システム
  • 処理状況監視機能

設計承認必要

  • チャンク化戦略(サイズ・重複度)
  • バッチ処理アーキテクチャ
  • ベクトル保存形式

完了条件

  • 大量ドキュメントが効率的に処理される
  • 埋め込み品質が基準をクリア
  • バッチ処理が安定動作

表示するデータがありません

他の形式にエクスポート: Atom PDF