RAGの全体の流れ
資料(PDF / メモ / Wiki / Slackログ …)
│
▼
① 文章を分割
│
▼
② ベクトルに変換(embedding)
│
▼
③ ベクトルDBに保存(Faiss / Chroma)
│
▼
質問(ユーザー入力)
│
▼
④ 類似文検索(最も近い文を取り出す)
│
▼
⑤ LLMに「検索結果 + 質問」を入れて回答生成
confluenceへの接続
import requests
from requests.auth import HTTPBasicAuth
import os
CONFLUENCE_URL = "https://id.atlassian.net/wiki/rest/api/content"
EMAIL = "hoge@gmail"
API_TOKEN = "*"
response = requests.get(
CONFLUENCE_URL,
auth=HTTPBasicAuth(EMAIL, API_TOKEN)
)
print(response.json())
これを応用していくとRAGができる。