[LLM] RAG：社内 / 自分用ナレッジ検索 – ソフトウェアエンジニアの技術ブログ：Software engineer tech blog

RAGの全体の流れ

資料(PDF / メモ / Wiki / Slackログ …)
│
▼
① 文章を分割
│
▼
② ベクトルに変換（embedding）
│
▼
③ ベクトルDBに保存（Faiss / Chroma）
│
▼
質問（ユーザー入力）
│
▼
④ 類似文検索（最も近い文を取り出す）
│
▼
⑤ LLMに「検索結果 + 質問」を入れて回答生成

confluenceへの接続

import requests
from requests.auth import HTTPBasicAuth
import os

CONFLUENCE_URL = "https://id.atlassian.net/wiki/rest/api/content"
EMAIL = "hoge@gmail"
API_TOKEN = "*"

response = requests.get(
    CONFLUENCE_URL,
    auth=HTTPBasicAuth(EMAIL, API_TOKEN)
)

print(response.json())

これを応用していくとRAGができる。