Bedrock (知识库) 检索器

本指南将帮助您开始使用 AWS 知识库检索器。

Amazon Bedrock 的知识库是亚马逊网络服务 (AWS) 提供的一项服务，可让您通过使用私有数据来定制 FM 响应，从而快速构建 RAG 应用程序。

实施 RAG 需要组织执行多个繁琐的步骤，将数据转换为嵌入（向量），将嵌入存储在专门的向量数据库中，并构建到数据库的自定义集成，以搜索和检索与用户查询相关的文本。这可能既耗时又效率低下。

借助 Amazon Bedrock 的知识库，您只需指向 Amazon S3 中数据的存储位置，Amazon Bedrock 的知识库 就会负责将所有数据摄取到您的向量数据库中。如果您没有现有的向量数据库，Amazon Bedrock 会为您创建一个 Amazon OpenSearch Serverless 向量存储。对于检索，请通过 Retrieve API 使用 Langchain - Amazon Bedrock 集成，从知识库中检索与用户查询相关的结果。

集成详情

Retriever	Self-host	Cloud offering	Package
AmazonKnowledgeBasesRetriever	❌	✅	langchain_aws

设置

知识库可以通过 AWS 管理控制台或使用 AWS SDK 进行配置。我们需要 knowledge_base_id 来实例化检索器。

如果你希望从单个查询中获得自动化追踪，你也可以通过取消注释下方来设置你的 LangSmith API 密钥：

# os.environ["LANGSMITH_API_KEY"] = getpass.getpass("Enter your LangSmith API key: ")
# os.environ["LANGSMITH_TRACING"] = "true"

安装

此检索器位于 langchain-aws 包中：

%pip install -qU langchain-aws

实例化

现在我们可以实例化我们的检索器：

from langchain_aws.retrievers import AmazonKnowledgeBasesRetriever

retriever = AmazonKnowledgeBasesRetriever(
    knowledge_base_id="PUIJP4EQUA",
    retrieval_config={"vectorSearchConfiguration": {"numberOfResults": 4}},
)

API Reference:AmazonKnowledgeBasesRetriever

用法

query = "What did the president say about Ketanji Brown?"

retriever.invoke(query)

在链式调用中使用

from botocore.client import Config
from langchain.chains import RetrievalQA
from langchain_aws import Bedrock

model_kwargs_claude = {"temperature": 0, "top_k": 10, "max_tokens_to_sample": 3000}

llm = Bedrock(model_id="anthropic.claude-v2", model_kwargs=model_kwargs_claude)

qa = RetrievalQA.from_chain_type(
    llm=llm, retriever=retriever, return_source_documents=True
)

qa(query)

API Reference:RetrievalQA

API 参考

有关 AmazonKnowledgeBasesRetriever 所有功能和配置的详细文档，请前往 API 参考。

Retriever conceptual guide
Retriever how-to guides

集成详情​

设置​

安装​

实例化​

用法​

在链式调用中使用​

API 参考​

Related​

集成详情

设置

安装

实例化

用法

在链式调用中使用

API 参考

Related