快速入门：使用Amazon Bedrock构建知识库检索系统

Knowledge Bases for Amazon Bedrock是AWS提供的一项工具，旨在通过使用您私有的数据自定义FM响应，快速构建RAG应用。它自动处理将数据加载到向量数据库的流程。Amazon Bedrock使您能够轻松集成知识库检索到应用程序中，实现高效的RAG流程。建议进一步阅读AWS的Retriever概念指南和Retriever使用指南。

stjklkjhgffxw

476人浏览 · 2024-10-24 01:13:51

stjklkjhgffxw · 2024-10-24 01:13:51 发布

快速入门：使用Amazon Bedrock构建知识库检索系统

引言

在现代AI应用中，检索增强生成(RAG)技术通过结合知识库和生成式模型极大提升了查询响应的相关性。然而，实现RAG需要将数据转换为向量、存储到专用数据库中，并建立复杂的集成。亚马逊Web服务(AWS)的Knowledge Bases for Amazon Bedrock简化了这一流程。本文将引导您快速上手这一工具。

主要内容

什么是Amazon Bedrock知识库检索器？

Knowledge Bases for Amazon Bedrock是AWS提供的一项工具，旨在通过使用您私有的数据自定义FM响应，快速构建RAG应用。它自动处理将数据加载到向量数据库的流程。

如何设置？

AWS提供了两种配置知识库的方式：通过AWS控制台或使用AWS SDK。您需要获得knowledge_base_id来实例化检索器。

安装

开始之前，您需要安装相关的Python包：

%pip install -qU langchain-aws

实例化检索器

以下代码展示了如何实例化AmazonKnowledgeBasesRetriever：

from langchain_aws.retrievers import AmazonKnowledgeBasesRetriever

retriever = AmazonKnowledgeBasesRetriever(
    knowledge_base_id="PUIJP4EQUA",
    retrieval_config={"vectorSearchConfiguration": {"numberOfResults": 4}},
)

代码示例

使用示例

下面是一个完整的使用示例，展示如何使用AmazonKnowledgeBasesRetriever进行查询：

query = "What did the president say about Ketanji Brown?"
response = retriever.invoke(query)
print(response)

在链中使用

结合Langchain和Bedrock模型，我们可以创建一个检索问答链：

from botocore.client import Config
from langchain.chains import RetrievalQA
from langchain_aws import Bedrock

model_kwargs_claude = {"temperature": 0, "top_k": 10, "max_tokens_to_sample": 3000}
llm = Bedrock(model_id="anthropic.claude-v2", model_kwargs=model_kwargs_claude)

qa = RetrievalQA.from_chain_type(
    llm=llm, retriever=retriever, return_source_documents=True
)

qa_response = qa(query)
print(qa_response)