Skip to main content
Open In ColabOpen on GitHub

Vespa

Vespa 是一个功能齐全的搜索引擎和向量数据库。它支持向量搜索 (ANN)、词汇搜索以及结构化数据搜索,所有操作都可以在同一个查询中完成。

本 notebook 演示了如何使用 Vespa.ai 作为 LangChain 的检索器。

为了创建检索器,我们使用 pyvespa 来 创建与 Vespa 服务的连接。

%pip install --upgrade --quiet  pyvespa
from vespa.application import Vespa

vespa_app = Vespa(url="https://doc-search.vespa.oath.cloud")

这会创建一个与 Vespa 服务的连接,这里是 Vespa 文档搜索服务。 使用 pyvespa 包,您还可以连接到 Vespa Cloud 实例 或本地 Docker 实例

连接到服务后,您可以设置检索器:

from langchain_community.retrievers import VespaRetriever

vespa_query_body = {
"yql": "select content from paragraph where userQuery()",
"hits": 5,
"ranking": "documentation",
"locale": "en-us",
}
vespa_content_field = "content"
retriever = VespaRetriever(vespa_app, vespa_query_body, vespa_content_field)
API Reference:VespaRetriever

此设置创建了一个 LangChain Retriever,用于从 Vespa 应用程序中获取文档。 在这里,使用 doumentation 作为排名方法,从 paragraph 文档类型的 content 字段中检索最多 5 个结果。 userQuery() 会被替换为从 LangChain 传入的实际查询。

更多信息请参考 pyvespa 文档

现在您可以返回结果并在 LangChain 中继续使用这些结果。

retriever.invoke("what is vespa?")