Skip to main content
Open on GitHub

Weaviate

Weaviate 是一个开源矢量(向量)数据库。它允许您存储来自您喜爱的 ML 模型的数据对象和矢量嵌入,并无缝扩展到数十亿个数据对象。

什么是 Weaviate

  • Weaviate 是一个开源的矢量搜索引擎数据库。
  • Weaviate 允许您以类的属性方式存储 JSON 文档,同时将机器学习矢量附加到这些文档上,以便在矢量空间中表示它们。
  • Weaviate 可以独立使用(即自带矢量),也可以与各种模块一起使用,这些模块可以为您处理矢量化并扩展核心功能。
  • Weaviate 拥有 GraphQL API,可轻松访问您的数据。
  • 我们的目标是将您的矢量搜索设置投入生产,在短短几毫秒内完成查询(请查看我们的 开源基准测试,了解 Weaviate 是否适合您的用例)。
  • 基础入门指南 中用不到五分钟的时间即可了解 Weaviate。

Weaviate 详解:

Weaviate 是一个低延迟的矢量搜索引擎,开箱即用地支持不同的媒体类型(文本、图像等)。它提供语义搜索、问答提取、分类、可定制模型(PyTorch/TensorFlow/Keras)等功能。Weaviate 完全使用 Go 从头开始构建,存储对象和矢量,能够将矢量搜索与结构化过滤以及云原生数据库的容错能力相结合。所有这些都可以通过 GraphQL、REST 以及各种客户端编程语言进行访问。

安装和设置

安装 Python SDK:

pip install langchain-weaviate

Vector Store

有一个围绕 Weaviate 索引的封装器,允许您将其用作矢量存储,无论是用于语义搜索还是示例选择。

要导入此矢量存储:

from langchain_weaviate import WeaviateVectorStore

有关 Weaviate 封装器的更详细的演练,请参阅 此笔记本