Weaviate
Weaviate 是一个开源矢量(向量)数据库。它允许您存储来自您喜爱的 ML 模型的数据对象和矢量嵌入,并无缝扩展到数十亿个数据对象。
什么是 Weaviate?
- Weaviate 是一个开源的矢量搜索引擎数据库。
- Weaviate 允许您以类的属性方式存储 JSON 文档,同时将机器学习矢量附加到这些文档上,以便在矢量空间中表示它们。
- Weaviate 可以独立使用(即自带矢量),也可以与各种模块一起使用,这些模块可以为您处理矢量化并扩展核心功能。
- Weaviate 拥有 GraphQL API,可轻松访问您的数据。
- 我们的目 标是将您的矢量搜索设置投入生产,在短短几毫秒内完成查询(请查看我们的 开源基准测试,了解 Weaviate 是否适合您的用例)。
- 在 基础入门指南 中用不到五分钟的时间即可了解 Weaviate。
Weaviate 详解:
Weaviate 是一个低延迟的矢量搜索引擎,开箱即用地支持不同的媒体类型(文本、图像等)。它提供语义搜索、问答提取、分类、可定制模型(PyTorch/TensorFlow/Keras)等功能。Weaviate 完全使用 Go 从头开始构建,存储对象和矢量,能够将矢量搜索与结构化过滤以及云原生数据库的容错能力相结合。所有这些都可以通过 GraphQL、REST 以及各种客户端编程语言进行访问。
安装和设置
安装 Python SDK:
pip install langchain-weaviate
Vector Store
有一个围绕 Weaviate 索引的封装器,允许您将其用作矢量存储,无论是用于语义搜索还是示例选择。
要导入此矢量存储:
from langchain_weaviate import WeaviateVectorStore
有关 Weaviate 封装器的更详细的演练,请参阅 此笔记本。