DocArray
DocArray 是一个用于处理嵌套、非结构化、多模态数据的库, 数据类型包括文本、图像、音频、视频、3D 网格等。它允许深度学习工程师通过 Pythonic API 高效地处理、 嵌入、搜索、推荐、存储和传输多模态数据。
安装与设置
我们需要安装 docarray Python 包。
pip install docarray
Vector Store
LangChain 提供了对 DocArray 库中 In-memory 和 HNSW 向量存储的访问。
请参阅 使用示例。
from langchain_community.vectorstores import DocArrayHnswSearch
API Reference:DocArrayHnswSearch
请参阅 使用示例。
from langchain_community.vectorstores import DocArrayInMemorySearch
API Reference:DocArrayInMemorySearch
Retriever
请参阅 使用示例。
from langchain_community.retrievers import DocArrayRetriever
API Reference:DocArrayRetriever