viking DB

viking DB 是一种数据库，用于存储、索引和管理深度神经网络及其他机器学习 (ML) 模型生成的海量嵌入向量。

本 Notebook 将演示如何使用与 VikingDB 向量数据库相关的函数。

您需要通过 pip install -qU langchain-community 安装 langchain-community 才能使用此集成。

!pip install --upgrade volcengine

我们想使用 VikingDBEmbeddings，所以我们需要获取 VikingDB API 密钥。

import getpass
import os

if "OPENAI_API_KEY" not in os.environ:
    os.environ["OPENAI_API_KEY"] = getpass.getpass("OpenAI API Key:")

from langchain_community.document_loaders import TextLoader
from langchain_community.vectorstores.vikingdb import VikingDB, VikingDBConfig
from langchain_openai import OpenAIEmbeddings
from langchain_text_splitters import RecursiveCharacterTextSplitter

API Reference:TextLoader | VikingDB | VikingDBConfig | OpenAIEmbeddings | RecursiveCharacterTextSplitter

loader = TextLoader("./test.txt")
documents = loader.load()
text_splitter = RecursiveCharacterTextSplitter(chunk_size=10, chunk_overlap=0)
docs = text_splitter.split_documents(documents)

embeddings = OpenAIEmbeddings()

db = VikingDB.from_documents(
    docs,
    embeddings,
    connection_args=VikingDBConfig(
        host="host", region="region", ak="ak", sk="sk", scheme="http"
    ),
    drop_old=True,
)

query = "What did the president say about Ketanji Brown Jackson"
docs = db.similarity_search(query)

docs[0].page_content

使用 Viking DB Collections 分隔数据

您可以在同一个 Viking DB 实例中的不同集合里存储不同的、不相关的文档，以保持上下文。

这里是创建新集合的方法

db = VikingDB.from_documents(
    docs,
    embeddings,
    connection_args=VikingDBConfig(
        host="host", region="region", ak="ak", sk="sk", scheme="http"
    ),
    collection_name="collection_1",
    drop_old=True,
)

然后，你可以这样检索已存储的集合

db = VikingDB.from_documents(
    embeddings,
    connection_args=VikingDBConfig(
        host="host", region="region", ak="ak", sk="sk", scheme="http"
    ),
    collection_name="collection_1",
)

检索之后，您可以像平常一样继续查询它。

Vector store conceptual guide
Vector store how-to guides

使用 Viking DB Collections 分隔数据​

Related​

使用 Viking DB Collections 分隔数据

Related