StarRocks
StarRocks 是一个高性能分析数据库。
StarRocks是新一代的亚秒级 MPP 数据库,适用于全分析场景,包括多维分析、实时分析和即席查询。
通常
StarRocks被归类为 OLAP,并且在ClickBench — 分析型数据库的基准测试中表现出色。由于它拥有超快的向量化执行引擎,因此也可以用作快速的向量数据库。
在这里,我们将展示如何使用 StarRocks Vector Store。
设置
%pip install --upgrade --quiet pymysql langchain-community
在开头设置 update_vectordb = False。如果没有文档更新,我们就不需要重新构建文档的 embeddings。
from langchain.chains import RetrievalQA
from langchain_community.document_loaders import (
DirectoryLoader,
UnstructuredMarkdownLoader,
)
from langchain_community.vectorstores import StarRocks
from langchain_community.vectorstores.starrocks import StarRocksSettings
from langchain_openai import OpenAI, OpenAIEmbeddings
from langchain_text_splitters import TokenTextSplitter
update_vectordb = False
API Reference:RetrievalQA | DirectoryLoader | UnstructuredMarkdownLoader | StarRocks | StarRocksSettings | OpenAI | OpenAIEmbeddings | TokenTextSplitter
/Users/dirlt/utils/py3env/lib/python3.9/site-packages/requests/__init__.py:102: RequestsDependencyWarning: urllib3 (1.26.7) or chardet (5.1.0)/charset_normalizer (2.0.9) doesn't match a supported version!
warnings.warn("urllib3 ({}) or chardet ({})/charset_normalizer ({}) doesn't match a supported "