Google Spanner
Spanner 是一个高可扩展性数据库,它以一种简单的解决方案,将无限的可扩展性与二级索引、强一致性、模式和 SQL 等关系语义相结合,并提供 99.999% 的可用性。
本笔记本将介绍如何使用 Spanner 通过 SpannerLoader 和 SpannerDocumentSaver 保存、加载和删除 langchain 文档。
在 GitHub 上了解更多关于该软件包的信息。
开始之前
要运行此笔记本,您需要执行以下操作:
在确认笔记本运行时环境已接入数据库后,请填写以下值并运行单元格,然后再运行示例脚本。
# @markdown Please specify an instance id, a database, and a table for demo purpose.
INSTANCE_ID = "test_instance" # @param {type:"string"}
DATABASE_ID = "test_database" # @param {type:"string"}
TABLE_NAME = "test_table" # @param {type:"string"}
🦜🔗 库安装
该集成存在于自有的 langchain-google-spanner 包中,因此我们需要安装它。
%pip install -upgrade --quiet langchain-google-spanner langchain
仅限 Colab: 取消注释以下单元格以重启内核,或使用按钮重启内核。对于 Vertex AI Workbench,您可以使用顶部的按钮重启终端。
# # Automatically restart kernel after installs so that your environment can access the new packages
# import IPython
# app = IPython.Application.instance()
# app.kernel.do_shutdown(True)
☁ 设置您的 Google Cloud 项目
设置您的 Google Cloud 项目,以便在本笔记本中利用 Google Cloud 资源。
如果您不知道您的项目 ID,可以尝试执行以下操作:
- 运行
gcloud config list。 - 运行
gcloud projects list。 - 请参阅支持页面:查找项目 ID。
# @markdown Please fill in the value below with your Google Cloud project ID and then run the cell.
PROJECT_ID = "my-project-id" # @param {type:"string"}
# Set the project id
!gcloud config set project {PROJECT_ID}
🔐 身份验证
在 Google Cloud 中以登录到此笔记本的 IAM 用户身份进行身份验证,以便访问你的 Google Cloud 项目。
- 如果你使用 Colab 运行此笔记本,请使用下面的单元格并继续。
- 如果你使用 Vertex AI Workbench,请参阅此处的设置说明。
from google.colab import auth
auth.authenticate_user()
基本用法
保存文档
使用 SpannerDocumentSaver.add_documents(<documents>) 保存 langchain 文档。要初始化 SpannerDocumentSaver 类,您需要提供 3 个内容:
instance_id- 一个 Spanner 实例,用于加载数据。database_id- 一个 Spanner 数据库实例,用于加载数据。table_name- Spanner 数据库中用于存储 langchain 文档的表名。
from langchain_core.documents import Document
from langchain_google_spanner import SpannerDocumentSaver
test_docs = [
Document(
page_content="Apple Granny Smith 150 0.99 1",
metadata={"fruit_id": 1},
),
Document(
page_content="Banana Cavendish 200 0.59 0",
metadata={"fruit_id": 2},
),
Document(
page_content="Orange Navel 80 1.29 1",
metadata={"fruit_id": 3},
),
]
saver = SpannerDocumentSaver(
instance_id=INSTANCE_ID,
database_id=DATABASE_ID,
table_name=TABLE_NAME,
)
saver.add_documents(test_docs)
API Reference:Document