NVIDIA

这将帮助您开始使用 NVIDIA 模型。有关所有 NVIDIA 功能和配置的详细文档，请访问 API 参考。

概述

langchain-nvidia-ai-endpoints 包包含了 LangChain 的集成，用于构建使用 NVIDIA NIM 推理微服务上的模型驱动的应用程序。这些模型由 NVIDIA 优化，可在 NVIDIA 加速基础设施上提供最佳性能，并部署为 NIM。NIM 是易于使用的预构建容器，可以使用 NVIDIA 加速基础设施上的单一命令在任何地方进行部署。

NVIDIA 托管的 NIM 部署可在 NVIDIA API 目录上进行测试。测试后，可以使用 NVIDIA AI Enterprise 许可从 NVIDIA 的 API 目录导出 NIM，并在本地或云端运行，从而使企业能够拥有并完全控制其 IP 和 AI 应用程序。

NIM 按模型打包为容器镜像，并通过 NVIDIA NGC Catalog 以 NGC 容器镜像的形式分发。NIM 的核心是提供简单、一致且熟悉的 API 来运行 AI 模型推理。

此示例将介绍如何使用 LangChain 通过 NVIDIA 类与 NVIDIA 进行交互。

有关通过此 API 访问 LLM 模型的信息，请查看 NVIDIA 文档。

集成详情

类名	包名	本地	可序列化	JS 支持	包下载量	包最新版本
NVIDIA	langchain_nvidia_ai_endpoints	✅	beta	❌

模型特性

JSON 模式	图像输入	音频输入	视频输入	Token 级流式传输	原生异步	Token 使用量追踪	Logprobs
❌	✅	❌	❌	✅	❌	❌	❌

设置

开始之前：

在 NVIDIA 创建一个免费账户，该平台托管 NVIDIA AI Foundation 模型。
点击您选择模型。
在 Input 下选择 Python 标签页，然后点击 Get API Key。接着点击 Generate Key。
复制生成的密钥并将其保存为 NVIDIA_API_KEY。之后，您应该就可以访问端点了。

凭证

import getpass
import os

if not os.getenv("NVIDIA_API_KEY"):
    # Note: the API key should start with "nvapi-"
    os.environ["NVIDIA_API_KEY"] = getpass.getpass("Enter your NVIDIA API key: ")

安装

LangChain NVIDIA AI Endpoints 集成位于 langchain_nvidia_ai_endpoints 包中：

%pip install --upgrade --quiet langchain-nvidia-ai-endpoints

实例化

有关完整功能，请参阅 LLM。

from langchain_nvidia_ai_endpoints import NVIDIA

API Reference:NVIDIA

llm = NVIDIA().bind(max_tokens=256)
llm

调用

prompt = "# Function that does quicksort written in Rust without comments:"

print(llm.invoke(prompt))

流式、批量和异步

这些模型原生支持流式传输，并且与所有 LangChain LLM 一样，它们公开了 batch 方法来处理并发请求，以及用于 invoke、stream 和 batch 的异步方法。以下是一些示例。

for chunk in llm.stream(prompt):
    print(chunk, end="", flush=True)

llm.batch([prompt])

await llm.ainvoke(prompt)

async for chunk in llm.astream(prompt):
    print(chunk, end="", flush=True)

await llm.abatch([prompt])

async for chunk in llm.astream_log(prompt):
    print(chunk)

response = llm.invoke(
    "X_train, y_train, X_test, y_test = train_test_split(X, y, test_size=0.1) #Train a logistic regression model, predict the labels on the test set and compute the accuracy score"
)
print(response)

支持的模型

查询 available_models 仍会列出您的 API 凭证提供的所有其他模型。

NVIDIA.get_available_models()
# llm.get_available_models()

链式调用

我们可以像这样将模型与提示模板进行链式调用：

from langchain_core.prompts import ChatPromptTemplate

prompt = ChatPromptTemplate(
    [
        (
            "system",
            "You are a helpful assistant that translates {input_language} to {output_language}.",
        ),
        ("human", "{input}"),
    ]
)

chain = prompt | llm
chain.invoke(
    {
        "input_language": "English",
        "output_language": "German",
        "input": "I love programming.",
    }
)

API Reference:ChatPromptTemplate

API 参考

有关所有 NVIDIA 功能和配置的详细文档，请访问 API 参考：https://python.langchain.com/api_reference/nvidia_ai_endpoints/llms/langchain_nvidia_ai_endpoints.llms.NVIDIA.html

LLM conceptual guide
LLM how-to guides

概述​

集成详情​

模型特性​

设置​

凭证​

安装​

实例化​

调用​

流式、批量和异步​

支持的模型​

链式调用​

API 参考​

Related​

概述