嵌入模型
嵌入模型 创建文本片段的向量表示。
本页记录了与各种模型提供商的集成,使您能够在 LangChain 中使用嵌入。
Select embeddings model:
pip install -qU langchain-openai
import getpass
import os
if not os.environ.get("OPENAI_API_KEY"):
os.environ["OPENAI_API_KEY"] = getpass.getpass("Enter API key for OpenAI: ")
from langchain_openai import OpenAIEmbeddings
embeddings = OpenAIEmbeddings(model="text-embedding-3-large")
embeddings.embed_query("Hello, world!")
所有嵌入模型
| Name | Description |
|---|---|
| AI21 | 这将帮助您开始使用 LangChain 的 AI21 嵌入模型。有关 AI21Embeddings 功能和配置选项的详细文档,请参阅API... |
| Aleph Alpha | 有两种使用 Aleph Alpha 语义嵌入的可能性。如果您有结构不同的文本(例如文档和查询),您会想要使用不对称嵌入。反之,对于结构相似... |
| Anyscale | 让我们加载 Anyscale Embedding 类。 |
| ascend | [[-0.00348254 0.03098977 -0.00203087 ... 0.08492374 0.03970494 |
| AwaDB | AwaDB 是一个原生 AI 数据库,用于存储和搜索 LLM 应用使用的嵌入向量。 |
| AzureOpenAI | 这将帮助你开始使用 LangChain 的 AzureOpenAI embedding 模型。有关 AzureOpenAIEmbeddin... |
| 百川文本嵌入模型 | 截至今日(2024年1月25日),百川文本嵌入模型在 CUB(中文多任务嵌入基准测试)排行榜上名列第一。 |
| Baidu Qianfan | Baidu AI Cloud 千帆平台是面向企业开发者的一站式大模型开发部署运营平台。千帆不仅提供文心一言(ERNIE-Bot)及第三方开... |
| Bedrock | Amazon Bedrock 是一项全托管服务,通过单一 API 提供来自 AI21 Labs、Anthropic、Cohere、Meta... |
| BGE 在 Hugging Face | HuggingFace 上的 BGE 模型 是最好的开源嵌入模型之一。 |
| Bookend AI | 让我们加载 Bookend AI Embeddings 类。 |
| Clarifai | Clarifai 是一个 AI 平台,提供从数据探索、数据标注、模型训练、评估到推理的全流程 AI 生命周期。 |
| Cloudflare Workers AI | Cloudflare, Inc. (Wikipedia)是一家提供内容分发网络服务、云安全防护、DDoS 缓解和 ICANN 认证域名注册... |
| Clova 嵌入 | Clova 提供嵌入服务 |
| Cohere | 这将帮助你开始使用 LangChain 中的 Cohere 嵌入模型。有关 CohereEmbeddings 的详细功能和配置选项,请参阅... |
| DashScope | 让我们加载 DashScope Embedding 类。 |
| Databricks | Databricks Lakehouse 平台在一个平台上统一了数据、分析和 AI。 |
| DeepInfra | DeepInfra 是一个无服务器推理即服务平台,提供对多种 LLM 和嵌入模型的访问。本教程将介绍如何将 LangChain 与 Dee... |
| EDEN AI | Eden AI 通过汇集顶尖的 AI 提供商,正在革新 AI 格局,使用户能够解锁无限可能,并发挥人工智能的真正潜力。通过一个全面且无忧的... |
| Elasticsearch | 讲解如何使用 Elasticsearch 中的托管嵌入模型生成嵌入 |
| Embaas | embaas 是一个完全托管的 NLP API 服务,提供诸如生成嵌入、文档文本提取、文档到嵌入等功能。您可以选择多种预训练模型。 |
| 虚假向量 | LangChain 还提供了一个虚假的向量类。您可以使用它来测试您的管道。 |
| FastEmbed by Qdrant | FastEmbed 由 Qdrant 开发,是一个轻量级、快速的 Python 库,专为生成 embedding 而构建。 |
| Fireworks | 这将帮助您开始使用 LangChain 的 Fireworks 嵌入模型。有关 FireworksEmbeddings 功能和配置选项的详... |
| Google Gemini | 使用 langchain-google-genai 包中的 GoogleGenerativeAIEmbeddings 类连接到 Googl... |
| Google Vertex AI | 这将帮助您开始使用 LangChain 的 Google Vertex AI 嵌入模型。有关 Google Vertex AI Embed... |
| GPT4All | GPT4All 是一个免费使用、本地运行、注重隐私的聊天机器人。不需要 GPU 或互联网。它提供流行的模型以及它自有的模型,如 GPT4A... |
| Gradient | Gradient 允许通过简单的 Web API 来创建 Embeddings,以及微调和获取 LLMs 的补全。 |
| GreenNode | GreenNode是一家全球性人工智能解决方案提供商,也是 NVIDIA 优选合作伙伴,为美国、中东和北非以及亚太地区的各类企业提供从基础... |
| Hugging Face | 让我们加载 Hugging Face Embedding 类。 |
| IBM watsonx.ai | WatsonxEmbeddings 是 IBM watsonx.ai 基础模型的封装器。 |
| Infinity | Infinity 允许使用 MIT 许可的 Embedding Server 创建 Embeddings。 |
| Hugging Face 上的指令嵌入 | Hugging Face sentence-transformers 是一个用于最先进句子、文本和图像嵌入的 Python 框架。 |
| IPEX-LLM: 在 Intel CPU 上本地运行 BGE Embeddings | IPEX-LLM 是一个 PyTorch 库,用于在 Intel CPU 和 GPU(例如带有 iGPU 的本地 PC、Arc、Flex ... |
| IPEX-LLM:在 Intel GPU 上本地运行 BGE 嵌入模型 | IPEX-LLM 是一个 PyTorch 库,用于在 Intel CPU 和 GPU(例如,本地 PC 的 iGPU,以及 Arc、Fle... |
| Intel® 扩展 for Transformers 量化文本嵌入 | 加载由 Intel® 扩展 for Transformers (ITREX) 生成的量化 BGE 嵌入模型,并使用 ITREX Neura... |
| Jina | 您可以在此处查看可用模型列表。 |
| John Snow Labs | John Snow Labs 的 NLP 和 LLM 生态系统包含用于大规模前沿 AI、负责任 AI、无代码 AI 的软件库,以及用于医疗... |
| LASER Meta AI 的激光语言无关句子表示嵌入集 | LASER 是由 Meta AI 研究团队开发的 Python 库,截至 2024 年 2 月 25 日,该库支持超过 147 种语言的多... |
| Lindorm | 这将帮助你开始使用 LangChain 的 Lindorm 嵌入模型。 |
| Llama.cpp | llama.cpp python 库是 @ggerganov |
| llamafile | 让我们加载 llamafile Embeddings 类。 |
| LLMRails | 让我们加载 LLMRails Embeddings 类。 |
| LocalAI | langchain-localai 是一个用于 LocalAI 的第三方集成包。它提供了一种在 Langchain 中使用 LocalAI... |
| MiniMax | MiniMax 提供文本嵌入服务。 |
| MistralAI | 这将帮助您开始使用 LangChain 的 MistralAI 嵌入模型。有关 MistralAIEmbeddings 功能和配置选项的详... |
| model2vec | Model2Vec 是一种将任何句子转换器变成非常小的静态模型的技术。 |
| ModelScope | ModelScope (主页 | GitHub) 构建于“模型即服务”(MaaS)的概念之上。它致力于汇聚来自人工智能社区最先进的机器学习... |
| MosaicML | MosaicML 提供托管推理服务。您可以使用各种开源模型,也可以部署自己的模型。 |
| Naver | 本 Notebook 介绍了如何开始使用 CLOVA Studio 提供的嵌入模型。有关 ClovaXEmbeddings 功能和配置选项... |
| Nebius | Nebius AI Studio 通过统一的接口提供对高质量嵌入模型的 API 访问。Nebius 嵌入模型将文本转换为能够捕捉语义含义的... |
| Netmind | 这将帮助你开始使用 LangChain 的 Netmind 嵌入模型。有关 NetmindEmbeddings 功能和配置选项的详细文档,... |
| NLP Cloud | NLP Cloud 是一个人工智能平台,可让您使用最先进的 AI 引擎,甚至可以用您自己的数据训练自己的引擎。 |
| Nomic | 这将帮助您开始使用 LangChain 的 Nomic 嵌入模型。有关 NomicEmbeddings 功能和配置选项的详细文档,请参阅 ... |
| NVIDIA NIMs | langchain-nvidia-ai-endpoints 包包含 LangChain 集成,用于构建使用 NVIDIA NIM 推理微服... |
| Oracle Cloud Infrastructure 生成式 AI | Oracle Cloud Infrastructure (OCI) 生成式 AI 是一项全托管服务,提供了一系列最先进、可定制的大型语言模... |
| Ollama | 这可以帮助您入门使用 LangChain 的 Ollama embedding 模型。有关 OllamaEmbeddings 功能和配置选... |
| OpenClip | OpenClip 是 OpenAI CLIP 的开源实现。 |
| OpenAI | 这将帮助您开始使用 LangChain 的 OpenAI 嵌入模型。有关 OpenAIEmbeddings 功能和配置选项的详细文档,请参... |
| OpenVINO | OpenVINO™ 是一个用于优化和部署 AI 推理的开源工具包。OpenVINO™ Runtime 支持多种硬件 设备,包括 x86 和... |
| 使用优化且量化的嵌入器嵌入文档 | 使用量化嵌入器嵌入所有文档。 |
| Oracle AI Vector Search: 生成嵌入 | Oracle AI Vector Search 专为人工智能 (AI) 工作负载而设计,允许您根据语义而非关键词查询数据。 |
| OVHcloud | 要使用此模型,您需要在 AI Endpoints 网站上创建一个新令牌:https://endpoints.ai.cloud.ovh.ne... |
| Pinecone Embeddings | Pinecone 的推理 API 可以通过 PineconeEmbeddings 来访问。通过 Pinecone 服务提供文本嵌入。我们首... |
| PredictionGuardEmbeddings | Prediction Guard 是一个安全、可扩展的 GenAI 平台,可保护敏感数据,防止常见的 AI 故障,并在经济实惠的硬件上运行。 |
| PremAI | PremAI 是一个一站式平台,可简化基于生成式 AI 构建的、功能强大的、可投入生产的应用程序的创建过程。通过精简开发流程,PremAI... |
| SageMaker | 让我们加载 SageMaker Endpoints Embeddings 类。如果您在 SageMaker 上托管自己的 Hugging ... |
| SambaNovaCloud | 这将帮助您开始使用 LangChain 的 SambaNovaCloud 嵌入模型。有关 SambaNovaCloudEmbeddings... |
| SambaStudio | 这将帮助您开始使用 LangChain 的 SambaNova's SambaStudio 嵌入模型。有关 SambaStudioEmbe... |
| 自托管 | 让我们加载 SelfHostedEmbeddings、SelfHostedHuggingFaceEmbeddings 和 SelfHost... |
| Hugging Face 上的 Sentence Transformers | Hugging Face sentence-transformers 是一个用于最先进的句子、文本和图像嵌入的 Python 框架。 |
| Solar | Solar 提供嵌入服务。 |
| SpaCy | spaCy 是一个用于高级自然语言处理的开源软件库,用 Python 和 Cython 编程语言编写。 |
| SparkLLM 文本嵌入 | 官方网站:https://www.xfyun.cn/doc/spark/Embeddingnewapi.html |
| TensorFlow Hub | TensorFlow Hub 是一个经过训练的机器学习模型库,可供进行微调并在任何地方部署。只需几行代码即可重用像 BERT 和 Fast... |
| Text Embeddings Inference | Hugging Face Text Embeddings Inference (TEI) 是一个用于部署和服务开源文本嵌入和序列分类模型的... |
| TextEmbed - Embedding 推理服务器 | TextEmbed 是一个高吞吐量、低延迟的 REST API,专为向量嵌入服务而设计。它支持广泛的 sentence-transform... |
| Titan Takeoff | TitanML 通过我们的训练、压缩和推理优化平台,帮助企业构建和部署更好、更小、更便宜、更快的 NLP 模型。 |
| Together AI | 这将帮助您开始使用 LangChain 对 Together 嵌入模型。有关 TogetherEmbeddings 功能和配置选项的详细 文... |
| Upstage | 本 Notebook 涵盖了如何开始使用 Upstage 嵌入模型。 |
| Volc Engine | 本 Notebook 将指导您如何加载 Volcano Embedding 类。 |
| Voyage AI | Voyage AI 提供尖端的嵌入/向量化模型。 |
| Xorbits 推理(Xinference) | 本教程将介绍如何在 LangChain 中使用 Xinference 嵌入。 |
| YandexGPT | 本指南将介绍如何在 Langchain 中使用 YandexGPT embeddings 模型。 |
| ZhipuAI | 本文将引导您开始使用 LangChain 的 ZhipuAI embedding 模型。有关 ZhipuAIEmbeddings 的功能和... |