Skip to main content
Open In ColabOpen on GitHub

pymupdf4llm

PyMuPDF4LLM

PyMuPDF4LLM 旨在更轻松地以 Markdown 格式提取 PDF 内容,这对于 LLM 和 RAG 应用是必需的。

langchain-pymupdf4llm 将 PyMuPDF4LLM 作为 Document Loader 集成到 LangChain 中。

%pip install -qU langchain-pymupdf4llm
from langchain_pymupdf4llm import PyMuPDF4LLMLoader, PyMuPDF4LLMParser