Skip to main content
Open on GitHub

Docugami

Docugami 将商业文档转换为文档 XML 知识图谱,生成代表整个文档的 XML 语义树森林。这是一种丰富的表示形式,包含文档中各种块的语义和结构特征,作为 XML 树。

安装和设置

pip install dgml-utils
pip install docugami-langchain

文档加载器

请参阅用法示例

from docugami_langchain.document_loaders import DocugamiLoader