文档加载器
先决条件
文档加载器旨在加载文档对象。LangChain 拥有数百种与各种数据源的集成,可从 Slack、Notion、Google Drive 等加载数据。
集成
您可以在文档加载器集成页面上找到可用的集成。
接口
文档加载器实现了BaseLoader 接口。
每个文档加载器都有其特定的参数,但都可以通过 .load 方法或 .lazy_load 以相同的方式调用。
这是一个简单的例子:
from langchain_community.document_loaders.csv_loader import CSVLoader
loader = CSVLoader(
... # <-- 此处为集成特定参数
)
data = loader.load()
API Reference:CSVLoader
在处理大型数据集时,您可以使用 .lazy_load 方法:
for document in loader.lazy_load():
print(document)
相关资源
请参阅以下资源以获取更多信息: