AgentQLLoader
AgentQL 的文档加载器使用 AgentQL 查询从任何网页提取结构化数据。AgentQL 可跨多个语言和网页使用,且不易随时间和更改而失效。
概览
AgentQLLoader 需要以下两个参数:
url: 要从中提取数据的网页的 URL。query: 要执行的 AgentQL 查询。 在 文档 中了解有关如何编写 AgentQL 查询的更多信息,或在 AgentQL Playground 中进行测试。
设置以下参数是可选的:
api_key: 来自 dev.agentql.com 的 AgentQL API 密钥。可选。timeout: 请求超时前等待的秒数。 默认为900。is_stealth_mode_enabled: 是否启用实验性的反机器人规避策略。此功能可能并非在所有时间都适用于所有网站。启用此模式后,数据提取可能需要更长时间才能完成。 默认为False。wait_for: 在提取数据前等待页面加载的秒数。 默认为0。is_scroll_to_bottom_enabled: 在提取数据前滚动到页面底部。 默认为False。mode:"standard"使用深度数据分析,而"fast"则牺牲部分分析深度以换取速度,并适用于大多数用例。在此指南中了解有关模式的更多信息。 默认为"fast"。is_screenshot_enabled: 在提取数据前是否截屏。在 'metadata' 中以 Base64 字符串形式返回。 默认为False。
AgentQLLoader 是 使用 AgentQL 的 REST API 实现的。
集成详情
| Class | Package | Local | Serializable | JS support |
|---|---|---|---|---|
| AgentQLLoader | langchain-agentql | ✅ | ❌ | ❌ |
加载器功能
| Source | Document Lazy Loading | Native Async Support |
|---|---|---|
| AgentQLLoader | ✅ | ❌ |
设置
要使用 AgentQL Document Loader,您需要配置 AGENTQL_API_KEY 环境变量,或者使用 api_key 参数。您可以从我们的 Dev Portal 获取 API 密钥。