Skip to main content
Open on GitHub

MODEL_RATE_LIMIT

您已达到模型提供商在给定时间段内允许的最大请求数,目前被暂时阻止。 通常情况下,此错误是暂时的,您的限制会在一段时间后重置。

故障排除

以下方法可能有助于解决此错误:

  • 联系您的模型提供商,要求提高速率限制。
  • 如果许多传入请求相同,请利用 模型响应缓存
  • 如果您的应用程序允许,请将请求分散到不同的提供商。
  • 使用 rate_limiter 来控制对模型的请求速率。