/
## 📊 Rate Limits 詳細解釋
### 什麼是 Rate Limit?
Rate limit = 同一時間允許的並發請求數量
**例子:**
- 假設限制是 **10 個並發**
- 你可以同時發 10 個請求
- 第 11 個請求會被擋住,直到有請求完成
### 你的情況
1. **GLM-4-Flash(免費試用)**
- 標準限制:例如 10 個並發
- 超過 8K 上下文:限制降到 **1%**(0.1 個並發)
- **結果:** 超過 8K 的請求基本上被擋住,速度極慢
2. **GLM-4(付費)**
- 限制通常比較高(例如 50 個並發)
- 不受 8K 限制影響
3. **GLM Coding 用戶**
- 看套餐福利,可能有特殊限制
### 🎯 實際影響
**如果你的上下文 < 8K:**
- 正常速度
- 可以同時發多個請求
**如果你的上下文 > 8K:**
- 速度極慢(1% 限制)
- 基本上無法使用
**建議:**
- 保持上下文在 8K 以下
- 或者升級付費方案獲得更高限制
發佈留言