原方案发起真实推理请求(需 16~20s),经 Cloudflare 代理时触发超时。 改为查询模型列表端点(毫秒级),同时验证连通性和 API Key 有效性, 并显示该厂商的可用模型列表(兼容 Ollama / OpenAI 格式)。