什么是 Workers AI?
Cloudflare Workers AI 在全球边缘网络上运行 AI 模型推理——无需管理 GPU,自动扩缩,按请求付费。
一句话总结:Cloudflare Workers AI 在全球 300+ 城市提供无服务器 AI 推理,支持 Llama、Stable Diffusion、Whisper 等模型。
适合人群:需要低延迟无服务器 AI 部署的开发者。
核心功能
1. 预置模型目录
文本生成、嵌入、图像生成、语音转文字等。
2. 内置向量数据库
Vectorize 提供嵌入存储和查询。
3. AI 网关
路由、缓存、监控 AI API 调用。
4. 边缘部署
全球 300+ 城市 GPU 集群,P50 延迟 < 50ms。
常见问题
Q: 有免费层吗? A: 有,每天 10,000 neurons 免费。
Q: 和 AWS Bedrock 比较? A: Workers AI 边缘原生更低延迟,更简单,中小负载更便宜。