Forge CLI是一款专为NVIDIA GPU内核开发设计的AI驱动代码编辑器与优化工具。它集成了智能性能分析、自动化基准测试和硬件感知的AI建议,能显著加速CUDA、Triton和PyTorch代码的编写、测试与优化过程,以实现极致性能。

适用于独立开发者。包含单GPU开发、无限性能分析与基准测试、CodeLens性能指标、GPU虚拟化、本地LLM支持,以及每月1个Forge积分。
适用于专业团队。包含免费版所有功能,外加GPU模拟器访问(50多种GPU型号)、多GPU对比(最多6个)、自然语言性能分析、每月10个Forge积分、无限自动补全、GPU优化建议以及优先电子邮件支持。
适用于大型组织。包含专业版所有功能,外加100+ GPU集群支持、数据中心优化、本地化部署、定制芯片支持、无限Forge积分、自定义模型微调,以及专属的24/7 SLA技术支持。
用于AI驱动内核优化的智能体积分。若性能未超越torch.compile(mode='max-autotune'),积分将退还。包含数据中心级GPU(B200、H100、H200)的访问权限。