中昊芯英新一代 TPU 芯片「须臾」现已发布,其单芯片混合精度浮点算力高达 896 TFLOPS,性能较前代「刹那」芯片提升了三倍。该芯片的 8-bit 推理算力可达 1792 TOPS,能够满足大规模词元处理和高并发推理的需求。与前代相比,「须臾」在显存容量和芯片内部互联速率方面均有显著增强,并支持超长上下文处理。单卡额定功耗为 600W,相较于传统算力芯片,功耗降低了 50%,为绿色数据中心的构建贡献力量。
值得注意的是,「须臾」芯片的 IP 核、专用指令集、底层算子加速库以及整体系统软件均由中昊芯英自主研发,不依赖任何海外核心技术,能够满足政务、金融、电网等行业在安全和合规方面的严格要求。
此外,中昊昊芯英还推出了高性能智算平台「泰则 2.0」。该平台是标准化的最小计算单元,集成了两颗高性能 CPU 处理器和八片高性能 TPU 处理单元。从物理形态上看,「泰则 2.0」由一台通用 CPU 服务器外接一台高性能 TPU 算力加速设备构成,总算力达到 7.168 PFLOPS(混合精度)。在同等任务处理下,该平台的整体能耗仅为传统 GPU 服务器的 80%。
在软件层面,「泰则 2.0」平台实现了对所有主流 AI 框架的兼容,原生支持 PyTorch、vLLM、SGLang 等开发工具。在训练方面,它适配了 DeepSpeed 和 Megatron-LM 等分布式套件。目前,「泰则 2.0」已深度适配了包括 Qwen 全系列、DeepSeek、GLM、MiniMAX 在内的数十款大语言和多模态模型,使开发者能够高效地完成模型迁移工作。