9月25日,在2024百度云智大会上,百度智能云宣布将百舸AI异构计算平台全面升级至4.0版本。据官方介绍,为了解决算力资源短缺的问题,百舸4.0对“多芯混训”能力进行了重点升级,实现了在万卡规模集群上95%的多芯混合训练效能。集群部署环节,升级后的百舸能够实现工具层面的秒级部署,将万卡集群运行准备时间从数周最快缩减至1小时。百舸4.0全面升级了故障检测手段和自动容错机制,在万卡集群上实现了超过99.5%的有效训练时长。(36氪)
9月25日,在2024百度云智大会上,百度智能云宣布将百舸AI异构计算平台全面升级至4.0版本。据官方介绍,为了解决算力资源短缺的问题,百舸4.0对“多芯混训”能力进行了重点升级,实现了在万卡规模集群上95%的多芯混合训练效能。集群部署环节,升级后的百舸能够实现工具层面的秒级部署,将万卡集群运行准备时间从数周最快缩减至1小时。百舸4.0全面升级了故障检测手段和自动容错机制,在万卡集群上实现了超过99.5%的有效训练时长。(36氪)