百度蒸汽机2.0大模型上线,首次实现多人有声视频一体化生成,引领行业新变革。
8月21日消息,百度蒸汽机(MuseSteamer)音视频一体化模型今日完成2.0版本升级,首次在行业内实现多人有声视频的一体化生成。这一技术突破为内容创作提供了更高效、更智能的解决方案,标志着AI在多媒体生成领域的进一步深化。随着技术的不断演进,未来在直播、短视频、虚拟会议等场景中,此类模型或将发挥更大作用,提升用户体验与生产效率。
目前,百度蒸汽机的Turbo版、Lite版、Pro版以及全系有声版本已全面上线,用户可通过百度搜索“百度蒸汽机”或访问“绘想”平台进行体验。企业用户则可在千帆平台获取高性能的视频生成服务。
从官方获悉,2.0版本依托多模态时空规划、针对中文场景的深度优化以及音视频端到端建模等先进的技术能力,实现了多人音视频的统一生成、复杂的镜头调度、电影级别的角色细腻表现、多样化的镜头语言以及流畅的画质效果。
8月19日,百度发布声明表示,近期海外出现大量假冒的视频生成模型——百度蒸汽机(MuseSteamer)的虚假网站,提醒用户提高警惕,仔细辨别,谨防上当受骗。