盖世汽车获悉 日前,小米汽车正式推出Xiaomi Auto World Model全新框架,将三维重建与视频生成进行深度耦合。与传统“重建+生成”简单串联的路径不同,该框架让两者在结构上互相约束:重建侧提供几何锚点,为生成“打地基”;生成侧补全未观测区域,为重建“扩边界”,共同抑制长时序漂移。
世界模型被视为辅助驾驶的“大脑预演系统”,能够基于历史与当前观测,预测环境下一步演化,帮助车辆应对暴雨、落石、逆行等低概率高危场景。此前行业两条主流路线——重建与生成(能预测但易漂移)——各自存在短板。小米的一体化架构尝试将两者优势融合。
在技术实现上,重建模块WorldRec采用稀疏三维锚点表征,替代传统逐像素稠密高斯方法,通过多视角多时刻特征聚合与可见性加权融合,实现10秒视频重建仅需10秒。生成模块WorldGen经两阶段训练,仅需4步去噪、0.19秒生成一帧,支持最长1分钟视频,可模拟罕见动物闯入、极端天气等长尾场景。
据小米公布,该框架在Waymo、nuScenes等主流基准测试中全面取得SOTA。其中WorldRec在Waymo数据集上PSNR达28.48,超出此前最佳方法;WorldGen在nuScenes上FVD达64.97,单视角生成速度较同类自回归方法快约5.6倍。
目前该框架已在小米汽车三大场景落地:合成数据生成、仿真测试(闭环复现真实事故)、辅助驾驶学堂(已上线全车型实景模拟功能)。
声明:本网转发此文,旨在为读者提供更多资讯信息,所渉内容不构成投资、建议消费。文章内容如有疑问,请与有关方核实,文章观点非本网站观点,仅供读者参考。
「认养一头牛」冷藏系列第2款产品包装长这样!
近日,凌云创意公布其为「认养一头牛」产品——“冷藏牛乳”设计的包...
澳洲啤酒品牌Better Beer获2000万美
澳洲啤酒品牌BetterBeer近日宣布获得2000万美元融资。...
汤臣倍健发布2022年业绩报告,年营收达78.6
3月17日晚间,汤臣倍健发布2022年业绩报告。报告显示,202...
时隔14年换新标!可口可乐旗下GEORGIA咖啡
3月15日,可口可乐旗下的即饮咖啡(RTD,ReadytoDri...
用上3.0T直六发动机!马自达旗舰CX-90现身
网上曝光了一组马自达全新CX-90车型实车街拍图片。据悉,新车目...
宏碁推出掠夺者HermesDDR5-8000高频
,宏碁掠夺者HermesDDR5内存现已发布,16G*2套装标价...