您的位置:首页 > 热点 >

智元发布全国首个通用具身基座模型ViLLA,开启具身智能新纪元

时间:2025-03-10 14:26:41     来源:盖世汽车  阅读量:8710  

2025年3月10日,国内人工智能领军企业智元科技在北京国家会议中心正式发布quot;智元启元大模型quot;,这是我国首个面向复杂物理世界的通用具身智能基座模型。该成果突破性地提出quot;Vision-Language-Latent-Action(ViLLA)quot;融合架构,标志着中国在通用人工智能领域取得重大技术跃迁。

重构人机交互范式 ViLLA架构实现多模态深度融合

区别于传统单模态大模型,启元模型通过三层异构神经网络构建感知决策闭环:视觉模块采用动态注意力机制处理环境信息,语言引擎集成多轮对话上下文记忆,而独创的Latent Action空间则将抽象指令转化为可执行的动作序列。在测试中,模型展现出跨场景任务迁移能力——面对quot;整理杂乱书桌quot;指令时,系统能自主规划路径、识别物品类别并完成精准抓取摆放,全程无需人工干预。

全场景落地加速 智能终端迎来革命性升级

基于启元基座开发的具身智能终端已进入规模化测试阶段。在工业质检领域,搭载该模型的机械臂可将零件缺陷识别准确率提升至99.7%,同时将操作效率提高3倍;智能家居系统中,家庭服务机器人可通过三维语义理解实现quot;擦桌子时避开装饰品quot;等精细化动作。更值得关注的是医疗护理场景,经过专业数据训练的机器人已能协助完成导诊分诊、康复器械操作等专业任务,为老龄化社会提供解决方案。

产学研联动构建生态壁垒

智元科技联合清华大学、中科院自动化所等机构成立quot;具身智能联合实验室quot;,计划年内开放百万级参数级的开源训练框架。公司CEO李峰透露:quot;我们将持续投入超20亿元研发资金,年内推出支持多国语言、适配主流硬件的开发者套件,与合作伙伴共建具身智能产业生态。quot;随着国家quot;新一代人工智能发展规划quot;的深入推进,智元科技此次突破或将加速我国在通用人工智能赛道上的国际竞争力。

声明:本网转发此文章,旨在为读者提供更多信息资讯,所涉内容不构成投资、消费建议。文章事实如有疑问,请与有关方核实,文章观点非本网观点,仅供读者参考。

精彩阅读