当前位置:首页 > 分类名称 > 正文内容

豆包:视频生成模型“VideoWorld”可仅靠视觉认知世界 现已开源

kokobe2025-02-10 17:43:07分类名称42

证券时报e公司讯,据豆包大模型团队消息,视频生成实验模型“VideoWorld”由豆包大模型团队与北京交通大学、中国科学技术大学联合提出。VideoWorld在业界首次实现无需依赖语言模型,即可认知世界。正如李飞飞教授9年前TED演讲中提到“幼儿可以不依靠语言理解真实世界”,VideoWorld仅通过“视觉信息”,即浏览视频数据,就能让机器掌握推理、规划和决策等复杂能力。团队实验发现,仅300M参数量下,VideoWorld已取得可观的模型表现。作为一种通用视频生成实验模型,VideoWorld去掉语言模型,实现了统一执行理解和推理任务。同时,它基于一种潜在动态模型,可高效压缩视频帧间的变化信息,显著提升知识学习效率和效果。

扫描二维码推送至手机访问。

版权声明:本文由zblogceshi发布,如需转载请注明出处。

本文链接:https://groovin-high.com/ceshi/I5DVFD.html

分享给朋友:

“豆包:视频生成模型“VideoWorld”可仅靠视觉认知世界 现已开源” 的相关文章

中国电科:30台套SiC外延设备顺利发货

证券时报e公司讯,2月9日,据中国电科官微消息,SiC外延设备是第三代半导体SiC器件制造的核心关键设备之一。装载着30台套SiC外延设备从中国电科48所园区顺利发货,这也是48所实现首次大规模批量发货。目前,该设备已成功出货百余台套,并在客户现场稳定运行。...

深蓝汽车宣布接入DeepSeek

证券时报e公司讯,深蓝汽车CEO邓承浩今日在深蓝汽车全场景智能驾驶解决方案发布会上表示,深蓝车机系统DEEPAL OS 3.0即将接入DeepSeek,预计一季度推送。...

中信建投:多家教育公司拥抱DeepSeek 有望加速AI教育产品商业化落地

证券时报e公司讯,中信建投研报认为,教育是AI应用落地的核心场景之一,AI技术通过降本增效使得教育兼顾高质量、普惠性和个性化成为可能,有望深度赋能教育提升交付效率以及提升学员个性化体验。目前AI教育应用主要场景体现在B端的教育信息化(如智慧教考、评测、批改等)、C端的智能硬件产品以及智慧应用(如写作...

早知道:证监会召开投资者座谈会;两部门发文深化新能源上网电价市场化改革

证券时报e公司讯,证监会召开投资者座谈会;证监会发布《关于资本市场做好金融“五篇大文章”的实施意见》;证监会:打通社保、保险、理财等中长期资金入市卡点堵点;金融监管总局:开展保险资金投资黄金业务试点;两部门发文深化新能源上网电价市场化改革;工信部:三家基础电信企业全面接入DeepSeek;春节假期居...

基金四季报映射投资动向 电子行业成增持宠儿

证券时报e公司讯,农历新年伊始,A股市场迎来一轮上涨行情。新年投资有哪些新动向?此前披露的基金四季报中已显现端倪。从整体规模来看,公募基金资产规模仍保持扩张态势。与此同时,主动偏股型基金在股票仓位与上季度基本持平的背景下,重点加仓了以电子、计算机为代表的科技板块以及高股息逻辑支持下的银行业。...

我国智能机器人产业企业数量超45万家

证券时报e公司讯,记者9日从市场监管总局获悉,据市场监管大数据中心数据显示,截至2024年12月底,全国共有45.17万家智能机器人产业企业,注册资本共计64445.57亿元,企业数量较2020年底增长206.73%,较2023年底增长19.39%,呈稳健上扬态势。...