您的当前位置:首页 > 百科 > 【google maps bangalore】智谱 AI 开源视频理解模型 CogVLM2 正文
时间:2024-09-07 21:57:53 来源:网络整理 编辑:百科
感谢IT之家网友 USER 的线索投递!IT之家 7 月 12 日消息,智谱 AI 宣布,训练了一种新的视频理解模型 CogVLM2-Video,并将其开源。据介绍,当前大多数的视频理解模型使用帧平均 google maps bangalore
感谢IT之家网友 USER 的智谱线索投递!
IT之家 7 月 12 日消息,开源智谱 AI 宣布,视频google maps bangalore训练了一种新的理解视频理解模型 CogVLM2-Video,并将其开源。模型
据介绍,智谱当前大多数的开源视频理解模型使用帧平均和视频标记压缩方法,导致时间信息的视频丢失,无法准确回答与时间相关的理解问题。一些专注于时间问答数据集的模型google maps bangalore模型过于局限于特定格式和适用领域,使得模型失去了更广泛的智谱问答能力。
▲ 官方效果演示智谱 AI 提出了一种基于视觉模型的开源自动时间定位数据构建方法,生成了 3 万条与时间相关的视频视频问答数据。基于这个新数据集和现有的理解开放领域问答数据,引入了多帧视频图像和时间戳作为编码器输入,模型训练出 CogVLM2-Video 模型。
智谱 AI 表示,CogVLM2-Video 不仅在公共视频理解基准上达到了最新的性能,还在视频字幕生成和时间定位方面表现出色。
IT之家附相关链接:
代码:https://github.com/THUDM/CogVLM2
项目网站:https://cogvlm2-video.github.io
在线试用:http://36.103.203.44:7868/
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。
暴雨引发山洪,武警某支队官兵连续奋战架通救援“生命之桥”2024-09-07 21:44
文字单机游戏:玩家必玩的十大游戏2024-09-07 21:26
免费文字游戏:探索游戏世界的新方式2024-09-07 21:15
11日短剧热度榜:《霍总新来的实习生好像是您夫人》第一,大盘6220万2024-09-07 20:46
美军重新部署装备 为加速升级的地区冲突对抗做准备2024-09-07 20:42
五款高人气免费文字游戏推荐2024-09-07 20:20
探索文字冒险的魅力:单机游戏精选推荐2024-09-07 20:10
新华三2023年国际业务营收增长 国际BG总裁黄智辉贡献不小2024-09-07 19:51
Libya's western2024-09-07 19:48
一月仅卖156瓶,听花酒继续赌天价2024-09-07 19:44
View of Nile River in Cairo, Egypt2024-09-07 21:29
果肉热量惊人 这种夏天顶流水果很多人没吃对2024-09-07 21:22
十款好玩的文字单机游戏排行2024-09-07 21:12
毕业典礼抽奖“苹果笔记本” 学生领到真苹果、真笔记本2024-09-07 21:09
中国驻菲使馆八问日本大使2024-09-07 20:51
网上免费玩的文字游戏合集推荐2024-09-07 20:50
网络单机文字游戏:免费试玩版推荐2024-09-07 20:16
英特尔酷睿 Ultra 7 258V 处理器跑分曝光,核显媲美英伟达 GTX 1650 移动独显2024-09-07 20:05
BiH work permits issuance up 21 pct in 20232024-09-07 19:38
DQ跨界:冰淇淋丢失的“高级感”汉堡来凑?2024-09-07 19:26