大公网

大公报电子版
首页 > 财经 > 香港财经 > 正文

商汤AI新应用 相片生成1分钟短片

2024-07-05 04:02:44大公报
字号
放大
标准
分享

  图:商汤AI新应用 相片生成1分钟短片

  【大公报讯】商汤(00020)昨宣布,推出首个向用户开放的可控人物视频生成大模型Vimi,基于商汤日日新大模型(SenseNova)的能力,一张照片可生成长达1分钟的人物短片,突破目前市面上只能生成3至4秒的技术。

  2024世界人工智能大会昨日上海揭幕,商汤推出的生成大模型Vimi成为大会最创新展品。

  目前,行业中80%短片都以人物为主要题材,加上短片、直播平台崛起,以人物为主体的短片需求大幅增长。Vimi的特点在于只需一张任何风格的照片,便能生成与目标动作一致的人物类短片,并支持多种驱动方式,包括通过已有人物影片、动画、声音、文字等元素进行驱动。

  目前,市场上有不少让照片中人物动起来的技术,惟仍然受制于多项因素,例如人物动作、表情动作无法精准控制,需要频繁输入多项“指令”,务求提升结果精准度。据介绍,Vimi可实现精准的人物表情控制,还可控制照片中人物上半身的自然肢体动作,并自动生成与人物相符的头发、服饰及背景变化。同时,光影变化亦能做到合理生成,让人物动作和视觉效果流畅自然。

  Vimi已在商汤网开放预约,将于今日商汤举办的“大爱无疆.向新力”人工智能论坛上披露更多细节。用户现可上传不同角度的高清人物照片,即可自动生成数字分身和不同风格的写真短片。

点击排行