大公网

大公报电子版
首页 > 新闻 > 内地 > 正文

精益求精/“投餵”精准数据 提升AI“理解力”

2024-02-27 04:03:37大公报
字号
放大
标准
分享

  图:上海AI实验室领军科学家林达华演示文生视频技术。

  《千秋诗颂》中,无论是古代诗人策马奔腾的场景,还是诗人们围坐喝茶用的茶具,都再现了中国古代的国风意境。制作团队披露,为了让央视听媒体大模型准确理解“国风”、“唐代”等传统文化词汇,甚至具备理解古诗词的能力,节目导演与科研人员对大模型“投餵”了大量精准数据进行训练,使其可精确生成符合历史依据的人物、建筑、场景等美术图,美术风格符合中华传统文化的水墨、工笔等风格化传统审美。

  《千秋诗颂》集合了总台海量视听数据与上海人工智能实验室的技术优势,应用实验室视频生成大模型“书生.筑梦”、文生视频框架AnimateDiff及多项可控图像生成、图像驱动等技术。在央视听大模型中,输入多段视频或图片素材,即可自动生成转场动画,基于独创的主题一致性模块,央视听大模型生成的动画还可实现“多机位”效果,保持故事情节的连贯和起伏。

  为了更真实地呈现古诗词中的人物和故事,导演团队在创作中坚持以史实为基础,片中的建筑、酒具器皿、摆件等道具的创作依据源自博物馆现存文物及图片。运用人工智能相关技术,研究团队对这些文物进行动画复原,让文物“活”了过来。

  大公报记者马静

点击排行