李泽言高光片段头像

对于直播高光时刻,不同场景不同垂类直播的高光定义不同,如秀场直播,将直播中主播唱歌、跳舞、搞笑聊天、互动性好等直播片段定义为高光时刻;游戏直播,将游戏直播中的各种击杀事件(三杀、四杀、五杀等)、各种击杀程度(锋芒必露、横扫千军等)以及助攻死亡等定义为高光片段;电商直播,将带货直播中主播介绍商品的片段定义为高光片段。另外,根据不同垂类的特点还将进行多个高光片段的卡点混剪,形成高光集锦,如游戏直播,将多个击杀事件和击杀程度混剪成一个完整的精彩击杀集锦。

如前面介绍,不同垂类直播的高光瞬间的定义不同,所以,针对不同垂类直播,分别利用不同的语音、视觉等多模态AI技术对直播内容进行理解分析,初步识别直播的高光片段,如才艺类直播则识别直播切片中是否在唱歌、跳舞等,语言类直播则识别是否有语音、有互动、直播氛围良好等,游戏类直播则识别击杀、助攻和死亡等,再根据直播垂类类别进行直播高光片段的粗裁聚合,将相同垂类且相邻的高光片段聚合在一起,形成各个垂类直播的粗裁高光片段。

如前所述,直播垂类众多,不同垂类的高光定义不同,所需的高光识别技术和创作方式不同,所以直播高光智能成片方案是以图像识别、音频识别和检测等人工智能技术,设计开发了直播垂类划分(分类)、高光片段识别(粗裁)、高光片段剪辑(精裁)、智能视频创作(智创)四个阶段的智能处理流程,实现一站式全自动智能高光成片。

快手直播的玩法多种多样,使得直播内容也是非常丰富多样,这就会造成粗裁高光视频片段通常会含有各种非高光成分,如上面粗裁视频片段中,包含了背景音乐、主播说话、唱歌片段为放着原唱而不是主播自己唱的非高光内容。针对各垂类的粗裁视频片段的非高光问题,我们利用音频事件检测、原唱检测、跨模态检索、人脸识别、唇动检测等多模态音视频技术进行精细化裁剪,即精裁处理,得到精确的直播高光瞬间的时间边界信息,有效去除原唱、长留白等非高光成分。

然而镜头切换到惠英红时,她忙着整理文件,懒理赵樱子,可能在老前辈看来,她所谓的“高光”不过是很普通的片段而已,没什么大不了的。

      打开APP搜你想看,本站所刊载图文之著作权归快看漫画官方和快看漫画用户所有,内含官方内容和快看社区用户编辑内容,非经本站授权许可,禁止转载。