本篇文章2487字,读完约6分钟
在首届“马兰山杯”国际音视频算法优化大赛颁奖仪式上,王新颖以绝对的特色获得了视频特定点跟踪的称号。照片由竞赛组织者提供
9月8日下午,首届“马兰山杯”国际音视频算法优化大赛颁奖仪式暨峰会论坛在马兰山举行。本次活动是网络岳麓峰会的重要组成部分。
前沿话题来自行业需求
马鞍山视频文创工业园凝聚了一大批音像相关公司。在普通人的印象中,音像领域属于文化创意的范畴,但实际上它的快速发展离不开科技的支撑。今年5月,园区与芒果电视联合举办首届“马兰山杯”国际音视频算法优化大赛,挑战音视频行业三大前沿课题,包括视频特定点跟踪、视频推荐、视频画质损伤修复。
这三个课题都是基于行业快速发展的需要而提出的。以视频特定点跟踪为例,就要处理广告投放的问题。这是一个困扰视频网站、广告商和观众很久的问题。
过去,视频网站会在故事片开始前插入一个补丁广告。选择花钱成为会员后,观众可以跳过这个广告,直接看剧情片。但是这种商业模式有一个缺陷,把广告主和受众放在了对立面。观众成为会员的比例越高,广告效果越差。这样一来,广告收入和会员收入就会呈现出结构性矛盾。
为了应对这一矛盾,视频网站选择用植入式广告取代植入式广告。植入式广告本身就是故事片的有机组成部分,比如综艺节目中的嘉宾饮料,电视剧中角色使用的手机,可以吸引相关的广告发布者。但是这种商业模式依赖于项目前期的投入,对于广告主来说是有风险的,就像投注一样。可能有广告商喜欢但观众不买的电视剧,也可能有广告商不喜欢但观众非常热衷的综艺节目。对于特别注重创新的新节目来说,这一点更加明显。有时候,一个好的想法是,因为没有“金爸爸”买单,所以只能封存在脑海里。
有什么办法可以保护受众免受补丁广告的痛苦,降低广告主的决策风险?去年2月,杨幂变脸和朱茵的视频在网上走红,提供了一个处理思路——既然视频中的动态脸可以替换,那么饮料可以换吗?可以换手机吗?招商前期即使没有广告,播出后反响也不错,广告主上门更换相应的企业品牌。要做到这一点,不可能逐帧挖掘地图。就业量太大,只能靠科技的力量让电脑自动取代。这就是行业对视频特定点跟踪的需求。
研究成果具有广阔的应用前景
“马兰山杯”的消息公布后,立刻吸引了一大批来自高校、科研院所、互联网公司的才女的关注。共有1294支队伍报名参赛,其中北京大学34支,清华大学25支,麻省理工等海外顶尖大学37支。
香港理工大学的曾辉博士和他的朋友组成了芒果小组,共同挑战视频图像质量损坏修复问题。曾辉导师从事图像质量行业研究十余年,发表多篇论文。在曾辉看来,科学研究的目的不仅是发表论文,而且是帮助处理实际问题。这些都是马兰山杯最吸引他的地方。他能走出实验室,了解行业的真实需求,这是他报名的重要原因。“本次竞赛题目中的图像质量压缩和噪声是业内经常出现的,这为我们提供了大量真实场景的经验,为以后的研究提供了数据支持。”
在曾辉看来,视频图像质量损伤修复的应用前景非常广阔。“国家高度重视4k超高清电视的快速发展,总局仅在6月份发布了《4k超高清电视节目制作技术实施指南(第一版)》。在政策特色和技术普及的背景下,相关应用场景和需求将大幅增加。”
视频质量损伤修复除了向前看,还可以向后看,可以用来恢复旧的图像数据。例如,曾辉说:“像一部经典的老戏,在4k超高清电视上播出会有问题,因为它需要再次修复。”《还珠格格》和《士兵突击》等经典,在再次与观众见面之前都经历过这样的修补。此外,旧图像的修复在保存历史记忆和继承以前传承的文化方面也起着重要作用。例如,20世纪80年代,湖南录制了湘剧、古画剧等地方戏的表演。但是由于当时的技术条件,这些视频像素低,噪音大,演员的面部表情和演唱细节看不清楚,这在很多粉丝心中是一种遗憾。复原后,这些戏剧素材的清晰度会达到更高的水平,对戏剧的传承起到重要作用。
出于这个原因,曾辉非常肯定地说:“可以说,视频图像质量损害修复对未来和过去都有丰富的实用场景。”
吸引算法人才加盟长沙
举办“马兰山杯”,除了应对行业的实际需求,还有一个重要的目的——吸引一批优秀的算法人才来长沙,加入网络行业的大潮。在论坛上,、罗、、王伟与芒果卫视签约,在趣味相投的大旗下正式成为“新长沙人”。
当记者看到王新颖时,湖南妹子姚婷立刻出现在他的脑海里。后者于8月入选华为“天才少年”项目,在网上引来不少好评。王新颖也是如此高学历的美女。从伦敦大学学院毕业后,她来到福州的一家公司做算法工程师。她对马兰山产生依恋是一种偶然。
王新颖在伦敦逗留期间学习了医学图像注册。目前医院有很多检测设备,如X线、b超、ct、核磁共振等。每台设备都能产生一个画面。有什么办法可以把这些不同设备产生的画面组合成一个大概的画面,从而更好的评价状况?医学图像配准就是为了处理这个问题。
看到“马兰山杯”这个话题后,王新颖敏锐地观察到,视频特定点跟踪问题可以通过医学图像配准来解决。其本质是利用数学中空的几何变换原理将视频的第一帧的目标映射到后续的每一帧。所以她单独组建了一个炒年糕团队参加比赛,以mse0.588的绝对特征夺冠,也就是说用她的算法,平均坐标点的像素误差可以控制在1像素以内。
从不同行业传递专业信息,王新颖的方法让比赛的组织者眼前一亮。她告诉记者:“我不一定比其他选手强。突破的关键可能是敢于打破固有的思维模式,灵活思考应用,尝试跨行业整合。”
王新颖是这样一个敢于尝试新事物的姐姐。长沙对她来说是一个完全陌生的城市,视频领域对她来说是一个很少接触的行业。在主办方的诚挚邀请下,她终于决定离开福州,加入长沙网络产业的怀抱。谈到她为什么来长沙,她说:“有趣是最好的动力。我参加比赛是因为对这个项目感兴趣,学的是技术。人工智能和音视频的结合,就是一望无际的星辰大海。长沙给了我这样一个在有趣的算法海洋里乘风破浪的机会。”
罗因为兴趣来到长沙。他不是一个训练有素的人,他通过这场比赛说明了自己的实力,得到了自己梦想中的算法位置。他鼓励越来越多的年轻人:“不要轻易放弃,一次又一次的爱,总有一天我们可以在马兰山相聚。”
标题:[本地]马栏山上绽放智能之花
地址:http://www.chengxinlibo.com/csxw/16800.html