AI 无上限。
所谓“生肉”,即未经翻译操作、无字幕的纯视频;相对应的,就是已添加字幕、可直接下载观看的视频节目。很多资深影迷常因为影片出炉后无字幕,而无法享受及时的观影体验。如果存在一款可以直接翻译视频的工具呢?
网易人工智能旗下的“网易见外”平台在AI技术加持下,支持一键生成双语字幕。用户可以浏览海外热门短视频,通过人工智能听写英文、同步翻译成中文。也可以自己上传中/英文短视频进行翻译,一般等上3-4分钟,机器就能把一段20分钟左右时长的视频翻译完成。
2018年伊始,网易见外再一次公示新动作——与人人影视(字幕组)签订战略合作,并与立青映画(欧洲电影)、迪幻字幕组(迪士尼)、松鼠字幕组(英剧)签订深度合作计划。
网易见外方面人士对雷锋网表示,四家字幕组将使用网易见外来为视频翻译字幕,此举可达到节省听写、翻译和切轴环节的效果,只需要进行人工校对便可,可以让剧集字幕更早上线,也可以提高产出、节省人力成本。对于公益性字幕组来讲,人力资源方面更为珍贵。
网易见外方面表示,虽然均是与字幕组合作,但与人人影视(字幕组)签订合作的不同之处在于,人人影视自己在开发一款名为“人人译视界”的字幕协作翻译平台,将和网易见外进行产品级的合作,见外把AI视频翻译的API接口开放给人人译视界,人人译视界上的众包译者只需要校对完成字幕,不需要重新翻译,而校对好的字幕回传给网易见外,进一步提升人工智能的精确性。
技术支撑与差异化竞争点
据雷锋网了解,技术方面,网易见外主要由三大核心技术支撑:
1.NMT神经网络机器翻译;
2.智能语音识别转写文字;
3.自动解析语音并即时切分时间轴
通过视频听翻功能,等待翻译完成便可获得精准切分时间轴的双语字幕,其主要应用场景包括电视台、视频网站、字幕组等机构为视频添加字幕或翻译。
另一项功能为直播听翻,即在上方区域可实时获得经过智能断句的中文文字内容,下方区域可实时获得对应的英文翻译内容。应用场景包括同声传译、直播字幕、会议速记等。
网易机器视频翻译负责人Robin 对雷锋网表示,网易见外是国内首个集成语音识别、机器翻译、智能断句、字幕生成全维度功能并同时满足直播和录播视频翻译场景的产品,具备显著的差异化竞争优势。
具体包括:
功能差异:产品接口提供语音听写、自动切轴、视频翻译校对等全流程服务,能快速满足视频行业相关客户的翻译需求;
服务差异:提供视频听翻全套API定制接口,能够快速接入并实现功能;
语种差异:专注于中英翻译,在中文识别和中译英领域,准确度优于竞品。
实际上,据雷锋网了解,国内外已有不少厂商深入挖掘视频翻译技术,包括微软Skype Translator、Google Word Lens、中译语通的字幕通等。对此,Robin对雷锋网表示,友商有的是针对单词打时间戳,有的只能一段段识别、无法切分或断句,而网易见外可以针对视频、在一分钟内切分出几句话,“是首个针对视频产品做出差异化和优化的公司。”Robin表示。
进化与布局
据雷锋网了解,作为网易人工智能旗下神经网络机器翻译产品,网易见外在汇集海外资讯的基础上,实现视频的高精度语音识别与即时翻译功能,能够一键生成双语字幕,并自动压制在视频中。
而其视频翻译功能,主要体现在上传视频之后,通过AI自动完成字幕听写、翻译和时间轴切分等最耗时的环节,可以在平台上进行人工校对后,自动把字幕压制在视频里,便于批量制作字幕,降低人力成本,提高产出效率。
商业模式上,该产品负责人对雷锋网称,网易见外会结合语音识别 、切轴等一系列技术,提供视频即时翻译服务,也可以同步添加字幕,应用到电视台采访、电影字幕、智能录音笔功能。未来也会针对听力障碍人群,提供视频字幕服务等。
据了解,网易见外产品于2017年5月份开始规划,基于当时人工智能正处于最火热元年的大背景。
但实际上,早在2011年,网易即成立感知与智能中心部门,系网易人工智能事业部前身,主要为网易提供人工智能技术方面的支撑,包括提供给有道的翻译技术、提供给例如大话西游等游戏部门的语音识别技术、提供给云音乐部门的AR技术等。
网易人工智能事业部从去年独立为网易一级事业部后,从纯粹技术支持的公共基础支撑定位,转变为业务部门。