每天通过互联网上传的视频、图片、文字数据,用“海量”描绘毫不为过——超越15亿条,并且还在呈数量级增加。
将其间触及恐惧、暴力、色情等违法违规内容过滤出来,使其不污染、要挟网络空间,曾经靠的是人工审阅,现在人工智能(AI)开始走上舞台。
21日,由我国互联网协会和阿里巴巴等一起举行的“2018网络安全生态峰会”在北京开幕。AI在助力网络内容安全上扮演的重要人物成为此次峰会的热门议题之一。
能够说,面临海量互联网数据,用人工智能进行互联网数据的管理,是一个不得不做出的选择。
“比较AI技能,现有的人工审阅办法无论是本钱仍是功率都处于明显劣势。”我国互联网协会在此次峰会上发布的《AI技能赋能网络内容安全保证研究陈述》(以下简称《陈述》)称。
依据《陈述》,人工智能已经在网络文本内容检测、文本分类技能、视频和图片内容辨认、语音内容检测等方面发挥重要作用。
例如,阿里巴巴开发的云盾内容安全体系能够根据深度学习技能,供给文字、图片、视频等多媒体的内容危险智能辨认效劳,有用削减触及恐惧、暴力、色情等违法违规信息。
国家互联网应急中心高级工程师徐杰介绍,传统的网络安全管理办法触及人工建模和提取特征,也就是描绘某个事物,并构成特征向量。越是杂乱的事物,特征向量的杂乱程度就越呈指数增加。
“AI技能,特别是近期比较火的深度学习技能,为我们处理这些问题供给了新的可能。”徐杰说,由于深度学习技能不再需求人工去描绘事物的特征,而是直接把相关事物的图片或视频交给机器去学习,由机器自己树立模型。
阿里巴巴集团资深算法专家薛晖以为,除了以上优势,AI技能也增加了网络内容管理的可靠性。由于,人工审阅的经历因人而异,并且这种经历较难传承,可是AI技能无论是模型仍是数据都更简略被继承。
还需求愈加靠谱
虽然AI在保证网络内容安全方面已显出种种优势,但作为一种新式的科技手法,不免还有许多缺乏。
“AI自身还有一些问题,比如说AI很大程度上根据模型和算法,而模型和算法自身具有脆弱性。”移动安全联盟秘书长杨正军说,如果其模型和算法遭受进犯,就会失效。别的,AI是根据海量数据进行练习,假设数据遭到污染,或被进犯者获取,结果也无法想象。
来自科大讯飞的技能专家李剑锋则以为,AI在网络内容管理方面存在的最大挑战,是现在AI的才能还有待提升。
李剑锋举例说,有用户发微博表达心境,内容是“黑夜总会过去,白日总会到来”。这句话重复发不出来,该用户百思不得其解。后来有朋友提醒他,是由于其间出现了“夜总会”。
“现在我们用AI技能,哪怕是一个十分简略的技能也很难做到100%正确。”李剑锋解说说,由于现在的机器学习归于统计学机器学习,包含深度学习、神经网络在内都是根据概率论,理论上不能保证100%正确。