AI于各种社群网路中的巧妙应用
2020-06-06

     AI於各種社群網路中的巧妙應用



全球资讯网(WWW)的诞生,让我们与世界更紧密的连结在一起。无论是平时生活中的脸书社群,电影界演员之间的合作关係、或者是专家学者们在学术论文的引用,如果我们把每一个人都设定成点(Node),人与人之间的各种关係视为边(Edge),那幺真实世界的网路经过视觉化呈现后,就会宛如人类大脑里神经元,神经元彼此之间连结时所构成的图像,看似一团混乱的网络,实际上存在着某种规律与秩序。

六度分离的世界

1967年,社会心理学家 Stanley Milgram,利用实体信件递交的方式,从Omaha到Boston,进行一场「小世界实验」。实验结果发现,在296实验对象中,有64人成功间接递交至目标,也就是说,人们平均只要透过6个人,就可以和另外一个人成功连结关係。除实体信件以外,网路网路中的各种社群网路的数据分析结果同样显示着小世界的存在,如E-mail、MSN、Facebook等。这些实验结果意味着小世界真的存在,平均只需4~6步就能够连结网路中的任意二人,且无关乎网路大小,他们存在于各种社群网路中,这隐含了资讯得以快速于社群网路中散播,也部分解释了当资讯是一种传染病,将很有机会快速且广泛地在全球扩散,其背后意义值得我们反思。

偏好依附法则

然而,如何解释社群网路从何而来?为什幺会具备小世界等性质?其实在AI快速发展之前,《新约圣经・马太福音》与老子的《道德经》,两本着作中就有揭露社群网路形成背后可能存在的法则。

《新约圣经・马太福音》第13章第12节:「凡有的,还要加给他,叫他有余;凡没有的,连他所有的也要夺去。」

老子《道德经》第77章:「天之道,损有余而补不足。人之道则不然,损不足以奉有余。孰能有余以奉天下,唯有道者。」

举例来说,新进一个社群网路的使用者倾向和朋友數多的人交朋友,像是网红效应与名人效应,在写论文时,我们引用的参考文献容易偏向是引用次數较高的論文,就如同经济学家 Herbert Simon 所說的「富者愈富」,因为人们不知不觉中遵从了「偏好依附法则」。基于偏好依附法则,我们透过新的小点汇集加入,点与点之间融合而转变成大的聚落,如此解释了社群网路的另一个重要性质「朋友数幂次法则」,即极少数人拥有很多朋友,多数人认识的人相对很少。

社群网路中的人工智慧

李政德老师展示他们在成大的资料工程与人工智慧实验室(DEAR Lab)应用人工智慧于社群网路的具体实例,可分为两大类,第一类是以人为主的社群网路 (Homogeneous Networks),典型AI于社群网路之应用,例如使用者标籤预测与分類、推荐系统、假新闻侦测、病毒式行销。第二大类万物皆可表示成网路 (Heterogeneous Networks) ,AI于其中之应用例如恐怖分子侦测、共享帐号侦测、个体行为侧写、感测环境保护。

以人为主的社群网路(Homogeneous Networks)

一、使用者标籤预测与分類
李老师团队所开发的此项应用,即是用已知社群网路中某些人的标籤,预测其他未知标籤者的标籤。例如下图,社群网路中有些使用者已确定罹患某疾病(蓝色),有些则确定未罹患该疾病(绿色),透过AI我们能够预测使用者6号到10号的黑点是否为罹病患者,基本概念是透过撷取社群网路各种使用者特徵(例如朋友拥有各种标籤之分布),佐以机器学习中的非监督式学习方法后,即可以精準的判断出哪些人确定罹患某种疾病,如图右所示使用者6、7、9被预测为没有罹患该疾病,使用者8与10则为罹病患者。

AI于各种社群网路中的巧妙应用

二、推荐系统
推荐系统主要是预测哪些「互动关係」在未來会发生,例如Facebook朋友推荐,AI系统可準确预测出,哪些人真的是你的朋友,但你还没有加他为好友,或者是你未来有机会能和这位朋友互动,其背后的基本想法是让机器去学习两位使用者为何会形成朋友关係,机器可能学到他们有许多共同朋友、经常出没在类似的地点等特徵。另一项与生活息息相关的例子,正是Netflix电影推荐,依据使用者平时观看哪些影片的历史纪录,佐以资料探勘中的协同式过滤方法,进而预测出使用者未来可能感兴趣的影片。

三、假新闻侦测
社群媒体中,假新闻流窜的频率越趋频繁,然而凭藉着人脑判断假新闻与否,是件相当困难的事。例如曾有一则新闻写着:「美国科罗拉多州的麦当劳餐厅,设置一个大麻吸食区」,透过常识判断,美国部分区域大麻合法化,因此这件事情看似很合理,会让很多人会相信这件事情是真的。根据研究显示,75%使用者会对假新闻信以为真。李老师团队所开发的AI系统,可以根据新闻扩散结构、新闻内容与用户回覆内容来侦测假新闻与否。AI学习到假新闻的线索可能包含较为浅短的社群网路扩散结构、试图让人信以为真的用字遣词、以及使用者对该新闻的情感随时间的变化。

四、病毒式行销
病毒式行销指的是公司透过免费试用品或折价券的行销手法,搭配招募具意见领袖效果的种子用户,在人际网路中进行向朋友推荐商品,也就是所谓的口碑行销,使得商品资讯于社群网路中扩散,最大化让对该商品感兴趣且有意愿购买的人,来达到促销商品的目的。李老师团队让AI介入病毒式行销的方式是从使用者过去贴文内容与分享历程中,学习出每位使用者感兴趣的商品主题,进而预测每位用户的社群影响力,即能吸引多少人前来购买该商品,让公司能在有限预算下,招募最有影响力的用户作为意见领袖,来最大化病毒式行销的效益。

万物皆可表示成网路(Heterogeneous Networks)

一、恐怖分子侦测
異常行为侦测想找出恐怖分子,必须先思考恐怖分子跟一般罪犯在行为上有何不同之处,换成另一种资料,在 IMDB电影网路中,知名女演员梅格莱恩(Meg Ryan)和其他女演员比起來有何特别之处?首先,我们要视觉化梅格莱恩社群网路,李老师团队透过AI去分析,区分出梅格莱恩的正常行为与异常行为,结果发现梅格莱恩这位女演员很喜欢演翻拍的电影,如果只凭藉肉眼观察,我们很难发现其中的差异。同理,在一个犯罪网路中,里面很可能夹带巨量且複杂的个体行为资讯,我们可以透过AI自动辨识出个体在网路中的异常行为,若一罪犯之行为与其他人比起来很不同,那幺他是恐怖份子的可能性应该不低。

二、共享帐号侦测
须付费线上多媒体服务如KKBOX与Spotify都有多人共享帐号的问题,以往我们只能以帐号的角度去分析使用者的喜好,进而推荐该帐号音乐,但一个帐号下若存在多位不同音乐偏好的使用者,将使得音乐推荐的使用者经验大幅下降。李老师团队透过AI从每一帐号之音乐聆听历程中,自动侦测哪些帐号有多人共享,预测一个共享帐号有几个人共享, 还可以即时侦测当前帐号是哪一位使用者,让AI在进行音乐推荐时,能精準地从使用者的角度做出推荐,甚至连该帐号其中一位使用者在不同情境下听音乐习惯都能学习到,做到兼具个人化与情境化的音乐推荐。

三、个体行为侧写
目的在于了解个体行为与个体间的互动,社群网路中的个体经常会有群聚现象,就如同每位使用者在家庭、大学同学、工作伙伴等不同社交圈,每个小圈圈群体内部通常会有较为紧密的社群互动,而群和群之间的互动关係则相对很稀疏且不频繁,透过AI找出哪些个体属于同一群体,可应用在各种类型的网路,带来不同的应用。譬如在人际网路中,我们可从群体中推估使用者喜好;在犯罪网路中,可从群体找出犯罪同伙;在股票共涨跌网路中,可推荐能带来获利的投资标的;在企业合作网路中,可了解公司间的竞合关係;甚至在大脑组织细胞网路中,AI可侦测大脑各功能部位。

四、感测环境保护
AI搭配网路结构,还可应用于环境保护。譬如给定某一城市的下水道网路(每个住家或工厂是点,地点间若存在下水道管线则彼此建立连结),以及歷史汙水扩散资料,我们可透过AI找出汙水感测器该设置在哪些地点,才能使得汙水能够在污染扩散到最大以前,能儘早被侦测到,让污水感测器能发挥最佳的效果。其基本想法是让AI根据地面上地点邻近区域的地点类型分布、地形地貌、人口分布状况等资讯作为特徵,来评估每一地点产生污染之机率,并同时从下水道网路中预测每一地点一旦被汙水流过所带来的扩散风险,两相结合预测地点搭建汙水感测器的效益。如此将可协助相关政府部门布设汙水感测网路,达到环境保护的目的。

(本文为教育部「人工智慧技术及应用人才培育计画」成果内容)


上一篇: 下一篇:

相关推荐