正文引见的是ICLR2020当选舆论《INDUCTIVE MATRIX COMPLETION BASED ON GRAPH NEURAL NETWORKS》(鉴于图神经搜集的归结矩阵补全) 。作品来自华盛顿大学圣路易斯分校硕士、Facebook AI 接洽院接洽科学家张牧涵 。
文 | 张牧涵
编 | 丛 末
载入链接:https://openreview.net/pdf?id=ByxxgCEYDS
代码地方:https://github.com/muhanzhang/IGMC
1 摘 要
矩阵补全(Matrix Completion)被普遍运用于引荐体例中 。保守的矩阵领会(Matrix Factorization)本领为转导推导模子(Transductive Model),所进修到的embedding不许实行到演练会合未展示过的用户(user)和商品(item) 。而 Inductive Matrix Completion (IMC) 模子运用实质消息(content)来补全矩阵,缺陷是对实质的品质诉求很高,且在实质品质不好的情景下会引导远低于矩阵领会的本能 。
正文提出一种新的Inductive Graph-based Matrix Completion (IGMC) 模子,在维持归结推导(inductive reasoning)的同声,实足不借助任何实质消息 。能不借助实质消息完毕归结推导的诀窍就在乎子图构造 。IGMC为每一个(user, item) pair索取一个包括子图(enclosing subgraph),并用图神经搜集(graph neural network)演练一个由子图构造映照到用户对商品味分(rating)的回归模子 。
IGMC在多个数据集上博得了最进步的本能;它不只不妨实用于没在演练会合展示的用户和商品,更不妨迁徙(transfer)到新数据上 。咱们运用一个在MovieLens上演练的IGMC模子去猜测豆瓣影戏评阅,博得了特殊好的本能,以至好于很多特意在豆瓣数据上演练的模子 。
2 动 机
只有咱们把每个user或item看成一个节点(node),每个rating看成一个边(edge),则矩阵补全不妨看成是在二分图(bipartite graph)上的链路猜测(link prediction)题目 。各别于保守链路猜测只关心猜测生存性(link existence),这边咱们要猜测链路的值(link value),也即是用户对商品的评阅 。
开始,咱们设置包括子图(enclosing subgraph) 。对一个(user, item) pair,它们的h阶包括子图是由该user、 item,一切该user、 item的h-hop内连接节点(包括h-hop),以及一切那些节点之间的边构成的图 。如许的一个包括子图内生存洪量对于猜测评阅有效的消息 。举例来说,纵然只用一阶包括子图,咱们也不妨赢得比方用户平衡评阅、商品平衡评阅、商品累计评介度数,以及洪量的鉴于路途(path)等的构造消息 。加入图一 。
一个大略的鉴于路途的构造特性如次,假设咱们想领会用户u0对于商品v0的评阅,咱们不妨看有几何和u0品位一致的用户u1对v0打了高分;而品位一致不妨用能否这个u1和u0已经都给某个其它的商品v1打过高分 。归纳下来,如许的一个路途特性即为:
咱们不妨经过查有几何如许的路途来预算u0能否会给v0高分 。并且,一切如许的路途都被包括在一阶包括子图(1-hop enclosing subgraph)中 。
咱们断定一致如许的构造特性不计其数 。所以,与其手动设置洪量如许的开辟式特性(heuristics),不如径直将一阶包括子图输出给一个图神经搜集,用图神经搜集宏大的图特性进修本领来机动进修更通用的、更有表白本领的特性 。咱们运用图神经搜集演练一个由包括子图映照到评阅的回归模子,试验表明,这种新的本领不妨透彻地猜测评阅 。
3 方 法
索取每个包括子图后,咱们开始要对个中的节点举行标明(node labeling) 。手段是为了辨别子图中节点的各别脚色 。比方咱们要辨别目的节点(target user/item)和后台节点 (context nodes) 。目的节点标示出咱们究竟要猜测子图中哪一对(user, item)之间的评阅 。同声,咱们不妨辨别各别阶的街坊节点,比方一阶街坊(1-hop neighbors)和二阶街坊(2-hop neighbors)对目的节点的奉献水平并不沟通 。
咱们沿用了一个大略的做法,对目的用户(target user),咱们标明为0,对目的商品(target item),咱们标明为1;对i-hop的后台用户咱们标明为2i,对i-hop的后台商品咱们标明为2i+1 。之后,咱们将那些标明变化为one-hot encoding vector,动作每个节点的初始特性输出给图神经搜集 。
在图神经搜集(GNN)中,咱们沿用relational graph convolutional operator (R-GCN)动作卷积层,由于R-GCN不妨从边典型中进修 。
个中,代办节点在第层的特性向量, 和 为可进修的参数,代办rating(普遍从 中采用,代办与节点以典型边贯串的街坊节点 。
多层卷积后,咱们将每一层截止贯串获得每个节点的最后表白:
结果,咱们取目的用户和目的商品的贯串的表白动作这个包括子图的最后表白:
并演练一个两层神经搜集(MLP)从子图表白回归到目的评阅(rating) 。
推荐阅读
- 空气炸锅的工作原理 空气炸锅能炸什么
- 猕猴桃和苹果催熟原理
- 百度引流原理是怎样的?三个重点讲解
- 豆瓣小组引流是什么原理?教你使用方法
- 算命真的假的 四柱神煞:截路空亡作用于原理解秘
- 一个月收益30%的虚拟货币赚钱原理 虚拟货币怎么赚钱的
- 明矾净水原理
- 坎儿井的原理图 坎儿井
- mybatis懒加载和延迟加载 mybatis懒加载原理
- 消毒柜的原理与维修 消毒柜的原理