1、深度学习
近几年深度学习技术的快速兴起与发展掀起了人工智能的新一波浪潮,因其具备强大的特征提取与表示能力,被广泛地应用在处理语音识别、计算机视觉和自然语言理解等领域的任务上,并取得了巨大的成功。已有不少的研究表明,将深度学习应用于推荐系统中同样可以取得不错的效果,因此将深度学习与推荐系统结合是当前推荐系统研究的最热门的话题。
目前关于深度学习与推荐系统结合的已有研究主要围绕在以下三个层面:
(1)提升表征学习能力:传统的推荐方法中使用One-Hot编码方式来对商品和用户进行编码,尽管这种编码方式有着简单易实现的优点,但却无法体现商品与商品之间、用户与用户之间的各种联系。自从Word2vec被提出并在NLP领域取得巨大的成功后,利用深度学习技术从复杂的内容数据中学习出有效的隐因子特征表示也被应用到了推荐系统中。
(2)深度协同过滤:经典的矩阵分解模型可以被描述为一种非常简单的线性模型,而神经网络具备非线性表示能力,我们可以通过深度学习来拓展其中的结构,引入更多的非线性单元来加强推荐模型的表示能力。
(3)特征间的深度交互:传统的推荐系统为了尽量提高模型的准确性,往往会由工程师手动将一些特征组合在一起来判断用户的偏好等,这有很大的局限性。神经网络可以自动学习高阶的特征交互模式,弥补人工带来的种种局限。
几个当前的研究热点包括:
(1)效率与可拓展性:神经网络的计算量十分庞大,而推荐系统因实时性的要求需要在短时间内完成对大量数据的处理,因此如何将它们更高效地应用在超大规模的推荐平台上,是亟需解决的技术难点。
(2)多样化数据融合;现实网络平台上的数据是多种多样的,关于物品会有语音、图像、文本等数据,而关于用户又有浏览、购买等数据,如何将这些多样的数据融合到一个模型中使它们共同发挥作用产生推荐具有重要意义。
(3)捕捉用户长短期偏好:深度学习中的RNN、LSTM等模型可以捕捉时序信息,将它们应用到推荐中可以用来捕捉用户的长短期偏好,进而结合用户长短期偏好产生推荐。
2、强化学习
继深度学习被应用于推荐后,强化学习也被应用到了推荐任务中。因在诸多现实场景中,例如电子商务或者在线新闻平台,用户与推荐系统之间往往会发生持续密切的交互行为,强化学习中的Reward机制十分适合应用到这种模式,所以基于强化学习的推荐方法中,往往会把推荐系统看做智能体(Agent)、把用户看做环境(Environment),商品的推荐问题可以看做经典的顺序决策问题。Agent每一次排序策略的选择可以看做一次试错(Trial and Error),把用户的反馈、点击成交等作为从环境中获得的奖赏。
3、可解释性
前面所述的研究大都将重心放在提高推荐准确性上,与推荐对象的沟通考虑得不够。近期,学者们开始关注推荐是否能够以用户容易接受的方式,充分抓住用户心理,给出适当的例子与用户沟通,即告诉用户为什么给他推荐这个物品。研究发现,这样的可解释性系统不仅能够提升系统透明度,还能够提高用户对系统的信任和接受程度 、用户选择推荐产品的概率以及用户满意程度。例如当系统向用户推荐一本书却不附加任何解释信息时,可能很难引起用户的兴趣。但如果系统在推荐这本书的时候附加上推荐这本书的原因是“这本书是您的朋友XXX写的”或者“这本书与您近期阅读的《XXX》相似”时,则有更大的概率激起用户的兴趣,提高推荐的转化率。
目前,学者在推荐系统的可解释性上做出的研究主要可以概括为以下三个方面:
(1)利用知识图谱增强算法解释能力。知识图谱作为可读性高的外部知识载体,给提高算法解释能力提供了极大的可能性。
(2)模型无关的可解释推荐框架。目前可解释推荐系统大多是针对特定的推荐模型设计,可拓展性较弱,对于新兴的推荐模型,例如含有深度神经网络的复杂、混合模型的解释能力还不够。
(3)结合生成模型进行对话式推荐。目前的推荐解释往往形式是预先设定、千篇一律的,这样尽管也能根据用户心理举出一些例证,但是在沟通方式上还过于呆板。
4、推荐结果的多样性和公平性
如果我们在推荐中,只考虑推荐的准确性,那么方法很容易就陷入“信息茧房”。例如某个用户在Netflix上观看了一部喜剧片,如果推荐系统缺乏推荐的多样性,那么接下来向这位用户推荐的内容将会全部都是喜剧片,但很有可能这个用户不仅喜欢喜剧还会喜欢悬疑片,如果只推荐喜剧无疑会带来不好的用户体验与较低的推荐转化率。
至于推荐的公平性,是一个暂时没有具体的衡量标准问题。一个比较典型的例子是前段时间网上的一则新闻,大概内容是某求职网站给企业雇主推荐应聘者时,推荐的结果中全是男性的应聘者,而没有女性的应聘者,这便是推荐不公平的一种体现。