如何搭建个性化推荐系统?【进阶篇】- 上下文感知系统

1 上下文感知推荐系统概述

本节首先对传统推荐系统进行概述,然后介绍上下文感知推荐系统的形式化定义,最后对面向过程的上下文感知推荐系统进行描述。

1.1 传统推荐系统

推荐系统涉及认知科学、逼近论、信息检索、预测理论、管理学以及消费者决策模型等众多学科,但是直到 20 世纪90 年代中期出现关于协同过滤技术的文章,才作为一门独立的学科得以系统研究。推荐系统通过建立用户与项目之间的二元系,利用已有的选择过程或相似性关系挖掘每个用户潜在感兴趣的对象,进而进行个性化推荐。从信息过滤角度,推荐系统常被分为以下几类:

  • (1) 协同过滤(collaborative filtering):源于“集体智慧”的思想,利用当前用户或者其他用户对部分项目的已知偏好数据来预测当前用户对其他项目的潜在偏好,或者利用部分用户对当前项目或者其他项目的已知偏好数据来预测其他用户对当前项目的潜在偏好;又可以分为启发式方法和基于模型的方法:前者需要计算用户(或者项目)之间的相似度,后者利用已知用户偏好学习一个模型为活动用户或者活动项目进行偏好预测。
  • (2) 基于内容的过滤(content-based filtering):首先由系统隐式地获取或者由用户显式地给出用户对项目属性的偏好,然后通过计算已知用户偏好和待预测项目的描述文档(由项目属性刻画)之间的匹配度(或相似度),最后按照偏好排序结果向用户推荐其可能感兴趣的项目;同样,可分为启发式方法和基于模型的方法。
  • (3) 混合式过滤(hybrid filtering):按照不同的混合策略(如加权、切换、混合呈现、特征组合、串联、特征扩充、元层次混合等)将不同推荐类型或推荐算法进行组合并生成推荐。

1.2 上下文感知推荐系统的形式化定义

从学科渊源来看,上下文感知推荐系统既是一种推荐系统,也是一种上下文感知应用系统。Adomavicius 和Tuzhilin 等人较早指出,把上下文信息融入推荐系统将有利于提高推荐精确度,并提出被广泛引用的“上下文感知推荐系统(context-aware recommender systems)”的概念。他们将传统的“用户-项目”二维评分效用模型u:Users×Items→R 扩展为包含多种上下文信息的多维评分效用模型u:D1×…×Dn→R或者R:User×Context×Item→Rating(如,用户a 在上下文x,y 下对项目i 的偏好为5,可表示为a×x×y×i→5)。那么,上下文感知推荐系统被形式化为:假设Dj1,…,Djl(l<n)为待预测偏好的目标维度空间,Di1,。。。,Dik(k<n)为推荐结果维度空间,且当前{Dj1,…,Djl}∩{Di1,。。。,Dik}=∅,效用函数u(⋅)用于计算用户在多维度上下文条件下对项目的偏好,那么上下文感知推荐系统就是为dj1,…,djl 找到偏好值最大的那些元组di1,。。。,dik,如公式:

此外,还有学者提出“Contextual Recommendation”和“Context-Aware Recommendation”等概念,或利用本体和面向服务计算理论表示CARS 的形式化模型,在输入、输出数据和功能模块等方面展开初步研究。

1.3 面向过程的视图

上下文感知推荐系统作为一种典型的推荐系统,应当遵循传统推荐系统的流程,但更应着重研究如何将上下文信息引入个性化推荐过程。纵观目前的研究工作,我们将上下文感知推荐系统流程归纳为以下4 个阶段:

  • (1) 数据采集:收集用户、上下文、项目、用户评分、用户行为、上下文关联的用户行为记录等相关数据;
  • (2) 用户偏好提取:分析影响用户偏好提取的各种因素及其影响程度,采用有效手段提取用户偏好;
  • (3) 上下文感知推荐生成:基于部分已知用户偏好预测用户、上下文、项目之间的潜在偏好,结合当前上下文信息生成推荐结果;
  • (4) 评价与自适应改进:采用合适的效用评价指标对推荐效果进行评价,并根据评价结果发现问题和改进。

根据是否将上下文信息引入用户偏好提取过程,我们将上下文感知推荐系统过程模型总结为如下两类:

  • (1) 将上下文信息同时引入用户偏好提取和推荐生成过程,即提取用户偏好时就考虑了上下文信息,用户偏好与上下文信息之间为紧耦合(tight coupling)关系,其过程主要包括:源数据采集与存储、上下文用户偏好提取、基于当前上下文和上下文用户偏好的推荐生成、推荐效果评价与矫正,如图1 中左图所示。
  • (2) 仅将上下文信息引入推荐生成过程,即提取用户偏好时不考虑上下文信息,用户偏好与上下文信息之间为松耦合(loose coupling)关系,其过程主要包括:源数据采集与存储、不含上下文信息的用户偏好提取、发现上下文信息与用户偏好之间的关联并预测潜在用户偏好以生成推荐、推荐效果评价与矫正,如图1 中右图所示。

Fig.1 Two different process-oriented context-aware recommender systems
图1 两种面向过程视图的上下文感知推荐系统

需要明确指出的是,当前许多上下文感知推荐系统只关注上下文感知推荐生成过程,而忽略了用户偏好提取过程,即它们假定已经具有充足的、包含上下文信息的显式用户偏好信息。但在实际应用领域,这种类型的下文用户偏好往往难以获取或者仅有极少量,从而造成当前上下文感知推荐系统不易展开应用实践。因此,图1中的第1 种面向过程的模型得到了越来越多研究人员的关注。

2 上下文感知推荐系统中的上下文感知计算

上下文感知推荐系统与传统推荐系统的重要区别在于前者融入了上下文信息,因此,如何对上下文进行定义、获取与建模计算,成为上下文感知推荐系统的研究重点之一。

2.1 上下文定义

自 20 世纪90 年代“上下文感知计算”概念提出以来,研究人员在上下文获取与感知、上下文建模与表示、上下文存储与管理、上下文有效利用、如何构建支持上下文感知的系统框架等方面取得许多研究成果。但是目前,“上下文”还没有公认的定义。

目前,在上下文感知推荐系统研究领域,上下文也没有统一的定义,需要根据具体应用系统或者用户需求引入合适的上下文类型及其具体实例。总体来看,常见上下文类型包括时间、位置、外界物理环境(如天气、温度等)、设备类型、周围人员、活动状态、目的/意图等,还有些系统考虑了情绪、计算平台、网络条件、社会化网络等更为广泛的上下文。此外,每种上下文类型所包含的具体实例也不尽相同。例如,时间上下文可以划分为上午、中午、下午、晚上,也可以按照年份、季节、时刻甚至用户自定义标准来划分。

2.2 上下文获取

在 CARS 研究和应用领域,上下文获取过程处于系统的数据采集阶段,其获取方式主要包括:

  • (1) 显式获取(explicitly):通过物理设备感知、用户问询、用户主动设定等方式,直接获取与用户、项目相关联的上下文信息。
  • (2) 隐式获取(implicitly):利用已有数据或周围环境间接获取一些上下文信息。例如,可以根据用户与系统的交互日志获取时间上下文信息。
  • (3) 推理获取(inferring):需要使用统计学方法或者数据挖掘技术推理获得一些不能显式或者隐式获取的上下文信息。例如,可以利用朴素贝叶斯分类器或其他预测模型推理用户是在“家里”还是在“办公室”。其中,显示获取的上下文信息最为精确,但通过这种方式难以获取大多数有意义的上下文。因此,隐式获取和推理获取方式也显得比较重要。

由于面向各种不同的应用领域,不同类型的上下文信息对用户需求和推荐任务的影响程度是不同的,即有些上下文信息影响较大,有些则较弱或者无影响。因此在推荐生成之前,识别和获取那些对推荐任务确有影响的有效上下文(valid context)是十分必要的。

2.3 上下文建模

目前,在上下文建模方面有以下几种典型方法:键值对模型、标记语言模型、图模型、面向对象的模型、逻辑模型和本体模型。在上下文感知推荐系统领域,目前大多数研究人员采用键值对、向量模型对单维度上下文和多维度上下文类型及其实例加以表示。还有一些研究人员利用本体、树/层次化模型等来表示和计算上下文类型或者实例之间的关联或者距离。在上下文推理和关联关系计算方面,贝叶斯络、本体、规则推理等方法使用较多。上述方法各有优点:键值对、向量模型表示简单直观、易于展开数学计算;树/层次化模型能够表示各个对象之间的从属逻辑关系;贝叶斯网络能够构建推理不确定性概率的框架;本体在领域知识表示方面具有良好的形式化表达能力,推理能力也较强。

3 上下文用户偏好提取技术

一般认为,偏好(preference)用于描述决策者对两个或多个项目的排序关系。20 世纪90 年代初,有学者提出“上下文相关偏好(context-dependent preference)”的概念,从决策分析角度指出“偏好”会受到外界因素的影响。近年来,出于“用户在不同上下文条件下对项目及其属性的偏好可能不同”的实际考虑,上下文用户偏好提取技术(contextual user preference elicitation)将上下文信息引入用户偏好建模,逐渐成为上下文感知推荐系统的前提条件和关键技术之一。目前,上下文用户偏好提取技术主要有两种研究思路:定量分析和定性分析。本节首先概述传统用户偏好提取技术,然后按照定量/定性划分方法对上下文用户偏好提取技术加以介绍并进行对比分析。

3.1 传统用户偏好提取技术

在个性化服务研究领域,用户偏好提取技术的研究可追溯到20 世纪70 年代末的用户建模技术,当时,通过收集用户的某些特定数据来分析不同用户的特征,并利用这些知识将用户划分为不同类别,以提供区分服务。随着信息技术的发展以及人工智能、决策科学、运筹学等多学科交叉融合,用户偏好提取技术不仅关注用户本身,还关注用户对项目及其属性的顺序选择关系,逐渐成为缓解“信息过载”问题的前提条件和推荐系统的关键技术之一。需要说明的是,各种文献涉及的术语,如用户偏好(user preference)与用户兴趣(user interest)、用户建模(user modeling)、用户描述文档(user profiles)、用户需求(user needs)等,在语义内涵上有相通之处。有些研究人员从定量分析角度研究用户偏好提取技术,主要通过数学模型、机器学习与数据挖掘技术(如最近邻算法、聚类、朴素贝叶斯、Rocchio 方法、决策树、决策规则分类器、神经网络和贝叶斯网络等)来现。也有研究人员采用定性分析方法。用户偏好提取过程还可以划分为显式提取(用户主动提供或者系统引导用户提供)和隐式提取(根据用户人口统计学特征、用户行为、标签、项目特征等来挖掘用户偏好)两种。此外,用户需求与偏好并不是一成不变的,如何监测这种变化并主动做出适应,对于提供实时、精确的个性化服务来讲也十分重要。

3.2 基于定量分析的上下文用户偏好提取技术

定量研究上下文用户偏好提取技术,是指使用数字评分量化表示上下文用户偏好,并设计偏好提取方法进行数学计算。目前,在上下文用户偏好量化表示方面,主要采用多维向量评分模型和层次模型(即层次树结构的根节点为用户节点,从根到叶子节点的路径上依次为顶层上下文类型、子上下文类型、上下文具体实例、项目实例等,而叶子节点使用具体数值表示用户偏好),还有少数研究人员采用本体。定量的上下文用户偏好提取技术,可以分为以下两类:

  • (1) 基于启发式的方法(heuristic-based approaches):利用一些具有直观意义的启发式方法来提取上下文用户偏好,例如TF-IDF、最近邻算法、聚类、相似度计算等。比较典型的研究工作有:Stefanidis 等人采用了聚类和相似度计算技术;Cantador 等人通过语义描述与推理、语义扩散机制和余弦相似性来计算用户对项目的偏好、用户偏好与上下文之间的语义路径连接,并加权提取上下文用户偏好;Jrad 等人基于聚类、协同过滤等技术提出一种基于本体的上下文用户建模方法;Shin 等人需要用户显式给定一些单维度上下文实例下的用户偏好,然后基于层次距离和Jaccard 系数计算上下文相似性,并加权聚合求得多维度上下文用户偏好。
  • (2) 基于模型的方法(model-based approaches):利用数学统计模型或机器学习技术学习一个模型(例如线性规划、贝叶斯分类器、决策树、矩阵分解等),以提取上下文用户偏好。

3.3 基于定性分析的上下文用户偏好提取技术

定性研究上下文用户偏好提取技术,则主要考察用户在上下文约束下对项目及其属性的“二元偏序关系”,即不关注用户对项目及其属性的偏好的量化值,而是从逻辑推理和偏序模型的角度提取用户对任意两个具体项目或其属性的偏序关系。
表1 给出了基于定量/定性分析的上下文用户偏好提取技术的对比研究。

Table 1 Comparison of different contextual user preference elicitation approaches
表1 上下文用户偏好提取技术对比研究

分类 主要优缺点 典型技术
定量分析
  • (1) 有利于展开数量化表示和计算,且方便生成排序和Top-n推荐;
  • (2) 使各个具体上下文用户偏好之间形成全序关系(total order),不允许偏好之间的弱序表示,不利于直观描述任何两个具体上下文用户偏好之间的关系,也不利于逻辑推理。
余弦相似性、聚类、贝叶斯概率模型、决策树等。
定性分析
  • (1) 有利于描述那些不一定满足全序关系的上下文用户偏好,方便处理偏好的弱序关系(直观、自然),可以表示任何两个上下文用户偏好具体实例之间的关系,并能够进行逻辑推理;
  • (2) 不具备采用数字量化表示和计算量大带来的优点。
严格偏序模型

4 上下文感知推荐生成技术

上下文感知推荐生成技术是上下文感知推荐系统的核心,主要研究如何基于部分已知的含有或不含有上下文的用户偏好,结合当前上下文预测潜在的用户偏好或者上下文用户偏好,并生成推荐。目前有如下两种划分方法:

  • (1) 基于传统推荐系统划分方法,将上下文感知推荐生成技术分为如下3 种:基于协同过滤的上下文感知推荐(CF-based contextual recommendation)生成技术、基于内容的上下文感知推荐(content-based contextual recommendation)生成技术、混合式上下文感知推荐(hybrid contextual recommendation)生成技术。
  • (2) 基于上下文信息在推荐生成过程所起作用的划分方法,即3 种范式:上下文预过滤(contextual pre-filtering)、上下文后过滤(contextual post-filtering)、上下文建模(contextual modeling)。

4.1 基于传统推荐系统划分方法的分类

4.1.1 基于协同过滤的上下文感知推荐生成

基于协同过滤的上下文感知推荐生成技术仍然基于“集体智慧”的思想,将引入上下文信息融入到基于用户相似性、项目相似性和基于模型的协同过滤中,将其扩展为基于上下文用户偏好相似性计算和基于模型的上下文感知协同过滤,期望通过增加上下文约束条件,提高相似性计算或者模型的精确度,进而提高推荐精确度。Chen较早对基于协同过滤的上下文感知推荐技术展开研究,他认为,“相似用户具有相似的偏好”并不充分,还应当关注“其他用户在与活动用户当前上下文相似的上下文条件下对项目的偏好”,从而提出将上下文息、基于项目的上下文关联系数、用户-上下文相似性等融入协同过滤技术。首先,使用多维向量模型表示上下文信息C=(C1,C2,…,Cz),并定义simt(x,y)为任意两个上下文向量x,y(x∈C,y∈C)在单维度上下文类型Ct(t∈[1,z])下的相似度。由于每种上下文类型包含的实例维度不同,难以人工定义一种通用的上下文相似度计算方法,因此提出基于项目的上下文关联系数计算方法,利用Pearson 相关系数计算所有用户在x,y 的单维度上下文类型Ct下对项目i 的偏好相似度,作为上下文关联系数(见公式(2),其中,用户u 在x 下对项目i 的偏好为ru,i,x):

然后,计算用户u 在活动用户a 的当前上下文条件c∈C 下对项目i 的偏好(见公式(3)):

最后,活动用户a 对项目i 的协同过滤评分预测可以表示为(见公式(4),其中,wa,u 为根据不含上下文的用户评分计算得到的用户a 与u 的Pearson 相关系数):

总体来看,基于协同过滤的上下文感知推荐生成技术的优点在于:充分利用“集体智慧”的思想,不需要对用户、上下文、项目等进行复杂的知识建模和分类,能够帮助用户发现新的兴趣点等等。但是,这种方式存在以下缺点:稀疏性、冷启动、可扩展性、高维数据挖掘难度大、模型训练复杂等问题以及不能推断是哪些因素导致“某个用户在特定上下文条件下偏爱某种项目”等等。

4.1.2 基于内容的上下文感知推荐生成

基于内容的上下文感知推荐生成技术的主要研究思路是,将上下文信息融入基于内容的推荐方法,着重考虑用户偏好、上下文与项目属性的匹配度,即:通过挖掘用户在不同上下文条件下对不同项目属性的偏好,并结合每个具体项目的属性描述,发现用户、项目、上下文之间的匹配程度(或概率),从而预测潜在的上下文用户偏好,最后结合用户当前上下文生成推荐。因此,在上下文建模、上下文用户偏好提取之后,项目属性特征描述和匹配度计算方法成为关键所在。目前,项目属性特征描述方法主要使用TF-IDF或者其他分类方法,匹配度计算方法主要包括余弦相似度、Pearson 相关系数、Jaccard 系数、Manhattan 距离等及其改进方法。

Yap 等人较早提出“上下文感知的基于内容的推荐系统”这一概念,将推荐过程分为两部分:

  • 1) 预测:
    根据用户在不同上下文条件下对已评分项目集的偏好,利用贝叶斯网络发现用户在不同上下文条件下对项目集的各种属性的偏好(先验概率),然后计算用户在特定上下文条件下对具有特定属性向量的未评分项目的潜在偏好为某特定偏好值(如1~10)的后验概率,并选取与最高概率值关联的特定偏好值作为预测评分;
  • 2) Top-N 推荐:
    从未评分项目集中选出偏好值最高的N 个项目作为推荐集。与此类似,Ono 等人也采用了贝叶斯网络模型;Yu等人则基于朴素贝叶斯分类器计算上下文信息与项目的关联概率;Adomavicius 提出将基于层次回归的贝叶斯偏好模型应用于基于内容的上下文感知推荐生成技术,并利用马尔可夫链蒙特卡洛方法估算获取与用户属性、项目属性和上下文类型各个维度所关联的各种模型参数。此外,前述研究都采用离线计算方式,不利于生成实时推荐。有些研究人员针对上下文环境动态变化的特点,在获取当前上下文之后,利用基于内容的上下文感知推荐生成技术,在线实时预测潜在的上下文用户偏好并生成推荐。例如,Park 利用模糊贝叶斯网络方法推理出用户当前情绪状态概率,然后结合项目属性和显式用户偏好预测用户在该情绪状态下对各种音乐的偏好。

总结来看,基于内容的上下文感知推荐生成技术的优点在于:能够发现用户在不同上下文条件下对项目属性类别的偏好,能够充分利用现有成熟的分类技术、概率统计模型,不存在“新项目”问题,推荐结果比较直观、易于理解等。其缺点在于:有限内容分析和有效上下文选择(涉及特征选择问题)、推荐范围过窄、新用户问题、多维上下文条件约束下的相似度匹配计算等问题,亟待解决。

4.1.3 混合式上下文感知推荐生成

除了上述两类上下文感知推荐生成方式以外,还有研究人员研究基于知识过滤的上下文感知推荐生成技术,例如结合上下文信息和常识性知识制定一些规则并生成推荐,基于历史上下文信息、用户偏好和关联规则为用户提供个性化服务,利用本体、面向领域的规则、基于案例的推理技术进行上下文预过滤等。这些模型都需要建立知识库来存放过滤规则。但是知识工程还远未成熟,构建一个完备、有效的知识库十分困难。由于上述推荐方式均存在许多缺点,有些研究人员开始研究混合式上下文感知推荐生成技术,按照不同的混合策略将不同类型的推荐算法进行组合,以生成混合推荐。这种推荐技术主要依赖于集成学习理论,即利用多个分类器共同学习,其推荐精确度可能会有所提高;其缺点则是增加了计算复杂度,需要引入组合参数,还可能会出现参数过拟合现象。目前,混合策略则主要包括加权、串联过滤、混合呈现等。比较典型的研究工作有:Cantador 等人混合了协同过滤和基于内容过滤的两种上下文推荐方式;Yu 等人混合基于内容过滤和基于知识过滤的上下文推荐方式;Weng 等人和Woerndl 等人各自混合了基于内容的、基于知识的和协同过滤这3 种上下文推荐方式;Wang 等人则混合了传统协同过滤方法与基于情绪特征上下文计算的协同过滤方法;Abbar 等人从面向服务的角度提出一种上下文感知混合推荐系统框架。

4.2 基于上下文在推荐生成过程所起作用的划分方法

按照将上下文融入推荐生成过程哪个阶段的角度划分,Adomavicius 等人提出如图2 所示的3 种范式。
(a) 上下文预过滤 (b) 上下文后过滤 (c) 上下文建模

Fig.2 Adomavicius-Tuzhilin classification
图 2 Adomavicius-Tuzhilin 分类范式

4.2.1 上下文预过滤

上下文预过滤范式是指:在生成推荐结果之前,利用当前上下文信息过滤掉无关的用户偏好数据,从而构建当前上下文信息相关的推荐数据集;然后,利用传统推荐技术(包含协同过滤、基于内容的过滤、基于知识的过滤、混合式过滤等)处理这些筛选后的数据以进行偏好预测,并生成满足当前上下文约束的推荐结果。例如,假定一个用户想在周末看电影,可以首先根据“周末”这条上下文具体实例将“非周末”的用户偏好数据过滤掉,然后利用传统推荐技术为其生成一个推荐列表。

Adomavicius 等人较早提出了基于维度约简的上下文预过滤方法:首先将每种上下文类型划分为不同的上下文具体实例(如上午/下午/晚上),并将多维度上下文推荐数据分割为不含上下文信息的推荐数据;然后,利用传统二维协同过滤方法分别为处于各种不同上下文实例下的用户生成不同的推荐,实验结果表明,这种上下文预过滤方法在特定上下文条件下能够取得较优精度,但在其他一些上下文条件下的优越性不太明显;如果将其与基于模型的方法进行混合,将明显取得更优效果。后续又有了改进的上下文预过滤方法:基于上下文的用户聚类、基于上下文的项目/用户分类、基于决策树的上下文用户偏好划分等,并利用电子商务零售、旅游、移动广告等应用领域的实验数据展开研究。将项目按照上下文变量进行划分(例如将沙滩分为“冬天的沙滩”和“夏天的沙滩”),然后利用传统协同过滤方法生成上下文相关推荐;COMPASS 移动旅游系统可以看作一个基于知识的上下文预过滤实用推荐系统。在国内,刘栋等人提出了一种基于本体和上下文感知的Web 服务推荐架构,首先利用用户当前上下文过滤出相关的Web 服务数据集然后设计合适的相似性计算公式,最后为用户生成符合上下文条件约束推荐Web 服务。

上下文具体实例的分类或者粒度,是影响上下文预过滤范式的重要因素。如果上下文具体实例的分类过于粗糙,则上下文过滤后的推荐数据集不一定全部与当前上下文相关,从而影响推荐精确度;如果上下文具体实例的分类过于精细,则可能造成筛选后数据集的极度稀疏性,也将影响推荐精确度,而且有些上下文过度精细划的作用也并不明显。Adomavicius 等人因此提出将层次化的上下文建模方法应用于上下文预过滤范式(例如,以时间上下文粒度划分为例,“周末”所处的层次要高于“星期六”),不同的上下文层次体现不同的上下文粒度和计算复杂度,从而有利于缓解上述问题。

4.2.2 上下文后过滤

上下文后过滤范式是指:首先忽略上下文因素,利用传统二维推荐技术处理不含上下文信息的推荐数据来预测潜在用户偏好;然后根据当前上下文信息过滤掉不相关的推荐结果或者调整Top-N 排序列表。例如,假定用户想在“周末”看电影,首先通过传统推荐技术为其生成一个推荐列表,如果已知他在“周末”只看喜剧电影,则可以从推荐列表中过滤掉非喜剧的电影。上下文后过滤范式又可以分为两种:启发式方法和基于模型的方法,前者重点关注如何发现处于特定上下文条件下的用户所偏爱项目集合的共同属性特征,后者则侧重于计算用户在特定上下文条件下选择该项目的概率值。

两种上下文后过滤方法:线性加权和直接过滤。前者将项目与当前上下文关联的概率和已预测评分进行加权;后者则将那些与当前上下文关联概率小的项目过滤掉,然后利用真实数据集对上下文预过滤和上下文后过滤两种范式进行实验比较。结果表明,它们都不能在所有评价指标上优于对方,但均优于传统协同过滤方法。这说明,不同的加权、过滤方法在用户偏好预测过程中所起的作用可能不一样,还需展开深入研究。

上下文预过滤/后过滤模型都将“多维推荐”转化为“二维推荐”,能够利用传统推荐系统的成熟技术。但是,它们由于使用筛选出的相关数据来生成推荐,降维后数据的完整性不能保证,而且忽略了上下文信息之间的关联关系,从而使推荐效果受到影响。因此,这两种模型较适用于上下文信息与用户偏好信息之间为松耦合关系的情形。

4.2.3 上下文建模

上下文建模范式是指:将上下文信息融入推荐生成的整个过程,设计合适的算法、模型处理多维度上下文用户偏好,而非忽略掉上下文信息的用户偏好。这种范式需要处理高维数据,最为复杂;但也最能有效挖掘用户、上下文、项目之间的关联关系,因此适用于上下文与用户偏好之间为紧耦合关系的情形。

上下文建模范式又可分为两种:

  • (1) 基于启发式的方法;
  • (2) 基于模型的方法。

前者利用具有直观意义的启发式方法,如最近邻算法、聚类等。而上下文相关的高维数据相似性计算公式是重点和难点,值得深入研究;后者利用基于层次回归的贝叶斯偏好模型、贝叶斯网络、朴素贝叶斯、PLRM、支持向量机、张量分解等机器学习或数学统计相关的模型。与基于启发式的方法相比,基于模型的方法需要花费较长时间来构建或更新一个预测模型,而且需要调整大量参数来优化,当用户偏好数据非常少时还有可能不足以构建可靠的分类;但后者往往只需要存储远小于原始数据的模型,在一定程度上降低了数据的稀疏性;而且往往能够充分利用相关模型的优点获得更好的推荐效果,代表着上下文感知推荐技术的研究方向。

支持向量机(support vector machine,简称SVM)到上下文感知推荐系统,把上下文作为影响项目分类的一个因素,利用SVM 在“高维特征空间非线性映射、线性可分”和“基于结构风险最小化理论的全局最优解”的优点,来提高推荐精确度。但是,由于经典支持向量机自身存在“难以处理大规模训练样本”和“难以解决多类分类问题”等缺点,使得基于经典支持向量机的上下文感知推荐模型还有待改进。目前,矩阵分解技术被认为是传统推荐系统领域最有效的手段之一,但是它只能处理二维推荐数据,而不适用于多维上下文推荐数据。

张量分解技术作为矩阵分解技术在多维数据空间的扩展,能够有效发现多维数据空间存在的潜在关联关系,并能有效缓解高维数据稀疏问题,已开始被应用于上下文感知推荐系统。例如:利用高阶奇异值矩阵分解技术来处理用户、上下文(如时间和周围人员、位置)、项目构建的张量空间,并生成上下文推荐结果;

将Factorization Machines 技术应用于快速上下文感知推荐生成,其推荐精确度和实时性俱佳。

鉴于上述上下文推荐范式及其具体算法各有优缺点,Adomavicius 等人建议设计组合的上下文推荐技术(如预测模型的多阶段组合、线性组合以及基于Boosting,Bagging,Stacking 等机器学习技术的组合方法),以期提高推荐的精确度、新颖性、实时性、多样性及鲁棒性等。

5 上下文感知推荐系统的效用评价

效用评价(evaluation)对于检验推荐系统的性能和发现其存在的问题来讲十分重要,是CARS 不可或缺的步骤,而数据集与效用评价指标是两个重要因素。

5.1 CARS相关数据集

传统推荐系统研究领域使用的数据集都很少考虑上下文因素,至今,公开、可用的包含上下文信息的数据集很少,从而给上下文感知推荐系统研究带来很大挑战。这是因为:

  • 1) 收集上下文信息比较困难,涉及到可行性、隐私性等问题;
  • 2) 即使公司花大力气收集到这些数据,出于商业目的也不愿意公开。尽管缺少公开、通用、有效的数据集,CARS 研究人员还是结合具体研究采用了各种各样的数据集。
    这些数据集一般分为如下3 类:
    • (1) 真实数据集(nature data set)。这类数据集的优点是,
      在一定意义上能够反映对客观现实的评价效果,说服力强;但它们往往与具体应用密切相关,涉及的上下文因素
      较少,而且有些真实数据集是研究人员为了实验研究而自己采集的,样本量相对较小,难以用于评价大规模上下文感知推荐系统的性能。
    • (2) 模拟数据集(synthesized data set)。这类数据集往往根据一定的规则自动生成,可用
      于评价复杂上下文感知推荐算法和大规模上下文感知推荐系统的效果;但是它们在评价效果及其说服力上要
      差于真实数据集,而且可能仅适用于部分算法,对其他算法来讲“不公平”。事实上,即使是真实数据集,特别是自
      采集的数据集,也不适合评测全部算法。
    • (3) 半模拟数据集(semi-synthetic data set),即在真实数据集的基础上,设定一些规则生成部分模拟数据以
      展开研究。这类数据集兼具上述两类数据集的优缺点,其生成方法对上下文感知推荐系统
      的数据集研究具有借鉴意义。此外,有些研究人员既使用真实数据集,也使用模拟数据集。

下面,我们对一些典型数据集进行简要介绍。

  • (1) Adomavicius 和Tuzhilin 等人构建的面向电影推荐应用领域的上下文感知推荐数据集:通过调查问卷方式,采集了117 位大学生用户对210 部电影的1 755 条评分,这些评分数据同时包含3 种上下文因素(时间、位置、周围人员),评分范围从1(讨厌)到13(喜爱);由于一些用户只对很少的电影给出评分,对这些用户评分数据进行舍弃处理,最终得到62 位用户对202 部电影的1 457 部评分。其中,时间上下文被划分为工作日、周末、无,位置上下文被划分为影院、家里、无,周围人员被划分为独自、普通朋友、男朋友/女朋友、家人和其他。这是较早用于研究上下文感知推荐系统的数据集,目前还未公开。这种数据集的构建方式也被许多研究人员所采纳。
  • (2) Ricci 等人构建的半模拟数据集:首先获取Yahoo! Webscope 电影评分数据集,包含7 642 位用户对11 915 部电影的22。1 万条评分数据(包含用户年龄和性别特征);然后将年龄和性别看作两种模拟上下文因素,并将年龄上下文划分为小于18 岁、18 岁~50 岁之间、大于50 岁,将性别上下文使用0 和1 标记,随机选取一定比例(10%,50%或90%)的电影。如果对这些电影进行评分的用户性别特征为1,则增加评分值,否则,减小评分
    值;其中,评分值的改变范围为10%,50%和90%,最终构建了6 个受“模拟上下文”影响的电影评分数据集。
  • (3) 德国Moviepilot 公司提供的Moviepilot 电影评分数据集:该数据集被用于CAMRa2010 挑战赛(Challenge on Context-Aware Movie Recommendation,上下文感知的电影推荐挑战赛),训练数据集包含105 137 位用户对25 058 部电影的4 544 409 条评分。其中,电影关联的上下文因素包括情绪、情节、时间、位置、观众等特征,评分值从0~100(以5 为跨度)。这个数据集主要被用于研究基于情绪的推荐和基于时间的推荐。CAMRa2011 以Moviepilot 基本数据集为基础,又引入了“Household”上下文信息。
  • (4) 瑞典Filmtipset 公司提供的Filmtipset 电影评分数据集:该数据集被用于CAMRa2010 挑战赛,按照不同的推荐任务分为两类数据集:一类是面向基于时间推荐的数据集,其训练数据集包含34 857 位用户对53 600 部电影的5 862 464 条评分,评分值从1~5;一类是面向基于社会化推荐的数据集(将用户的社会化好友网络看作一种上下文),其训练数据集包含16 473 位用户对24 222 部电影的3 075 346 条评分,评分值从1~5。

5.2 CARS效用评价指标

目前,上下文感知推荐系统主要以传统推荐系统使用的推荐精确度(performance accuracy)作为评价指标,包括MAE,Precision,Recall,F1,P@N,MAP,AUC,ROC,RSME,nDCG,MRR等等。其中,MAE 和RSME 属于预测精确度指标,其他几种属于分类精确度指标。此外,一些上下文感知推荐系统还将用户满意度作为评价指标,此时需要用户对推荐效果给出主观评价(如邀请用户参与人工实验和调查问卷)。在评测方法上,数据集被分割为训练集和测试集;在训练集上进行参数学习和调整,在测试集上计算精确度和运行效率;分割比例为一般为80%:20%(涉及稀疏性研究则需额外考量)。在获得效用评价效果后,需要进一步研究如何提高CARS 的性能,即如果效用评测值不理想或者不能让用户满意,则需要分析哪些环节(如数据采集与存储、偏好提取、推荐生成甚至效用评价本身)应当改进。

6 上下文感知推荐系统的应用进展

上下文感知推荐系统具有两个鲜明的特征:普适计算、个性化,使其在许多工业领域具有广阔的应用前景。本节就上下文感知推荐系统的应用进展进行总结分析,表2 列举并分析了一些典型案例。

  • (1) 电子商务
    用户在网上购买书籍、食品、快消类商品、服务等项目时,没有足够精力检索、了解它们的所有信息,而处于不同上下文条件下(如时间、季节、位置、天气状况等)的用户需求也不尽相同。CARS 能够挖掘用户、相关上下文、在线商品、商品提供者之间的潜在关联,将为用户的最终决策提供更有效的支持。这使得电子商务领域成为CARS 的主要应用场合。目前,国内外有些企业(如亚马逊、阿里巴巴等)研发了上下文感知的(如时间、位置等)电子商务推荐系统;Palmisano 等人尝试将其所设计的上下文感知推荐系统应用于网上电子零售系统。
  • (2) 信息检索
    鉴于信息检索领域对个性化推荐的极大需求,为处于不同上下文条件下的用户提供或者推荐适合的Web信息,已成为CARS 的另一个典型的应用点。例如,设计实现了News@hand 系统,将上下文信息同时引入用户偏好提取和推荐生成过程,在给定时间单元内为用户提供相关的新闻信息;有一种通过网页日志挖掘进行上下文相关的用户兴趣建模方法,其中,上下文因素包括:

    • 1) 交互行为上下文,即浏览此网页之前的最近交互行为;
    • 2) 关联关系上下文,即与当前网页存在超链接关系的网页;
    • 3) 任务上下文,即与当前网页共享搜索关键词的网页;
    • 4) 历史上下文,即用户长期兴趣;
    • 5) 社会上下文,即访问过当前网页的其他用户的兴趣。
  • (3) 移动应用
    移动计算与普适计算、上下文感知计算密切相关,如何在输入能力、显示能力、处理能力都较弱的移动设备上提供满足个性化用户需求的移动服务和移动信息内容,一直是工业界关注的热点。CARS 既能充分利用移动计算领域的普适计算特性,又能满足用户对各类移动应用更加实时、精确的需求,使得移动应用领域成为其最重要的应用场合。
  • (4) 电影、音乐推荐
    电影、音乐推荐是目前CARS 学术界较为关注的热点(受到传统推荐系统数据集以电影、音乐领域为主的一定影响),也是CARS 的主要应用领域之一。例如,CoMeR 系统是一种支持面向智能手机的多媒体信息推荐、自适应和传送等功能的上下文感知媒体推荐平台,其输出的推荐结果与用户使用的移动设备类型以及多媒体
    信息类型密切关联;CA-MRS 系统较早将CARS 应用于音乐推荐领域,重点考虑情绪上下文;uMender系统对音乐内容特征进行两层聚类分析,并根据上下文相似性将用户划分到不同的群组,从而生成协同推荐。此外,德国柏林工业大学的智慧屋实验中心正在研发上下文感知的多媒体推荐系统KMuIE。
  • (5) 电子旅游
    CARS 研究初期就应用于电子旅游,并持续地在该领域展开实践,典型应用案例有:COMPASS是较早的面向电子旅游服务的上下文感知推荐实用系统,首先根据用户周围上下文环境发现一些相匹配的项目(包括博物馆、餐馆、商店、电影院等),然后将这些项目发送到推荐引擎,生成推荐结果后显示给用户(例如,COMPASS会在电子地图上向对历史和建筑学感兴趣的游客推荐距其最近的、建于1890 年之前的古迹);MyMap 系统针对大多数移动旅游推荐系统只考虑用户偏好和位置的缺点,引入更多上下文信息并利用常识性知识制定一些规则(例如,“不要在下雨天推荐露天餐厅”),然后结合用户偏好、当前上下文信息向用户生成旅游信息推荐;上下文感知的餐馆推荐系统也是CARS 的典型应用,无论是在电子旅游场景还是日常生活中。

Table 2 Classification of typical applications of context-aware recommender systems
表2 典型上下文感知推荐系统应用分类

应用领域 典型案例 主要上下文类型 关键技术
电子商务 e-retailer 购买意图、季节、时间 基于模型的隐式用户偏好提取(定量分析方式,下同),基于内容的推荐
信息检索 News@hand 语义运行时上下文(基于本体表示的、与时间关联的事件主题) 基于启发式方法的隐式用户偏好提取,混合式推荐
Website-Recommendation 交互行为上下文、关联关系上下文、任务上下文、历史上下文、社会上下文 基于概率模型的隐式用户偏好提取,基于内容的推荐
移动应用 LBSRM 位置 显式用户偏好,基于内容的推荐
VANET 位置、加油站信息、剩余汽油量等 显式用户偏好,混合式推荐
PIM 日期、时间、位置 基于模型的隐式用户偏好提取,基于内容的推荐
Appazaar 时间、位置、网络状态等 显、隐式用户偏好,基于内容的推荐
AppBrain 时间、位置 基于统计学习的隐式用户偏好提取,混合式推荐
电影/音乐 CoMeR 位置、时间、活动状态、终端能力、网络条件等 显式用户偏好,混合式推荐
CA-MRS 情绪、温度、湿度、噪音、性别、年龄、时间等 显式用户偏好,基于内容的推荐
UMender 位置、时间、温度、噪音、湿度、光线、运动状态等 显式用户偏好,协同过滤推荐
电子旅游 COMPASS 位置、时间、天气、商店列表、日程、用户信息目标等 显式用户偏好,基于知识的推荐
MyMap 位置、时间、天气等 显式用户偏好,基于知识的推荐

目前,由于上下文感知推荐系统面临许多问题与挑战,使其与大规模商业化应用之间还有很大距离。近年来,无线传感器网络、物联网、计算广告学、个人数字化、智能家居环境、经济地理信息系统等新技术和应用需求的快速涌现,为上下文感知推荐系统的应用研究与实践提供了良好的机会。以物联网为例,它能够把任何物品与互联网连接起来,实现智能化识别、定位、跟踪、监控和管理。尝试着将上下文感知推荐系统应用于物联网领域,将会提高后者的服务质量:想象这样一台智能电冰箱,它可以连接到互联网,收集许多食物网站到数据库,并存储用户对一些食物的评分或者偏好信息;然后,它利用感知设备及相关推理技术获取一些有用上下文信息(例如,食物减少、季节、位置、促销活动、用户健康情况等等),再利用上下文感知推荐系统提供的算法,为用户推荐一些其可能感兴趣的食物。此外,广告仍然是互联网企业目前主要的盈利模式之一,为处于不同上下文环境下的不同用户展示不同的广告,具有鲜明的商业价值,将可能成为上下文感知推荐系统的应用实践方向之一。

7 上下文感知推荐系统研究发展的难点与热点

在海量个性化需求的驱动下,随着普适计算、个性化服务、人工智能、决策科学、信息检索、下一代网络应用等领域发展的推动,上下文感知推荐系统已取得一定进展,但仍然是一个充满问题与挑战的新兴研究领域,可以深入并可能取得成果的方向有很多,主要包括:

  • (1) CARS 的形式化定义
    第 1.2 节介绍了上下文感知推荐系统的典型形式化定义,但是目前,研究人员还没有对包括输入、输出、计算模型、处理流程、一致性描述等方面的严密数学描述达成一致,从而不利于复杂问题的描述与求解。从面向过程的视图来看,目前的数学模型大多侧重于上下文推荐生成过程,而较少考虑用户偏好提取过程。此外,如何对复杂的上下文信息进行建模,使之更有效地参与CARS 的形式规约,也是需要考虑的问题之一。总之,上下文感知推荐系统的形式化定义与上下文建模、传统推荐系统和用户偏好的形式化模型密切相关。
  • (2) CARS 中的有效上下文检测与计算
    由于面向各种不同的应用领域,用户需求差异也较大,CARS 所研究的上下文目前并没有统一的定义,也很难明确规定需要考虑哪些上下文类型和实例。从降低计算复杂度来讲,获取尽可能多的上下文信息并不是必需的。因此,有效上下文的检测与计算,即检测出对CARS 的用户偏好提取和推荐生成过程确有影响的有效上下文,并计算其对CARS 性能的不同影响程度,便成为CARS 面临的主要挑战之一。这一难题的解决,不仅有利于降低上下文获取的难度和上下文建模与计算的复杂度,而且有利于降低CARS的计算复杂度和提高CARS的推荐精确度。第2.2 节介绍了几种现有的有效上下文获取方法,但这一方向还有待深入研究。
  • (3) 精确化上下文用户偏好提取技术上下文用户偏好提取技术作为上下文感知推荐系统的前提条件,仍然存在很多问题没有得到有效解决:首先,随着上下文信息的引入,用户偏好提取技术面临着更大数据量和更高计算复杂度的局面。采用更加复杂、先进的技术手段判断影响上下文用户偏好提取的重要因素及其影响程度,并对上下文用户偏好进行有效表示和提取,仍然是上下文感知推荐系统面临的重要挑战;其次,多源上下文用户偏好融合提取方法,即在充分利用多源数据在数据覆盖率方面优势的同时,解决其可能带来的偏好冲突问题,也是值得深入研究的难点。例如,Berkovsky 等人提出一种“通用用户建模仲裁框架”,利用从其他推荐系统获取的数据构建融合的用户模型,即使某些源数据缺失,仍然可以提供较好的推荐效果;再次,由于用户在不同上下文环境下的偏好不尽相同,如何快速获取上下文用户偏好,使之适应快速动态变化的上下文环境和推荐环境,也是一个难题;最后,随着时间的推移,用户偏好不是一成不变的,上下文用户偏好也是如此(例如,用户原本喜欢“独自”看喜剧类电影,后来喜欢“和好友一起”看喜剧类电影),因此,上下文用户偏好变化检测与修正技术,也是值得关注的研究方向。
  • (4) 上下文感知推荐生成技术
    生成上下文感知推荐结果是 CARS 的核心,因此,上下文感知推荐生成技术在很大程度上决定了推荐系统的效用和性能。目前,上下文感知推荐生成技术仍然面临着各种各样的问题,主要包括:面向高维数据的上下文推荐关键技术(如高维数据相似度计算/最近邻发现、高维数据聚类、高维数据特征提取等)、基于模型的上下文感知推荐技术、模型选择与参数优化、单维度上下文推荐生成与多维度上下文推荐生成、上下文感知推荐方法的集成学习、基于多源数据融合的上下文感知推荐结果冲突检测与解决、自适应的上下文感知推荐技术、上下文感知推荐结果的呈现和交互等等。
  • (5) CARS 的稀疏性问题与冷启动问题传统推荐系统几乎都面临着比较严重的稀疏性问题,即已知的用户偏好远远小于需要预测的用户偏好。随着上下文信息的引入,上下文感知推荐系统将面临着比前者更为严重的稀疏性问题:一方面,传统推荐系统的稀疏性问题依然存在;另一方面,上下文感知推荐系统大都利用多维度向量(高维矩阵)存储和计算上下文用户偏好,而事实上,每个用户与很多多维度上下文实例的关联为0(即用户不可能处于该具体上下文实例),用户在许多与其关联的具体上下文实例下也可能与许多项目不发生交互(例如在晚上,不使用、没有购买项目或者没有对项目进行评价),使得所提取上下文用户偏好值为0。上述两种因素使得高维矩阵中绝大部分元素的值为空(或0 值)。如何解决比传统推荐系统更为严重的稀疏性问题,即利用极少部分非零的上下文用户偏好生成相对精确的推荐,成为CARS 研究领域的一大难题。传统推荐系统中用于缓解稀疏性问题的方法有很多,但它们都面向二维矩阵而不适合多维矩阵的数据稀疏性问题的求解。近年来,有些研究人员开始利用高阶奇异值分解技术来缓解CARS 领域的高维数据稀疏性问题,取得一定进展,并有待进一步深入研究。此外,利用多源数据融合的优势也能够帮助CARS 克服稀疏性难题。从缓解稀疏性的角度来看,对有效上下文检测技术的研究也显得更有意义。
    另外,传统推荐系统还存在冷启动问题,即用户在获取较为精确的推荐内容之前,需要向系统提供反馈信息。虽然上下文信息的引入部分缓解了传统推荐系统领域的冷启动问题,但就CARS 自身来讲,冷启动问题依存在,因为获取上下文用户偏好比获取不含上下文的用户偏好更加困难。如何在实际应用中解决CARS 的冷启动问题,应当引起关注。当用户、上下文、项目的数据量达到一定级别时,可扩展性问题值得引起工业界的重视。
  • (6) CARS 的效用评价问题
    上下文感知推荐系统性能的优劣不仅取决于理论与关键技术的优化,还取决于评价指标的设计。第5 节介绍的效用评价指标还存在一些缺陷,例如:评价指标较为单一,绝大多数以推荐精确度为主,而很少考虑到推荐的多样性、新颖性、实时性和鲁棒性等,也较少涉及推荐算法的时空效率;较少将上下文因素考虑进评价准则设计过程;不同的上下文用户偏好提取方法与上下文感知推荐生成算法在不同数据集的表现不同,适配性问题较难衡量;数据集中训练集和测试集不一定满足“数据同分布”原则;调查问卷法样本量小、耗时、成本高等;用户的交互体验也值得考虑,特别是输入/输出、终端处理能力较弱的移动应用场合。此外,缺少公开、可用的据集是影响CARS 效用评价的主要因素。总之,效用评价问题是一个非常具有挑战性的课题。
  • (7) 将CARS 与其他学科结合展开交叉研究
    目前,CARS 主要基于上下文感知计算理论和推荐系统,而较少结合其他学科的成果展开跨学科研究。实际上,用户需求不仅依赖于用户、上下文、项目的关联关系,也受社会化环境、人类决策行为等各方面因素的影响。因此,可以考虑将CARS 与其他学科结合展开交叉研究。例如,可以考虑将社会化网络分析方法引入CARS,为处于社会化网络的用户推荐符合其当前上下文条件约束的项目(从狭义的角度来讲,“基于社会化网络分析的上下文感知推荐系统”与“将社会化网络条件看作一种上下文因素的社会化推荐系统”的计算模型并不相同,前者需要处理社会化网络数据与多维度上下文感知推荐数据,后者则以社会化网络数据和二维推荐数为输入);为用户推荐项目实际上是一种帮助用户进行决策的过程,而情绪对用户的决策行为又会产生一定的影响,那么结合决策学、情感计算、心理学等知识研究CARS 便具有非常直观的意义。此外,近几年兴起的基于MapReduce 并行编程模型和Hadoop 分布式计算平台的“云计算”理论有利于解决、满足“大规模上下文感知推荐系统”所面临的海量数据获取/存储和计算问题、快速适应动态变化的上下文环境要求;还可以考虑将不确定性理论应用于上下文用户偏好提取、预测过程。总之,如何将CARS 与其他学科结合展开交叉研究,是一个有趣的长期挑战,值得深入研究。
  • (8) CARS 的隐私与安全问题
    隐私与安全问题一直困扰着个性化服务系统和上下文感知应用系统,CARS 的隐私与安全问题源于两方面:一方面,推荐系统需要记录用户信息、用户行为等,数据越丰富,推荐精度可能越高。但是,用户出于隐私与信息安全考虑,可能不愿意让这些数据被推荐系统记录、存储。2010 年,Netflix2 比赛因为用户要求的隐私问题而不能继续举办。另外,有些攻击者可能利用虚假数据欺骗推荐系统,从而危害系统的信用安全;另一方面,上下文感知计算的开放性、自发互操作、智能执行等特点以及上下文环境的动态性给上下文感知应用系统的隐私和安全提出挑战。CARS 所面临的隐私与安全问题由于融合了上述两个方面,将更加复杂和难以解决:CARS 不仅需要收集用户信息、用户行为,还需要考虑用户行为发生时的历史上下文信息,以及生成推荐时用户所处的当前上下文环境。但是目前,专门解决CARS 的隐私与安全问题的解决方案几乎没有,从而给应用实践带来严重的障碍。因此,面向CARS 的隐私性保护和安全策略研究将成为CARS 研究应用领域的热点方向之一。

8 结束语

如果把人类发展的历史看作一条按照一定目的向前延伸的轨迹,那么我们就会发现,它是沿着信息不断膨胀的方向前进的。随着信息技术的迅速发展和信息内容的日益扩充,“信息过载”问题愈来愈严重,给人们带来很大的信息负担。推荐系统被认为可以有效缓解这一难题,得到学术界和工业界的广泛关注和应用,并取得许多研究成果。近年来,上下文感知推荐系统将上下文信息引入推荐系统,以进一步提高推荐精确度和用户满意度,促进了学科交叉融合的研究,成为推荐系统研究领域最为活跃的分支之一,并逐渐应用于诸多工业领域。目前,国内外关于上下文感知推荐系统领域的综述性文献还极少见,我们将该领域的研究进展和趋势进行归纳总结和预测,并介绍给信息科学工作者,希望促进我国在该领域的研究工作。

您可能也感兴趣:

磨刀不误砍柴工——二十个你必须知道的Sublime Text快捷键
移动web页面头部书写
程序启动
程序员的“慢”
程序员的一天(1)
组合模式
编程工作的破窗效应与童子军原则(3)
编程的初心
表现与业务逻辑分离
装饰者模式