学术文化网:本站代理期刊可作为职称及学位评审依据;并代写(职称、本科、硕士、博士)论文,代写代发论文一条龙服务;保证原创,保证质量,100%通过,保密服务

学术文化网

重点推荐省级国家级期刊、北大中文核心、CSSCI、EI、SCI发表,稳妥操作,速度快,包发表。有意向联系客服咨询。
论文代写:十年专业服务品质,全部由期刊编辑、硕士、博士撰写;保证原创、版权归您;保证通过、否则全额退款。代写论文申请表
论文发表:与百家优秀期刊合作,代理审核组稿,论文发表涵盖所有专业领域,全部正刊,保证出刊,否则全额退款。代写代发论文申请表
业务合作:因业务发展需要,诚招优秀写手合作,要求硕士以上学历,不限专业,另诚征优秀期刊代理合作,具体详谈。QQ:415835425 代写论文写手申请表
当前位置: 主页 > 图书情报

高校图书馆的个性化图书推荐系统应用研究

摘要: 数字图书馆已经成为广大高校大力推广的信息化工程,在该工程中,通过推荐系统为用户提供个性化的服务是该领域中研究的热点问题。本文针对目前个性化推荐系统中仍然存在的关系建模、数据稀疏等问题开展研究。提出面向高校图书馆的个性化图书推荐系统框架,对用户之间、图书之间的同质性关系,用户和图书之间的异质关系进行建模,进而尽可能解决数据的稀疏性问题。推荐系统采用正交非负矩阵三分解实现联合聚类算法,确保解的唯一性和可解释性。联合聚类算法同时对用户和图书进行聚类分析,进而提高聚类的准确性。通过历史数据的对比分析,本文提出的推荐算法在准确性方面有了较为明显的提高。
关键词: 个性化推荐;联合聚类;数据稀疏



Abstract: Digital libraries have become the majority of colleges and universities to promote the information technology projects, in this project, through the recommendation system to provide users with personalized service is the hot issue in the field of research. Aiming at the personalized recommendation system still exist in the relationship modeling, data sparse research and other issues. Proposed for the university library books, personalized recommendation system framework for users, books homogeneity relationship between the user and book modeling the relationship between heterogeneity and thus possible to solve the problem of data sparsity. Recommended system uses three orthogonal non-negative matrix decomposition algorithm for joint clustering to ensure the uniqueness of solution and interpretability. Joint clustering algorithm and books simultaneously to users of cluster analysis, thus improving the accuracy of clustering. Through comparative analysis of historical data, the proposed recommendation algorithm with the accuracy of the more obvious increase. 
Keywords: personalized recommendations; joint clustering; sparse data。



0 引言
随着网络迅速发展,信息出现过载现象,用户搜寻所需信息要花费大量时间。基于数据
挖掘技术的个性化推荐系统在一定程度上解决了此问题,并广泛应用各个领域。
高校图书馆为提高读者服务质量,将个性化推荐引入图书借阅,并提出了大量的相关推
40 荐算法。但是,目前的这些推荐算法多是依据图书的相关信息,采用文本挖掘的方法揭示图
书之间的关系[1-2],存在一定问题。本文尝试采用联合聚类分析的方法同时对读者和图书进
行分析,充分分析读者和图书之间的复杂关系。选择准确率较高的算法,提高个性化推荐作
用。
 
采用联合聚类方法在高校图书资源挖掘过程中,仍然面临数据稀疏问题。由于借阅的历
45 史数据中,读者和图书的规模很大,读者借阅图书的关系相对整体来说是非常稀疏的。高校
图书馆中任意一种图书副本量又是有限的,所以不同读者借阅同样图书的几率是非常低的。
而数据的稀疏性会降低现有推荐算法的准确性,因此需要对稀疏数据下的推荐算法进行研
究。本文不仅考虑读者和图书之间的异质关系,同时考虑读者和读者之间、图书和图书之间
的同质关系,因此大大丰富了数据之间的特征[3]。
50 1 系统结构
面向高校的个性化图书推荐应该满足如下功能:(1)面向用户的图书推荐服务。当用户登
录其数字图书馆主页时,根据用户的历史借阅记录、其用户所在社区等给用户推荐其可能
感兴趣的图书。(2)面向图书的关联推荐服务。当用户搜索某本图书时,根据用户和图书的
相关信息,给用户推荐其他的图书。(3)图书推荐过程中应该能够明确给出图书的相关信
55 息。(4)给用户推荐图书时应该满足多样性。
根据个性化推荐系统的需求,本文提出了面向高校的个性化推荐系统框架,框架如图1
所示。
图1 推荐系统框架图
60
在该框架中包括三个层次,分别为数据层、推荐系统实现层、个性化图书推荐可视化界
面层。数据层主要是为推荐系统提供基础数据源。推荐系统实现层利用基于非负矩阵分解的
联合聚类算法同时对图书和读者信息进行聚类分析,并提取规则库中形成的个性化推荐规
则,结合个性化推荐规则和聚类结果,形成推荐结果。用户界面层主要是实现推荐图书等信
65 息的可视化展示。
个性化推荐系统的工作流程如图2 所示。主要包括几个核心的工作步骤:从原始数据中
抽取其对应的特征数据,并进行关系建模,关系建模是整个推荐系统的基础。利用联合聚类
算法对用户和图书进行同时聚类分析,得到的聚类结果结合推荐规则库中的规则为用户提供
个性化的图书推荐服务。
http://www.paper.edu.cn
- 3 -
中国科技论文在线
70
图2 推荐系统工作流程
2 关系建模
面向高校的图书借阅数据中包含了用户和图书两类实体,其中用户与用户之间、图书与
图书之间存在同质性关系,用户与图书之间存在异质关系。通过对同质关系与异质关系进行
75 统一建模。
针对用户之间的同质关系可利用图U 进行表示,U U,E,W,其中U 代表用户集合,
|U|为用户总数,E 代表任意两个用户之间建立的边集合,W 为边的权重。通过聚类算法可
将用户集合U 划分成U k 个类。
针对图书之间的同质关系可利用图B 进行表示,B B,E,W,其中B 代表
80 图书集合,|B|为图书总数,E 代表任意两本图书之间建立的边集合,W 为边的
权重。通过聚类算法可将图书集合B 划分成B k 个类。
用户与图书之间的异质关系可通过二部图进行建模R U,B,E,W,其中U
代表用户集合,B 代表图书集合,E 代表用户与图书之间建立的边集合,W 为边
的权重。原始二部图如图3(a)所示,经过联合聚类算法可同时将用户U 和图书B
进行划分,分别划分成U l 和B 85 l 个类,示意图如图3(b)所示。
(a)关系图 (b)关系划分图
图3 学生-图书异质关系建模示意图
 
3 个性化图书推荐算法
90 本文针对用户和图书建立不同的推荐规则。推荐规则分为两种,一种是针对常规用户的
推荐,一类是针对冷启动用户的推荐。在本文中,新生,新采购图书等都属于冷启动情况,
其只有很少的特征信息,因此,需要针对这些冷启动情况进行单独的设计推荐规则。
系统采用联合聚类算法对用户和图书进行同时聚类。利用正交非负矩阵三分解分解实现
联合聚类,确保解的唯一性和可解释性[4]。算法过程如算法1 所示。
95 其对应的优化目标函数如公式1 所示,可通过迭代更新的方法求解,知道目标函数收敛。
2 min
. .
NMTF F
T
T
Q
st HH I
W W I
 
R WSH
(1)
目标函数中要求R 矩阵为待分析异质关系矩阵,对应的元素都为非负值。分解的结果
中同样满足W,S,H 矩阵中的元素都为非负值,且W 和H 满足正交的条件。
T
T T  W W RHS
WW XHS (2)
T
T T  H H X WS
100 HH X WS (3)
T
T T SS W XH
W WSH H (4)
算法1 正交非负矩阵三分解算法
输入:关系数据, U l 为用户聚类数目, B l 为
图书聚类数目
输出:W,H 分别为用户和图书的划分
指示矩阵
1.初始化W,H,S
2.while(1)
3. 利用(2)-(4)迭代计算W,H,S
4.直到公式(1)收敛
5.得到划分矩阵W,H。
在联合聚类结果的基础上,联合推荐规则,给用户推荐其可能感兴趣的图书。在本文中,
105 参考协同过滤的基本思想,给出预测评分。采用公式5 对其进行评分计算。
 
,
,
( , )
( , )
i k
j C
i k
j C
Sim i j R
P
Sim i j
 (5)
其中i,k P 为用户i 对图书k 的的评分,C 为目标用户i 属于的集合, Sim(i, j) 为用户i 和j
的相似性, i,k R 为用户i 给图书k 的评分值。
4 系统实验及分析
110 针对本文提出的推荐算法进行对比实验分析。实验平台为intel 4 core,4G 内存服务器,
操作系统为linux 2.6.18 内核。
4.1 实验数据集
本文收集哈尔滨工业大学图书馆的借阅记录数据。时间跨度为2012 年1 月1 日到2012
年12 月31 日,共计得到借阅数据记录条数为435821,经过去重后,得到独立的非重复用
115 户数为28310,非重复图书本数为96366。
4.2 实验结果分析
基于非负矩阵分解的算法中需要事先给出聚类数目,因此,首先需要根据80%的数据
确定聚类数目。本文算法在不同聚类数目下的MAE 值对比结果如图4 所示。
120 图4 不同聚类个数对推荐结果的影响
由图4 可知,当用户聚类数目和图书聚类数目都等于25 时,基于非负矩阵三分解的联
合聚类算法的准确性最高。
下面将针对本文提出的基于非负矩阵三分解的联合聚类算法基础上的推荐算法与其他
协同过滤算法进行对比分析。本文的算法以NMTF 代替,CF 算法为基于用户的协同过滤算
125 法,UCCF 为基于用户评分聚类的协同过滤算法。对比结果如图5 所示,由对比结果表明,
本文提出的基于非负矩阵分解的联合聚类算法基础上的推荐算法的准确率更高。
图5 推荐算法对比结果
 
5 结束语
130 本文针对目前个性化推荐系统中仍然存在一系列问题开展研究,文中提出面向哈尔滨工
业大学图书馆的个性化图书推荐系统框架,并对个性化图书推荐系统设计、实施进行了深入
的分析与研究。通过历史数据的对比分析,本文提出的推荐算法在准确性方面有了较为明显
的提高。
[参考文献] (References)
135 [1] Min Gao, Kecheng Liu, Zhongfu Wu . Personalisation in web computing and informatics: Theories, techniques,
applications, and future research[J]. Information Systems Frontiers, 2010, 5(12): 607-629.
[2] Fidel Cacheda, Victor Carneiro, Diego Fernandez. Comparison of collaborative filtering algorithms:
Limitations of current techniques and proposals for scalable,high-performance recommender systems[J]. ACM
Transactions on the Web (TWEB),2011, 1(5): 1-33.
140 [3] Inderjit S D, Mallela S, Modha D S. Information theoretic co-clustering[C]. Proceedings of the 9th ACM
SIGKDD International Conference on Knowledge Discovery and Data Mining. Washington, DC, USA, 2003:
89-98.
[4] Ding C, Li T,Peng W, Park H. Orthogonal nonnegative matrix Tri-actorizations for clustering[C].
In:Proceedings of the 12th ACM SIGKDD international conference on knowledge discovery and data mining,
145 2006: 126-135.


学术论文网Tag:
本站郑重声明:
  1、我们与数十所知名高校博士强强联手,保持常年稳定合作关系,论文质量更有保证;;
  2、写作领域涉及所有专业,实力操作,出稿更快,质量更高,通过率100%;
  3、所有代写文章,全部原创,包检测,保证质量,后续免费修改,保证通过;
  4、信誉实力服务,专业代写毕业论文,职称论文,硕博士论文,留学生论文,成熟操作;
------分隔线----------------------------
栏目列表
联系我们
服务承诺
推荐内容