栏目分类:
子分类:
返回
文库吧用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
热门搜索
文库吧 > 学术 > 人文期刊 > 科技资讯

融合个性化推荐的文章聚合系统

融合个性化推荐的文章聚合系统

袁黄辉 孙知信 高凤玲

摘  要:随着互联网大数据时代的到来,资源聚合平台逐渐成为一种趋势,而文章聚合系统则是其中最普遍的一种资源整合方式。一方面,它能满足用户对于阅读数量的追求;另一方面,系统中内容分发方式的丰富也迎合了用户个性化的需要。该文针对平台方实际需求,实现了一种融合个性化推荐的文章聚合系统,系统的推荐内核主要依赖于所提的融合用户画像的协同过滤推荐方法,以此为平台方用户提供文章推荐服务。

关键词:个性化推荐  文章聚合  协同过滤  用户画像

中图分类号:TP391.3                       文献标识码:A文章编号:1672-3791(2021)04(a)-0035-03

An Article Aggregation System Integrating Personalized Recommendation

YUAN Huanghui1  SUN Zhixin2   GAO Fengling3

(1.School of Computer Science and technology, Nanjing University of Posts and Telecommunications, Nanjing, Jiangsu Province, 210023 China; 2.School of Modern Posts, Nanjing University of Posts and Telecommunications, Nanjing, Jiangsu Province, 210003  China; 3.China Electronics System

Engineering NO.2 Construction Co., Ltd., Wuxi, Jiangsu Province, 214135  China)

Abstract: With the advent of the era of Internet big data, resource aggregation platform has gradually become a trend, and article aggregation system is one of the most common ways of resource integration.On the one hand, it can meet the user's pursuit of reading quantity; on the other hand, the rich content distribution in the system also caters to the needs of personalized users. According to the actual needs of platform, this paper presents an article aggregation system that integrates personalized recommendation. The recommendation kernel of the system mainly relies on the proposed collaborative filtering recommendation method that integrates user portrait, so as to provide article recommendation service for platform users.

Key Words: Personalized recommendation;Article aggregation;Collaborative filtering;User portrait

互联网时代的到来衍生出了各类信息聚合的平台和网站。不论是新浪新闻、今日头条这类以文本信息为主的网站,还是类似于淘宝、京东这类的电商平台,它们都是帮用户将海量的数据做了初步的聚合归类,但是即便如此用户对于便捷和效率的诉求随着信息数据的激增依旧无法得到满足。因此,如何针对不同用户进行个性化推荐是这类信息聚合平台亟需解决的问题。

基于文章聚合系统的个性化服务诉求,该文结合实际场景设计了一种融合用户画像的协同过滤推荐方法进行文章个性化推荐,使得最终的推荐结果更加准确。

1  关键技术概述

1.1 协同过滤推荐方法

协同过滤推荐方法主要分为两类:基于用户和基于内容的协同过滤[1]。基于用户的协同过滤主要是通过用户的历史行为记录来计算用户间的相似性,使用相似用户的其他偏好进行推荐[2];而基于内容的协同过滤则是根据所有用户对项目的喜好来计算项目间的相似性,根据用户偏好将相似的内容推荐给用户[3]。

1.2 用户画像技术

用户画像顾名思义就是将原本晦涩难懂的用户数据以一种更形象的方式梳理并呈现出来,通常的呈现形式是一系列与用户相关的结构化标签集合[4-6]。此项技术目前已被广泛应用于推荐系统领域,目的就是快速、准确地分析用户的行为习惯和兴趣偏好,最终实现个性化的内容分发。

2  系统架构设计

该系统架构自下而上分别是基础数据层、特征计算层、召回策略层、排序过滤层以及展示层,以这5层架构实现系统核心功能,具体的总架构图见图1。

3  融合用戶画像的协同过滤推荐方法

3.1 用戶画像标签体系建立

该系统设计的用户画像标签体系包括静态和动态标签两部分,画像标签体系见图2。

3.2 用户画像构建

基于上述用户标签体系的设计,将画像模型具体表示为。第一维度表示用户的基本信息特征,分别为用户的性别、年龄、婚姻状况和兴趣爱好。第二维度表示用户的主题分布特征。第三维特征和第四维特征则是用户的阅读频率和一天中的阅读时间分布。画像模型的具体构建方法如下。

3.2.1 用户基本信息统计

用户基本信息的具体标签种类如表1所示。该方法使用二进制序列对多维特征进行表示,例如:性别维度设一个标志位,即性别男置1,女置0;年龄维度设6个标志位,将对应年龄段的标志位置1;婚姻和兴趣也根据表1中信息进行设置。最终得到用户静态信息的二进制序列表示B。

3.2.2 用户的主题特征表示

将用户偏好文章输入到预训练好的LDA主题模型,得到文章的主题分布向量。

3.2.3 用户阅读频率计算

将阅读频率作为用户画像的一维特征可以有效地区分用户,有助于个性化推荐的精准性。阅读频率R的具体计算公式如公式(1)所示。其中k表示统计到有阅读行为的总天数,Rm表示用户在第C天阅读的总文章数。

(1)

3.2.4 用户阅读时间分布统计

为了方便度量一个人的阅读时间分布,该方法中将一天划分为7个不同的时间段,即最终得到的阅读时间分布向量有7个维度。具体计算方法如式(2),其中 RN表示每个时间段阅读总数分布向量。

(2)

3.2.5 多维度相似性计算

对于得到的用户多维度特征表示向量使用余弦相似度计算方法进行计算,得到最终的用户相似度矩阵US。计算方法如式(3)。其中PRi和PRj分别表示用户 Vi和Vj的多维特征向量。

(3)

3.3 协同过滤生成结果集

基于得到的用户相似度矩阵,使用K-means聚类方法对用户进行聚类。在对特定用户进行推荐时,找到与其属于同一类别的其他相似用户,获取到他们的偏好文章集合。再利用用户相似度矩阵数值对每篇文章进行加权排序,最终筛选出指定数量的结果集。

4  结语

该文针对文章资源整合以及用户个性化推荐服务的需求,设计并实现了一种融合个性化推荐的文章聚合系统。且在该系统的推荐内核中设计了一种融合用户画像的协同过滤推荐方法来增加推荐结果的准确性,并在实际的应用场景中能很好地完成个性化的文章内容分发任务。

参考文献

[1] 顾明星,黄伟建,黄远,等.结合用户聚类与改进用户相似性的协同过滤推荐[J].计算机工程与应用,2020,56(22):185-190.

[2] yeongwook yang,jang hongjun,byoungwook kim. A Hybrid Recommender System for Sequential Recommendation: Combining Similarity Models With Markov Chains[J].IEEE Access,2020(8):190136-190146.

[3] 王永,赵旭辉,李晓光,等.一种面向协同过滤的快速最近邻居搜索方法[J/OL].计算机工程与应用:1-14[2021-04-08].https://www.kns.cnki.net/kcms/detail/11.2127.TP.20201208.1533.022.html.

[4] Simsek A, Karagoz P. Wikipedia enriched advertisement recommendation for microblogs by using sentiment enhanced user profiles[J].Journal of Intelligent Information Systems,2020,54(2):245-269.

[5] Ouaftouh S, Zellou A, Idri A. Social recommendation: A user profile clustering‐based approach[J].Concurrency and Computation: Practice and Experience,2019,31(20):5330.

[6] 刘勇,吴翔宇,解本巨.基于动态用户画像的信息推荐研究[J].计算机系统应用,2018,27(6):236-239.

转载请注明:文章转载自 www.wk8.com.cn
本文地址:https://www.wk8.com.cn/xueshu/278220.html
我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2022 wk8.com.cn

ICP备案号:晋ICP备2021003244-6号