博客
关于我
推荐系统项目实战一(推荐业务架构介绍)
阅读量:215 次
发布时间:2019-02-28

本文共 550 字,大约阅读时间需要 1 分钟。

架构与业务流

基础数据层

该层主要处理业务数据和用户行为日志数据,数据来源于前端埋点和系统日志。其中,用户数据包括注册信息、个人资料等基础信息;文章数据则涵盖用户上传的内容、发布信息等基础属性。用户行为日志数据实时流向Kafka,用于实时计算和分析;而业务数据则以批量形式存储在HDFS上,为后续的离线分析提供数据支持。

数据处理层

这一层面对基础数据进行深度处理,主要包括用户画像和文章画像的构建。具体流程包括:基于离线数据和实时数据,通过多种算法进行数据分析和特征提取,构建用户兴趣模型和阅读习惯模型。

召回与排序

召回环节通过算法逻辑从海量文章中筛选出用户感兴趣的候选集合,集合规模通常在上千级别。排序环节则对候选文章进行用户画像模型结果的排序,生成最终的推荐列表。

推荐业务层

该层通过提供RESTful接口为推荐业务场景服务,主要包括以下功能:

  • Feed流推荐:支持用户在今日推荐场景中通过不断下拉刷新获取内容流。

转载地址:http://jvxp.baihongyu.com/

你可能感兴趣的文章
PIL Image对图像进行点乘,加上常数(等像素操作)
查看>>
PIL Image转Pytorch Tensor
查看>>
PIL&QOOT;IOERROR:带有大图像的图像文件被截断(&Q)
查看>>
PIL.Image、cv2的img、bytes相互转换
查看>>
PIL.Image进行图像融合显示(Image.blend)
查看>>
pilicat-dfs 霹雳猫-分布式文件系统
查看>>
Pillow lacks the JPEG 2000 plugin
查看>>
SpringBoot之ElasticsearchRestTemplate常用示例
查看>>
ping 全网段CMD命令
查看>>
ping 命令的七种用法,看完瞬间成大神
查看>>
Pinia入门(快速上手)
查看>>
Pinia:$patch的使用场景
查看>>
Pinia:$subscribe()的使用场景
查看>>
Pinpoint对Kubernetes关键业务模块进行全链路监控
查看>>
Pinterest 大规模缓存集群的架构剖析
查看>>
pintos project (2) Project 1 Thread -Mission 1 Code
查看>>
PinYin4j库的使用
查看>>
PIP
查看>>
pip install goose-extractor // SyntaxError: Missing parentheses in call to 'print'
查看>>
pip install mysqlclient报错
查看>>