有了解今日头条系统
ss : 有了解今日头条系统架构的吗?请问每个用户的推荐列表 是在下拉刷新的时候生成的吗?
2018-04-09(6赞)
评论区:
王一丁 : 这种为了推荐的速度以及质量,大多数都会冗余数据 但不确定
EAsY : 我们做的信息流是实时加离线多种召回排序 ss : 实时算,系统能算的过来吗?
Caoz : 这个话题说来大了,首先用户已经标签化,你是怎样的用户只要一登录你的标签就跟随你的行为,并作为重要参数 跟随你的刷新和下拉操作。 其次是数据的预处理和缓存处理,基于你的标签,对缓存中的数据进行快速查询和拼接,提供 给你资料,但个别情况,你的标签过于冷门,或下拉过深超出缓存范围,可能会去数据库基于标签查询,并有一定机制做 缓存更新。 我不知道他们的方案,但如果我来设计,基本都是这个思路。 查询这块有很多优化的方法 实时查询也没想像 的那么耗费资源,数据都是结构化,预处理的,基于标签加时间逆序快查没那么难处理。
EAsY : 可以的 redis solr MySQL 多种存储结构 再加实时流计算 用户点击下次刷新都能实时反馈 整个架构并不耗时
EAsY : [强][强]和曹大大的思路差不多[呲牙][呲牙]
ss : 最近按这个写了个demo,现在卡在不能精确去重,存在给用户重复推的可能,曹大有思路吗? EAsY : 去重很简单的事
关注公众号"懒人找资源",星球资源一站式服务
Caoz : 卖家必看!亚马逊数据分析工具深度测评 2018-04-09(21赞)
评论区: 微光 : 这个赞
晚自习 : 点击进来怎么是这个? 晚自习 : 网路被劫持了?
Caoz : 被劫持了?!
晚自习 : 点击退出来回七八次,才看到顾小北 晚自习 : 我是用移动 4g啊,深圳地区啊 [大哭 ]
Caoz : 劫持后获利的公众号发出来,我报给微信,发现一个举报一个,这群王八蛋。 晚自习 : 微信是 qubanf123. 网站是 http://web.meirenzhi.com.cn/web/fx/20180409_1/
关注公众号"懒人找资源",星球资源一站式服务