sunliwen / poco

Poco v1.6

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

[好药师] 分析目前商品相关性计算结果的质量

jacobfan opened this issue · comments

  1. 有多少商品相关性计算出来了,分数如何;
  2. 是否采集的用户行为数据有问题

好药师,小刀:

现在推荐部分相当不准,运营那边反馈不好,有没有什么好的办法和方案可以解决一下呢

相关推荐部分的准确性,希望能帮忙找找原因,再做一些具体的调整,这方面的压力很大。

@brook-peng 目前 batch server、推荐相关的改动已经相继上线, 能不能在这些问题上提供点反馈,数据质量是否有改善。

@lisztli ,如 http://www.ehaoyao.com/product-2956.html “太极藿香正气口服液”,但在右侧的推荐商品中,有幼儿奶粉,排毒养颜胶囊,轮椅车之类, 这个地方是调用的/unit/item的推荐

@brook-peng 这个条目的 /unit/item 结果是由几种结果生成的,在 db 中, 轮椅这个结果确实是出现在「浏览过该商品的用户也浏览过」这个选项里的。

推荐结果: http://poco.ehaoyao.com/api/v1.6/public/recommender/?&api_key=prod-b02c65ef&callback=ehaoyao._function.fillRecommendByGoodsId&amount=10&user_id=null&item_id=2956&type=%2Funit%2Fitem&1419666496524

有一点需要讨论,就是 /unit/item 类型的推荐使用的 processorIfEmptyTryNextProcessor, 它所使用的 filter 是 SimpleRecommendationResultFilter,这个 filter 的过滤行为是不做任何过滤,导致了轮椅也出现在结果中。

@jacobfan @brook-peng 这个推荐的行为目前看是符合程序的预期的; 这种推荐是否合理,我们需要继续讨论。

1.不确定浏览“太极藿香正气口服液”而浏览“幼儿奶粉“及其它的用户日志的量有多少,我想,基于用户浏览日志更多是希望能跨物品门类对同一话题的物品进行推荐,如果运算过程没有问题,那问题就出在历史数据,目前可行的办法,似乎只能结推荐结果进行门类过滤
2.@lisztli 提到的/unit/item 使用的推荐器是IfEmptyTryNextProcessor,我在看代码的时候有点奇怪,IfEmptyTryNextProcessor使用了子推荐器的gettop方法,为什么不调用子推荐器的过滤器,

我在#110 中涉及到一些其他的问题,找时间一起讨论一下

@jacobfan @brook-peng 我也觉得使用每个子 filter 的过滤器比较合理。