展示HN:我抓取了30亿条Goodreads书评来训练一个更好的推荐模型。
Show HN: I scraped 3B Goodreads reviews to train a better recommendation model

原始链接: https://book.sv

输入你读过的书,我们的模型会为你推荐接下来要读的书。 搜索结果和生成的推荐仅包括达到流行度阈值的书籍。 较不流行的书籍可以在本网站的其他地方使用。 为了获得最佳效果,请提供 3 本或更多书籍。

## 书籍推荐引擎:book.sv - 摘要 一位开发者创建了book.sv网站,该网站包含一个基于超过30亿条Goodreads书评训练的推荐引擎。该网站提供两个主要功能:根据用户提供的书单推荐书籍,以及识别阅读过特定书籍集的Goodreads用户(“交集”功能)。 该模型优先预测用户可能阅读的下一本书,并且在输入3本或以上书名时表现良好。用户也可以找到与单本书籍相似的书籍。虽然通常准确,但反馈表明推荐结果可能偏向于热门书籍或同一作者的书籍,并且可能受益于筛选选项。 开发者使用了Hetzner服务器和Meilisearch进行索引。该项目引发了关于数据抓取伦理、API的可能性以及构建真正新颖的推荐系统(超越基于流行的建议)的挑战的讨论。该网站速度快且功能完善,为现有的书籍推荐平台提供了一个有希望的替代方案。
相关文章

原文
Input books you've read and receive recommendations on what to read next from our model. Only books that meet a popularity threshold are included in the search results and generated recommendations. Less popular books can be used elsewhere on this site. Provide 3+ books for best results.
联系我们 contact @ memedata.com