展示HN:使用分层贝叶斯模型研究Hacker News、ArXiv 和 Google
Show HN: Research Hacker News, ArXiv & Google with Hierarchical Bayesian Models

原始链接: https://sturdystatistics.com/deepdive-search

加载中...

## 稳健统计:一种新的研究与文本分析方法 一位贝叶斯统计学家开发了一种工具,**稳健统计 (sturdystatistics.com)**,用于深入研究和文献综述,超越了传统的LLM方法。该工具利用分层贝叶斯混合模型(受基因组学启发)来组织和可视化文本数据,提供了一个透明且可定制的大型语言模型替代方案。 与LLM不同,它能够快速在小型数据集上进行训练,创建自定义分类法并能够探索引用网络,并配备了专门的“深度挖掘”功能。最初是为学术研究而构建的,现在它支持Hacker News、Google搜索结果和收益记录。 底层模型类似于LDA,但使用Pitman-Yor过程,擅长捕捉复杂的数据结构。它基于自定义的C语言Gibbs采样器,具有Python接口和DuckDB,用于快速查询。该创建者提供了一个API和一个免费使用的网站,并寻求Hacker News社区的反馈。一个演示关于AI幻觉的文献综述的视频可在此处观看:[https://www.youtube.com/watch?v=OUmDPAcK6Ns](https://www.youtube.com/watch?v=OUmDPAcK6Ns)。
相关文章

原文
Loading...
联系我们 contact @ memedata.com