展示HN:LLM工作原理 – 基于Karpathy讲座的交互式视觉指南
Show HN: How LLMs Work – Interactive visual guide based on Karpathy's lecture

原始链接: https://ynarwal.github.io/how-llms-work/

大型语言模型幕后解析:从原始互联网文本到对话助手——基于Andrej Karpathy的技术深度剖析。 训练数据:15万亿 Tokens 参数:4050亿 文本数据:44 TB Token词汇量:10万

Hacker News新 | 过去 | 评论 | 提问 | 展示 | 工作 | 提交登录展示 HN:LLM 的工作原理 – 基于 Karpathy 讲座的交互式视觉指南 (ynarwal.github.io)11 分,由 ynarwal__ 1 小时前发布 | 隐藏 | 过去 | 收藏 | 1 条评论所有内容均基于 Andrej Karpathy 的“大型语言模型入门”讲座 (youtube.com/watch?v=7xTGNNLPyMI)。我下载了讲稿并使用 Claude Code 从中生成了整个交互式网站——单个 HTML 文件。我发现不时重温这些内容很有用。帮助 learningToFly33 1 小时前 [–] 我看了看,解释得很好!如果你想扩展它,你也可以添加如何在最后一步为特定任务提供嵌入式数据,以及它如何影响预测结果。回复 考虑申请 YC 的 2026 年夏季批次!申请截止至 5 月 4 日 指南 | 常见问题 | 列表 | API | 安全 | 法律 | 申请 YC | 联系方式 搜索:
相关文章

原文

A Visual Deep Dive

Live LLM Response

Human: What is behind this text box?

A complete walkthrough of how large language models like ChatGPT are built — from raw internet text to a conversational assistant. Based on Andrej Karpathy's technical deep dive.

Training Tokens
15T

Parameters
405B

Text Data
44 TB

Token Vocabulary
100K

联系我们 contact @ memedata.com