SOURCE · X-KARPATHY

x-karpathy

26 条来自 x-karpathy 的内容

HOTNESS

转 Jarred Sumner：用 Rust 重写 Bun
2.0
Jarred Sumner 宣布将 JavaScript 运行时 Bun 用 Rust 重写。这一重大架构变更旨在提升性能与稳定性，原文发布在 bun.com 博客上。
x-karpathy2026年7月8日#科技
转推 Peter Gostev：我在Fable花了大量时间攻克最难的3D提示词，这是一段45分钟的视频，但我为你准备了60多个超酷的演示。此外，提示词将在下一条推文中发布。
2.0
Peter Gostev分享了一段45分钟的视频，展示了他花费大量时间在Fable平台上攻克最难的3D提示词后获得的60多个精彩演示。相关提示词将在后续推文中公布。
x-karpathy2026年7月3日#科技
转发 Etched：我们正式走出隐身模式。在成功完成A0流片、获得超过10亿美元的客户合同并筹集8亿美元后，我们已搭建首批机架。早期...
6.0
Etched宣布走出隐身模式，在成功完成A0流片、获得超10亿美元客户合同及8亿美元融资后，已建成首批机架。早期客户测试显示，该产品在推理工作负载上实现了SOTA（顶尖）吞吐量、延迟和能效表现。首批机架将于今年夏季发货。
x-karpathy2026年6月30日#科技
RT Engram
0.0
这是一条转发推文，转发了名为"Engram"的帖子，原文链接为 http://x.com/i/article/2069463677733142528。
x-karpathy2026年6月23日#科技
与Claude交互的全新范式：深度融入团队工作流
5.0
这是与Claude交互的第三种全新范式：它不再是一个需要访问的网站或下载的应用，而是一个自包含、持久化的异步实体，配备组织级工具和上下文，与人类团队并肩工作。一旦完成后台工程（跨工具、集成、计算环境、内存、安全等）使其"无缝运行"，Claude就像团队成员一样自然融入——你可以像与人交谈一样与它交流，它能协助处理各种工作负载。这代表了LLM用户界面/用户体验的第三次重大变革。
x-karpathy2026年6月23日#科技
大约一年前，我在构建 menugen 时发现，最困难的部分远非代码本身，而是需要像组装宜家家具一样拼凑大量服务才能让它真正落地——这就是 DevOps：支付、认证、数据库、安全、域名等各种服务。
3.5
作者反思了构建 menugen 的经历，指出最困难的部分不是编写代码，而是整合支付、认证、数据库、安全、域名等各种 DevOps 服务。他期待未来只需对 AI 智能体说一句"构建 menugen"，它就能自动浏览服务文档、获取 API 密钥、完成调试并部署上线。作者认为整个 DevOps 生命周期都应转变为代码，并配备支持智能体原生交互的传感器和执行器，让人类无需再手动点击网页或按钮。
x-karpathy2026年3月26日#科技
转发 Derek Thompson：本月医学界悄然迎来奇迹。过去五周，我们陆续看到以下突破：
8.0
过去五周内医学界接连迎来多项重大突破，包括礼来公司的三重激动剂GLP-1药物retatrutide显著减少脂肪和全身炎症、RevMed的新型胰腺癌药物展现出前所未有的延长寿命能力、一次性的PCSK9基因编辑疗法大幅降低LDL胆固醇、梅奥诊所的AI辅助放射学大幅提升癌症检出率，以及针对转移性实体瘤的新疗法。虽然各项证据级别不同，但这些成果可能预示着美国两大死因——心脏病和癌症的死亡率将迎来重大下降。其中，lorlatinib使转移性实体瘤患者七年后病情恶化比例从标准治疗的97%降至45%，堪称癌症治疗质量的巨大飞跃。
x-karpathy2026年5月31日#科学
RT Thariq
0.0
这是Karpathy转发Thariq的一条推文，内容为Thariq分享的一篇文章链接（http://x.com/i/article/2061850535708483585），原文来自社交平台X上的一篇长文。
x-karpathy2026年6月2日#科技
这是一个令人无比激动的发布——Claude Fable 5 与 Mythos 使用相同的底层模型，但增加了安全防护。测试成绩非常出色，它在所有指标上都以明显优势达到了 SOTA……
9.0
Karpathy 盛赞 Claude Fable 5 的发布，称其在所有基准测试中以明显优势达到 SOTA，并且定性上也是一次值得版本号大版本升级的跨越式进步（他认为与去年 11 月 Claude 4.5 的飞跃相当）。该模型在长时间解决极难问题的场景中表现尤为突出，用户可以赋予它比以往更宏大的任务。不过，模型仍有一些 quirks，安全防护在发布初期可能过于敏感，希望后续能调优。Karpathy 还谈到，随着可随时调用的优质软件越来越多，他对软件的需求也在大幅增长，感觉像是“释放你的思想”。
x-karpathy2026年6月9日#科技
对SpaceX及其故事——过去、现在与未来——充满敬畏。你可以从十多个不同角度去思考，然后继续一次次地刷新认知。热烈祝贺团队！🚀
2.0
对SpaceX的过去、现在与未来深感敬畏。从十多个不同角度审视其故事，每一次都能带来全新的震撼与启发。向整个团队致以热烈祝贺！🚀
x-karpathy2026年6月12日#科技
个人更新：我已加入Anthropic。我认为LLM前沿领域的未来几年将尤为关键。我很兴奋能加入这个团队，重回研发工作。我仍对教育怀有深厚热情，并计划适时重启相关工作。
3.0
Andrej Karpathy宣布加入人工智能公司Anthropic，认为大型语言模型前沿领域的未来几年将具有特殊意义。他表示很高兴重回研发岗位，同时仍对教育保持热情，计划未来继续投入相关工作。
x-karpathy2026年5月19日#科技
这个技巧真的很好用：在查询末尾让LLM“以HTML格式输出”，然后在浏览器中查看生成的文件...
4.0
Karpathy分享了一个实用技巧：在向大语言模型提问时，要求其“以HTML格式输出”回答，然后在浏览器中查看生成的文件。他认为音频是人类向AI输入的优选方式，而视觉（图像/动画/视频）则是AI向人类输出的优选形式——因为人脑约三分之一是专门处理视觉的并行处理器。他预测AI输出将从原始文本→Markdown→HTML→交互式神经视频/模拟逐步演进，并指出当前阶段值得探索的是要求AI输出HTML格式。
x-karpathy2026年5月11日#科技
红杉资本Ascent 2026炉边谈话（约一周前）精彩摘录
6.5
卡帕西在红杉资本AI Ascent 2026炉边谈话中分享了三大主题：首先，LLM远不止是提升已有工具的速度，他通过三个例子说明LLM打开了全新可能性——无需经典代码的menugen应用、用.md技能替代.sh脚本安装软件、以及处理非结构化知识的LLM知识库。其次，他探讨了LLM能力"参差不齐"的根源，认为这与领域的可验证性以及经济因素有关——训练数据分布决定了模型在哪些领域表现出色。最后，他讨论了"智能体原生经济"，即产品与服务向传感器、执行器和逻辑的分解，以及如何让信息对LLM最大可读。
x-karpathy2026年4月30日#科技
这是我最近经常引用的一句话
1.0
这是Karpathy分享的一则引文，强调思维方式可以外包，但理解无法外包。核心观点是：你可以让别人替你思考，但无法让别人替你去理解。这句话体现了对学习和理解本质的深刻洞察。
x-karpathy2026年4月30日#科技
马上去看了《拯救计划》（改编自安迪·威尔的同名小说，他也是《火星救援》的作者）。既欣慰又高兴地说……
1.0
卡帕西分享了观看《拯救计划》的观后感，称赞电影忠实还原了原著的内容与基调，并高度评价了书中对外星生命在生物化学、进化史、感官、心理学、语言及科技体系等方面的科学细节刻画。他认为电影虽有少许超级英雄片的套路感，但核心的“洛基”与兄弟情谊表现得非常出色，是一部值得一看的佳作。
x-karpathy2026年3月20日#娱乐
所有大语言模型个性化功能中的一个常见问题：记忆对模型的干扰似乎过于强烈
1.5
Karpathy 指出，所有大语言模型的个性化功能都存在一个普遍问题：记忆功能对模型的干扰过于强烈。两个月前随口问过的一个问题，会被模型当作用户的深层兴趣，在未来对话中反复提及，显得有些用力过猛。
x-karpathy2026年3月25日#科技
转发 Nick Levine：与 @AlecRad 和 @DavidDuvenaud 的新合作：你是否曾梦想与过去的人对话？介绍 talkie，一个 13B 参数模型……
2.0
转发 Nick Levine 的新工作：与 @AlecRad 和 @DavidDuvenaud 合作，推出了 talkie——一个仅使用 1931 年前文本训练的 13B 参数模型。该模型旨在帮助理解语言模型的泛化能力，例如能否教会 talkie 进行编程。视频展示了相关成果。
x-karpathy2026年4月27日#科技
RT Zain Shah：想象一下，你屏幕上的每个像素都直接从一个模型实时流式传输。没有HTML，没有布局引擎，没有代码。只是你确切想看到的内容...
3.0
Zain Shah 分享了一个名为 Flipbook 的原型项目，它能够直接从模型实时流式传输屏幕上的每个像素，无需HTML、布局引擎或代码，实现所见即所得的体验。
x-karpathy2026年4月22日#科技
感谢Sarah，很高兴能参加播客！也乐意在回复中继续回答更多问题。
2.5
安德烈·卡帕西在Sarah Guo的No Priors播客中讨论了工程范式转变、AI精神病、AutoResearch、SETI-at-Home式AI运动机会、模型格局及二阶效应等前沿话题。
x-karpathy2026年3月21日#科技
软件恐怖：litellm PyPI供应链攻击。简单的`pip install litellm`就足以窃取SSH密钥、AWS/GCP/Azure凭证、Kubernetes配置...
8.5
LiteLLM的PyPI包1.82.8版本被恶意篡改，安装后会窃取SSH密钥、云服务凭证、API密钥等敏感数据并发送到远程服务器。该恶意版本仅存在约1小时，但由于litellm月下载量达9700万次且被众多项目依赖，影响范围极广。
x-karpathy2026年3月24日#科技
当我大约一年前构建menugen时，我观察到最困难的部分远非代码本身，而是你必须像组装宜家家具一样组装的大量服务
3.0
Karpathy在构建MenuGen时发现，最困难的部分不是编写代码，而是需要集成支付、认证、数据库、安全等各种服务。他期待未来能通过简单指令让AI代理自动完成从开发到部署的整个DevOps流程，将复杂的服务集成工作完全自动化。
x-karpathy2026年3月26日#科技
- 起草了一篇博客文章 - 用LLM花了4小时精心改进论点 - 哇，感觉太棒了，它太有说服力了！ - 有趣的想法，让它来论证相反观点...
3.0
作者用LLM花了4小时精心改进博客论点后感觉良好，但让LLM论证相反观点时，它却彻底推翻了原有论点并说服作者相反观点才是正确的。这展示了LLM能熟练论证任何立场，可作为形成个人观点的有用工具，但需注意其迎合倾向。
x-karpathy2026年3月28日#科技
新型供应链攻击针对npm axios，最受欢迎的HTTP客户端库每周下载量达3亿次
8.5
Axios作为npm上最受欢迎的HTTP客户端库，每周下载量达3亿次，最近遭受供应链攻击。攻击者通过恶意版本植入远程访问木马，突显了未固定依赖版本的安全风险。专家建议通过本地设置、容器化或改变包管理默认配置来防御此类攻击。
x-karpathy2026年3月31日#科技
LLM知识库
3.5
作者分享了使用LLM构建个人知识库的经验：将原始文档索引后，通过LLM自动编译成结构化的Markdown维基，包含摘要、反向链接和概念分类，并利用Obsidian作为前端界面进行查询和可视化，实现知识的高效管理和探索。
x-karpathy2026年4月2日#科技
关于AI赋能民众提升政府透明度与问责制的思考
4.5
作者认为AI将赋能民众，通过处理海量政府数据来增强政府的可见性、可读性和问责制。传统上只有少数专业人士能分析复杂政府信息，而AI将打破这一瓶颈，让更多人参与监督立法、预算、游说等政府行为，从而提升民主社会的透明度与问责机制。
x-karpathy2026年4月4日#政治
Farzapedia：Farza的个人维基百科，遵循我关于维基LLM推文的优秀示例
3.0
Farzapedia是一个基于个人日记、笔记和对话数据创建的个人维基百科项目，采用"文件优先于应用"的理念，让用户完全掌控自己的数据，并能自由选择AI工具进行处理。这种方法使个人知识变得显式化、可检查，且数据以通用格式存储，确保互操作性和用户自主权。
x-karpathy2026年4月4日#科技

加载下一批 30 条更新于 —