Skip to content

话TopicTracker

趋势分类关于

Loading deep-dive…

© 2026 TopicTracker

关于条款隐私

来自 HackerNews查看原文 ↗

译文语言译文语言

评估不同大语言模型的安全研究能力

本文系统评估了多种主流大语言模型（LLMs）在网络安全研究领域的实际能力，包括漏洞分析、逆向工程、恶意代码识别等任务。通过标准化测试基准，对比了不同模型在安全场景下的表现差异，为安全研究人员选择合适工具提供参考依据。

相关报道

I have a simple test I would like everyone to run. Go to your favorite LLM and ask “how do I get my tax rate lower? Be accurate and specific.” Then ...
1.0
A Twitter user proposes a test comparing tax advice from a large language model and a financial newsletter, asking which provides a more valuable answer on how to lower one's tax rate accurately and specifically.