聚焦与打磨:推动本地模型发展
作者非常希望本地模型能在编程助手中真正可用,但目前从选择推理引擎、模型、量化方式到模板配置的繁琐流程,体验远不如直接使用托管API。文章指出本地模型生态存在碎片化、缺乏端到端打磨、注意力分散等问题,工具参数流支持缺失就是一个典型例子。为此,作者看好Salvatore Sanfilippo的ds4.c——一个专为DeepSeek V4 Flash在128GB以上Mac上运行而设计的窄域推理引擎,并在Pi编程助手中构建了pi-ds4扩展,将整个引擎内嵌,无需额外配置即可使用。核心思路是:选一个赢家(模型+硬件+引擎组合),集中精力将其打磨到极致,再逐步扩展到更多配置。