Published on 2025-08-31

如何选择辅助编程大模型:统计数据、经验与成本考量

新模型频繁般发布、各路自媒体推荐的最佳实践不胜枚举,让人们容易陷入选择模型的困扰之中:要不要选择新的模型来提升生产力?要不要更换模型来降低成本? 就拿大模型相对成熟的代码协助来说,cursor、windsurf、zed等IDE工具几乎每周都会带来结合新模型而带来新玩法。然而,这些新鲜事物的学习成本,是否能提升产出呢?

在过去的几年中,我从GPT3.5开始基于LLM进行开发(例如RAG,agent应用),也付费使用各种AI辅助编程工具超过30个月,同时,也曾深陷各种自媒体慷慨分享的“知识漩涡”之中,希冀能帮助我更好的使用LLM。

基于这些经验,对于层出不穷的模型和用法该如何进行甄选?是否要替换自己的模型?几个月前费劲周章所实现的功能是否可以通过模型更迭而轻而易举的实现呢?下面是我对辅助编程大模型选择的观点:

1. 根据统计数据,而不是自媒体的推荐来选择模型

基于openRouter的统计数据能看到不同时间维度、不同应用维度下各个模型的使用分布情况和top表。从编程相关的标签进行钻取,可以直观获取到哪些模型被广泛应用于编程领域。再结合时间维度,便能够获取到统计意义上被“最广泛”选择的编程大模型。 不要轻信自媒体的推荐,很多自媒体只希望获取流量而不是提供合理的观点(很容易看到相互矛盾的观点),因为前者更容易获得驱动他们撰写的经济利益,而openRouter并非依靠数据来盈利,这是本质差别。

2. 认可自己的宝贵经验,不需要频繁切换模型

如果自己的经验已经被证明有效,比如某模型适合自己的应用,解决了实际问题,那么就不需要频繁的切换模型,即便大模型有重大版本迭代,但这并不意味着适合你的应用场景。我个人非常喜欢使用一个小众ts/js library(solidjs),但某些“久负盛名”的模型,却对它存在巨大幻觉,即使它存在大版本更新。考虑到大模型的原理,字面意义上的更强,可能会对某些领域造成更多的幻觉。

3. 降低成本是切换模型的一个重要因素

若模型能够满足需求,但价格较高,那么寻找一定程度上的替代,而不是一蹴而就的替代是理性的模式。先在当前流程中,将简单任务尝试替代,以节省部分成本,等到输出稳定后,再进一步提升替代率。

总结一下,如果还没有自己熟稔的模型,那么通过统计数据来选择,而不是根据某些自媒体的营销话述。一旦用得顺手,那就不要狐疑的用下去,新的模型出来先不要替换,而是缓慢的结合统计数据推荐的模型,来小规模替代,让模型始终作为自己的生产力工具。

built byHannus, a former statistician