快讯内容
谷歌 DeepMind 团队在 2024 年 8 月 6 日发布的论文《优化 LLM 测试时计算比扩大模型参数规模更高效》中探讨了大模型(LLM)在面对复杂问题时,是否可以通过增加测试时的计算量来提高决策质量。研究表明,增加测试时(test-time compute)计算比扩展模型参数更有效。这一发现与 OpenAI 近期发布的 o1 模型原理相似,o1 模型在给出答案之前,会生成一系列中间推理步骤,不断完善自己的思维过程,尝试不同的策略,并能识别自身错误,从而提升性能。 此外,谷歌和斯坦福大学研究人员在