模型优化正向着适配智能体工作流发展
工具使用的演变:从提示设计到原生功能支持
Anthropic计算机使用能力的突破
对未来的预期
-
许多开发者正在引导大语言模型执行他们所需的代理行为,这使得快速且丰富的探索成为可能:在数量较少的情况下,开发者会对大语言模型进行微调,以更可靠地执行特定的代理功能。例如,尽管许多LLM原生支持函数调用,但它们通过接收函数描述作为输入,然后生成输出令牌来请求正确的函数调用。对于那些对生成正确的函数调用至关重要的应用,针对特定函数调用的微调可以显著提高模型的可靠性。(但请避免过早优化!我仍然看到许多团队在应该更多地使用提示之前就开始进行微调。) -
当像工具使用或计算机使用这样的能力对许多开发者有价值时,主要的大语言模型提供商会将这些能力直接构建到他们的模型中:尽管OpenAI的o1-preview在高级推理方面帮助了消费者,但我认为它在代理推理和规划方面更为有用。大多数大语言模型已经针对回答问题进行了优化,主要是为了提供良好的消费者体验,目前已经能够将它们应用于复杂的代理工作流程中,以构建有价值的应用。构建原生支持代理中特定操作的LLM的趋势将大幅提升代理性能。在未来几年内,这个方向上的大量性能提升将会实现。
参考资料
本文采用「CC BY-SA 4.0 CN」协议转载自互联网、仅供学习交流,内容版权归原作者所有,如涉作品、版权和其他问题请给「我们」留言处理。