OpenAI 宣讲第二天：发布强化微调研究项目，支持多任务定制模型

Time：2024-12-07 Click：1056

【OpenAI宣讲第二天:推出强化微调研究项目,能够使用多个高质量任务定制模型】金色财经报道,OpenAI连续12个工作日的宣讲进入第二天,今天介绍的是强化微调研究项目(Reinforcement Fine-Tuning Research Program)。据悉,该项目旨在使开发人员和机器学习工程师能够创建经过微调的专家模型。新的模型自定义技术使开发人员能够使用数十到数千个高质量任务定制模型,并根据提供的参考答案对模型的响应进行分级。此技术强化了模型对类似问题解决方案的推导,以及在特定任务上的准确性。OpenAI表示,鼓励研究机构、大学和企业申请使用,预计在法律、保险、医疗保健、金融和工程等领域有积极结果,因为该模型在结果具有客观“正确”答案(大多数专家都会同意)的任务中表现出色。