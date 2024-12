Bis kurz vor Weihnachten stellt OpenAI im Rahmen der an den Weihnachtsklassiker Twelve Days of Christmas angelehnten Livestream-Reihe 12 Days of OpenAI einige große und kleine Features vor.

hieß es in der Ankündigung. Zuletzt wurden bereits der Start des neuen Abonnementmodells ChatGPT Pro sowie ein großes Update für das vor wenigen Monaten eingeführte Modell o1 vorgestellt. Kurz darauf stellte das Unternehmen das Reinforcement Fine-Tuning in den Fokus.

Mit dem Reinforcement Fine-Tuning bietet OpenAI Entwickler:innen und Engineering-Expert:innen eine Option an, um eine personalisierte Modellversion zu kreieren, die spezifische und teils unikale Nutzugsmustern abdecken kann. So erklärt das Unternehmen:

This new model customization technique enables developers to customize our models using dozens to thousands of high quality tasks and grade the model’s response with provided reference answers. This technique reinforces how the model reasons through similar problems and improves its accuracy on specific tasks in that domain.