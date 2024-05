Auf dem eigenen Blog erklärt OpenAI, dass GPT-4o effizienter als andere Modelle ist und deshalb für alle User bereitgestellt werden kann, auch für nicht zahlende. Das bezieht sich aber auf die Text- und Image-Input-Optionen, wobei Plus User ein höheres Message Limit haben. In den kommenden Wochen kommt eine Alphaversion des Voice Modes für GPT-4o in der Plus-Version. Und im API-Kontext sind Text- und Bildeingaben schon möglich, in den kommenden Wochen erhalten erste Developer den Audio- und Video-Input-Zugang.

Auch geht OpenAI auf die Risiken ein, die durch dieses multimodale Modell hervorgerufen werden könnten.

We recognize that GPT-4o’s audio modalities present a variety of novel risks. Today we are publicly releasing text and image inputs and text outputs. Over the upcoming weeks and months, we’ll be working on the technical infrastructure, usability via post-training, and safety necessary to release the other modalities. For example, at launch, audio outputs will be limited to a selection of preset voices and will abide by our existing safety policies. We will share further details addressing the full range of GPT-4o’s modalities in the forthcoming system card.