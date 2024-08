Auf dem eigenen Blog erklärt xAI mehr über die Möglichkeiten, die Grok-2 mit sich bringt. Noch ist diese neue Version in der Betaphase – ebenso wie Grok-2 mini. Diese Version ist kleiner und schneller. Grok-2 ist für Premium+ User in der aktuellsten Version von X zu nutzen. Dabei soll die AI-Assistenz besonders leistungsfähig sein. Getestet wurde sie im LMSYS (Large Model Systems Organization)-Kontext. Im Leaderboard konnte sie Modelle wie Claude 3.5 Sonnet, GPT-4 Turbo und Mistral Large 2 im sogenannten Elo Score hinter sich lassen. Aber auch intern wurde die neue Grok-Version getestet und optimiert. So schreibt das Team:

[…] We focused on evaluating model capabilities in two key areas: following instructions and providing accurate, factual information. Grok-2 has shown significant improvements in reasoning with retrieved content and in its tool use capabilities, such as correctly identifying missing information, reasoning through sequences of events, and discarding irrelevant posts.