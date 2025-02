Anthropic hat das neueste KI-Update veröffentlicht: Claude 3.7 Sonnet kann schneller rechnen, komplexe Probleme lösen und „sich Zeit nehmen, um nachzudenken“. Mit Claude Code kommt zudem ein Tool, das Programmieren einfacher machen soll.

Das KI-Unternehmen Anthropic hat mit Claude 3.7 Sonnet eine neue Version des Sprachmodells vorgestellt – und verspricht damit einen entscheidenden Fortschritt. Der Tech-Experte Saadh Jawwadh schreibt auf Threads über das KI-Modell-Update:

Seems like a new Gangster model for math, coding and agentic tasks.

Besonders spannend: Es handelt sich um das erste hybride Reasoning-Modell auf dem Markt. Nutzer:innen können zwischen schnellen Antworten und einer tiefergehenden, reflektierten Analyse wählen. Claude 3.7 Sonnet schlägt außerdem laut eigener Angaben GPT-4o in acht Kategorien und ist speziell darauf ausgelegt, echte Unternehmensprobleme zu lösen – mit klarem Fokus auf Praxistauglichkeit.

Parallel dazu bringt Anthropic mit Claude Code ein KI-Tool heraus, das speziell für Entwickler:innen gedacht ist.

© Anthropic

Ein neues Coding Tool für Entwickler:innen

Anthropic launchte jüngst Claude Code – ein Coding Tool, das Entwickler:innen direkt im Terminal unterstützt.

Claude Code: Anthropics neues KI-Coding-Tool in der Research Preview, © Anthropic

Claude Code kann Dateien durchsuchen, Code-Änderungen vornehmen, Tests schreiben und Fehler beheben. Laut Anthropic übernimmt das Tool Aufgaben, die sonst 45 Minuten dauern würden, in wenigen Sekunden. Frühe Tester:innen berichten von beeindruckenden Ergebnissen. Anthropic beschreibt die Möglichkeiten des neuen Tools wie folgt:

Claude Code is an active collaborator that can search and read code, edit files, write and run tests, commit and push code to GitHub,

Der Claude Code ist aktuell in einer limitierten Research Preview verfügbar. Mehr Details gibt es im Einführungsvideo von Anthropic auf YouTube.

Anthropics neues KI-gestütztes Coding Tool in der Research Preview, © Anthropic

Claude 3.7: Verbesserte Mathematik- und Coding-Fähigkeiten

Laut Anthropic soll das neue Modell deutlich besser in Mathematik, Coding und logischem Schlussfolgern sein als seine Vorgänger:innen. Besonders in Benchmarks setzt es neue Maßstäbe: In acht verschiedenen Kategorien schlägt es OpenAIs GPT-4o und andere KI-Modelle.

Claude 3.7 Sonnet achieves state-of-the-art performance,

heißt es in der offiziellen Ankündigung. Besonders beeindruckend: Der erweiterte Denkmodus, der es der KI ermöglicht, sich Zeit zu nehmen und komplexe Probleme Schritt für Schritt zu lösen. Wer Claude 3.7 über die API nutzt, kann sogar festlegen, wie lange das Modell „nachdenken“ darf – ein Novum in der Welt der KI.

Claude 3.7 Sonnet ist jetzt für alle Claude-Pläne verfügbar – von Free über Pro bis hin zu Team und Enterprise. Zudem kann das Modell über die Anthropic API, Amazon Bedrock und Vertex AI von Google Cloud genutzt werden. Der erweiterte Denkmodus steht auf allen Plattformen außer der kostenlosen Version zur Verfügung.

Wie schlägt sich Claude 3.7 in der Praxis?

In ersten Tests zeigt sich, dass Claude 3.7 Sonnet besonders in den Bereichen Coding und logisches Denken überzeugt. Das Modell erkennt präziser den Unterschied zwischen schädlichen und unbedenklichen Anfragen und reduziert unnötige Ablehnungen um 45 Prozent im Vergleich zur vorherigen Version. Die aktuelle Systemkarte liefert eine umfassende Sicherheitsbewertung über mehrere Kategorien hinweg und bietet eine detaillierte Analyse der Evaluierungen zur Richtlinie für verantwortungsvolles Skalieren – ein wertvolles Tool für andere KI-Labore und Forschende.

Claude 3.7 Sonnet setzt neue Maßstäbe in Software Engineering Benchmarks

Unternehmen wie Cursor, Cognition und Replit bestätigen dem Modell eine herausragende Leistung in der Software-Entwicklung. Bei Canva schnitt Claude 3.7 besser ab als seine Vorgänger:innen und erzeugte nahezu fehlerfreies, produktionsreifes Code-Design.

Claude 3.7 Sonnet setzt neue Maßstäbe in Software Engineering Benchmarks, © Anthropic

KI-Agenten auf neuem Niveau: Claude 3.7 in der TAU-Bench-Bewertung

Claude 3.7 Sonnet überzeugt in der TAU-Bench-Bewertung, einem Test-Framework, das die Fähigkeiten von KI-Agent:innen anhand anspruchsvoller realer Aufgaben mit Benutzer:innen- und Tool-Interaktionen prüft. Die Ergebnisse zeigen eine deutliche Leistungssteigerung gegenüber vorherigen Modellen.

Claude 3.7 Sonnet erzielt Bestwerte bei TAU-Bench-Tests für KI-Agenten, © Anthropic

Benchmark-Sieger:in: Claude 3.7 Sonnet übertrifft alle Erwartungen

Claude 3.7 Sonnet zeigt herausragende Fähigkeiten in Anweisungsbefolgung, logischem Denken, multimodalen Aufgaben und agentenbasiertem Coding. Besonders das erweiterte Denkvermögen steigert die Performance in Mathematik und Naturwissenschaften erheblich. Neben klassischen Benchmarks übertrifft das Modell in internen Tests sogar alle bisherigen KI-Systeme – selbst in strategischen Gameplay-Szenarien.

Claude 3.7 Sonnet überzeugt in mehreren Benchmarks mit Spitzenwerten, © Anthropic

Interessant ist zudem, dass Anthropic weniger auf mathematische Wettbewerbsaufgaben optimiert, sondern sich stärker auf realistische Business-Szenarien konzentriert. Das bedeutet, dass Claude 3.7 Sonnet speziell darauf ausgelegt ist, echte Unternehmensprobleme zu lösen – ein klarer Fokus auf Praxistauglichkeit.

Wettlauf um die beste KI: Wo steht Anthropic?

Anthropic positioniert sich mit Claude 3.7 Sonnet als direkte Konkurrenz zu OpenAI, Google und xAI. Dabei verfolgt das Unternehmen eine eigene Philosophie: Statt zwischen verschiedenen Modellen für unterschiedliche Aufgaben zu wechseln, kombiniert Claude 3.7 schnelle Antworten mit tiefgehenden Analysen in einer einzigen KI.

Doch nicht alles ist perfekt: Während Claude 3.7 Sonnet neue Maßstäbe setzt, bleibt die Monetarisierung eine Herausforderung. Die Kostenstruktur bleibt unverändert bei drei US-Dollar pro Million Input Tokens und 15 US-Dollar pro Million Output Tokens – ein Preismodell, das sich besonders für Unternehmen mit hohen Anforderungen lohnt.

KI, die mehr kann: Claude 3.7 Sonnet und Claude Code erweitern menschliches Potenzial

Claude 3.7 Sonnet und Claude Code markieren einen wichtigen Schritt in Richtung intelligenterer KI-Systeme, die nicht nur assistieren, sondern aktiv mitdenken. Mit tiefgehendem logischem Denken, autonomen Prozessen und smarter Zusammenarbeit bringen sie uns einer Zukunft näher, in der KI menschliche Fähigkeiten gezielt ergänzt und weiterentwickelt.

Die Entwicklung von Claude: Von Assistenz zur eigenständigen Problemlösung, © Anthropic

Die Grafik zeigt die geplante Entwicklung von Claude über die kommenden Jahre. Während das KI-Modell 2024 vor allem als Assistenzsystem dient, das individuelle Arbeitsprozesse verbessert, soll es 2025 in der Lage sein, eigenständig mit Expert:innen zusammenzuarbeiten und Teams produktiver zu machen. Bis 2027 strebt Anthropic an, dass Claude komplexe Herausforderungen eigenständig löst – Aufgaben, die sonst Jahre in Anspruch nehmen würden. Diese Vision verdeutlicht, dass Claude nicht nur als Tool, sondern als echte:r Innovationstreiber:in gedacht ist.