Der neue Evaluate Tab soll erstellte Prompts mit Real World Inputs vergleichen und es Developern ermöglichen, ihre Testfälle bei Bedarf anzupassen und alle mit einem Klick auszuführen. Anthropic erklärt:

Testing prompts against a range of real-world inputs can help you build confidence in the quality of your prompt before deploying it to production. With the new Evaluate feature you can do this directly in our Console instead of manually managing tests across spreadsheets or code.