Forschung Neues Stress-Test-Framework zeigt Fehler im fortschrittlichen KI-Argumentation Juli 29, 2025