Anthropic hat seit 2024 seinen technischen Take-Home-Interviewtest für Bewerber wiederholt überarbeitet, um KI-gestütztes Betrügen einzudämmen. Das Leistungsoptimierungsteam, das für die Durchführung des Tests verantwortlich ist, habe das gefunden Fortschritte bei den KI-Codierungstools machten diese Änderungen erforderlich. Teamleiter Tristan Hume erklärte in einem Blogbeitrag vom Mittwoch, dass jedes neue Claude-Modell Test-Redesigns erforderlich gemacht habe. Claude Opus 4 übertraf bei gleichem Zeitlimit die meisten menschlichen Bewerber, während Claude Opus 4.5 mit der Leistung der Spitzenkandidaten mithalten konnte. Dadurch war Anthropic nicht mehr in der Lage, unter den Take-Home-Testbedingungen zwischen der Arbeit führender menschlicher Bewerber und seinem fortschrittlichsten KI-Modell zu unterscheiden. Hume hat einen neuen Test entwickelt, der sich weniger auf die Hardwareoptimierung konzentriert und ihn so komplex macht, dass er aktuelle KI-Tools in Frage stellt. Der ursprüngliche Test wurde auch im Blog-Beitrag geteilt und forderte die Leser auf, alternative Lösungen vorzuschlagen. In dem Beitrag hieß es: „Wenn Sie Opus 4.5 am besten beherrschen, würden wir uns freuen, von Ihnen zu hören.“





