ChatGPT im HR: 90 Sekunden schneller — und trotzdem schlechter
Eine HTW-Studie mit 51 HR-Fachkräften zeigt das nüchterne Bild hinter dem Hype: KI spart kaum Zeit und verliert klar bei der Qualität.
In einer experimentellen Studie der HTW Berlin lösten 51 HR-Fachkräfte Aufgaben in drei Feldern — Arbeitsrecht, Personalgewinnung, Entgeltgestaltung —, die eine Hälfte mit allen üblichen Quellen, die andere ausschließlich mit ChatGPT 3.5. Das Ergebnis ist ernüchternd: Die KI-Gruppe war im Schnitt nur 1:30 Minuten schneller (17:35 vs. 19:05) und erreichte bei der Qualität nur 2,41 von 5 Punkten gegenüber 3,27 der menschlichen Gruppe. „Schneller, aber nicht besser“ fasst es zusammen. Der größte Zeitvorteil lag im Recruiting, die größte Qualitätslücke im Arbeitsrecht. KI im HR ist also kein Selbstläufer — sie verschiebt Aufwand, ersetzt aber kein Urteil.
Über ChatGPT im Personalmanagement wird viel versprochen. Wir haben es gemessen, statt darüber zu spekulieren — in einem kontrollierten Experiment mit 51 HR-Fachkräften an der HTW Berlin. Das Ergebnis taugt nicht für eine Heilsbotschaft, aber es ist ehrlich, und genau deshalb nützlich.
Das Experiment
51 Fachkräfte bearbeiteten dieselben Aufgaben für ein fiktives Unternehmen in drei HR-Feldern. Die Kontrollgruppe nutzte alle herkömmlichen Informationsquellen, die Experimentalgruppe ausschließlich ChatGPT 3.5 in der Gratisversion. Gemessen wurden Bearbeitungszeit, Lösungsqualität gegen vorab definierte Standardlösungen und die Zufriedenheit der Teilnehmenden. Drei harte Befunde blieben.
Befund 1: Der Zeitvorteil ist klein
Die KI-gestützte Gruppe war im Schnitt 1:30 Minuten schneller — 17:35 gegen 19:05. Das ist messbar, aber kein Durchbruch. Der größte Vorteil zeigte sich im Recruiting (rund zweieinhalb Minuten), der kleinste im Arbeitsrecht (knapp eine halbe Minute). Wer von KI eine Halbierung der Bearbeitungszeit erwartet, wird enttäuscht: Das Tippen von Prompts und das Prüfen der Antworten kostet selbst Zeit.
KI war 90 Sekunden schneller und fast einen ganzen Qualitätspunkt schlechter. Das ist kein Ersatz, das ist eine Verschiebung.
Befund 2: Die Qualitätslücke ist groß
Auf der Fünf-Punkte-Skala erreichte die KI-Gruppe nur 2,41, die menschliche 3,27 — eine signifikante Lücke. Sie verteilt sich höchst ungleich: Im Arbeitsrecht brach die KI ein (1,71 gegen 3,88), im Recruiting war sie nahezu gleichauf (3,06 gegen 3,18), bei der Entgeltgestaltung dazwischen. Die Maschine ist also nicht überall gleich schwach — aber dort, wo Präzision zählt, am schwächsten.
Was das praktisch heißt
Die nüchterne Lesart: ChatGPT ist im HR ein nützlicher Entwurfshelfer, kein Sachbearbeiter. Es beschleunigt das Generieren von Erstfassungen, besonders bei kreativen, wenig regelgebundenen Aufgaben wie Stellenanzeigen. Es ersetzt aber nicht das fachliche Urteil — und wer es so einsetzt, riskiert teure Fehler. Die spannendere Frage ist deshalb nicht „Mensch oder Maschine?“, sondern wie man beide kombiniert. Mehr dazu in Nicht das Tool entscheidet, sondern die KI-Kompetenz und, zu den Risiken, in Wo ChatGPT im Arbeitsrecht gefährlich wird.

Häufige Fragen
Spart ChatGPT im HR viel Zeit? Kaum. In der HTW-Studie war die KI-Gruppe im Schnitt nur 1:30 Minuten schneller (17:35 vs. 19:05), weil das Formulieren von Prompts und Prüfen der Antworten selbst Zeit kostet.
Ist ChatGPT im HR so gut wie ein Mensch? Nein. Auf der Fünf-Punkte-Skala erreichte die KI nur 2,41, der Mensch 3,27. Besonders im Arbeitsrecht war die Lücke groß (1,71 vs. 3,88), im Recruiting nahezu gleichauf.
Wofür eignet sich ChatGPT im HR? Als Entwurfshelfer für kreative, wenig regelgebundene Aufgaben wie Stellenanzeigen — nicht als Sachbearbeiter für präzise, rechtssichere Arbeit.