Generic filters
FS Logoi

Prüfung von Generativer KI: ZEW-Forschende entwickeln Rahmenbedingungen

Die beschlossene KI-Verordnung der EU sieht vor, dass KI-Modelle „für allgemeine Zwecke mit systemischem Risiko“ besonders strikt überprüft werden. In diese Modellkategorie gehören auch populäre generative KI-Modelle wie GPT4 von OpenAI. ZEW-Forschende schlagen nun Rahmenbedingungen vor, wie die Prüfungen solcher Modelle systematisch durchgeführt werden sollten. Der Vorschlag basiert auf einem Forschungsprojekt, das von der Baden-Württemberg […]

von | 25.04.24

Die KI-Verordnung sieht vor, dass betreffende KI-Modelle durch sogenanntes Adversarial Testing systematisch auf Schwachstellen geprüft werden.
Foto: putilov_denis - stock-adobe.com

Die beschlossene KI-Verordnung der EU sieht vor, dass KI-Modelle „für allgemeine Zwecke mit systemischem Risiko“ besonders strikt überprüft werden. In diese Modellkategorie gehören auch populäre generative KI-Modelle wie GPT4 von OpenAI. ZEW-Forschende schlagen nun Rahmenbedingungen vor, wie die Prüfungen solcher Modelle systematisch durchgeführt werden sollten. Der Vorschlag basiert auf einem Forschungsprojekt, das von der Baden-Württemberg Stiftung gefördert wurde.

„Die Prüfung generativer KI mit systemischen Risiken benötigt klar definierte Ziele, abgegrenzte Rollen sowie Anreiz- und Koordinierungssysteme für alle Beteiligten. Nur so sind verlässliche Prüfergebnisse zu erwarten – und diese sollten in standardisierter Form veröffentlicht werden. Um Interessenkonflikte zu vermeiden, sollte die Prüfung durch unabhängige Dritte durchgeführt werden. Als externe Dienstleistung kann so ein spezialisierter Markt für KI-Sicherheitstests entstehen“, fasst Dr. Dominik Rehse, Ko-Autor des Vorschlags und Leiter der ZEW-Nachwuchsforschungsgruppe „Design digitaler Märkte“, zusammen.

Prüfung auf Schwachstellen durch Adversarial Testing

Die KI-Verordnung sieht vor, dass betreffende KI-Modelle durch sogenanntes Adversarial Testing systematisch auf Schwachstellen geprüft werden. Dabei handelt es sich um Stresstests, die darauf ausgelegt sind die KI-Modelle durch wiederholte Interaktion zu unerwünschtem Verhalten zu provozieren.

„Allerdings ist das Adversarial Testing in der KI-Verordnung nicht genauer geregelt. Die Vorgabe verweist lediglich auf Verhaltenskodizes und harmonisierte Standards, die nun entwickelt werden. Es gilt, diese Kodizes und Standards so zu gestalten, dass sie zu einer effizienten und effektiven Prüfung führen“, so Rehse.

Hierfür eignet sich aus Sicht der ZEW-Wissenschaftler insbesondere das sogenannte Red Teaming. Diese umfassendere Form des geforderten Adversarial Testing bezieht zusätzlich verschiedene Arten von Angriffen auf das Modell selbst ein.

„Internes Red Teaming wird zwar nach eigenem Bekunden von den meisten großen KI-Entwicklungshäusern bereits durchgeführt, allerdings gibt es dafür keine standardisierten Ansätze, auch nicht für KI-Modelle desselben Typs. Dadurch wird der Vergleich der Ergebnisse unnötig erschwert. Vor allem fehlt bei den derzeitigen Versuchen meist ein klar definiertes Ziel, sodass unklar ist, ob und wann ein Modell ausreichend getestet wurde“, kritisiert ZEW-Wissenschaftler Sebastian Valet, Ko-Autor aus dem Forschungsbereich „Digitale Ökonomie“.

ZEW-Forschende schlagen vier Rollen für das Red Teaming vor

Entsprechend müssen für das Red Teaming klare Strukturen und Rollen definiert werden, damit die Potenziale dieses Prüfverfahrens effizient genutzt werden können. Die ZEW-Forschenden schlagen dafür vier definierte Rollen vor, die je eigene Aufgaben, Ziele und Anreize haben, um den Prüfprozess möglichst effizient zu gestalten. Die Rollen sind:

  1. die Organisatoren der Prüfung,
  2. das testende Red Team,
  3. Validierer, die entscheiden, ob tatsächlich ein Fehlverhalten gefunden wurde, und
  4. das KI-Entwicklerteam. Jede dieser Rollen sollte dabei von unabhängigen Einheiten ausgefüllt werden.

Nur so hat beispielsweise ein testendes Red Team einen Anreiz seine Aufgabe bestmöglich zu erfüllen.

„Ähnlich wie bei der externen Rechnungsprüfung darauf spezialisierte Unternehmen beauftragt werden, sollte auch das Red Teaming an externe Prüfstellen gegeben werden. Dabei sollten die KI-Entwicklungshäuser die Kosten für ein unabhängiges Red Teaming tragen: Da der Prüfprozess günstiger ist, je weniger Fehlverhalten gefunden wird, haben die Entwickler so einen Anreiz, ihre Modelle bereits im Vorfeld so gut wie möglich zu testen“, erklärt Ko-Autor Johannes Walter aus dem ZEW-Forschungsbereich „Digitale Ökonomie“.

Weitere Informationen gibt es unter www.zew.de.

Bildquelle, falls nicht im Bild oben angegeben:

Jetzt Newsletter abonnieren

Brennstoff für Ihr Wissen, jede Woche in Ihrem Postfach.

Hier anmelden

26. VDI-Kongress AUTOMATION diskutiert Technologie-Trends
26. VDI-Kongress AUTOMATION diskutiert Technologie-Trends

Erkenntnisse, die im vergangenen Monat noch aktuell waren, sind heute bereits wieder überholt: Die Geschwindigkeit, mit der Generative Künstliche Intelligenz sich weiterentwickelt und Prozesse verändert, beeindruckt auch die Fachwelt der Mess- und Automatisierungstechnik. Auf dem 26. VDI-Kongress AUTOMATION am 1. und 2. Juli in Baden-Baden diskutierte die Community über Technologie-Trends, Transformationen und Perspektiven einer „Human-centric Automation“.

mehr lesen
Holzwespe verhilft Oliver Schwarz zum Award
Holzwespe verhilft Oliver Schwarz zum Award

Das Projekt „KMUmanoid” des Fraunhofer IPA zielt darauf ab, den Einsatz humanoider Roboter im Mittelstand zu fördern. Trotz der Fortschritte in der Entwicklung humanoider Roboter und ersten Praxistests in großen Firmen haben kleine und mittlere Unternehmen (KMU) bisher kaum Zugang zu diesen Technologien.

mehr lesen
VDI-Studie: Generative KI verändert das Ingenieurwesen
VDI-Studie: Generative KI verändert das Ingenieurwesen

Generative KI hält zunehmend Einzug in das Ingenieurwesen – mit spürbaren Auswirkungen auf Arbeitsprozesse, Rollenbilder und Ausbildung. Der Verein Deutscher Ingenieure (VDI) hat im Rahmen einer aktuellen Studie Potenziale und Risiken beleuchtet und konkrete Handlungsempfehlungen formuliert.

mehr lesen
Digitaltag: Digitale Demokratie im Fokus
Digitaltag: Digitale Demokratie im Fokus

Mehr als 2.500 Aktionen und über 5.000 Stunden Programm: Zum sechsten Mal hat der Digitaltag Menschen in ganz Deutschland für digitale Themen begeistert und einen zentralen Beitrag zur Förderung digitaler Teilhabe geleistet. Ein besonderer Fokus lag dieses Jahr auf dem Thema Digitale Demokratie. In zahlreichen Aktionen wurden Angebote zur digitalen Bürgerbeteiligung vorgestellt und über den Umgang mit Risiken wie Hassrede und Fake News diskutiert.

mehr lesen
Daniel Hager als ZVEI-Präsident elect nominiert
Daniel Hager als ZVEI-Präsident elect nominiert

Der ZVEI-Vorstand hat Daniel Hager (53), Vorsitzender des Aufsichtsrats der Hager Group, als ZVEI-Präsident elect nominiert. Er soll im Rahmen der Mitgliederversammlung am 20. Mai 2026 satzungs- und turnusgemäß gewählt werden und die Nachfolge von ZVEI-Präsident Dr. Gunther Kegel übernehmen, der das Amt seit 2020 ausübt.

mehr lesen

atp weekly

Der Newsletter der Branche

Ihr kostenfreier E-Mail-Newsletter für alle Belange der Automatiserung.

Sie möchten das atp magazin testen

Bestellen Sie Ihr kostenloses Probeheft

Überzeugen Sie sich selbst: Gerne senden wir Ihnen das atp magazin kostenlos und unverbindlich zur Probe!

Finance Illustration 03