WEBVTT

00:00:00.133 --> 00:00:03.933
Herzlich willkommen zur zweiten
Folge der KI-News von ORCA.nrw.

00:00:04.566 --> 00:00:08.366
Wir geben einen kompakten Überblick
über die Lage der KI für Lehrkräfte.

00:00:08.600 --> 00:00:11.633
Mein Name ist Benjamin Passen
und ich bin Juniorprofessor

00:00:11.633 --> 00:00:14.633
an der Uni Bielefeld und forsche
zu KI in der Bildung.

00:00:14.933 --> 00:00:17.833
In den letzten Monaten
ist ein neues Trendthema in der KI

00:00:17.833 --> 00:00:20.833
Diskussion aufgetaucht,
nämlich “Agentenische KI”.

00:00:21.033 --> 00:00:22.633
Was ist das eigentlich?

00:00:22.633 --> 00:00:25.633
Agentensysteme gibt es in der KI Forschung
schon lange.

00:00:25.900 --> 00:00:29.833
Damit sind Systeme gemeint,
die ihre Umwelt wahrnehmen, planen können,

00:00:29.833 --> 00:00:33.466
was sie als nächstes tun sollten
und diesen Plan dann in die Tat umsetzen.

00:00:34.333 --> 00:00:37.433
Bei Sprachmodellen ist es ja so,
dass wir sie mit einem Prompt füttern

00:00:37.433 --> 00:00:39.466
und dann genau eine Antwort bekommen.

00:00:39.466 --> 00:00:43.200
Bei Agenten ist die Idee,
dass wir ihnen einmal eine Aufgabe geben

00:00:43.500 --> 00:00:46.700
und sie dann selbst alle Schritte planen
und ausführen, die nötig sind.

00:00:46.833 --> 00:00:49.766
Wir können auch ein ganzes Netzwerk
von Agenten aufbauen,

00:00:49.766 --> 00:00:52.766
die zusammenarbeiten,
um eine Aufgabe zu erfüllen.

00:00:53.000 --> 00:00:55.133
Das klingt erst mal sehr beeindruckend.

00:00:55.133 --> 00:00:59.100
Tatsächlich steckt dahinter aber bloß
eine ganze Reihe von Sprachmodellanfragen.

00:00:59.233 --> 00:01:01.100
Lasst uns mal ein Beispiel basteln.

00:01:01.100 --> 00:01:04.400
Angenommen, meine Aufgabe ist
Ich möchte gerne einen Absatz

00:01:04.400 --> 00:01:07.466
schreiben, der in Kürze erklärt, was
agentische KI ist.

00:01:07.600 --> 00:01:10.466
Normalerweise würde ich diese Aufgabe
jetzt direkt als prompt

00:01:10.466 --> 00:01:13.466
in ein Sprachmodell eingeben
und mir dann die Antwort anschauen.

00:01:13.666 --> 00:01:15.966
Wenn ich nicht zufrieden bin,
dann prompte ich halt neu.

00:01:15.966 --> 00:01:17.666
Bei einem agentischen System

00:01:17.666 --> 00:01:20.700
wird stattdessen meine Anfrage
in mehreren Schritten verarbeitet.

00:01:20.800 --> 00:01:23.800
Zum Beispiel könnte die erste Anfrage
an das Sprachmodell lauten

00:01:23.900 --> 00:01:27.700
Du bist ein Planer, Du bist rational,
gründlich und fehlerfrei.

00:01:28.066 --> 00:01:31.700
Ich möchte gerne einen Absatz schreiben,
der in Kürze erklärt, was agentische

00:01:31.700 --> 00:01:32.433
KI ist.

00:01:32.433 --> 00:01:35.200
Welche Schritte sind nötig,
um diese Aufgabe zu erfüllen?

00:01:35.200 --> 00:01:35.833
Merke

00:01:35.833 --> 00:01:36.600
Diesen prompt

00:01:36.600 --> 00:01:39.700
habe ich zwar als Mensch entworfen,
er lässt sich aber leicht wiederverwenden.

00:01:39.900 --> 00:01:42.466
Ich kann einfach eine andere Aufgabe
einfügen.

00:01:42.466 --> 00:01:45.433
Als Antwort kommt
dann eine Reihe von Schritten zurück.

00:01:45.433 --> 00:01:48.666
In dem Fall
Definition, Funktionen und Fertigkeiten,

00:01:48.933 --> 00:01:51.933
Anwendungsgebiete und Zusammenfassung.

00:01:52.033 --> 00:01:55.566
Als nächstes erstelle ich dann eine neue
Aufgabe für jeden dieser Schritte

00:01:55.900 --> 00:01:58.500
und gebe sie dem Sprachmodell.
Zum Beispiel:

00:01:58.500 --> 00:02:00.333
Du bist ein wissenschaftlicher Autor.

00:02:00.333 --> 00:02:03.300
Du bemühst dich um faktische Korrektheit
und Verständlichkeit.

00:02:03.300 --> 00:02:07.766
Bitte schreib mir einen Satz mit folgendem
Inhalt: Definition von Agentischer KI.

00:02:07.800 --> 00:02:10.566
Und ganz am Ende
folgt noch eine abschließende Anfrage.

00:02:10.566 --> 00:02:11.900
Du bist ein Redakteur.

00:02:11.900 --> 00:02:14.900
Füge alle vorherigen Sätze
zu einem kohärenten Text zusammen.

00:02:15.066 --> 00:02:18.600
Bemühe dich dabei um stilistische
und grammatikalische Korrektheit.

00:02:18.833 --> 00:02:20.933
Und dann bekomme ich erst den finalen
Text.

00:02:20.933 --> 00:02:22.766
Das haben wir jetzt von Hand gebastelt.

00:02:22.766 --> 00:02:26.333
In einem agentischen KI
System würden diese Schritte automatisch

00:02:26.533 --> 00:02:30.033
nacheinander ausgeführt und ich würde
nur die Antwort ganz am Ende sehen.

00:02:30.400 --> 00:02:33.400
Die Hoffnung ist, dass so die Ergebnisse
deutlich besser werden,

00:02:33.533 --> 00:02:36.666
weil ja jede einzelne Anfrage an
das Sprachmodell kleiner ist.

00:02:37.266 --> 00:02:39.733
Es lassen sich auch Teilschritte
dazwischenschalten,

00:02:39.733 --> 00:02:41.700
die externe Quellen hinzuziehen.

00:02:41.700 --> 00:02:44.566
So wie wir es in der letzten Folge
schon mal erwähnt haben.

00:02:44.566 --> 00:02:48.400
Für den Bereich Lehre wäre agentische KI
im Prinzip sehr spannend,

00:02:48.633 --> 00:02:49.800
weil wir uns pädagogische

00:02:49.800 --> 00:02:51.466
Agenten ausdenken könnten,

00:02:51.466 --> 00:02:54.133
die Lernende bei ihren Hausarbeiten
unterstützen und dabei

00:02:54.133 --> 00:02:56.466
kleine pädagogische Entscheidungen
treffen.

00:02:56.466 --> 00:02:59.000
Zum Beispiel
wie viel Unterstützung gerade nötig ist,

00:02:59.000 --> 00:03:03.266
welches Lernmaterial gerade helfen würde
und wie man eine Aufgabe abwandeln könnte,

00:03:03.400 --> 00:03:06.400
so dass sie einfacher wird,
wenn die Studierenden nicht weiterkommen.

00:03:06.566 --> 00:03:10.266
Auch in der Forschung wird aktuell
viel mit agentischer KI experimentiert.

00:03:10.666 --> 00:03:14.500
Es fehlt aus meiner Sicht allerdings
noch an überzeugenden Evaluationen,

00:03:14.600 --> 00:03:16.066
dass das wirklich funktioniert.

00:03:16.066 --> 00:03:19.200
Ich sehe aktuell noch Grund zur Skepsis
und will das an dem Beispiel

00:03:19.200 --> 00:03:20.466
von vorhin illustrieren.

00:03:20.466 --> 00:03:23.200
In dem Beispiel
habe ich eine Reihe von Annahmen gemacht,

00:03:23.200 --> 00:03:24.733
nämlich dass mein Sprachmodell überhaupt

00:03:24.733 --> 00:03:28.400
in der Lage ist, die ursprüngliche Aufgabe
adäquat in Teilschritte zu zerlegen

00:03:28.900 --> 00:03:31.900
und dass jeder Teilschritt
auch korrekt ausgeführt wird.

00:03:32.166 --> 00:03:33.800
Denn der Sinn ist ja gerade,

00:03:33.800 --> 00:03:34.433
dass die Schritte

00:03:34.433 --> 00:03:36.233
von Menschen nicht mehr geprüft werden,

00:03:36.233 --> 00:03:38.166
sondern automatisch
im Hintergrund passieren.

00:03:38.166 --> 00:03:40.366
Wenn dort
aber irgendwo ein Fehler geschieht,

00:03:40.366 --> 00:03:42.566
dann kann der ganze agentische Prozess
scheitern.

00:03:42.566 --> 00:03:46.266
Und tatsächlich kann man ja schon
in meinem Beispiel fragen, ob Definition,

00:03:46.633 --> 00:03:50.200
Funktion und Fertigkeiten,
Anwendungsgebiete und Zusammenfassung

00:03:50.500 --> 00:03:53.566
eine sinnvolle Einteilung ist,
um agentische KI zu erklären.

00:03:54.033 --> 00:03:57.566
Ich selbst hätte zum Beispiel auf jeden
Fall noch so was wie Kritik hinzugefügt.

00:03:57.833 --> 00:03:59.000
Das passiert hier aber nicht.

00:03:59.000 --> 00:04:02.000
Ich habe auch in meine Prompts
etwas hineingeschrieben wie:

00:04:02.000 --> 00:04:05.000
Du bemühst dich um faktische Korrektheit
und Verständlichkeit.

00:04:05.133 --> 00:04:08.233
Aber es garantiert mir ja
niemand, dass das auch wirklich passiert.

00:04:08.266 --> 00:04:10.766
Und tatsächlich
hat der Text, der am Ende herauskommt,

00:04:10.766 --> 00:04:14.100
eigentlich nichts mit agentischer KI
zu tun, so wie ich sie beschreiben würde.

00:04:14.133 --> 00:04:17.500
Nüchtern gesagt:
Agentische KI heißt im Wesentlichen bloß,

00:04:17.700 --> 00:04:21.933
dass eine Reihe von Sprachmodellanfragen
automatisch in Reihe ausgeführt wird.

00:04:22.466 --> 00:04:25.100
Und dann hoffen wir,
dass mehr Sprachmodellanfragen

00:04:25.100 --> 00:04:28.166
auch zu besseren Ergebnissen führen,
aber ohne Garantie.

00:04:29.033 --> 00:04:32.200
Deshalb würde ich vorerst
lieber mehr menschliche Mitarbeit

00:04:32.200 --> 00:04:33.600
und Prüfung empfehlen.

00:04:33.600 --> 00:04:35.800
Lieber sollte man also selbst
die Prompts schreiben.

00:04:35.800 --> 00:04:37.333
Damit kommen wir zum Praxistipp.

00:04:37.333 --> 00:04:39.166
Wie schreibt man eigentlich gute Prompts?

00:04:39.166 --> 00:04:42.733
Sagen wir Ich will einen Satz
schreiben, der generative KI definiert.

00:04:42.833 --> 00:04:44.666
Erster Schritt zu einem guten Prompt:

00:04:44.666 --> 00:04:47.600
Das Sprachmodell sollte mir nicht
die Arbeit aus der Hand nehmen,

00:04:47.600 --> 00:04:49.566
sondern
ich sollte ja selbst die Verantwortung

00:04:49.566 --> 00:04:51.500
für das Ergebnis übernehmen können.

00:04:51.500 --> 00:04:55.000
Also mache ich lieber selbst einen Entwurf
und bitte dann um Feedback.

00:04:55.066 --> 00:04:56.833
Ich frage also das Sprachmodell:

00:04:56.833 --> 00:04:59.333
Bitte gibt mir Feedback zu folgendem Text.

00:04:59.333 --> 00:05:03.300
Generative KI versteht Text
und gibt dann die passende Antwort.

00:05:03.400 --> 00:05:06.100
Ich habe ihr höflicherweise
bitte geschrieben.

00:05:06.100 --> 00:05:09.600
Das mache ich aber nicht, weil ich denke,
dass das Sprachmodell Gefühle hat

00:05:09.600 --> 00:05:11.166
oder ein Recht auf Höflichkeit,

00:05:11.166 --> 00:05:14.300
sondern weil ich mir erhoffe,
dass in den Trainingsdaten freundlich

00:05:14.300 --> 00:05:18.300
formulierte Aufgaben auch eher in der Nähe
guter Antworten waren

00:05:18.566 --> 00:05:21.700
und deshalb die Antwort des Sprachmodells
jetzt auch besser wird.

00:05:21.866 --> 00:05:24.100
Die Antwort des Sprachmodells
ist aber noch recht lang.

00:05:24.100 --> 00:05:27.000
Also füge ich hinzu: Gib keine langen Erklärungen.

00:05:27.000 --> 00:05:28.533
Das funktioniert hier sogar.

00:05:28.533 --> 00:05:32.133
Das Sprachmodell gibt mir nur noch kurz
die Fehler und eine verbesserte Version.

00:05:32.500 --> 00:05:35.500
Aber generell sind Verneinungen
eher eine schlechte Idee.

00:05:35.733 --> 00:05:38.733
Sprachmodelle haben mit Verneinung
immer noch ein Problem,

00:05:38.833 --> 00:05:41.833
weil der verneinte Text
trotzdem assoziiert werden kann.

00:05:41.833 --> 00:05:44.700
Und damit passiert vielleicht genau
das Gegenteil von dem, was ich wollte.

00:05:44.700 --> 00:05:48.500
Es ist ein bisschen so, als wenn ich sage:
Bitte denkt nicht an rosa Elefanten!

00:05:48.500 --> 00:05:50.733
Und man denkt unwillkürlich an rosa
Elefanten.

00:05:50.733 --> 00:05:53.800
Kann auch helfen, wenn man
dem Sprachmodell eine Rolle zuweist.

00:05:53.933 --> 00:05:58.033
Hier etwa: Du bist ein Schreib-Tutor und
hilfst mir beim akademischen Schreiben.

00:05:58.433 --> 00:06:01.433
Du bist hilfsbereit,
professionell, höflich und präzise.

00:06:01.633 --> 00:06:04.200
Bitte gib mir Feedback zu folgendem Text:

00:06:04.200 --> 00:06:07.700
Generative KI versteht Text
und gibt dann die passende Antwort.

00:06:07.800 --> 00:06:10.200
Jetzt wird sogar ein bisschen inhaltlich
korrigiert.

00:06:10.200 --> 00:06:13.466
Das Modell weist mich darauf hin,
dass Sprachmodelle nicht verstehen,

00:06:14.100 --> 00:06:18.000
aber trotzdem Sprachmodellen
Rollen zuzuweisen ist spekulativ.

00:06:18.366 --> 00:06:22.100
Es gibt keine Garantie dafür, dass sich
das Sprachmodell auch an die Rolle hält,

00:06:22.100 --> 00:06:23.166
die man ihm zugewiesen hat.

00:06:23.166 --> 00:06:26.066
Besser ist deshalb,
passende Quellen einzugeben,

00:06:26.066 --> 00:06:28.933
die die passende faktische Grundlage
enthalten.

00:06:28.933 --> 00:06:32.266
Hier gebe ich zum Beispiel Textabschnitte
aus einem Kurs über generative

00:06:32.266 --> 00:06:35.066
KI ein, den wir an der Uni
Bielefeld erstellt haben.

00:06:35.066 --> 00:06:38.066
Und jetzt bekomme ich auch mal inhaltlich
wertvolles Feedback.

00:06:38.233 --> 00:06:41.466
Meine Entwurf ist zu simpel
und irreführend, denn generative KI

00:06:41.466 --> 00:06:45.033
versteht nicht, ist statistisch
und gibt möglicherweise falsche Antworten.

00:06:45.600 --> 00:06:47.966
Das würde ich auch so sehen.
Also zusammenfassend:

00:06:47.966 --> 00:06:50.466
Sprachmodelle funktionieren
dann am besten,

00:06:50.466 --> 00:06:54.133
wenn wir eine Aufgabe stellen, bei der
bloß Text neu kombiniert werden muss.

00:06:54.400 --> 00:06:56.266
Denn darin sind die Modelle nun mal
am besten.

00:06:56.266 --> 00:06:59.400
Dafür sollten wir am besten Textquellen
zur Verfügung stellen, denen wir

00:06:59.400 --> 00:07:00.500
vertrauen.

00:07:00.500 --> 00:07:03.600
Agentische KI und Retrieval Augmented Generation

00:07:03.800 --> 00:07:06.800
können diese Arbeit
teilweise automatisieren.

00:07:06.900 --> 00:07:10.200
Aber es lohnt sich, selbst mal zu lernen,
wie man solche Prompts schreibt.

00:07:10.400 --> 00:07:14.166
Und es lohnt sich, unseren Studierenden
und Schüler*innen das auch beizubringen.

00:07:14.266 --> 00:07:16.200
Das war natürlich nur ein Beispiel.

00:07:16.200 --> 00:07:19.000
Wer es ganz genau wissen will,
dem lege ich das Promptlabor

00:07:19.000 --> 00:07:21.966
Hochschullehre 2.00,
des KI-Campus ans Herz.

00:07:21.966 --> 00:07:23.500
Da geht es noch deutlich tiefer

00:07:23.500 --> 00:07:26.866
und ich bin dort auch als Lehrkraft
für verantwortungsvolle KI Nutzung dabei.

00:07:27.033 --> 00:07:29.666
Apropos verantwortungsvolle KI Nutzung

00:07:29.666 --> 00:07:32.533
Wann immer wir mit Technologie
in der Lehre zu tun haben

00:07:32.533 --> 00:07:36.166
und das gilt ganz besonders
für KI, reicht es meiner Meinung nach

00:07:36.166 --> 00:07:38.500
nicht allein,
sich mit der Technik auszukennen.

00:07:38.500 --> 00:07:41.100
Mir ist natürlich wichtig,
technische Grundlagen zu vermitteln.

00:07:41.100 --> 00:07:42.866
Ich komme ja aus der Informatik.

00:07:42.866 --> 00:07:44.400
Aber noch wichtiger ist mir, euch

00:07:44.400 --> 00:07:48.300
Mut zu machen, euch auch aus anderen
Fachrichtungen selbstbewusst am Diskurs

00:07:48.566 --> 00:07:52.600
um sinnvolle und verantwortungsvolle KI
Nutzung im Bildungsbereich zu beteiligen.

00:07:52.633 --> 00:07:55.866
Denn pädagogische Entscheidungen
sollten didaktisch sinnvoll

00:07:56.033 --> 00:07:59.400
und gesellschaftlich verantwortlich sein,
nicht nur technologisch machbar.

00:08:00.000 --> 00:08:03.000
Und dazu brauchen wir interdisziplinäre
Zusammenarbeit.

00:08:03.066 --> 00:08:07.333
Lehrkräfte aus den Einzelfächern können
am besten bewerten, welche KI Nutzungs-

00:08:07.333 --> 00:08:10.666
praktiken nach den Standards
des jeweils eigenen Fachs sinnvoll sind

00:08:10.933 --> 00:08:11.866
und welche nicht.

00:08:11.866 --> 00:08:12.666
In Zusammenarbeit

00:08:12.666 --> 00:08:16.700
mit Lernenden können wir auch erforschen,
was die gesellschaftlichen Effekte sind.

00:08:17.100 --> 00:08:20.100
Und dann braucht es eben auch
Techniker*innen wie mich,

00:08:20.133 --> 00:08:22.533
die das alles in Technik übersetzen
können.

00:08:22.533 --> 00:08:26.766
Das Zusammenspiel aus technischer
Perspektive, Anwendungsperspektive

00:08:27.000 --> 00:08:30.233
und gesellschaftlicher Perspektive
heißt auch Dagstuhl-Dreieck.

00:08:30.433 --> 00:08:32.766
Und das möchte ich noch einmal
allen ans Herz legen,

00:08:32.766 --> 00:08:34.700
die sich mit Bildungstechnologien
beschäftigen.

00:08:34.700 --> 00:08:37.366
Zum Abschluss
noch eine Frage aus der Community.

00:08:37.366 --> 00:08:40.933
Es heißt immer, wir sollen die Antworten
von Sprachmodellen kritisch reflektieren.

00:08:41.133 --> 00:08:43.400
Aber wie macht man das eigentlich?

00:08:43.400 --> 00:08:45.933
Nehmen wir mal die Beispiele aus
dieser Folge.

00:08:45.933 --> 00:08:49.400
Wenn ich nur oberflächlich prüfe,
dann sind die Antworten des Sprachmodells

00:08:49.400 --> 00:08:51.066
ja gar nicht so falsch.

00:08:51.066 --> 00:08:55.133
Ich muss wissen oder zumindest ahnen,
dass hier etwas nicht stimmen könnte.

00:08:55.566 --> 00:08:57.500
Und ob es zusätzliche Quellen braucht.

00:08:57.500 --> 00:08:59.533
Es braucht also zwei Dinge.

00:08:59.533 --> 00:09:03.600
Erstens ein grundsätzliches, gesundes
Misstrauen gegenüber Sprachmodellen.

00:09:04.066 --> 00:09:05.733
Ich sollte eigentlich immer damit rechnen,

00:09:05.733 --> 00:09:08.366
dass etwas übersehen wird,
was wichtig sein könnte.

00:09:08.366 --> 00:09:11.366
Oder Sprachmodelle einfach Unfug ausgeben.

00:09:11.366 --> 00:09:14.433
Und zweitens brauche ich Fachwissen,
um die Ausgabe

00:09:14.433 --> 00:09:18.000
eines Sprachmodells prüfen
und passende Quellen finden zu können.

00:09:18.000 --> 00:09:22.233
Wenn ich dieses Misstrauen nicht habe oder
mangels Fachwissen nicht umsetzen kann,

00:09:22.766 --> 00:09:25.800
dann kann ich Sprachmodelle eigentlich
nicht verantwortungsvoll nutzen.

00:09:25.900 --> 00:09:28.200
Und das müssen wir im Unterricht
dringend vermitteln.

00:09:28.200 --> 00:09:30.766
Sonst steht uns nämlich ein großes Problem
ins Haus.

00:09:30.766 --> 00:09:34.766
Lernende, die im Fach nicht gut sind,
merken nicht, dass das Sprachmodell

00:09:34.766 --> 00:09:36.000
ihnen Unfug erzählt.

00:09:36.000 --> 00:09:37.833
Und lernen auch nichts dazu.

00:09:37.833 --> 00:09:38.800
Sie werden dadurch immer

00:09:38.800 --> 00:09:42.100
abhängiger von Sprachmodellen,
weil sie selbst immer weniger mitkommen.

00:09:42.766 --> 00:09:45.900
Lernende, die ohnehin schon gut
im Fach sind, werden nur noch besser.

00:09:46.366 --> 00:09:48.200
Da geht eine Schere auf.

00:09:48.200 --> 00:09:51.500
Wenn wir nichts dagegen tun.
So weit die zweite Folge der KI-News.

00:09:51.733 --> 00:09:53.200
Es ist vielleicht aufgefallen.

00:09:53.200 --> 00:09:56.200
Wir haben uns umbenannt
von KI Update auf KI-News.

00:09:56.333 --> 00:09:59.700
KI Update heißt nämlich
schon ein Angebot von KI-Edu NRW.

00:10:00.166 --> 00:10:02.733
Schöne Grüße dahin
und eine Empfehlung, sich

00:10:02.733 --> 00:10:06.033
das KI Update von KI-Edu
NRW auch mal anzusehen.

00:10:06.833 --> 00:10:07.900
Schreibt gerne weiter.

00:10:07.900 --> 00:10:10.600
Fragen und Rückmeldung
und bis zum nächsten Mal.

