WEBVTT

00:00:00.000 --> 00:00:03.666
Herzlich Willkommen zur dritten Folge
der Ki-News von ORCA.NRW

00:00:04.033 --> 00:00:07.833
Wir wollen einen kompakten Überblick
zu KI für Lehrkräfte geben.

00:00:08.166 --> 00:00:11.233
Mein Name ist Benjamin Paaßen
und ich bin Juniorprofessur

00:00:11.266 --> 00:00:14.366
an der Uni Bielefeld und forsche
zu KI in der Bildung.

00:00:14.566 --> 00:00:16.133
Fangen wir an mit einer Neuigkeit

00:00:16.133 --> 00:00:20.133
OpenAI hat vor einigen Wochen
den sogenannten Study Mode herausgebracht.

00:00:20.200 --> 00:00:24.533
Wenn man im Study Mode mit ChatGPT spricht,
dann verrät ChatGPT nicht mehr

00:00:24.533 --> 00:00:28.633
direkt die Lösung für eine Aufgabe,
sondern versucht pädagogisch vorzugehen.

00:00:28.766 --> 00:00:30.166
Hier ist mal ein Beispiel.

00:00:30.166 --> 00:00:33.366
Ich sage ChatGPT,
dass ich als Hausaufgabe diskutieren soll,

00:00:33.533 --> 00:00:36.200
ob KI Vertrauen in die Forschung zerstört

00:00:36.200 --> 00:00:39.366
und frage, ob ChatGPT
meine Aufgabe für mich machen kann.

00:00:40.066 --> 00:00:41.100
Das tut ChatGPT

00:00:41.100 --> 00:00:44.100
dann tatsächlich nicht, sondern
stellt erst mal ein paar Rückfragen.

00:00:44.400 --> 00:00:47.133
Wenn ich die beantworte, schlägt
ChatGPT mir vor,

00:00:47.133 --> 00:00:50.700
dass es mir Vorlagen geben könnte
für jeden Teil meiner Hausaufgabe.

00:00:50.800 --> 00:00:54.066
Und wenn ich das bejahe, dann kriege
ich trotzdem eine Lösung heraus.

00:00:54.566 --> 00:00:55.900
Das ist auch kein Wunder,

00:00:55.900 --> 00:00:59.466
denn der Study Mode ist nicht wirklich
eine neue Variante von ChatGPT.

00:00:59.866 --> 00:01:00.766
Es wird lediglich

00:01:00.766 --> 00:01:04.733
das existierende Sprachmodell
mit ein paar System-Prompts kombiniert.

00:01:05.533 --> 00:01:09.800
Also wenn ich eine Frage stelle, dann wird
im Hintergrund meine Anfrage kombiniert

00:01:09.800 --> 00:01:13.800
mit Text wie: “Du bist eine Lehrkraft
und sollst nicht die Lösung verraten.”

00:01:14.100 --> 00:01:15.600
Oder so ähnlich.

00:01:15.600 --> 00:01:19.333
Die genaue Formulierung dieser System
Prompts ist Firmengeheimnis von openAI.

00:01:19.800 --> 00:01:22.800
Die grundsätzliche Technik ist
also weiterhin die gleiche

00:01:22.900 --> 00:01:26.833
und es können immer noch falsche Antworten
gegeben oder die Lösung verraten werden.

00:01:27.366 --> 00:01:30.066
OpenAI hat bloß etwas dazu gepromptet

00:01:30.066 --> 00:01:33.066
und hofft, dass dadurch die Antworten
im Schnitt besser werden.

00:01:33.533 --> 00:01:36.800
Das scheint mir auch zu stimmen,
aber man spricht halt nach

00:01:36.800 --> 00:01:40.366
wie vor mit einem Sprachmodell,
mit allen Vor und Nachteilen, die das hat.

00:01:40.633 --> 00:01:43.633
Apropos Vertrauen in die Forschung
In der Forschung

00:01:43.633 --> 00:01:47.400
gibt es einen Trend, der aus meiner Sicht
das Zeug hat, Vertrauen zu untergraben.

00:01:47.800 --> 00:01:51.033
Und zwar geht es um
künstliche Teilnehmende für Studien.

00:01:51.166 --> 00:01:53.566
Erstmal wäre das ja eine feine Sache.

00:01:53.566 --> 00:01:56.566
Stellen wir uns das allein
mal für den Bildungsbereich vor.

00:01:57.000 --> 00:01:59.666
Was wir
alles an Pädagogik erforschen könnten,

00:01:59.666 --> 00:02:01.866
wenn wir keine echten Menschen dafür
bräuchten.

00:02:01.866 --> 00:02:03.300
Ich hätte das auch gern.

00:02:03.300 --> 00:02:05.233
Dann könnte ich zum Beispiel
meine Klausuren

00:02:05.233 --> 00:02:09.200
mit simulierten Studierenden testen und
schauen, ob sie immer gleich schwer sind.

00:02:09.266 --> 00:02:11.300
Also könnten wir unsere Studien einfach

00:02:11.300 --> 00:02:14.300
mit Sprachmodellen machen
statt mit Menschen oder?

00:02:14.300 --> 00:02:17.300
Dann haben wir ein paar hunderte Antworten
für nur ein paar Euro.

00:02:17.833 --> 00:02:20.300
Es gibt auch Forschung,
die zeigt, dass Sprachmodelle

00:02:20.300 --> 00:02:23.300
häufig so antworten,
wie Menschen das tun würden.

00:02:23.333 --> 00:02:28.066
Ich kann zum Beispiel ChatGPT bitten, das
folgende Szenario moralisch zu bewerten

00:02:28.500 --> 00:02:33.500
“Person X cuts the beard of a local
elder to shame him” und das bewertet

00:02:33.500 --> 00:02:36.466
ChatGPT - berechtigterweise - moralisch schlecht.

00:02:36.466 --> 00:02:38.233
Genau so, wie Menschen das tun würden.

00:02:38.233 --> 00:02:40.033
Leider reicht das nicht.

00:02:40.033 --> 00:02:43.066
Denn Sprachmodelle antworten
nicht zuverlässig wie Menschen.

00:02:43.766 --> 00:02:46.900
Wir haben das zusammen mit Kolleg/innen
an der Purdue University

00:02:47.100 --> 00:02:50.933
in den USA ausprobiert
und das Szenario leicht umformuliert.

00:02:51.500 --> 00:02:52.466
Wenn wir fragen:

00:02:52.466 --> 00:02:55.700
“Person X cuts the beard of a local
elder to shave him”

00:02:56.333 --> 00:02:59.133
Die alte Person wird also rasiert,
nicht beschämt.

00:02:59.133 --> 00:03:01.600
Dann findet ChatGPT
das immer noch schlimm.

00:03:01.600 --> 00:03:03.733
Menschen
aber finden das moralisch neutral.

00:03:03.733 --> 00:03:04.600
Das sind jetzt natürlich

00:03:04.600 --> 00:03:08.033
nur kleine Beispiele,
aber die zeigen ein generelles Phänomen.

00:03:08.500 --> 00:03:11.966
Sprachmodelle verarbeiten
Text nicht so wie wir Menschen.

00:03:12.533 --> 00:03:15.533
Deshalb kann es immer sein,
dass sie anders antworten.

00:03:15.633 --> 00:03:19.500
Gerade dann, wenn wir neuartige Fragen
stellen, die es sonst nie gab.

00:03:19.566 --> 00:03:21.500
Wir haben keine Garantien.

00:03:21.500 --> 00:03:25.100
Und deshalb sollten wir menschliche
Studienteilnehmer/innen auch nicht durch

00:03:25.100 --> 00:03:26.333
Sprachmodelle ersetzen.

00:03:26.333 --> 00:03:29.466
Dass Vertrauen in die Wissenschaft durch
KI bedroht sein kann,

00:03:29.700 --> 00:03:32.100
ist auch der Frankfurter
Rundschau aufgefallen.

00:03:32.100 --> 00:03:36.500
Dort geht es darum, wie mithilfe
von Sprachmodellen und Bildgeneratoren

00:03:36.866 --> 00:03:38.900
wissenschaftliche Artikel erzeugt werden,

00:03:38.900 --> 00:03:42.333
ohne dass jemals tatsächliche Forschung
stattgefunden hat.

00:03:42.900 --> 00:03:43.666
Und es gibt auch

00:03:43.666 --> 00:03:47.166
wissenschaftliche Zeitschriften,
die so was gegen Geld veröffentlichen.

00:03:47.700 --> 00:03:52.533
16 % aller biomedizinischen Artikel
könnten vielleicht schon so entstanden

00:03:52.533 --> 00:03:55.466
sein. Das mag jetzt alles
relativ absurd erscheinen.

00:03:55.466 --> 00:03:58.633
Warum sollte ich viel Geld an einen Verlag
bezahlen, damit

00:03:58.633 --> 00:04:02.533
der einen Artikel voll Unfug publiziert,
auf dem dann auch noch mein Name steht?

00:04:02.900 --> 00:04:04.266
Was habe ich denn davon?

00:04:04.266 --> 00:04:07.000
Ich hätte davon,
dass dann mehr Publikationen

00:04:07.000 --> 00:04:10.100
auf meinem Lebenslauf stehen
und mit mehr Publikationen

00:04:10.333 --> 00:04:13.500
habe ich auch mehr Chancen darauf,
einen Job in der Wissenschaft zu bekommen.

00:04:14.333 --> 00:04:17.533
Ich muss bloß darauf vertrauen,
dass niemand so genau nachliest,

00:04:17.533 --> 00:04:20.566
was in meinen ganzen Artikeln
da eigentlich wirklich drinsteht.

00:04:20.833 --> 00:04:23.300
Das Problem ist grundsätzlich
auch nicht neu.

00:04:23.300 --> 00:04:25.833
Es gibt leider schon viele Jahre lang
den Anreiz,

00:04:25.833 --> 00:04:30.133
die eigene Publikationsliste aufzupusten
und dabei vielleicht auch bei Verlagen

00:04:30.133 --> 00:04:33.133
zu veröffentlichen, die nicht ganz so
genau auf den Inhalt schauen.

00:04:33.300 --> 00:04:36.300
Wenn man ihnen bloß Geld
für die Veröffentlichung bezahlt.

00:04:36.466 --> 00:04:37.800
Wer dazu mehr wissen will.

00:04:37.800 --> 00:04:41.033
Es gibt zum Beispiel
eine Folge von MAITHINKX zum Thema.

00:04:41.333 --> 00:04:45.066
Das Grundproblem scheint mir hier
die Anreizstruktur im Wissenschaftssystem

00:04:45.066 --> 00:04:45.966
zu sein.

00:04:45.966 --> 00:04:50.300
Die Anzahl der Publikationen muss weniger
Rolle spielen und eher der Inhalt.

00:04:50.600 --> 00:04:52.833
Anders wird es nicht gehen, denke ich.

00:04:52.833 --> 00:04:55.866
Das würde auch den Arbeits
und Erfolgsdruck in der Wissenschaft

00:04:55.866 --> 00:04:58.866
reduzieren, an dem viele Wissenschaftler/innen gerade ausbrennen.

00:04:58.966 --> 00:05:00.700
Ein Gruß an die “Ich bin Hannah Bewegung”

00:05:00.700 --> 00:05:04.266
zum Vertrauen in Forschung
jedenfalls trägt es sicherlich nicht bei,

00:05:04.500 --> 00:05:06.933
wenn ein erheblicher Anteil aller
vermeintlich

00:05:06.933 --> 00:05:10.533
wissenschaftlichen Publikationen
bloß generierten Unfug enthalten.

00:05:11.066 --> 00:05:14.800
Umso wichtiger sind Aktivitäten in Bildung
und Wissenschaftskommunikation.

00:05:15.366 --> 00:05:18.500
Wir müssen über Wissenschaft sprechen,
auch mit Menschen,

00:05:18.700 --> 00:05:21.666
die Wissenschaft vielleicht nicht schon
positiv gegenüberstehen.

00:05:21.666 --> 00:05:24.666
Aber zurück zu Themen,
die direkter mit der Lehre zu tun haben.

00:05:24.700 --> 00:05:28.566
Wie thematisiere ich denn nun am besten
KI in meiner Lehrveranstaltung?

00:05:28.600 --> 00:05:33.566
Mein erster Tipp Nicht über abstrakte KI
sprechen, sondern über konkrete Beispiele.

00:05:34.233 --> 00:05:38.966
KI als abstraktes Thema ist häufig
verknüpft mit vagen Sorgen und Hoffnungen,

00:05:39.366 --> 00:05:43.266
dass KI uns unseren Job wegnimmt oder uns
vielleicht im Alltag assistieren kann.

00:05:44.166 --> 00:05:48.600
Deshalb spreche ich eigentlich immer über
konkrete Systeme in konkreten Kontexten,

00:05:49.166 --> 00:05:53.066
zum Beispiel ChatGPT Study Mode, das mir
bei meinen Hausaufgaben helfen soll.

00:05:53.466 --> 00:05:56.466
Darüber lässt sich viel informierter
und handfester sprechen.

00:05:56.533 --> 00:05:57.600
Tipp zwei

00:05:57.600 --> 00:06:01.166
Das Thema KI mit den Fachinhalten
in meiner Veranstaltung verbinden.

00:06:01.800 --> 00:06:04.500
Ich erlaube zum Beispiel
den Einsatz von Sprachmodellen

00:06:04.500 --> 00:06:07.200
bei den Hausaufgaben
in meinen Veranstaltungen.

00:06:07.200 --> 00:06:10.866
Aber ich spreche immer in der ersten
Sitzung über die Probleme dabei.

00:06:11.400 --> 00:06:13.133
Ich zeige konkret, wie

00:06:13.133 --> 00:06:17.000
ChatGPT eine der ersten Hausaufgaben
beantwortet und diskutiere,

00:06:17.100 --> 00:06:20.900
warum die Antwort so einfach nicht stimmt
und wie man das erkennen kann.

00:06:20.900 --> 00:06:24.266
Um zu erkennen, dass ein Sprachmodell
die Aufgabe falsch gelöst hat,

00:06:24.500 --> 00:06:26.666
muss man sich aber im Fach auskennen.

00:06:26.666 --> 00:06:29.400
Und so motiviere
ich hoffentlich zu lernen,

00:06:29.400 --> 00:06:32.533
wie man Fehler erkennen
und die Aufgabe selbst lösen könnte.

00:06:32.566 --> 00:06:36.533
Wenn Studierende in der Lage sind,
KI generierte Abgaben selbst zu verstehen,

00:06:37.033 --> 00:06:37.900
zu erklären

00:06:37.900 --> 00:06:41.266
und wissenschaftlich zu verteidigen,
dann ist für mich ja alles in Ordnung.

00:06:41.900 --> 00:06:46.333
KI als Unterrichtsthema hat für mich also
nicht nur den Zweck, über KI zu sprechen.

00:06:46.833 --> 00:06:50.700
Es hilft hoffentlich auch, das eigentliche
fachliche Thema zu motivieren.

00:06:51.500 --> 00:06:55.133
Denn meistens macht es Studierenden Spaß,
es besser zu wissen als ein KI System.

00:06:55.266 --> 00:06:59.066
Und Tipp drei In unserem Projekt
KI Akademie OWL

00:06:59.400 --> 00:07:02.733
haben wir eine dreiteilige Struktur
für Lehre über KI entwickelt.

00:07:03.333 --> 00:07:08.400
Wir zeigen erstmal, dass KI ein Problem
lösen kann und deshalb spannend sein kann.

00:07:09.233 --> 00:07:12.266
Dann zeigen wir an Beispielen,
wo die Grenzen liegen

00:07:12.700 --> 00:07:16.133
und schließlich ziehen wir ein Fazit,
wie KI wirklich funktioniert

00:07:16.433 --> 00:07:18.400
und sich verantwortungsvoll nutzen ließe.

00:07:19.433 --> 00:07:20.433
Nehmen wir mein Beispiel

00:07:20.433 --> 00:07:23.433
von vorhin
mit den künstlichen Studienteilnehmenden.

00:07:23.533 --> 00:07:25.300
Ich habe zuerst gezeigt, dass

00:07:25.300 --> 00:07:29.500
ChatGPT typische Moralfragen so beantwortet
wie Menschen - toll und faszinierend.

00:07:30.133 --> 00:07:33.666
Aber ich habe dann auch gezeigt, dass man
die Frage leicht umformulieren kann

00:07:33.900 --> 00:07:36.900
und ChatGPT dann
eine seltsame Antwort gibt.

00:07:36.900 --> 00:07:39.566
Und daraus können wir ableiten, dass man ChatGPT

00:07:39.566 --> 00:07:42.900
nicht als zuverlässigen Menschen
Simulator einsetzen sollte.

00:07:43.000 --> 00:07:45.733
Vielleicht noch Tipp vier:
Übernehmt euch nicht.

00:07:45.733 --> 00:07:48.966
Ihr braucht eure Lehre nicht vollständig,
um KI herum zu stricken.

00:07:49.433 --> 00:07:50.766
Wenn ihr es allein schafft,

00:07:50.766 --> 00:07:53.800
euch in einer der ersten Sitzungen
20 Minuten Zeit zu nehmen,

00:07:54.133 --> 00:07:57.133
um an einem konkreten Beispiel
aus eurem Fach zu erläutern,

00:07:57.233 --> 00:08:01.533
was KI Systeme beitragen können
und was nicht, ist schon viel gewonnen

00:08:01.533 --> 00:08:02.466
aus meiner Sicht.

00:08:02.466 --> 00:08:06.300
Dazu braucht ihr auch nicht lange auf
Fortbildungen oder Richtlinien zu warten.

00:08:06.666 --> 00:08:09.600
Einfach mal selbst ausprobieren,
was ein Sprachmodell

00:08:09.600 --> 00:08:14.200
so bei einer typischen Frage in eurem Fach
tut und bringt gesundes Misstrauen mit.

00:08:14.466 --> 00:08:18.166
Und apropos Misstrauen:  Aus der Community
wurden wir gefragt

00:08:18.333 --> 00:08:19.333
Wie gehen wir mit dem

00:08:19.333 --> 00:08:23.400
Klima des Misstrauens um, das in Sachen
KI gerade zwischen Studierenden

00:08:23.400 --> 00:08:24.400
und Lehrenden herrscht?

00:08:24.400 --> 00:08:28.366
Viele Lehrkräfte misstrauen Studierenden,
weil jetzt verstärkt das Risiko

00:08:28.366 --> 00:08:32.100
zu bestehen scheint, dass Hausaufgaben
von Sprachmodellen geschrieben wurden.

00:08:32.100 --> 00:08:35.333
Umgekehrt misstrauen
viele Studierenden ihren Lehrkräften,

00:08:35.633 --> 00:08:37.000
weil sie sich überwacht fühlen.

00:08:37.000 --> 00:08:40.933
Zum Beispiel wird mir zuweilen berichtet,
dass hochschuleigene Chatangebote

00:08:40.933 --> 00:08:43.400
mit Sprachmodellen nicht genutzt werden,

00:08:43.400 --> 00:08:47.100
weil Studierende befürchten, dass ihre
Anfragen von Lehrkräften überwacht werden.

00:08:47.100 --> 00:08:48.133
Und wichtig

00:08:48.133 --> 00:08:51.600
Erst mal finde ich es ja gut, wenn
Studierende sich um ihre Daten sorgen.

00:08:51.833 --> 00:08:54.400
Das ist gesundes Misstrauen, nicht Gutes.

00:08:54.400 --> 00:08:57.800
Aber wenn Studierende dann stattdessen
kommerzielle Modelle benutzen,

00:08:58.000 --> 00:09:00.300
die aus meiner Sicht schlechter
mit den Daten umgehen.

00:09:00.300 --> 00:09:03.300
Ich glaube, dieses Problem braucht
mehrere Ansätze.

00:09:03.400 --> 00:09:05.200
Zum einen plädiere ich dafür,

00:09:05.200 --> 00:09:08.466
dass wir als Lehrkräfte
klare Regelungen für KI Nutzung

00:09:08.466 --> 00:09:12.866
in unserer Veranstaltung finden und
die gegenüber unseren Lernenden begründen.

00:09:13.000 --> 00:09:16.533
Bei mir heißt das, Ihr dürft Sprachmodelle
bei den Hausaufgaben einsetzen.

00:09:16.766 --> 00:09:20.100
Wenn ihr das kennzeichnet,
keine privaten Daten eingebt

00:09:20.600 --> 00:09:23.166
und das Ergebnis
immer noch selbst verteidigen könnt.

00:09:23.166 --> 00:09:26.700
Die ersten zwei Auflagen existieren
aus rechtlichen und ethischen Gründen.

00:09:27.300 --> 00:09:29.566
Die dritte Auflage ist die wichtigste

00:09:29.566 --> 00:09:30.000
und dient

00:09:30.000 --> 00:09:33.766
dazu, dass ihr immer noch verantwortliche
Autor/innen eurer Hausaufgaben seid

00:09:34.000 --> 00:09:37.200
und die Fähigkeiten erworben habt,
die diese Veranstaltung lehren soll.

00:09:38.100 --> 00:09:41.033
Aber sonst vertraue ich euch,
dass ihr mit diesen Werkzeugen

00:09:41.033 --> 00:09:42.566
verantwortungsvoll umgeht.

00:09:42.566 --> 00:09:46.633
Und ich setze auch keine KI Detektoren
oder andere Überwachungsmethoden ein.

00:09:47.100 --> 00:09:50.433
Wir brauchen auch klare Regeln
in der KI Infrastruktur,

00:09:50.800 --> 00:09:52.866
damit Lernende darauf vertrauen können,

00:09:52.866 --> 00:09:56.300
dass ihre Nutzungsdaten nicht
ohne Zustimmung weitergegeben werden.

00:09:56.500 --> 00:09:58.600
Auch nicht innerhalb der Universität.

00:09:58.600 --> 00:10:02.400
Das muss Studierenden klar werden
und sie müssen darauf vertrauen können.

00:10:02.466 --> 00:10:05.666
Anders gesagt
Ich glaube, wir sollten als Lehrkräfte

00:10:05.666 --> 00:10:09.366
und als Universitäten den ersten Schritt
gehen, Vertrauen aufzubauen.

00:10:09.666 --> 00:10:12.666
Das war Folge drei
der KI News von ORCA.NRW.

00:10:13.033 --> 00:10:14.700
Wir laden auch weiterhin dazu ein,

00:10:14.700 --> 00:10:18.366
uns Fragen zuzuschicken
und ich hoffe, die News helfen euch weiter

00:10:18.533 --> 00:10:23.466
bei der Einordnung von KI in der Lehre
und damit bis zum nächsten Mal.

