Verzeichnis: Begriffe
Verzeichnis: Begriffe
Special | A | B | C | D | E | F | G | H | I | J | K | L | M | N | O | P | Q | R | S | T | U | V | W | X | Y | Z | ALL
A |
|---|
AustauschformatDateiformat, in dem die Weitergabe (der "Austausch") von Dateien üblich ist. Austauschformate sind meist weit verbreitet und können meist von vielen Anwendungsprogrammen unter mehreren Betriebssystemen verarbeitet werden. | |
AuszeichnungsspracheEine Auszeichnungssprache (engl. Markup Language) ist eine maschinenlesbare Sprache für die Gliederung und Formatierung von Texten und anderen Daten. (Wikipedia, 2023) Strukturelemente sind in Auszeichnungssprachen gekennzeichnet. Für diese Kennzeichnung werden häufig Tags verwendet.
Beispielsweise wird in den Textformaten HTML und TEI ein neuer Absatz
mit dem Tag<p> eingeleitet. Das p steht dabei für "paragraph" oder "prose". | |
B |
|---|
Bézier-KurveParametrisch modellierte Kurve mit Polynomen als Koordinatenfunktionen | |
C |
|---|
Cascading Style SheetsCascading Style Sheets (CSS) ist eine Formatierungssprache (Stylesheet-Sprache) für elektronische Dokumente, z.B. HTML-, SVG- und TEI-Dateien. Das "Cascading" im Namen hat seinen Ursprung darin, dass nacheinander
eingelesen werden. Dabei besitzt die zuletzt eingelesene Regel Vorrang. HTML-Beispiel für ein Style-Attribut: Mit
| ||
CMYK-FarbmodellSubtraktives Farbmodell, in dem Farbwerte in den Komponenten Cyan, Magenta, Yellow und Key (Schwarzanteil) angegeben werden | |
Code BeautifyWebdienst zur Prüfung auf Wohlgeformtheit von XML: https://codebeautify.org/xmlvalidator?/xmlvalidate | |
ContainerformatEin Containerformat ist in der Lage mehrere Datenströme (beispielsweise Dateien) zu vereinen. Mit im Container befinden sich Informationen, auf was wo zugegriffen werden kann. Archivdateien wie zip und tar, die im Wesentlichen dem Ein- und Auspacken und der Datenkompression dienen, sind einfache Containerformate. Dank der mitgespeicherten internen Links müssen die Container nicht unbedingt ausgepackt, sondern können direkt verarbeitet werden. Beispiele hierfür sind PDF, die Büroanwendungsformate OOXML (.docx, .xlsx, .pptx) und ODF (Open Data Format), sowie alle gängigen Videoformate (Quicktime, MPEG-2, MPEG-4, AVI, DV). Beispielsweise muss ein Videoformat Video- und Tonspur in einer Datei vereinen können. | ||
CoreTrustSealCoreTrustSeal ist zum einen eine Zertifizierung (ein Siegel) für Forschungsdatenrepositorien, zum anderen die Organisation gleichen Namens, die das Siegel vergibt. Die Organisation CoreTrustSeal wurde gegründet von Data Seal of Approval (DSA) und The World Data System of the International Science Council (WDS). Die Zertifizierung können Forschungsdatenrepositorien auf Antrag erhalten, die 16 Richtlinien erfüllen, die ein breites Spektrum von Anforderungen von der Mission über Rechtsfragen bis zur Systemsicherheit abdecken. (coretrustseal.org) | |
CrossRefCrossRef ist eine internationale Non-Profit-Organisation, die sich auf die Bereitstellung von Digital Object Identifiers (DOIs) für wissenschaftliche Inhalte spezialisiert hat, insbesondere für wissenschaftliche Artikel in Fachzeitschriften. Die Gründung von CrossRef erfolgte im Jahr 2000 als Kooperationsprojekt von Verlagen mit dem Ziel, eine standardisierte Methode für die Identifizierung, Verlinkung und Zitierung wissenschaftlicher Artikel im digitalen Umfeld zu schaffen. Homepage: https://www.crossref.org | |
D |
|---|
DataCiteDataCite ist eine 2009 gegründete internationale Non-Profit-Organisation, die DOIs für Forschungsdaten und andere Forschungsergebnisse bereitstellt. Sie ist außerdem ein aktiver Teilnehmer in der Forschungsgemeinschaft und fördert den Datenaustausch und die Zitierung von Daten durch gemeinschaftsbildende Maßnahmen und Outreach-Aktivitäten. Homepage: https://datacite.org/ | |
DatenvolumenDer Platz, den die Daten auf einem Datenträger belegen, gemessen in Byte bzw. einem Vielfachen (kB, MB, GB, TB, PB) | |
Document Type DefinitionIst eine XML-Schemasprache zur Definition einer Struktur in Auszeichnungssprachen auf XML-Basis. Beispiel: Das Element empty, das der Markierung nicht ausgefüllter Stellen (Nodes) im TEI-Textmodell dient, ist in der Datei tei_all.dtd der Text Encoding Initiative folgendermaßen definiert: <!--doc:indicates the presence of an empty node within a content model [22. Documentation Elements] --> empty enthält nach dieser Definition keine Kindelemente (EMPTY), aber Attribute aus der Liste att.global.attributes sind möglich und können gesetzt werden, z.B. für Analysezwecke. | ||
E |
|---|
emschriftgrößenabhängige Längeneinheit. 1em ist der Mindestzeilenabstand der verwendeten Schrift. Das entspricht etwa der Breite des Großbuchstabens M. | |
Extensible Markup LanguageDie Extensible Markup Language (XML) ist eine Auszeichnungssprache 2. Stufe in dem Sinne, dass XML anderen Auszeichnungssprachen einige grundsätzliche Regeln vorgibt. Nähere Informationen in Kurzform können in diesem Kurs gefunden werden unter Dateiformate / Text. Ausführlichere Informationen: XML-Tutorium von W³schools mit nur wenig Text | |
Extensible Stylesheet LanguageUnter dem Namen Extensible Stylesheet Language (XSL) sind drei XML-Auszeichnungssprachen zusammengefasst, die mit der Formatierung von Dokumenten zusammenhängen:
XSL nutzt selbst XML-Syntax. | ||
F |
|---|
FAIR-PrinzipienFAIR steht für "Findable Accessible Interoperable Reusable". Die FAIR-Prinzipien sollen die Nachnutzbarkeit von Forschungsdaten verbessern. Eine Arbeitsgruppe aus Mitgliedern der FORCE11 Community hat die Abkürzung mit einem Satz von Regeln unterlegt und einer breiten Öffentlichkeit zugänglich gemacht. (FORCE11, 2016) Eine wichtige Forderung ist, dass Forschungsdaten menschen- und maschinenlesbar sein sollen. | |
FormatierungsspracheComputersprache, in der Stylesheets geschrieben werden können | ||
FormatvalidierungPrüfung auf Einhaltung des Datenformats | |
G |
|---|
Gemeinsame NormdateiDie Normdaten der Gemeinsamen Normdatei (GND) beschreiben eindeutig und regelbasiert "Personen, Körperschaften, Konferenzen, Geografika, Sachbegriffe und Werke, die in Bezug zu Kulturgut sowie kulturellen und wissenschaftlichen Sammlungen stehen". Die GND ist damit ein kontrolliertes Vokabular und der GND-ID ein persistenter Identifikator, ähnlich dem ORCID ID für Personen und dem DOI für Objekte. In den Normdaten kann gesucht werden. "Die Gemeinsame Normdatei (GND) wird von der Deutschen Nationalbibliothek, allen deutschsprachigen Bibliotheksverbünden mit den angeschlossenen Bibliotheken, der Zeitschriftendatenbank und zahlreichen weiteren Einrichtungen gemeinschaftlich geführt." Homepage und Quelle: https://gnd.network/ Suchfunktion und Normdaten-Ausgabe: http://gnd.eurospider.com/ | ||
H |
|---|
HeaderTeil vor dem Datenteil einer Datei, der Metadaten oder Angaben zum Aufbau des Datenteils der Datei enthält | ||
I |
|---|
InkscapeZeichenprogramm zur Erzeugung und Bearbeitung zweidimensionaler Vektorgrafiken. Inkscape ist
Inkscape kann Vektor- und Rastergrafiken in zahlreichen Formaten im- und exportieren. Homepage und Download: https://inkscape.org/ | |
ISNIInternational Standard Name Identifier ist eine standardisierte Identifikationsnummer für Urheberinnen und Urheber und wurde von der International Organization for Standardization (ISO) entwickelt. Homepage: https://isni.org/ | |
L |
|---|
LandungsseiteIn der Web-Oberfläche der meisten Repositorien sind Forschungsdaten nicht über nur einen Mausklick abrufbar, sondern es befindet sich noch eine Seite dazwischen, die Landungsseite oder landing page. Die Landungsseite enthält üblicherweise Informationen zum Forschungsdatensatz, meist einen Teil der Metadaten und eine Liste der verfügbaren Dateien. | ||
Lempel-Ziv-Welch-AlgorithmusEin nach den Entwicklern benannter Kompressionsalgorithmus, der mit einem Wörterbuch arbeitet. In der zu komprimierenden Datei werden die am häufigsten vorkommenden Wörter durch eine Abkürzung ersetzt. Der Lempel-Ziv-Welch-Algorithmus wird häufig zur Kompression von Bildern eingesetzt, wobei anstelle von Wörtern nach Bitmustern gesucht wird. | |
LigaturBegriff aus der Typografie: Zeichen (Glyphe), das durch Verschmelzung mehrerer Buchstaben entstanden ist. Beispiele: ae → æ | ||
LizenzbedingungenBei Forschungsdaten können Lizenzbedingungen die Nutzungsrechte regeln. Empfehlenswert ist die Vergabe einer freien Lizenz, wie sie Creative Commons anbietet. Für Texte allgemein kann es ebenfalls Lizenzbedingungen geben, die selbstverständlich auch im Studium zu beachten sind. Grundlage
sind das Urheberrecht und die Nutzungsbedingungen der Verlage/Anbieter. Nach deutschem Urheberrecht gilt: Volltexte dürfen nur zum persönlichen Gebrauch und zu
Forschungszwecken ausgedruckt oder gespeichert werden. Ein systematischer
Download von Aufsätzen oder Suchresultaten (v. a. von kompletten Büchern oder
großen Teilen) ist untersagt. Einzelne Seiten/Kapitel
zum persönlichen Gebrauch oder zu Forschungszwecken sind in Ordnung. Aufsätze
dürfen weder elektronisch noch in gedruckter Form an Dritte weitergegeben
werden. Bei einigen
Verlagen ist deshalb beispielsweise nur der Download einzelner Kapitel möglich oder sogar ein rein lesender Zugriff ohne Download-Möglichkeit. | |
M |
|---|
MetadatenMetadaten sind strukturierte Daten, die verwendet werden, um
Objekte, Konzepte und Daten systematisch zu beschreiben. Sie dienen
dazu, umfassende Information über die Merkmale anderer Daten oder
Datensätze zu vermitteln. Sie sind sozusagen "Daten über Daten". | ||
N |
|---|
nestor-SiegelZertifizierung, die vom Verein nestor vergeben wird. Es basiert
auf der DIN-Norm 31644 und umfasst 34 Kriterien, die u.a.
rechtliche Aspekte und Fragen der Finanzierung behandeln. | |
O |
|---|
ORCIDORCID steht für Open Researcher and Contributor ID und ist eine gemeinnützige Organisation, die sich darauf konzentriert, weltweit eindeutige Identifikatoren für Forschende (d.h. Personen!) zu vergeben. Das Ziel von ORCID besteht darin, die Zuordnung wissenschaftlicher Beiträge zu erleichtern und die Anerkennung der Leistungen von Forschenden zu verbessern. Homepage: https://orcid.org | |
P |
|---|
parametrisch modellierte KurveWir haben die Aufgabe, eine Kurve in der Ebene mathematisch darzustellen. Eine Kurve ist ein eindimensionales Gebilde. Entsprechend brauchen wir nur eine Variable, die als Parameter bezeichnet wird und im Folgenden mit t abgekürzt werden soll. Das t-Intervall [tAnfang, tEnde] wird abgebildet auf die Kurve mithilfe einer ParametrisierungP, die jedem t aus dem Intervall einen Punkt auf der Kurve zuordnet. P muss glatt sein (unendlich oft differenzierbar), damit Sprünge, Knickstellen und andere Unebenheiten der Kurve ausgeschlossen sind.
Die parametrisch modellierte Kurve ist definiert als die Menge aller Bildpunkte P(t) mit t aus [tAnfang, tEnde]. In der Ebene hat jeder Punkt zwei Koordinaten. Entsprechend brauchen wir zwei Koordinatenfunktionen x und y, für jede Koordinate eine. Beide Koordinatenfunktionen hängen von t ab. P(t) ist in den Koordinatenfunktionen geschrieben der Vektor P(t) = (x(t), y(t)) | |
PDF/APDF for Archive ist ein nach ISO 19005 standardisiertes PDF, das sich für die Archivierung von Dokumenten eignet, weil
| ||
Präfixunselbstständiger Wortteil, der dem Wort vorangestellt wird. Wohl wichtigstes Beispiel sind die Vorsilben aus der Grammatik. Aber auch in Wissenschaft und Technik sind Präfixe häufig zu finden. Beispiel: Metadaten | |
proprietärEine Software oder ein Datenformat wird als proprietär bezeichnet, wenn mindestens einer der folgenden Punkte zutrifft:
| ||
R |
|---|
RELAX NGXML-Schemasprache zur Definition einer Struktur in Auszeichnungssprachen auf XML-Basis. RELAX NG kann wahlweise selbst in XML-Form oder in einer kompakteren Syntax verfasst werden. Beispiel geschrieben in der XML-Form: Das Element empty, das der Markierung nicht ausgefüllter Stellen (Nodes) im Textmodell dient, ist in der Datei tei_all.rng der Text Encoding Initiative folgendermaßen definiert: <define name="empty"> | |
Repositoriumspezielle Art von Datenbanksystemen, die für die Speicherung, Organisation, Verwaltung und Bereitstellung digitaler Informationsobjekte verwendet werden und über das WWW zugänglich sind. In diesem Kurs gibt es unter Grundsätze digitaler Publikation, Nachnutzung & Datenorganisation / Modul: Was braucht es für eine Datenpublikation? je eine Seite zu Repositorien und deren Auswahl. | ||
RohdatenAusgangsdaten, d. h. Daten, die
noch unbearbeitet sind. Rohdaten müssen nicht unbedingt digital, sondern können auch auf Papier oder einem anderen Träger vorliegen. | |
S |
|---|
selfhtmlVerein, der eine deutschsprachige Einführung in die Web-Technik zur Verfügung stellt. Eine solche Einführung mit Nachschlagewerk gibt es u.a. für HTML, CSS (Cascading Style Sheets), SVG (Scalable Vector Graphics) und MathML (Mathematical Markup Language). Homepage mit den Einführungen und Nachschlagewerken: https://wiki.selfhtml.org/ | |
Stylesheetlegt fest, wie ein elektronisches Dokument dargestellt werden soll. Beispiele für Stylesheet-Sprachen sind CSS (Cascading Style Sheets) und XSL (Extensible Stylesheet Language). | ||
SuffixUnselbstständiger
Wortteil, der dem Wort angefügt wird. Wohl wichtigstes Beispiel
sind die Nachsilben aus der Grammatik. Beispiel: Flüssigkeit. Aber auch in Wissenschaft und
Technik sind Suffixe häufig zu finden, z.B. als Dateinamensendung: text.txt | |
SupplementAnhang innerhalb einer wissenschaftlichen Publikation, welcher den Hauptteil ergänzt. Hinzufügungen können z. B. Datensätze, Grafiken, Tabellen oder Visualisierungen sein. | |
T |
|---|
TagsKennzeichner, Abgrenzer Abgegrenzt wird häufig durch ein Anfangs- und ein End-Tag, die häufig in spitzen Klammern stehen. Beispiel aus TEI und HTML: <p>Beginn eines neuen Absatzes | |
Text Encoding InitiativeText Encoding Initiative (TEI) ist sowohl ein Dokumentenformat als auch der Name der Organisation, die an Standards für dieses Dokumentenformat arbeitet. Das Dokumentenformat hat die Form einer Auszeichnungssprache, ursprünglich auf Basis von SGML (Standard Generalized Markup Language), seit Version P4 auf Basis von XML (Extensible Markup Language). Das Dokumentenformat TEI sieht einen Header mit Pflichtelementen und Hunderten optionaler Elemente vor, in denen beschreibende Daten zum Text untergebracht werden können. TEI ist daher auch ein Metadatenstandard. TEI-Homepage: https://tei-c.org/ Im Kurs wird TEI unter Dateiformate/Text erklärt. | |
TextGridvirtuelle Forschungsumgebung für die Geisteswissenschaften. Dateien, z.B. TEI- oder Bilddateien, können ins TextGrid Laboratory
hochgeladen und dort — in "Projekten" organisiert — gespeichert und
bearbeitet werden. Das TextGrid Laboratory bietet einen XML-Editor und weitere Open-Source-Werkzeuge. Um das TextGrid
Laboratory nutzen zu können, muss die TextGrid-Client-Software heruntergeladen und installiert werden. Das TextGrid Laboratory ist für die Entwicklung mit XML/TEI optimiert. TextGrid eignet sich besonders gut für die Arbeit mit digitalen
Editionen. Im TextGrid Repository, einem Repositorium für textwissenschaftliche Forschungsdaten, können eigene Forschungsdaten archiviert und publiziert werden. Außerdem kann nach Daten anderer Forschender gesucht werden. Homepage: https://textgrid.de/ | |
ThesaurusEin Thesaurus ist eine strukturierte, geordnete Begriffssammlung, welche verschiedene Begriffe über eine hierarchische Ordnung (über Oberbegriffe) miteinander in Beziehung setzt und deren Bedeutung festschreibt. Thesauri werden häufig in Informationssystemen und
Bibliotheken verwendet, um die Suche und Auffindbarkeit von
Informationen zu verbessern. | ||
U |
|---|
URLEin Uniform Resource Locator ist eine Zeichenkette zur Lokalisierung von Ressourcen im World Wide Web (WWW) und dient als Adressierung in der Serverkommunikation. Eine typische URL setzt sich aus dem Protokoll (das den Verbindungstyp definiert), dem Domain-Namen (der den Server referenziert) und einem Pfad (der den genauen Speicherort auf dem Server angibt) zusammen. Beispiel:
| |
URNpersistenter Identifikator, der vor allem im deutschsprachigen Raum sehr verbreitet ist. Die Deutsche Nationalbibliothek bietet einen kostenlosen Vergabe-Service für wissenschaftliche Datensätze aus deutschen Einrichtungen sowie einen URN-Resolving-Dienst für Deutschland und die Schweiz an. Mit dem URN können alle Arten von digitalen Publikationen eindeutig identifiziert und so wiederauffindbar gemacht werden. Beispiel für einen URN der Deutschen Nationalbibliothek:
Im Beispiel steht nbn:de für die Deutsche Nationalbibliothek, hbz für das Hochschulbibliothekszentrum NRW und 468 für die Bergische Universität Wuppertal. Leider gibt es keinen globalen Resolver und auch der URN-Aufbau variiert im Detail von Land zu Land. | ||
UTF-8UCS Transformation Format, wobei UCS die Abkürzung für Universal Code Character Set ist UTF-8 ist die am weitesten verbreitete Zeichencodierung für Text (genauer: Unicode-Zeichen). Die "8" steht für eine maximale Länge von 8 Byte pro Zeichen. Dabei wird aber nur die tatsächlich benötigte Länge verwendet. Die ersten 128 Zeichen stimmen mit dem ASCII-Zeichensatz überein, d.h. für die lateinische Schrift kommt UTF-8 mit nur einem Byte pro Zeichen aus. UTF-8 enthält neben der lateinischen Schrift auch fast alle anderen heute noch verwendeten Schriftarten, wie z.B. griechisch, kyrillisch, arabisch, chinesisch, Braille und mehrere indische und japanische Schriftarten. Auch etliche alte Schriftarten, wie z.B. ägyptische Hieroglyphen, und eine Vielzahl von Sonderzeichen sind enthalten. | |
V |
|---|
VIAFist eine weltweit genutzte Normdatei für personenbezogene Daten und wird
unter der Verwaltung des Online Computer Library Center (OCLC)
betrieben. Homepage: http://viaf.org/. | ||
virtuelle ForschungsumgebungArbeitsplattform, die eine kooperative Forschungstätigkeit durch mehrere Wissenschaftler an unterschiedlichen Orten zu gleicher Zeit ohne Einschränkungen ermöglicht. Inhaltlich unterstützt sie potentiell den gesamten Forschungsprozess — von der Erhebung, der Diskussion und weiteren Bearbeitung der Daten bis zur Publikation der Ergebnisse — während sie technologisch vor allem auf Softwarediensten und Kommunikationsnetzwerken basiert. (Allianz der deutschen Wissenschaftsorganisationen, 2011, Original nicht mehr online, Archivdatei) | ||
VokabularIm Zusammenhang mit Forschungsdaten ist ein Vokabular oder kontrolliertes Vokabular
eine Wortliste, die der Vereinheitlichung der Wortwahl dienen soll. Eine
solche Liste könnte beispielsweise die Namen der an einem Projekt
beteiligten Institutionen enthalten und so zu einer einheitlichen
Schreibweise beitragen. Offene Vokabulare erlauben Wörter, die nicht auf der Liste stehen, geschlossene Vokabulare
nicht. Geschlossene Vokabulare treiben die Vereinheitlichung weiter
voran, sind aber weniger flexibel und müssen alle Wörter enthalten, die
gebraucht werden könnten. | ||
VolltextsucheIm gesamten Umfang eines Dokumentes wird gesucht bzw. bei Datenbanken werden auch die Datenbankinhalte durchsucht. | |
W |
|---|
Web-RootNicht der gesamte Verzeichnisbaum eines Computers sollte einfach so durch einen Web-Dienst öffentlich gemacht werden. Durch die Konfiguration des Web-Dienstes kann eingeschränkt werden, was durch den Web-Dienst abrufbar ist. Das Web-Root ist das oberste Verzeichnis, welches über den Web-Dienst zugänglich ist. Auch die Unterverzeichnise des Web-Root sind in der Regel zugänglich. Das Web-Root wird durch den Web-Administrator in der Konfiguration des Web-Dienstes festgelegt. | |
World Wide Web ConsortiumDas World Wide Web Consortium (W3C) ist die führende Organisation für die Standardisierung der Techniken des World Wide Web. Durch das W3C wurden beispielsweise HTML, XHTML, CSS und SVG standardisiert. Homepage: https://www.w3.org/ | ||
X |
|---|
XML SchemaXML Schema ist eine XML-Schemasprache. Mit XML Schema ist die Definition von Syntaxregeln im Vergleich zur DTD (Data Type Definition) ausgeprägt systematisch und detailliert möglich. Zum einen ist XML Schema selbst in der Form eines XML-Dokumentes verfasst. Zum anderen gibt es mehr atomare Datentypen wie xs:string Es sind neben Strings (Text) und weborientierten Typen auch numerische vorhanden. Kleinteilig kann über Restriktionen gesteuert werden, welche Werte z.B. ein Attribut annehmen kann. Zudem können komplexe Datentypen aus den atomaren zusammengesetzt werden. | ||
XML-EditorSoftware-Werkzeug zum Editieren von Dokumenten, die in der Extensible Markup Language (XML) verfasst sind. XML-Editoren können nicht nur XML-Dokumente bearbeiten, sondern auch
Eine Liste gängiger XML-Editoren kann bei Curlie.org gefunden werden. | ||
XML-NamensraumBezogen auf die Extensible Markup Language (XML) enthält ein Namensraum alle zulässigen Element- oder Attributnamen. | ||
XML-SchemaspracheEine XML-Schemasprache gibt einer Auszeichnungssprache auf Basis der Extensible Markup Language (XML) eine Grammatik vor. Die Schemasprache regelt
und definiert Entitäten (u.a. Sonderzeichen) für diese Sprache. | ||
Z |
|---|
Zeichenkodierungeindeutige Zuordnung von Schriftzeichen und Symbolen zu einer Bitfolge.
Das Wort "ab" würde als "0110000101100010" gespeichert werden, mit anderen Worten: Das kodierte a und das kodierte b werden einfach hintereinander gespeichert. Im Teil "Daten im Forschungsprozess / Modul: Was sind Daten?" können Sie selbst Texte als ASCII kodieren. Der de-Facto-Standard für die Zeichenkodierung im Web ist UTF-8, das ASCII mit enthält. | ||||||


