Browse the glossary using this index

Special | A | B | C | D | E | F | G | H | I | J | K | L | M | N | O | P | Q | R | S | T | U | V | W | X | Y | Z | ALL

Page:  1  2  3  4  5  6  (Next)
  ALL

A

American Standard Code for Information Interchange

eine 7-Bit-Zeichenkodierung für englischen Text. Beispielsweise wird A stets als 1000001 kodiert. 7-Bit-ASCII enthält die 95 druckbaren Zeichen

 !"#$%&'()*+,-./

0123456789:;<=>?

@ABCDEFGHIJKLMNO

PQRSTUVWXYZ[\]^_

`abcdefghijklmno

pqrstuvwxyz{|}~

sowie weitere nicht druckbare Druckersteuerzeichen. Der erweiterte ASCII-Zeichensatz (8 Bit) enthält z.B. auch die deutschen Umlaute. Der der-facto-Standard für die Zeichenkodierung im Web UTF-8 ist eine Erweiterungen des druckbaren Teils von ASCII.


Austauschformat

Dateiformat, in dem die Weitergabe (der "Austausch") von Dateien üblich ist. Austauschformate sind meist weit verbreitet und können meist von vielen Anwendungsprogrammen unter mehreren Betriebssystemen verarbeitet werden.


Auszeichnungssprache

Eine Auszeichnungssprache (engl. Markup Language) ist eine maschinenlesbare Sprache für die Gliederung und Formatierung von Texten und anderen Daten. (Wikipedia, 2023) 

Strukturelemente sind in Auszeichnungssprachen gekennzeichnet. Für diese Kennzeichnung werden häufig Tags verwendet. Beispielsweise wird in den Textformaten HTML und TEI ein neuer Absatz mit dem Tag<p> eingeleitet. Das p steht dabei für "paragraph" oder "prose".


B

Bézier-Kurve

Parametrisch modellierte Kurve mit Polynomen als Koordinatenfunktionen


C

Cascading Style Sheets

Cascading Style Sheets (CSS) ist eine Formatierungssprache (Stylesheet-Sprache) für elektronische Dokumente, z.B. HTML-, SVG- und TEI-Dateien. Das "Cascading" im Namen hat seinen Ursprung darin, dass nacheinander

  • eine externe Stylesheet-Datei
  • Style-Element im Head
  • Style-Attribute der Elemente des Textteils

eingelesen werden. Dabei besitzt die zuletzt eingelesene Regel Vorrang. HTML-Beispiel für ein Style-Attribut: Mit

   <style="font-family: Courier New, Courier, mono;">Text</span>


wird innerhalb des span-Elementes auf die Schrift Courier new umgeschaltet, die jedem Zeichen dieselbe Breite zuweist (mono für "monospace").


CMYK-Farbmodell

Subtraktives Farbmodell, in dem Farbwerte in den Komponenten Cyan, Magenta, Yellow und Key (Schwarzanteil) angegeben werden


Code Beautify

Webdienst zur Prüfung auf Wohlgeformtheit von XML: https://codebeautify.org/xmlvalidator?/xmlvalidate


Containerformat

Ein Containerformat ist in der Lage mehrere Datenströme (beispielsweise Dateien) zu vereinen. Mit im Container befinden sich Informationen, auf was wo zugegriffen werden kann. Archivdateien wie zip und tar, die im Wesentlichen dem Ein- und Auspacken und der Datenkompression dienen, sind einfache Containerformate. 

Dank der mitgespeicherten internen Links müssen die Container nicht unbedingt ausgepackt, sondern können direkt verarbeitet werden. Beispiele hierfür sind PDF, die Büroanwendungsformate OOXML (.docx, .xlsx, .pptx) und ODF (Open Data Format), sowie alle gängigen Videoformate (Quicktime, MPEG-2, MPEG-4, AVI, DV). Beispielsweise muss ein Videoformat Video- und Tonspur in einer Datei vereinen können.


CoreTrustSeal

CoreTrustSeal ist zum einen eine Zertifizierung (ein Siegel) für Forschungsdatenrepositorien, zum anderen die Organisation gleichen Namens, die das Siegel vergibt. Die Organisation CoreTrustSeal wurde gegründet von Data Seal of Approval (DSA) und The World Data System of the International Science Council (WDS). Die Zertifizierung können Forschungsdatenrepositorien auf Antrag erhalten, die 16 Richtlinien erfüllen, die ein breites Spektrum von Anforderungen von der Mission über Rechtsfragen bis zur Systemsicherheit abdecken. (coretrustseal.org)


CrossRef

CrossRef ist eine internationale Non-Profit-Organisation, die sich auf die Bereitstellung von Digital Object Identifiers (DOIs) für wissenschaftliche Inhalte spezialisiert hat, insbesondere für wissenschaftliche Artikel in Fachzeitschriften. 

Die Gründung von CrossRef erfolgte im Jahr 2000 als Kooperationsprojekt von Verlagen mit dem Ziel, eine standardisierte Methode für die Identifizierung, Verlinkung und Zitierung wissenschaftlicher Artikel im digitalen Umfeld zu schaffen.

Homepage: https://www.crossref.org


D

DataCite

DataCite ist eine 2009 gegründete internationale Non-Profit-Organisation, die DOIs für Forschungsdaten und andere Forschungsergebnisse bereitstellt.

Sie ist außerdem ein aktiver Teilnehmer in der Forschungsgemeinschaft und fördert den Datenaustausch und die Zitierung von Daten durch gemeinschaftsbildende Maßnahmen und Outreach-Aktivitäten.

Homepage: https://datacite.org/
DOI-Suchmaschine: https://commons.datacite.org/


Datenvolumen

Der Platz, den die Daten auf einem Datenträger belegen, gemessen in Byte bzw. einem Vielfachen (kB, MB, GB, TB, PB)


Document Type Definition

Ist eine XML-Schemasprache zur Definition einer Struktur in Auszeichnungssprachen auf XML-Basis. Beispiel: Das Element empty, das der Markierung nicht ausgefüllter Stellen (Nodes) im TEI-Textmodell dient, ist in der Datei tei_all.dtd der Text Encoding Initiative folgendermaßen definiert:

<!--doc:indicates the presence of an empty node within a content model [22. Documentation Elements] -->
<!ELEMENT empty  EMPTY>
<!ATTLIST empty xmlns CDATA "http://www.tei-c.org/ns/1.0">
<!ATTLIST empty %att.global.attributes; >

empty enthält nach dieser Definition keine Kindelemente (EMPTY), aber Attribute aus der Liste att.global.attributes sind möglich und können gesetzt werden, z.B. für Analysezwecke.


E

em

schriftgrößenabhängige Längeneinheit. 1em ist der Mindestzeilenabstand der verwendeten Schrift. Das entspricht etwa der Breite des Großbuchstabens M.


Extensible Markup Language

Die Extensible Markup Language (XML) ist eine Auszeichnungssprache 2. Stufe in dem Sinne, dass XML anderen Auszeichnungssprachen einige grundsätzliche Regeln vorgibt.

Nähere Informationen in Kurzform können in diesem Kurs gefunden werden unter Dateiformate / Text. Ausführlichere Informationen:

XML-Tutorium von W³schools mit nur wenig Text

XML-Tutorium von selfhtml

XML 1.0 Recommendation (W3C-Standard)


Extensible Stylesheet Language

Unter dem Namen Extensible Stylesheet Language (XSL) sind drei XML-Auszeichnungssprachen zusammengefasst, die mit der Formatierung von Dokumenten zusammenhängen:

  • Die Formatierungssprache XSL (das "eigentliche" XSL, auch XSL-FO genannt), die Layout-Regeln vorgibt
  • Extensible Stylesheet Language Transformation (XSLT), eine Skriptsprache für die Umwandlung eines XML-Baums in einen anderen
  • XPath für die Adressierung von Zweigen im XML-Baum
XSL nutzt selbst XML-Syntax.

F

FAIR-Prinzipien

FAIR steht für "Findable Accessible Interoperable Reusable". Die FAIR-Prinzipien sollen die Nachnutzbarkeit von Forschungsdaten verbessern. Eine Arbeitsgruppe aus Mitgliedern der FORCE11 Community hat die Abkürzung mit einem Satz von Regeln unterlegt und einer breiten Öffentlichkeit zugänglich gemacht. (FORCE11, 2016) Eine wichtige Forderung ist, dass Forschungsdaten menschen- und maschinenlesbar sein sollen.


Formatierungssprache

Computersprache, in der Stylesheets geschrieben werden können


Formatvalidierung

Prüfung auf Einhaltung des Datenformats


G

Gemeinsame Normdatei

Die Normdaten der Gemeinsamen Normdatei (GND) beschreiben eindeutig und regelbasiert "Personen, Körperschaften, Konferenzen, Geografika, Sachbegriffe und Werke, die in Bezug zu Kulturgut sowie kulturellen und wissenschaftlichen Sammlungen stehen". Die GND ist damit ein kontrolliertes Vokabular und der GND-ID ein persistenter Identifikator, ähnlich dem ORCID ID für Personen und dem DOI für Objekte. In den Normdaten kann gesucht werden.

"Die Gemeinsame Normdatei (GND) wird von der Deutschen Nationalbibliothek, allen deutschsprachigen Bibliotheksverbünden mit den angeschlossenen Bibliotheken, der Zeitschriftendatenbank und zahlreichen weiteren Einrichtungen gemeinschaftlich geführt."

Homepage und Quelle: https://gnd.network/

Suchfunktion und Normdaten-Ausgabe: http://gnd.eurospider.com/


H

Header

Teil vor dem Datenteil einer Datei, der Metadaten oder Angaben zum Aufbau des Datenteils der Datei enthält


I

Inkscape

Zeichenprogramm zur Erzeugung und Bearbeitung zweidimensionaler Vektorgrafiken. Inkscape ist

  • Plattformunabhängig
  • Open Source
  • Entgeltfrei
Inkscape kann Vektor- und Rastergrafiken in zahlreichen Formaten im- und exportieren.

Homepage und Download: https://inkscape.org/

ISNI

International Standard Name Identifier

ist eine standardisierte Identifikationsnummer für Urheberinnen und Urheber und wurde von der International Organization for Standardization (ISO) entwickelt.

Homepage: https://isni.org/


L

Landungsseite

In der Web-Oberfläche der meisten Repositorien sind Forschungsdaten nicht über nur einen Mausklick abrufbar, sondern es befindet sich noch eine Seite dazwischen, die Landungsseite oder landing page. Die Landungsseite enthält üblicherweise Informationen zum Forschungsdatensatz, meist einen Teil der Metadaten und eine Liste der verfügbaren Dateien.


Lempel-Ziv-Welch-Algorithmus

Ein nach den Entwicklern benannter Kompressionsalgorithmus, der mit einem Wörterbuch arbeitet. In der zu komprimierenden Datei werden die am häufigsten vorkommenden Wörter durch eine Abkürzung ersetzt. Der Lempel-Ziv-Welch-Algorithmus wird häufig zur Kompression von Bildern eingesetzt, wobei anstelle von Wörtern nach Bitmustern gesucht wird.


Ligatur

Begriff aus der Typografie:

Zeichen (Glyphe), das durch Verschmelzung mehrerer Buchstaben entstanden ist. Beispiele:

   ae → æ
   oe → œ


Lizenzbedingungen

Bei Forschungsdaten können Lizenzbedingungen die Nutzungsrechte regeln. Empfehlenswert ist die Vergabe einer freien Lizenz, wie sie Creative Commons anbietet.

Für Texte allgemein kann es ebenfalls Lizenzbedingungen geben, die selbstverständlich auch im Studium zu beachten sind. Grundlage sind das Urheberrecht und die Nutzungsbedingungen der Verlage/Anbieter. Nach deutschem Urheberrecht gilt: Volltexte dürfen nur zum persönlichen Gebrauch und zu Forschungszwecken ausgedruckt oder gespeichert werden. Ein systematischer Download von Aufsätzen oder Suchresultaten (v. a. von kompletten Büchern oder großen Teilen) ist untersagt. Einzelne Seiten/Kapitel zum persönlichen Gebrauch oder zu Forschungszwecken sind in Ordnung. Aufsätze dürfen weder elektronisch noch in gedruckter Form an Dritte weitergegeben werden. Bei einigen Verlagen ist deshalb beispielsweise nur der Download einzelner Kapitel möglich oder sogar ein rein lesender Zugriff ohne Download-Möglichkeit.


M

Metadaten

Metadaten sind strukturierte Daten, die verwendet werden, um Objekte, Konzepte und Daten systematisch zu beschreiben. Sie dienen dazu, umfassende Information über die Merkmale anderer Daten oder Datensätze zu vermitteln. Sie sind sozusagen "Daten über Daten".


N

nestor-Siegel

Zertifizierung, die vom Verein nestor vergeben wird. Es basiert auf der DIN-Norm 31644 und umfasst 34 Kriterien, die u.a. rechtliche Aspekte und Fragen der Finanzierung behandeln.


O

ORCID

ORCID steht für Open Researcher and Contributor ID und ist eine gemeinnützige Organisation, die sich darauf konzentriert, weltweit eindeutige Identifikatoren für Forschende (d.h. Personen!) zu vergeben. Das Ziel von ORCID besteht darin, die Zuordnung wissenschaftlicher Beiträge zu erleichtern und die Anerkennung der Leistungen von Forschenden zu verbessern.

Homepage:  https://orcid.org


P

parametrisch modellierte Kurve

Wir haben die Aufgabe, eine Kurve in der Ebene mathematisch darzustellen. Eine Kurve ist ein eindimensionales Gebilde. Entsprechend brauchen wir nur eine Variable, die als Parameter bezeichnet wird und im Folgenden mit t abgekürzt werden soll.

Das t-Intervall [tAnfang, tEnde] wird abgebildet auf die Kurve mithilfe einer ParametrisierungP, die jedem t aus dem Intervall einen Punkt auf der Kurve zuordnet. P muss glatt sein (unendlich oft differenzierbar), damit Sprünge, Knickstellen und andere Unebenheiten der Kurve ausgeschlossen sind.


Die parametrisch modellierte Kurve ist definiert als die Menge aller Bildpunkte P(t) mit t aus [tAnfang, tEnde].

In der Ebene hat jeder Punkt zwei Koordinaten. Entsprechend brauchen wir zwei Koordinatenfunktionen x und y, für jede Koordinate eine. Beide Koordinatenfunktionen hängen von t ab. P(t) ist in den Koordinatenfunktionen geschrieben der Vektor

P(t) = (x(t), y(t))



PDF/A

PDF for Archive ist ein nach ISO 19005 standardisiertes PDF, das sich für die Archivierung von Dokumenten eignet, weil

  • alle Schriftarten und Abbildungen, die im Dokument verwendet werden, eingebunden sind
  • Animationen, Videos und andere Elemente, die auf externe Software zugreifen, nicht eingebunden sind
  • Farben im Farbraum des Ausgabegeräts so gewählt werden, dass sie der Farbe im Dokument möglichst nahekommen
  • die Verwendung von Kryptofunktionen (Verschlüsselungen) nicht erlaubt ist.


Präfix

unselbstständiger Wortteil, der dem Wort vorangestellt wird. Wohl wichtigstes Beispiel sind die Vorsilben aus der Grammatik. Aber auch in Wissenschaft und Technik sind Präfixe häufig zu finden. Beispiel: Metadaten


proprietär

Eine Software oder ein Datenformat wird als proprietär bezeichnet, wenn mindestens einer der folgenden Punkte zutrifft:

  • Die Nutzungsrechte sind durch das Vorhandensein urheber- oder patentrechtlich geschützter Teile eingeschränkt
  • Der Quellcode ist unter Verschluss (Closed Source)
  • Teile der Dokumentation sind unter Verschluss oder fehlen


R

RELAX NG

XML-Schemasprache zur Definition einer Struktur in Auszeichnungssprachen auf XML-Basis. RELAX NG kann wahlweise selbst in XML-Form oder in einer kompakteren Syntax verfasst werden. Beispiel geschrieben in der XML-Form:

Das Element empty, das der Markierung nicht ausgefüllter Stellen (Nodes) im Textmodell dient, ist in der Datei tei_all.rng der Text Encoding Initiative folgendermaßen definiert:

   <define name="empty">
      <element name="empty">
         <a:documentation xmlns:a="http://relaxng.org/ns/compatibility/annotations/1.0">indicates the presence of an empty node within a content model [22. Documentation Elements]</a:documentation>
         <empty/>
         <ref name="att.global.attributes"/>
         <empty/>
      </element>
   </define>
empty enthält nach dieser Definition keine Kindelemente, aber Attribute aus der Liste att.global.attributes sind möglich und können gesetzt werden, z.B. für Analysezwecke.


Repositorium

spezielle Art von Datenbanksystemen, die für die Speicherung, Organisation, Verwaltung und Bereitstellung digitaler Informationsobjekte verwendet werden und über das WWW zugänglich sind. In diesem Kurs gibt es unter

Grundsätze digitaler Publikation, Nachnutzung & Datenorganisation / Modul: Was braucht es für eine Datenpublikation?

je eine Seite zu Repositorien und deren Auswahl.



Rohdaten

Ausgangsdaten, d. h. Daten, die noch unbearbeitet sind. Rohdaten müssen nicht unbedingt digital, sondern können auch auf Papier oder einem anderen Träger vorliegen.


S

selfhtml

Verein, der eine deutschsprachige Einführung in die Web-Technik zur Verfügung stellt. Eine solche Einführung mit Nachschlagewerk gibt es u.a. für HTML, CSS (Cascading Style Sheets), SVG (Scalable Vector Graphics) und MathML (Mathematical Markup Language).

Homepage mit den Einführungen und Nachschlagewerken: https://wiki.selfhtml.org/


Stylesheet

legt fest, wie ein elektronisches Dokument dargestellt werden soll. Beispiele für Stylesheet-Sprachen sind CSS (Cascading Style Sheets) und XSL (Extensible Stylesheet Language).


Suffix

Unselbstständiger Wortteil, der dem Wort angefügt wird. Wohl wichtigstes Beispiel sind die Nachsilben aus der Grammatik. Beispiel: Flüssigkeit. Aber auch in Wissenschaft und Technik sind Suffixe häufig zu finden, z.B. als Dateinamensendung: text.txt



Supplement

Anhang innerhalb einer wissenschaftlichen Publikation, welcher den Hauptteil ergänzt. Hinzufügungen können z. B. Datensätze, Grafiken, Tabellen oder Visualisierungen sein.


T

Tags

Kennzeichner, Abgrenzer

Abgegrenzt wird häufig durch ein Anfangs- und ein End-Tag, die häufig in spitzen Klammern stehen. Beispiel aus TEI und HTML:

<p>Beginn eines neuen Absatzes
...
Ende des Absatzes</p>


Text Encoding Initiative

Text Encoding Initiative (TEI) ist sowohl ein Dokumentenformat als auch der Name der Organisation, die an Standards für dieses Dokumentenformat arbeitet. Das Dokumentenformat hat die Form einer Auszeichnungssprache, ursprünglich auf Basis von SGML (Standard Generalized Markup Language), seit Version P4 auf Basis von XML (Extensible Markup Language).

Das Dokumentenformat TEI sieht einen Header mit Pflichtelementen und Hunderten optionaler Elemente vor, in denen beschreibende Daten zum Text untergebracht werden können. TEI ist daher auch ein Metadatenstandard.

TEI-Homepage: https://tei-c.org/
TEI-Dokumentation: https://tei-c.org/release/doc/tei-p5-doc/en/html/index.html
DTDs, XML Schemas, RELAX NG und Stylesheets für TEI

Im Kurs wird TEI unter Dateiformate/Text erklärt.


TextGrid

virtuelle Forschungsumgebung für die Geisteswissenschaften. Dateien, z.B. TEI- oder Bilddateien, können ins TextGrid Laboratory hochgeladen und dort — in "Projekten" organisiert — gespeichert und bearbeitet werden. Das TextGrid Laboratory bietet einen XML-Editor und weitere Open-Source-Werkzeuge. Um das TextGrid Laboratory nutzen zu können, muss die TextGrid-Client-Software heruntergeladen und installiert werden. Das TextGrid Laboratory ist für die Entwicklung mit XML/TEI optimiert. TextGrid eignet sich besonders gut für die Arbeit mit digitalen Editionen.

Im TextGrid Repository, einem Repositorium für textwissenschaftliche Forschungsdaten, können eigene Forschungsdaten archiviert und publiziert werden. Außerdem kann nach Daten anderer Forschender gesucht werden.

Homepage: https://textgrid.de/


Thesaurus

Ein Thesaurus ist eine strukturierte, geordnete Begriffssammlung, welche verschiedene Begriffe über eine hierarchische Ordnung (über Oberbegriffe) miteinander in Beziehung setzt und deren Bedeutung festschreibt.

Thesauri werden häufig in Informationssystemen und Bibliotheken verwendet, um die Suche und Auffindbarkeit von Informationen zu verbessern.


U

URL

Ein Uniform Resource Locator ist eine Zeichenkette zur Lokalisierung von Ressourcen im World Wide Web (WWW) und dient als Adressierung in der Serverkommunikation. Eine typische URL setzt sich aus dem Protokoll (das den Verbindungstyp definiert), dem Domain-Namen (der den Server referenziert) und einem Pfad (der den genauen Speicherort auf dem Server angibt) zusammen.

Beispiel:



URN

persistenter Identifikator, der vor allem im deutschsprachigen Raum sehr verbreitet ist. Die Deutsche Nationalbibliothek bietet einen kostenlosen Vergabe-Service für wissenschaftliche Datensätze aus deutschen Einrichtungen sowie einen URN-Resolving-Dienst für Deutschland und die Schweiz an. Mit dem URN können alle Arten von digitalen Publikationen eindeutig identifiziert und so wiederauffindbar gemacht werden.

Beispiel für einen URN der Deutschen Nationalbibliothek:

Aufbau einer URN

Im Beispiel steht nbn:de für die Deutsche Nationalbibliothek, hbz für das Hochschulbibliothekszentrum NRW und 468 für die Bergische Universität Wuppertal. Leider gibt es keinen globalen Resolver und auch der URN-Aufbau variiert im Detail von Land zu Land.


UTF-8

UCS Transformation Format, wobei UCS die Abkürzung für Universal Code Character Set ist

UTF-8 ist die am weitesten verbreitete Zeichencodierung für Text (genauer: Unicode-Zeichen). Die "8" steht für eine maximale Länge von 8 Byte pro Zeichen. Dabei wird aber nur die tatsächlich benötigte Länge verwendet. Die ersten 128 Zeichen stimmen mit dem ASCII-Zeichensatz überein, d.h. für die lateinische Schrift kommt UTF-8 mit nur einem Byte pro Zeichen aus.

UTF-8 enthält neben der lateinischen Schrift auch fast alle anderen heute noch verwendeten Schriftarten, wie z.B.  griechisch, kyrillisch, arabisch, chinesisch, Braille und mehrere indische und japanische Schriftarten. Auch etliche alte Schriftarten, wie z.B. ägyptische Hieroglyphen, und eine Vielzahl von Sonderzeichen sind enthalten.



V

VIAF

ist eine weltweit genutzte Normdatei für personenbezogene Daten und wird unter der Verwaltung des Online Computer Library Center (OCLC) betrieben.

Homepage: http://viaf.org/.



virtuelle Forschungsumgebung

Arbeitsplattform, die eine kooperative Forschungstätigkeit durch mehrere Wissenschaftler an unterschiedlichen Orten zu gleicher Zeit ohne Einschränkungen ermöglicht. Inhaltlich unterstützt sie potentiell den gesamten Forschungsprozess — von der Erhebung, der Diskussion und weiteren Bearbeitung der Daten bis zur Publikation der Ergebnisse — während sie technologisch vor allem auf Softwarediensten und Kommunikationsnetzwerken basiert. (Allianz der deutschen Wissenschaftsorganisationen, 2011, Original nicht mehr online, Archivdatei)



Vokabular

Im Zusammenhang mit Forschungsdaten ist ein Vokabular oder kontrolliertes Vokabular eine Wortliste, die der Vereinheitlichung der Wortwahl dienen soll. Eine solche Liste könnte beispielsweise die Namen der an einem Projekt beteiligten Institutionen enthalten und so zu einer einheitlichen Schreibweise beitragen. Offene Vokabulare erlauben Wörter, die nicht auf der Liste stehen, geschlossene Vokabulare nicht. Geschlossene Vokabulare treiben die Vereinheitlichung weiter voran, sind aber weniger flexibel und müssen alle Wörter enthalten, die gebraucht werden könnten.


Volltextsuche

Im gesamten Umfang eines Dokumentes wird gesucht bzw. bei Datenbanken werden auch die Datenbankinhalte durchsucht.


W

Web-Root

Nicht der gesamte Verzeichnisbaum eines Computers sollte einfach so durch einen Web-Dienst öffentlich gemacht werden. Durch die Konfiguration des Web-Dienstes kann eingeschränkt werden, was durch den Web-Dienst abrufbar ist. Das Web-Root ist das oberste Verzeichnis, welches über den Web-Dienst zugänglich ist. Auch die Unterverzeichnise des Web-Root sind in der Regel zugänglich. Das Web-Root wird durch den Web-Administrator in der Konfiguration des Web-Dienstes festgelegt.


World Wide Web Consortium

Das World Wide Web Consortium (W3C) ist die führende Organisation für die Standardisierung der Techniken des World Wide Web. Durch das W3C wurden beispielsweise HTML, XHTML, CSS und SVG standardisiert.

Homepage: https://www.w3.org/


X

XML Schema

XML Schema ist eine XML-Schemasprache.

Mit XML Schema ist die Definition von Syntaxregeln im Vergleich zur DTD (Data Type Definition) ausgeprägt systematisch und detailliert möglich. Zum einen ist XML Schema selbst in der Form eines XML-Dokumentes verfasst. Zum anderen gibt es mehr atomare Datentypen wie

xs:string
xs:decimal
xs:integer
xs:date
xs:time
xs:anyURI

Es sind neben Strings (Text) und weborientierten Typen auch numerische vorhanden. Kleinteilig kann über Restriktionen gesteuert werden, welche Werte z.B. ein Attribut annehmen kann. Zudem können komplexe Datentypen aus den atomaren zusammengesetzt werden.


XML-Editor

Software-Werkzeug zum Editieren von Dokumenten, die in der Extensible Markup Language (XML) verfasst sind. XML-Editoren können nicht nur XML-Dokumente bearbeiten, sondern auch

  • die Wohlgeformtheit des Dokuments prüfen
  • XML-Elemente durch Ergänzen des End-Tags automatisch vervollständigen
  • XML-Strukturen (z.B. Tags) erkennen und farblich hervorheben
  • DTDs und Schemadateien lesen und nutzen, um
    • das XML-Dokument auf Gültigkeit zu überprüfen
    • beim Editieren Kindelemente und Attribute vorzuschlagen
Eine Liste gängiger XML-Editoren kann bei Curlie.org gefunden werden.

XML-Namensraum

Bezogen auf die Extensible Markup Language (XML) enthält ein Namensraum alle zulässigen Element- oder Attributnamen.


XML-Schemasprache

Eine XML-Schemasprache gibt einer Auszeichnungssprache auf Basis der Extensible Markup Language (XML) eine Grammatik vor. Die Schemasprache regelt

  • welche Elemente die Auszeichnungssprache besitzt
  • welche Kindelemente ein Element haben kann
  • welche Kindelemente ein Element haben muss
  • welche Attribute ein Element haben kann
  • welche Attribute ein Element haben muss
  • welche Werte ein Attribut annehmen kann
und definiert Entitäten (u.a. Sonderzeichen) für diese Sprache.

Z

Zeichenkodierung

eindeutige Zuordnung von Schriftzeichen und Symbolen zu einer Bitfolge.

Beispiel: 8-Bit-ASCII-Kodierung
Buchstabewird zeichenkodiert gespeichert als
a01100001
b01100010

Das Wort "ab" würde als "0110000101100010" gespeichert werden, mit anderen Worten: Das kodierte a und das kodierte b werden einfach hintereinander gespeichert. Im Teil "Daten im Forschungsprozess / Modul: Was sind Daten?" können Sie selbst Texte als ASCII kodieren. Der de-Facto-Standard für die Zeichenkodierung im Web ist UTF-8, das ASCII mit enthält.



Page:  1  2  3  4  5  6  (Next)
  ALL