Browse the glossary using this index

Special | A | B | C | D | E | F | G | H | I | J | K | L | M | N | O | P | Q | R | S | T | U | V | W | X | Y | Z | ALL

Page: (Previous)   1  2  3  4  5  6  (Next)
  ALL

S

Supplement

Anhang innerhalb einer wissenschaftlichen Publikation, welcher den Hauptteil ergänzt. Hinzufügungen können z. B. Datensätze, Grafiken, Tabellen oder Visualisierungen sein.


T

Tags

Kennzeichner, Abgrenzer

Abgegrenzt wird häufig durch ein Anfangs- und ein End-Tag, die häufig in spitzen Klammern stehen. Beispiel aus TEI und HTML:

<p>Beginn eines neuen Absatzes
...
Ende des Absatzes</p>


Text Encoding Initiative

Text Encoding Initiative (TEI) ist sowohl ein Dokumentenformat als auch der Name der Organisation, die an Standards für dieses Dokumentenformat arbeitet. Das Dokumentenformat hat die Form einer Auszeichnungssprache, ursprünglich auf Basis von SGML (Standard Generalized Markup Language), seit Version P4 auf Basis von XML (Extensible Markup Language).

Das Dokumentenformat TEI sieht einen Header mit Pflichtelementen und Hunderten optionaler Elemente vor, in denen beschreibende Daten zum Text untergebracht werden können. TEI ist daher auch ein Metadatenstandard.

TEI-Homepage: https://tei-c.org/
TEI-Dokumentation: https://tei-c.org/release/doc/tei-p5-doc/en/html/index.html
DTDs, XML Schemas, RELAX NG und Stylesheets für TEI

Im Kurs wird TEI unter Dateiformate/Text erklärt.


TextGrid

virtuelle Forschungsumgebung für die Geisteswissenschaften. Dateien, z.B. TEI- oder Bilddateien, können ins TextGrid Laboratory hochgeladen und dort — in "Projekten" organisiert — gespeichert und bearbeitet werden. Das TextGrid Laboratory bietet einen XML-Editor und weitere Open-Source-Werkzeuge. Um das TextGrid Laboratory nutzen zu können, muss die TextGrid-Client-Software heruntergeladen und installiert werden. Das TextGrid Laboratory ist für die Entwicklung mit XML/TEI optimiert. TextGrid eignet sich besonders gut für die Arbeit mit digitalen Editionen.

Im TextGrid Repository, einem Repositorium für textwissenschaftliche Forschungsdaten, können eigene Forschungsdaten archiviert und publiziert werden. Außerdem kann nach Daten anderer Forschender gesucht werden.

Homepage: https://textgrid.de/


Thesaurus

Ein Thesaurus ist eine strukturierte, geordnete Begriffssammlung, welche verschiedene Begriffe über eine hierarchische Ordnung (über Oberbegriffe) miteinander in Beziehung setzt und deren Bedeutung festschreibt.

Thesauri werden häufig in Informationssystemen und Bibliotheken verwendet, um die Suche und Auffindbarkeit von Informationen zu verbessern.


U

URL

Ein Uniform Resource Locator ist eine Zeichenkette zur Lokalisierung von Ressourcen im World Wide Web (WWW) und dient als Adressierung in der Serverkommunikation. Eine typische URL setzt sich aus dem Protokoll (das den Verbindungstyp definiert), dem Domain-Namen (der den Server referenziert) und einem Pfad (der den genauen Speicherort auf dem Server angibt) zusammen.

Beispiel:



URN

persistenter Identifikator, der vor allem im deutschsprachigen Raum sehr verbreitet ist. Die Deutsche Nationalbibliothek bietet einen kostenlosen Vergabe-Service für wissenschaftliche Datensätze aus deutschen Einrichtungen sowie einen URN-Resolving-Dienst für Deutschland und die Schweiz an. Mit dem URN können alle Arten von digitalen Publikationen eindeutig identifiziert und so wiederauffindbar gemacht werden.

Beispiel für einen URN der Deutschen Nationalbibliothek:

Aufbau einer URN

Im Beispiel steht nbn:de für die Deutsche Nationalbibliothek, hbz für das Hochschulbibliothekszentrum NRW und 468 für die Bergische Universität Wuppertal. Leider gibt es keinen globalen Resolver und auch der URN-Aufbau variiert im Detail von Land zu Land.


UTF-8

UCS Transformation Format, wobei UCS die Abkürzung für Universal Code Character Set ist

UTF-8 ist die am weitesten verbreitete Zeichencodierung für Text (genauer: Unicode-Zeichen). Die "8" steht für eine maximale Länge von 8 Byte pro Zeichen. Dabei wird aber nur die tatsächlich benötigte Länge verwendet. Die ersten 128 Zeichen stimmen mit dem ASCII-Zeichensatz überein, d.h. für die lateinische Schrift kommt UTF-8 mit nur einem Byte pro Zeichen aus.

UTF-8 enthält neben der lateinischen Schrift auch fast alle anderen heute noch verwendeten Schriftarten, wie z.B.  griechisch, kyrillisch, arabisch, chinesisch, Braille und mehrere indische und japanische Schriftarten. Auch etliche alte Schriftarten, wie z.B. ägyptische Hieroglyphen, und eine Vielzahl von Sonderzeichen sind enthalten.



V

VIAF

ist eine weltweit genutzte Normdatei für personenbezogene Daten und wird unter der Verwaltung des Online Computer Library Center (OCLC) betrieben.

Homepage: http://viaf.org/.



virtuelle Forschungsumgebung

Arbeitsplattform, die eine kooperative Forschungstätigkeit durch mehrere Wissenschaftler an unterschiedlichen Orten zu gleicher Zeit ohne Einschränkungen ermöglicht. Inhaltlich unterstützt sie potentiell den gesamten Forschungsprozess — von der Erhebung, der Diskussion und weiteren Bearbeitung der Daten bis zur Publikation der Ergebnisse — während sie technologisch vor allem auf Softwarediensten und Kommunikationsnetzwerken basiert. (Allianz der deutschen Wissenschaftsorganisationen, 2011, Original nicht mehr online, Archivdatei)




Page: (Previous)   1  2  3  4  5  6  (Next)
  ALL