Glossar

A-B-C-D-E-F-G-H-I/J-K-L-M-O-P-Q-R-S-T-U-V-W-X-Y/Z

Zu einzelnen ...
    Dienstleistungsunternehmen siehe z.B. unter
        Classen Convertronics, Digital Imaging Technologies, Herrmann & Kraemer, SRZ, Zeutschel
    zu Datenbank- und Dokumentenmanagementprogrammen z.B. unter
        AGORA, Allegro, CLARITweb, FAUST, FoxPro, kleio
    zu Scanner-Hardware z.B. unter
        BookEye, Omniscan (x)000, PageScan150, PS 3000
    zu OCR-Software z.B. unter
        FineReader, Omnipage, ProLector, Recognita, TextBridge
    zu Organisationen z.B. unter
        CLIR, DLF, ECPA, IFLA, TEI, W3C
    zu Beschreibungsstandards z.B. unter
        AACR2, Dublin Core, EAD, GKD, ICONCLASS, RAK, RDF, SWD
    zu Programm- und Programmierstandards z.B. unter
        ASP, CGI, CSS, DHTML, DSSSL, HTML, SGML, SQL, XML, XSL
    zu technischen Standards z.B. unter
        ASCII, GIF, JPG, PNG, TIFF, UNICODE

- A -

AACR2 - "Anglo-American Cataloguing Rules", Regelwerk für bibliographische Metadaten. Ausführliche deutsche Beschreibung (Übersetzung)
AGORA - Dokumentenmanagementsystem (Digital Library System) das vom SRZ in Zusammenarbeit mit dem GDZ entwickelt wird. AGORA-Startseite
ALLEGRO-C - Katalogisierungs-Software
ALLEGRO-HANS - Allegro-Datenbank für Handschriften, Autographen, Nachlässe und Sonderbestände. Siehe Seite der Staatsbibliothek Hamburg.
ASCII - "American Standard Code for Information Interchange". Derzeit am weitesten verbreiteter Standard-Zeichensatz mit 8-bit- Codierung, z.B. meistens Grundlage von HTML.
ASP - "Active Server Pages", von Microsoft entwickelte Scriptsprache für serverseitige Datenbankabfragen. Alternative zu CGI, noch nicht ganz so etabliert, wird aber in Zukunft eine größere Rolle spielen. Linksammlung zu Seiten über ASP.

- B -

Bar-Code - Streifencode, Strichcode. Daten werden digital als Striche codiert, und können über eine spezielles Lesegerät wiedereingescannt werden (vgl. der aus dem Supermarkt bekannte EAN-Code).
Batch-Verarbeitung - Bei der Batch-Verarbeitung (Stapelverarbeitung) liegen der Vorgang der Dateneingabe und die eigentliche Datenverarbeitung zeitllich auseinander. Mehrere Befehle oder Daten werden dem Computer zunächst in Form einer sogenannten Batch-Datei gesammelt übergeben, der diese dann Schritt für Schritt ohne weitere Interaktion durch den Benutzer abarbeitet. (nach Eysenbach-Glossar)
BookEye - Aufsichtsscanner der Firma ImageWare.

- C -

CAERE - Unternehmen, das Hard-und Software für den Scanning- und OCR-Bereich entwickelt (u.a. OmniPage)
CGI - "Common Gateway Interface". Dient der Einbindung von skriptgesteuerten Abläufen (z.B. Datenbankanfragen an einen Server) in eine HTML-Seite. Derzeit die Internet-Standard-Technik für die Anbindung von Datenbanken an das WWW. Einführung: Was ist CGI?
Chadwyck-Healey - Verlagshaus, das auch digital erschlossene Bestände publiziert. Startseite des Verlages.
CLARITweb - Software für Internet-Interfaces zu Datenbanken, siehe die entsprechenden Seiten des Herstellers CLARITECH
Classen-Convertronics - Dienstleistungsunternehmen im Bereich Scanning und Digitalisierung. Startseite.
CLIR - Council on Library and Information Ressources
CSS - "Cascading Style Sheets", Sprache zur Definition von Formateigenschaften von HTML- (oder anderen ...ML-) Dokumenten. Formateigenschaften sind in den Browsern zwar auch voreingestellt, es besteht aber die Möglichkeit, eigene Definitionen zu schaffen, was insbesondere in Verbindung mit XML an Bedeutung gewinnen wird. CSS-Seite des W3C.

- D -

DBMS/Datenbank-
managementsystem
- Umfassendes Softwaresystem, das nicht nur unterschiedliche Datenarten (Text, Bild), sondern auch verschiedene Datenbanken verwalten kann und eine Benutzerschnittstelle (z.B. für das WWW) zur Verfügung stellt.
DHTML - "Dynamic HTML", dynamisches HTML, eine Erweiterung zum klassischen HTML mit zusätzlichen Möglichkeiten im Layout und zur Gestaltung dynamischer Elemente.
Digital Imaging Technologies - Dienstleister im Digitalisierungsbereich, mit dem unter anderem die "Internet Library for Early Journals" zusammengarbeitet hat.
DISKUS - "Digital Information System for Art and Social History", Publikationsreihe zu Bildsammlungen in Museen, Archiven und Bibliotheken. Die Publikationsliste beim Saur-Verlag.
DLF - Digital Library Federation. Eine Tochterorganisation des Council on Library and Information Resources (CLIR)
Dokumentenmanage-
mentsystem (DMS)
Umfassendes Softwaresystem zur Archivierung, automatischen Konvertierung Indexierung, Verwaltung und Publikation von Dokumenten sowohl in bildlicher Form als auch als Volltexte. Siehe u.a. die Seite des GDZ zu diesem Thema.
DPI - "Dots Per Inch", Punkte pro Zoll. In dpi wird oft die Auflösung von Scannern und Druckern angegeben. Dabei ist zu beachten, daß die Angaben nur dann vergleichbar sind, wenn sie gleiche Bezugsgrößen betreffen: Ein mit 2000dpi gescanntes Dia einer Buchseite ergibt nicht unbedingt eine schärfere Auflösung als das scannen der Originalseite mit 300dpi.
DSSSL - "Document Style Semantics and Specification Language". Gesprochen "Dissel". DSSSL ist ein ISO-Standard zur Formatierung von SGML-Dokumenten. Ähnlich wie SGML eine Metasprache zur Schaffung von Definitionen (wie bei SGML für Auszeichnungssprachen) für Style-Sheets. Wie SGML die Basis für eine vereinfachte Version (XML) ist, so ist auch DSSSL die Grundlage für XSL (eXtensible Style Language). Vgl. die DSSSL-Seite der SGML/XML-Web-Page.
DTD - "DocumentTypeDeclaration". In SGML und XML die Vereinbarung über die Struktur des Dokumentes, entsprechend der verwendeten Tags und ihrer Eigenschaften. Alle HTML-Dateien folgen beispielsweise der entsprechenden HTML-DTD.
Dublin Core (DC) - Metadatensystem zur Beschreibung elektronischer Ressourcen. Internet-Seite zum Dublin Core.
DVD - "Digital Video Disc" oder "Digital Versatile Disc", Massenspeichermedium mit 7,2 Gigabyte. Ein mögliches Nachfolgemdium für die CD-ROM.d

- E -

EAD - "Encoded Archival Description". Eine DTD zur Beschreibung von Archivalien und zur Generierung von online-Findbüchern. Die offizielle Homepage der EAD.
ECPA - European Commission on Preservation and Access. EPIC (European Preservation Information Center) ist die WWW-Seites der ECPA.
EROMM - "Europäisches Register der Master-Mikroformen". Siehe z.B. die Seite des GDZ dazu.
EUROVOC - Europäischer Thesaurus, z.B. zur multilingualen Indexierung und Verschlagwortung. Eine Seite in Tschechien dazu.

- F -

FAUST - Im Archivbereich relativ weit verbreitete Software zur Bestandsverwaltung.
FineReader - OCR-Software der Firma Abbyy.
FoxPro - Ein Datenbankprogramm. Eine Übersichtsseite dazu; die deutschsprachige FoxPro User Group.
Fuzzy search - "Unscharfe Suche". Eine Suchroutine, die auch dann Treffer anzeigt, wenn sie nicht exakt mit dem Suchterm übereinstimmen.

- G -

GDZ - Göttinger Digitalisierungszentrum
GIF - "Graphics Interchange Format" - weit verbreitetes komprimierendes Bildformat im Internet, wird vor allem für bitonale und Halbtonbilder verwendet. Ein Vergleich von GIF und JPG.
GIS - "Geographisches Informationsystem" - Datenmanagementsystem, das die Informationen unter einer geographischen Perspektive verwaltet.
GIS-VISOR - Geographisches Informationssystem der Firma Megatel, Bremen.
GKD - "Gemeinsame Körperschaftsdatei", siehe Seite der Deutschen Bibliothek Leipzig.
GUI - Graphical User Interface, Graphische Benutzerschnittstelle zwischen Anwender und den digitalen Inhalten. Das GUI arbeitet hauptsächlich mit Symbolen, Schaltflächen und Auswahllisten.

- H -

HANS -
Hermann&Kraemer - Dienstleistungsunternehmen im Bereich Digitalisierung. Startseite.
HTML - HyperTextMarkupLanguage, die derzeit gängige Auszeichnungssprache im WWW.

- I, J -

ICONCLASS - Ikonographisches Klassifikationssystem. Homepage von ICONCLASS.
ICR - "Intelligent Character Recognition", wie OCR ein Verfahren zur automatischen Buchstabenerkennung.
IFLA - International Federation of Library Associations and Institutions, laut Selbstbeschreibung eine "worldwide, independent organization created to provide librarians around the world with a forum for exchanging ideas, promoting international cooperation, research and development in all fields of library activity"
ILEJ - Internet Library of Early Journals. Gemeinsames Pilotprojekt mehrerer englischer Universitäten für Zeitschriften des 18. und 19. Jahrhunderts.
JAVA - Plattformneutrale, C++-ähnliche Programmsprache von Sun, die in der Lage ist, Echtzeit-Operationen über ein Netz durchzuführen. Kurzbeschreibung in einem anderen Glossar.
JOSHI - Ein Dienstleistungsunternehmen im Bereich Scanning und Keyboarding.
JPEG, JPG - "Joint Photographers Expert Group"-Format; eines der verbreitetsten Bildformate im Internet. Das Format ermöglicht verschiedene Kompressionsgrade und wird vor allem für farbige Abbildungen verwendet. Ein Vergleich von GIF und JPG. Über die JPEG-Bilddatenkompression

- K -

kleio - Datenbanksystem, von Manfred Thaller (MPI für Geschichte, Göttingen) für geschichtswissenschaftliche Anforderungen (Textliches und bildliches Quellenmaterial) entwickelt. Startseite von Kleio.
KVK - Karlsuher Virtueller Katalog
KVVK - Karlsruher Virtueller Volltext Katalog

- L -

Lexis - Ein italienischer Verlag für elektronische Publikationen. Teilweise auch digitale Fassungen älterer Werke.

- M -

MAB2 - Maschinelles Austauschformat für Bibliotheken. Siehe u.a. die MAB-Seite der Deutschen Bibliothek.
MARC2 - "MAchine Readable Cataloging data". Ein Standard für (hauptsächlich bibliographische) Metadaten. Die MARC-Seite der Library of Congress.
MDZ - Münchener Digitalisierungszentrum
Mekel MX500XL-G - Ein Mikrofilmscanner. Siehe den Erfahrungsbericht bei der ILEJ.
MIDAS - "Marburger Inventarisations-, Dokumentations- und Administrationssystem"; Im Bildarchiv Marburg entwickeltes Verfahren für die Katalogisierung (Inventarisation) und Verwaltung von Kunst- und Bauwerken mit Hilfe elektronischer Datenverarbeitung.
Minolta PS3000 - Ein Buchscanner. Siehe entsprechende Produktseite bei Minolta.

- N -

- O -

OCR - "Optical Character Recognition" (optische Buchstabenerkennung), automatische Texterkennung durch Computerprogramme.
Omnipage - OCR-Software. Siehe die entsprechende Produktseite der Firma Caere.
Omniscan (x)000 - Omniscan 3000, Omniscan 5000 oder Omniscan 6000 sind Aufsichtscanner der Firma Zeutschel, die zum Digitalisieren unterschiedlicher Vorlagen verwendet werden.

- P -

PageScan150 - Spezieller Buchscanner - siehe Produktseiten bei der Firma "Reality Imaging Systems".
PDF - "Portable Document Format". Acrobat-Dateiformat von Adobe. Dient dem plattform- und programmunabhängigen Austausch und der Publikation beliebiger Seiten. Es wird allerdings eine spezielle Software zum lesen der Dateien benötigt, die (noch) kostenfrei ist. Adobe Acrobat Startseite.
PICA Das "Netherlands Centre for Library Automation and Online Services" produziert eine Reihe von Softwareprodukten im Bibliotheksbereich, z.B. Internet-Suchmaschinen für Kataloge. Startseite PICA.
PND "Personennamendatei", siehe Seite der Deutschen Bibliothek Leipzig.
PNG - Neueres komprimierendes Bildatenformat mit einigen Vorteilen gegenüber GIF und JPG. Es ist aber noch nicht abzusehen, ob es sich als Standard im WWW durchsetzen wird.
ProLector - OCR-Software. Siehe die Produktseite von Pronobis.
PS 3000 - PS 3000, PS 3000P und PS 7000 sind Aufsichtscanner (z.B. für Bücher) der Firma Minolta. Siehe die Scanner-Seite der deutschen Minolta-Vertretung.

- Q -

Quadrant - Dienstleistungsunternehmen im Bereich Scanning und Digitalisierung.

 

- R -

RAK - "Regeln für den Alphabetischen Katalog". System für die Aufnahme und Ordnung von bibliographischen Metadaten, das auch Untermengen für bestimmte Bereiche enthält, z.B. "Regeln für die alphabetische Katalogisierung von Nichtbuchmaterialien" (RAK-NBM) oder "Regeln für den alphabetischen Katalog in wissenschaftlichen Bibliotheken" (RAK-WB)
Recognita - OCR-Software. Siehe die entsprechende Produktseite.
RDF - "Resource Description Framework", eine Spezifikation zur Beschreibung von Metadaten, die derzeit vom W3C entwickelt wird. Die RDF-Seite des W3C.
RNA - "Regeln zur Erschließung von Nachlässen und Autographen", Deutsche Forschungsgemeinschaft, Unterausschuß für Nachlaßerschließung. Siehe Seite des DBI.

- S -

Saur (K.G. Saur) - Verlag, der u.a. auch Katalog-CDs publiziert. Startseite des Saur-Verlags.
SGML - "Structured Generalized Markup Language" - eine Metasprache zur Generierung von Auszeichnungssprachen und internationaler Standard seit 1986 (ISO 8879). Bislang war z.B. HTML eine Anwendung von SGML; XML ist eine Untermenge von SGML. Eine private Überblicksseite zu SGML.
SQL - "Standard Query Language". Abfragesprache für relationale Datenbanken, die in Form von standardisierten Befehlen eine Datenabfrage über verschiedene Plattformen hinweg ermöglicht.
SRZ-Berlin - Satzrechenzentrum Berlin, Dienstleister im Bereich Scanning und Softwareentwicklung für Digitale Bibliotheken.
SWD - Schlagwortnormdatei; normierter, terminologisch kontrollierter Wortschatz für Schlagwörter. Seite der Deutschen Bibliothek dazu.

- T -

TEI - "Text Encoding Initiative", Eine Art Standard für die Auszeichnung von elektronischen Texten. Basierend auf SGML und in Zukunft wahrscheinlich Grundlage XML-konformer DTDs im Bereich elektronischer Texte. Startseite der TEI.
Textbridge - OCR-Software. Siehe die entsprechende Produktseite der Firma ScanSoft.
Thumbnails - Verkleinerungen von Bildern, Illustrationen oder ganzen Seitenlayouts zur Übersicht und zur Unterstützung der Auswahl bei gleichzeitig minimierter Dateigröße.
TIFF - "Tagged Image File Format", unkomprimiertes Datenformat für Bilder. Weitestgehend Standard im Bereich der Bildarchivierung.

- U -

UNICODE - Internationaler Standardzeichensatz (ISO 10646), der ASCII ablösen soll und z.B. die Grundlage von XML ist. Da UNICODE ein 32-Bit System verwendet sind fast alle nationalen Sonderzeichen enthalten.

- V -

VD17 - Verzeichnis der deutschen Drucke des 17. Jahrhunderts. Startseite des Projektes.
VDF - "Verteilte Digitale Forschungsbibliothek". Übergeordneter Förderbereich der DFG, der u.a. das Förderprogramm "Retrospektive Digitalisierung von Bibliotheksbeständen" enthält.

- W -

W3C - "WorldWideWebConsortium", zentrales Gremium zur Entwicklung und Verabschiedung von Empfehlungen und technischen Spezifikationen im Bereich des WWW (HTML, CSS, XML, XSL, etc.). Startseite des W3C.

- X -

XEROX - Unternehmen, das Hard- und Software im Scanning-Bereich entwickelt.
XML - "eXtensible Markup Language", eine Metasprache zur Definition von DTDs (auch der zukünftigen HTML-Generationen) und als zukünftiger Internet-Standard Anknüpfungspunkt für andere technische Spezifikationen. Die XML-Seite des W3C.
XSL - "eXtebsible Style Language", eine Sprache zur Definition von Style-Sheets (und damit z.B. zur Formatierung von XML-Dokumenten). Die XSL-Seite des W3C.

- Y,Z -

Z39.50 - Internationaler Standard zum Datenaustausch, Die Z39.50-Seite der Library of Congress.
Zeutschel - Unternehmen, das unter anderem Spezialscanner (z.B. Aufsichtsscanner) und Zusatzgeräte herstellt.
ZKA - "Zentralkartei der Autographen", siehe unter anderem die Seiten der Berliner Staatsbibliothek; Lit.: May, Hans J.: "Die Zentralkartei der Autographen bei der Staatsbibliothek Preußischer Kulturbesitz," in: Der Archivar 31 (1978), Sp. 361-366.

 


Patrick Sahle M.A. (Sahle@uni-koeln.de) - 12. März 1998