Ergebnisse:

1. Vorbemerkungen Älterer Text "Vorbemerkungen", geschrieben vor Durchführung der Studie (etwas weniger dicht)
1.1. Einführung
1.2. Der Untersuchungsbereich

Älterer Text "Untersuchungsbereich", geschrieben vor Durchführung der Studie.

1.3. Die Untersuchungsmenge
1.4. Durchführung der Studie

Älterer Text "Erhebungsraster", geschrieben vor Durchführung der Studie.

1.5. Systematisierungsversuch

Zu: 2. Untersuchung

 


        1. Vorbemerkungen

                     1.1. Einführung


    Auf dem Weg in die Informationsgesellschaft besteht auch in Bibliotheken, Archiven und anderen Institutionen, die Dokumentenbestände egal welcher Art besitzen, die Tendenz zur Erschließung dieser Bestände unter den gegebenen neuen technischen Möglichkeiten. Mit dem Wandel der Werkzeuge gehen dabei grundsätzlichere Veränderungen einher, die alle Bereiche solcher Erschließungsvorhaben betreffen. Es wird nicht bloß die gleiche Arbeit mit anderen Mitteln geleistet, vielmehr ist ein fundamentaler Wandel zu beobachten, der eine Reihe von Fragen ganz neu aufwirft: welche Bestände sollen überhaupt erschlossen werden, warum sollen sie erschlossen werden, in welcher Art und Weise und in welcher Tiefe, in welcher Form sollen sie den Benutzern zugänglich gemacht werden und wie ist dies schließlich alles zu organisieren und durchzuführen?

    Es handelt sich hier um ein wissenschaftliches Arbeitsfeld, das sich in einem Stadium grundlegender Umbrüche befindet. So kann es nicht verwundern, daß es einerseits bereits eine große Zahl von Pilotprojekten gibt, die das Feld in seinen Möglichkeiten ausloten, daß aber andererseits auch Orientierungslosigkeit, Verunsicherung sowie Informations- und Kommunikationsmängel als erste Grundbeobachtungen festzustellen sind. Orientierungslosigkeit resultiert aus mangelnden "Vorbildern", nicht vorhandenem theoretischem Fundament, fehlenden Richtlinien und der Unbekanntheit der späteren Benutzer und ihrer Anforderungen. Verunsicherung ergibt sich oft aus der ungeklärten rechtlichen Lage, ebenso aber aus der rasanten technischen Entwicklung, die kaum erkennen läßt, welche Lösung die jeweils beste ist und die vor allem die Langlebigkeit und dauerhafte Nutzbarkeit und Archivierbarkeit aller jetzt geleisteten Arbeit fraglich erscheinen läßt. Informations- und Kommunikationsmängel schließlich entstehen durch die breite Streuung der einzelnen Projekte auf die verschiedensten Arten von Institutionen und Fachgebieten und durch das hohe Maß an notwendiger Interdisziplinarität. Hier treffen oft hoch spezialisierte Fachleute aufeinander, denen ohne eine gemeinsame Gesamtperspektive die Blickwinkel des jeweils anderen verschlossen bleiben.

    Gleichzeitig ist zu erwarten, daß die Pilotprojekte der Formierungsphase des neuen Arbeitsfeldes für die Zukunft Leitbilder mit hoher normierender Kraft sein werden. Dies verstärkt die Notwendigkeit einer frühzeitigen Gesamtreflexion über den ganzen Bereich. Die vorliegende Untersuchung ist dementsprechend als Beitrag zur Gewinnung eines besseren Überblicks über das Forschungsgebiet "digitaler Bestandserschließung" und die dort vorhandenen hauptsächlichen Problemstellungen und Entwicklungstendenzen aufzufassen.
Mittelfristig sollen dadurch Information, Orientierung und Kommunikation in diesem Bereich verbessert werden, langfristig muß es darum gehen, dem Feld der digitalen Bestandserschließung durch Abstraktion, Begriffsbildung, Strukturierung und Segmentierung ein referenzfähiges theoretisches und methodisches Gerüst zu geben. Der Bereich der digitalen Bestandserschließung ist inzwischen so umfang- und facettenreich geworden, daß eine Modularisierung der Arbeiten und eine Fokussierung auf Teilprobleme wünschenswert wäre. Dies ist aber nur möglich, wenn dahinter eine integrative Gesamtschau steht, die für die einzelnen Bereiche Funktion und Ziel angeben kann.

    Dieser Überblick kann nur ein erster Ansatz sein, zumal hier in relativ kurzer Zeit nur eine begrenzte Zahl von Projekten untersucht wurden. Zu der Aufgabe, mehr Klarheit in das Forschungsfeld zu bringen, tragen gleichzeitig auch andere bei. Hinzuweisen ist unter anderem auf die Facharbeitsgruppen (1) der Deutschen Forschungsgemeinschaft, aber auch auf eine Erhebung, die im Rahmen von "DIEPER" (DIgitised European PERiodicals)(2) durchgeführt wird und Projekte im Bereich der retrospektiven digitalen Erschließung von Zeitschriften zum Gegenstand hat. Außerdem ist bei einigen Erschließungsprojekten vorgesehen, gleichzeitig eine Benutzerbefragung durchzuführen bzw. Rückmeldungen und Anfragen systematisch auszuwerten (3).

 

             1.2. Der Untersuchungsbereich

    Der Untersuchungsbereich umfaßt Projekte zur "digitalen Bestandserschließung". Was aber bedeutet "digital", was meint  "Bestand", und was heißt "Erschließung"?

    Unter "digital" soll die Anwendung von Techniken verstanden werden, durch die es zu einer Art von Erschließung oder Repräsentation kommt, die mit herkömmlichen Mitteln (Druck, Karteisysteme, etc.) nicht zu realisieren wäre. Dies kann die digitale Abbildung von Dokumenten oder auch die elektronische Verwaltung von Erschließungsinformationen betreffen.

    Unabhängig von den speziellen Definitionen, die im Bibliotheks- bzw. im Archivwesen Verwendung finden, wird hier der Begriff "Bestand" sehr allgemein gefaßt, als größere Menge an Dokumenten bzw. Datenträgern, die Informationen enthalten, welche für die geistes- oder sozialwissenschaftliche Forschung von Interesse sind. Im Regelfall sind solche Bestände materielle Sammlungen in Bibliotheken, Archiven, Universitäts- oder Forschungsinstituten. Neben solchen "realen" Beständen werden aber auch jene mit in die Untersuchung einbegriffen, die entweder als Gruppe von "digital born documents" nicht durch ein bestimmtes materielles Trägermedium geprägt sind, oder als thematischer Bestand nicht an eine bestimmte Institution gebunden sind oder in einer solchen Institution "quer" zur eigentlichen Bestandsordnung verlaufen. Dies mag dem allgemeinen Begriffsverständnis widersprechen - eine Einbeziehung auch thematisch orientierter Projekte ohne zugrundeliegenden realen Bestand scheint aber sinnvoll, weil die konzeptionellen Ansätze und die verwendeten Techniken sich nicht von anderen Projekten unterscheiden. Nicht als Bestand betrachtet werden einzelne Bücher oder geringe Dokumentenmengen oder aber Sammlungen digitaler Texte ohne Bezug zu einem realen Bestand oder ohne bestimmte Ordnungs- oder Auswahlkriterien.

    Auch der Begriff der "Erschließung" wird nicht sehr scharf definiert. Zur Abgrenzung des Untersuchungsbereiches wird von einer "Mindesterschließungstiefe" ausgegangen, die über die Digitalisierung, die grobe Beschreibung des Gesamtbestandes oder aber die reine (traditionelle) Katalogisierung hinausgeht. Reine Digitalisierung ist Bestandsrepräsentation, aber nicht Erschließung, während die Katalogisierung zwar auch eine Form der Erschließung darstellt, hier aber nicht berücksichtigt wird, weil sie als traditionelle und entwickelte Technik nicht zu den wesentlichen neuen Feldern der Quellenerschließung gehört.

    Innerhalb der Untersuchung gibt es zwischen den Projekten so große Unterschiede, daß man sich zuweilen fragen könnte, wieso überhaupt Bestandsdigitalisierungen in Bibliotheken mit Findbucherstellungen in Archiven oder Datenbanken zu ethologischen Filmen in Forschungseinrichtungen verglichen werden und ob diese nicht eigentlich grundverschiedene Bereiche sind. Zusammengehalten wird die Untersuchungsmenge aber dadurch, daß alle Projekte darauf abzielen, große und in der Regel komplexe Informationsmengen unter Nutzung digitaler Techniken in neuer Form benutzbar zu machen, indem sie entweder neue Zugangswege eröffnen oder das Material in neuer Form bereitstellen. Verschieden sind im wesentlichen die Ausgangspunkte und grundsätzlichen Perspektiven, mit denen z.B. Bibliothekare, Archivare oder Wissenschaftler aus einzelnen Disziplinen an ihre Erschließungsprojekte herangehen und durch welche die Unternehmungen in ihrer Ausgestaltung dann auch geprägt sind. Durch die noch folgenden Ausführungen wird aber hoffentlich auch klar, daß die digitale Bestandserschließung mit Gewinn als ein konzeptionelles Gesamtsystem aufgefaßt werden kann, in dem unterschiedliche Projekte nur die einzelnen Bereiche unterschiedlich gewichtet ausfüllen, jeweils eigene Lösungsansätze anbieten und gleichzeitig aufzeigen, welche Bereiche in anderen Projekten noch offen sind, dort aber im besten Fall auch Eingang in die Gesamtkonzeption finden sollten. Eine Reduzierung der Projektauswahl würde folglich nur die Breite verschleiern, welche die Frage nach der digitalen Bestandserschließung eröffnet und die Perspektive auf Probleme jenseits enger Insellösungen verstellen.

             1.3. Die Untersuchungsmenge

    Von der theoretischen Abgrenzung zur tatsächlichen Untersuchungsmenge. Diese ist ein nicht-repräsentativer Ausschnitt aus einem Bereich, der selbst wieder durch einige Schieflagen geprägt ist. "Nicht-repräsentativ" bedeutet zunächst, daß die Projekte untersucht werden, über deren Existenz Informationen auf verschiedenen Wegen zu erlangen waren. Informationsressourcen boten (in der Reihenfolge der Ergiebigkeit):

    Die Informationsmöglichkeiten wurden gleichzeitig in unterschiedlicher Intensität genutzt. So lag der Schwerpunkt auf Internet-Recherchen und Projekten im deutschsprachigen Raum. Eher zu Vergleichszwecken wurde aber auch versucht, eine gewisse Zahl anderer Projekte mit einzubeziehen.

    Wenn von einer Schieflage im Untersuchungsbereich selbst die Rede ist, so meint das dreierlei: Einerseits gibt es je nach Bereich unterschiedlich viele Projekte. Zum zweiten gibt es je nach Projektart eine unterschiedliche Öffentlichkeitsarbeit. Und schließlich verdankt sich die Existenz eines sehr großen Teils der Untersuchungsmenge einem speziellen Faktor: den besonderen Schwerpunktförderprogrammen von DFG und VW-Stiftung.

    Zum ersten: Bibliotheken haben eine deutlich stärkere Tendenz zu Projekten im Bereich der digitalen Bestandserschließung, als Archive oder andere wissenschaftliche Forschungseinrichtungen. Dies beruht u.a. wohl auf einer grundsätzlichen stärkeren Vertrautheit mit dem Einsatz von Computertechnologien in Bibliotheken, einer relativ gut ausgebauten Kommunikation und Zusammenarbeit zwischen ihnen und der dort mittlerweile einigermaßen verbreiteten Auffassung, daß innovative Projektarbeit für die langfristige Positionssicherung und finanzielle Zuwendung von Bedeutung ist. Alle drei Punkte treffen auf Archive im allgemeinen nicht in gleichem Maße zu. Bei den fachwissenschaftlichen Einrichtungen kommt - zumindest in etlichen Fächern - noch das Hemmnis der mangelnden Akzeptanz computergestützer Forschung unter den Fachkollegen hinzu.

    Zum zweiten: Der Wille zur aktiven öffentlichen Darstellung, z.B. auch von Zwischenergebnissen oder ersten Modellen divergiert nicht nur innerhalb unterschiedlicher Länder, sondern ebenfalls zwischen den Institutionstypen. Während es z.B. in den USA üblich ist, schon in den Förderanträgen zu versichern, daß die Projektergebnisse ausführlich dokumentiert und auf entsprechenden Tagungen präsentiert werden, scheint sich diese Haltung in Deutschland erst langsam durchzusetzen. Bibliotheken habe hier wiederum die geringsten Probleme mit umfangreicher Öffentlichkeitsarbeit, während es in den Archiven und Forschungsinstituten zuweilen noch Vorbehalte gibt, insbesondere gegen das Veröffentlichen von Zwischenergebnissen.

    Zum dritten: Gut die Hälfte der untersuchten Projekte wird entweder von der DFG oder der VW-Stiftung finanziell unterstützt. Es ist davon auszugehen, daß die meisten dieser Projekte ohne die speziellen Förderschwerpunkte dieser Organisationen nicht existieren würden. Für die Formierung der Untersuchungsmenge erweisen sich die Richtlinien dieser Förderprogramme als äußerst wichtig. Mit dem VW-Schwerpunkt(5) zu Archiven und Forschungsinstituten bzw. mit dem DFG-Schwerpunkt(6) zu Bibliotheken sind die wesentlichen Bereiche zwar abgedeckt, gerade die DFG hat aber in ihrer Ausschreibung und in ihrer Bewilligungspraxis sehr klare Vorgaben in allen Bereichen gemacht, so daß sich die Gestaltung vieler Projekte mehr den zielgerichteten Vorstellungen(7) der entsprechenden DFG-Gremien zu verdanken scheinen, als der Phantasie der Antragssteller. Trotzdem verstehen sich auch die meisten der DFG-geförderten Vorhaben als unabhängige Einzelprojekte. Trotz des gemeinsamen Überbaus der "verteilten digitalen Forschungsbibliothek" ist das Programm in Teilen ausdrücklich auf möglichst heterogene Unternehmungen ausgerichtet, mit denen die Breite des Arbeitsfeldes erschlossen und in allen Bereichen Erfahrung gesammelt werden soll. Die Praxis zeigt hier eine größere Vielfalt als es die technisch-konzeptionellen Normierungsversuche der Förderrichtlinien hätten vermuten lassen.

    Es werden nur "konkrete", klar abgegrenzte Projekte untersucht. Es gibt darüber hinaus eine Reihe von flankierenden Projekten (z.B. zur Entwicklung von Software) oder Trägerprojekten. Erste Hinweise dazu geben weitere links auf einer gesonderten Aufstellung. Grundsätzlich stehen die Vorhaben für sich alleine. Trotzdem bestehen in hohem Maße Interdependenzen zwischen Projekten, sei es direkter Art, über gemeinsame Dienstleister oder gemeinsame Trägerprojekte. Eine quantitative Analyse wäre entsprechend verzerrt und macht deshalb weniger Sinn, als das heuristische Beobachten von alternativen Vorgehensweisen und groben Grundtendenzen.

    Insgesamt bilden - zum Zeitpunkt der Erstellung der Zusammenfassung - ca. 75 Projekte die Grundgesamtheit der Untersuchung. Diese Zahl ist nicht endgültig festgelegt. In dem gesonderten Projektweiser kann sich eine andere Zahl ergeben, weil für eine gewisse Zeit noch Projekte hinzugefügt oder entfernt werden könnten. Außerdem wurde kein großer Wert auf eine hohe Datendichte gelegt. Es darf deshalb nicht verwundern, wenn sich Auszählungen auf andere Basiswerte beziehen. Entgegen der oben ausgeführten Definition des Bereiches findet sich in der Untersuchungsmenge kein Projekt, das "digital born documents" oder bereits digital vorliegende Bestände zum Gegenstand hätte. Alle beziehen sich vielmehr auf materiell vorhandene Dokumente. Der Schwerpunkt der Untersuchung liegt im deutschsprachigen Bereich. Diesem sind 61 Projekte zuzuordnen(8) (5 davon in Österreich), während das übrige Europa mit 8 und die außereuropäische Welt mit 5 Unternehmungen vertreten sind. Hinsichtlich der Zuordnung nach Institutionstyp werden 30 Projekte von Bibliotheken, 29 von Forschungsinstituten (im weitesten Sinne) und 15 von Archiven durchgeführt.

 

             1.4. Durchführung der Studie

    Die Untersuchung wurde von November '98 bis Februar '99 am Kölner Zentrum für Historische Sozialforschung als Abteilung des Zentralarchivs für empirische Sozialforschung durchgeführt. Ziel war es, innerhalb einer eng umgrenzten Zeit und mit limitiertem Aufwand einen ersten groben Überblick zu erstellen, der einen Beitrag zur allgemeine Diskussion über die Entwicklung digital erschlossener Bestände leisten sollte. Es wurde deshalb nicht nur auf die Vollständigkeit der Untersuchungsmenge, sondern auch auf die Tiefe der Informationserhebung kein allzu großer Wert gelegt. Die einzelnen Arbeitsschritte wurden zudem nicht klar getrennt, das ursprünglich angelegt Frageraster wurde mehrfach verändert, und es gab keine gleichmäßige Untersuchungstiefe für alle Projekte.

    Die Untersuchung wurde zunächst mit Zielsetzung und erstem Überblick über die Untersuchungsmenge im Internet publiziert. Dann wurden weitere geeignete Projekte gesucht und diese (hauptsächlich) per Telefon, brieflich oder mittels E-mail befragt, sowie gedruckte oder Internet-Dokumentationen ausgewertet. Die Informationen wurden in einer Datenbank organisiert und verwaltet und schließlich ausgewertet.

    Das Frageraster diente einerseits dem Versuch, Kategorien zu finden, die sich - unabhängig von deren konkreter Formierung - auf alle Erschließungsprojekte anwenden lassen, so daß ein verallgemeinernder Vergleich möglich wird. Andererseits wurde in Detailbereichen gezielt nachgefragt, um Besonderheiten oder spezielle Probleme und Lösungen mit in den Überblick einfließen lassen zu können.

    Es wurden nicht alle Projekte einer Einzelbefragung unterzogen. Diese unterblieb, wenn die Internet-Dokumentation als ausreichend betrachtet wurde, wenn eine weitere Befragung keine besonderen neuen Erkenntnisse erwarten ließ oder wenn bis zu einem bestimmten Stichtag keine Vereinbarung eines Termines oder der Befragungsmodalitäten gelang.

    Die Informationen wurden in einer Access-Datenbank gespeichert. Da diese Zusammenfassung nur einer ersten Orientierung dient, enthält die Datenbank in etlichen Bereichen sehr viel mehr Informationen, als in diesem Text wiedergegeben werden. Gesonderte Anfragen zu bestimmten Problemfeldern, aber besonders auch zu bestimmten Projektarten können deshalb gerne gestellt werden. Am einfachsten per E-mail, an Sahle@uni-koeln.de.

 

             1.5. Systematisierungsversuch

    Die Untersuchung betrifft insgesamt fünf Bereiche: Die Organisation der Projekte, die zu erschließenden Bestände und schließlich jene drei Bereiche, die als konstituierend für das Feld der digitalen Bestandserschließung betrachtet werden können. "Digitale Bestandserschließung" bedeutet die Überführung eines realen Bestandes in einen allgemein zugänglichen digitalen Bestand. Diese Umformung, die als "Gesamtsystem" betrachtet werden kann, besteht aus drei Komponenten: der wiedergebenden, der erschließenden (im engeren Sinne) und der öffentlich machenden. Anders ausgedrückt: ein realer Bestand kann zu einem erschlossenen digitalen Bestand werden, durch den Prozeß der digitalen Wiedergabe, den Prozeß der Sammlung von Erschließungsinformationen und den Prozeß der Publikation. Das folgende Schaubild versucht, diese Dreigliedrigkeit zu verdeutlichen.

Realer Bestand

ar12-dn-grey.gif (1384 Byte)

ar12-dn-grey.gif (1384 Byte)

Repräsentation

Erschließung

ar12-dn-grey.gif (1384 Byte)

ar12-dn-grey.gif (1384 Byte)

Digitale Abbildung

Teildigitalisierung

Volldigitalisierung

Bestandsbeschreibung
ar12-dn-grey.gif (1384 Byte)
Elementbeschreibung
(Bibliographisch, Formal, Formlos)
ar12-rd-grey.gif (1419 Byte)
Binnengliederung

ar12-dn-grey.gif (1384 Byte)

ar12-rd-grey.gif (1419 Byte)

Digitaler Text

Teiltranskription
Automatisches OCR
Volltranskription

 

ar12-ri-grey.gif (1355 Byte)

ar12-ri-grey.gif (1355 Byte)

Verschlagwortung
ar12-rd-grey.gif (1419 Byte)
Registerbildung
ar12-rd-grey.gif (1419 Byte)
Volltextindizierung

.
ar12-dn-grey.gif (1384 Byte) .

Übersetzung

.

Zusatzinformationen

ar12-le-grey.gif (1355 Byte)
. .

Digitaler Bestand

. .

Publikation
ar12-ld-grey.gif (1486 Byte)                            ar12-rd-grey.gif (1419 Byte)
Browse                                             Search

. .

    Die Bereiche der Repräsentation und der Erschließung haben eine Dimension der "Tiefe". Auch bisher war bereits die Rede von "flacher Bestandserschließung" und von "Tiefenerschließung". Hörte die flache Erschließung in der Regel bei der Bestandsbeschreibung oder der Elementbeschreibung auf, so meinte Tiefenerschließung oft die Wiedergabe der Vorlage in regulierter Form (z.B. als Editionstext) und die Erschließung durch genauere Erläuterungen, Register und Zusatzinformationen. Tiefe bedeutet hier aber auch teilweise, daß eines auf dem anderen aufbaut. Dies ist z.B. bei der automatischen Texterkennung der Fall, die digitalisierte Bilder "liest". Auf der Seite der Erschließung im engeren Sinne sind eher unterschiedliche Erschließungsverfahren aufgelistet, die nicht unbedingt direkt aufeinander aufbauen. So haben Elementbeschreibung, Rekonstruktion der Binnengliederung und Verschlagwortung zunächst nicht unbedingt etwas miteinander zu tun. Im Gegensatz zu den Zusatz- oder Sekundärinformationen werden sie aber dem realen Bestand entnommen, während die ergänzenden Informationen von außen kommen.

    Bestandsrepräsentation kann die Erschließung (im engeren Sinne) erleichtern, teilweise auch automatisieren. Zusammenhänge bestehen hier vor allem zwischen der Erstellung elektronischer Texte und den daraus zu gewinnenden Registern oder Volltextindizes. Für die Elementbeschreibung und Verschlagwortung wäre ebenfalls an automatische Verfahren der Erkennung und Klassifikation zu denken. Da diese aber in der Praxis keine Rolle spielen, wurden sie hier auch nicht visualisiert.

    Das Schaubild ist ein Maximalmodell. In der Praxis fehlen in den meisten Projekten mehrere Bereiche. Gleichzeitig ist es stark vereinfacht: Viele Aspekte könnten noch eingefügt werden. Es dient der groben Orientierung: Die folgende Beschreibung von Projekten zur digitalen Bestandserschließung wird darauf aufbauen und es in verschiedenen Details näher ausführen und differenzieren.

Weiter im Text mit: 2. Untersuchung


Patrick Sahle M.A. (Sahle@uni-koeln.de) - 22. April 1999.