TU Wien | ZID | ZIDline 10 | Dissertationen online

Dissertationen der TU Wien online

Peter Kubalek, Hans Hrusa
Universitätsbibliothek der TU Wien

Dissertationen aus den naturwissenschaftlich-technischen Fachbereichen liefern in vielen Fällen aktuelle und wichtige Forschungsergebnisse. Durch die - zumindest in Österreich - meist geringe Anzahl der veröffentlichten Exemplare ist die Verbreitung dieser Informationen sehr eingeschränkt. Wird etwa in bibliographischen Datenbanken eine interessante Dissertation nachgewiesen, so ist deren Beschaffung meist zeitaufwendig und kostspielig. Die Online-Publikation einer Dissertation bietet einfacheren Zugang, Vervielfachung der Verfügbarkeit und bessere Verwertbarkeit der darin enthaltenen wertvollen Informationen.

Dissertationen erscheinen - überwiegend - nicht im Buchhandel,1 sie zählen damit zur so genannten "Grauen Literatur" und wurden bald (ab Ende des 16. Jahrhunderts gibt es gedruckte Dissertationen) Tauschobjekte zwischen Universitäten, Instituten und Bibliotheken. Auch unsere Universitätsbibliothek tauschte die Dissertationen der TU Wien gegen jene von der ETH Zürich. Seit September 2003 werden Dissertationen im Volltext auf einem Server der Universitätsbibliothek angeboten.

Aus Gründen des Schriftentauschs sahen Promotionsordnungen deutscher Universitäten die Drucklegung der Dissertationen vor 2 - und forderten eine Ablieferung von zwischen 75 und 150 gebundenen Exemplaren. Nur in den Zeiten der beiden Weltkriege wurde dieser Druck- zwang vorübergehend zugunsten der Ablieferung der Dissertationen in Gestalt von Vervielfältigungsverfahren (Kohlepapier-Durchschlagverfahren) aufgehoben.

Mit der Verbreitung des Mikrofilms, vor allem in Form des Microfiches ab den Sechzigerjahren des 20. Jahrhunderts, wurden viele deutsche Promotionsordnungen zugunsten dieser für den Promovenden kostengünstigeren Variante abgeändert. Auf einem Master (Silberfilm) im Format A6 können je nach Verkleinerungsfaktor 48, 96 oder 192 A4-Seiten aufgenommen werden. Von diesem Masterfilm können billige Diazo- Kopien hergestellt werden. Abzuliefern waren dann neben einer bestimmten Anzahl an Archivexemplaren (auf Papier) eine gewisse Anzahl Microfiche-Exemplare.

Der PC am Arbeitsplatz jedes Studierenden brachte - fast könnte man sagen: logischerweise - die Möglichkeit zur Online-Verfügbarkeit der Dissertationen und damit die Änderung der deutschen Promotionsordnungen dahingehend, dass die Anzahl der abzugebenden gedruckten Exemplare drastisch verringert wurde.

Eine Dissertation online anzubieten ist relativ schnell bewerkstelligt,3 nur "der Teufel steckt im Detail"! Da ist einmal die Frage nach dem Dateiformat, das "unbedingt die Authentizität und die Integrität des Dokumentes gewährleisten muss. Dazu gehört, dass die Bildschirmanzeige und die Druckerausgabe zu hundert Prozent mit der originalen Druckausgabe identisch sein soll. Das bedeutet, dass das Format in der Lage sein sollte, Sonderzeichen, Formeln, dreidimensionale Bilder und verschiedene Medien ohne Veränderung bei der Informationsausgabe darzustellen bzw. auch auszudrucken. Es sollen ein verlustfreier und problemloser Dokumentenaustausch im Internet möglich und Einzelseiten bei Bedarf ausdruckbar sein. Ein weiterer wichtiger Aspekt ist die Recherchierbarkeit bei elektronischen Dokumenten: das Format sollte die Möglichkeit zum Retrieval und zur Volltextrecherche bieten." 4

Das Urheberrecht an der Dissertation verbleibt auch bei einer Veröffentlichung über das Internet beim Verfasser. Es ist daher ein entsprechender Vertrag über die Einräumung der Vervielfältigungs- und Verbreitungsrechte mit dem Dissertanten abzuschließen.

Im Vergleich zu Deutschland steht in Österreich die Behandlung von Dissertationen in einer anderen Tradi- tion. So stellte z.B. 1986 das Bundesministerium für Wissenschaft und Forschung fest: "... die österreichischen Dissertationen [werden] üblicherweise nur in der Form eines maschinschriftlichen Manuskriptes vorgelegt".5 Und auch das geltende österreichische Universitätsrecht sieht für das Doktoratsstudium die Abfassung einer Dissertation vor 6 und fordert, dass vor der Verleihung des akademischen Grades die Dissertation durch Übergabe an die jeweilige Universitätsbibliothek zu veröffentlichen ist. Ein Exemplar der "positiv beurteilten Dissertation ist überdies durch Übergabe an die Österreichische Nationalbibliothek zu veröffentlichen."7 Die Benützung von Dissertationen nicht unmittelbar in der Universitätsbib- liothek der Universität, die die Dissertation approbiert hat, ist daher nur über den Weg der Fernleihe (ein Service der Universitätsbibliothek) möglich.

Und hier setzt der Gedanke an "Dissertationen online" an 8. Stellvertretend soll hier auf einen Artikel hingewiesen werden, der in der Wiener Zeitung erschienen ist.9 Viele Dissertationen beschweren nach diesem Artikel die Regale der Bibliotheken und Archive, ohne dass jemand aus diesem Wissen Nutzen ziehen konnte. Das Anliegen, die in den Dissertationen enthaltenen Informationen und Forschungsergebnisse einer breiteren, interessierten (Fach-)Öffentlichkeit bekannt zu machen, wird durch die geringe Anzahl publizierter Exemplare (Dissertationen gelten aus diesem Grund als "veröffentlicht aber vergriffen") stark behindert, wenn nicht gar verunmöglicht.10

Deshalb hat die Universitätsleitung beschlossen, die an der TU Wien approbierten Dissertationen auch via Web anzubieten. Seit September 2003 werden TU-Dissertationen im Volltext auf einem Server der Universitätsbibliothek der TU Wien zur Verfügung gestellt. Voraussetzung ist das Einverständnis des Dissertanten, welches durch Unterschrift und Abgabe eines entsprechenden Formulars (www.tuwien.ac.at/ud/formulare/roabt/Sonstiges/Veroeffentlichung_Dissertation.pdf) erklärt wird. Nach längeren Diskussionen über die Form des elektronischen Exemplars wurde von der Universitätsleitung vorgegeben, ein gedrucktes Exemplar zu scannen. Die Bibliothek wurde beauftragt, dies möglichst kostengünstig zu organisieren. Gegenüber einer vom Dissertanten abgegebenen Datei bestehen wie schon oben erwähnt folgende Vorteile:

Da die Anschaffung eines entsprechenden Scanners und der Texterkennungssoftware sowie deren Wartung und Nutzung uns zum damaligen Zeitpunkt zu aufwendig erschien, entschlossen wir uns, einen Teil der Projektarbeiten auszulagern. Mit dem Scannen und der OCR beauftragten wir die niederösterreichische Firma Business Imaging Solutions & Services Gesellschaft m.b.H. (BISS).

Datenproduktion und Kosten

Die ungebundenen Exemplare der Dissertationen werden mit 300 dpi monochrom gescannt und mit einem OCR Programm bearbeitet. Auf CD-ROM oder mittels ftp erhalten wir pro Dissertation folgende Files:

Die Kosten betragen pro Seite Scannen 0,022 Euro, pro Seite Texterkennen 0,008 Euro. Die Gesamtkosten für eine Dissertation betragen somit ca. 6 Euro. An der TU Wien werden ca. 180 Dissertationen pro Jahr verfasst. Somit belaufen sich die jährlichen Kosten des Projekts auf etwa 1000 Euro. Zusätzliche Kosten für Hard- und Software fallen nicht an. Die Datenhaltung, Datensicherung und Weiterverarbeitung konnte innerhalb der vorhandenen EDV-Infrastruktur der Bibliothek geleistet werden.

Weiterverarbeitung der Daten

Die Einbindung der Dissertation als pdf-File in den Online-Katalog erfolgt durch einen Link von der bibliographischen Aufnahme im Online-Katalog des Bibliotheks- systems Aleph auf das entsprechende elektronische Exemplar am WEB-Server der Bibliothek, der damit auch die Aufgabe eines Dokumentenservers übernimmt. Eine so über den Online-Katalog gefundene Dissertation kann gelesen, ausgedruckt oder lokal abgespeichert werden. Im pdf-File kann wie üblich nach Freitext gesucht werden.

Darüber hinaus bieten wir unter Ausnutzung der gelieferten Dateien der einzelnen Seiten eine einfache und bequeme Freitextsuche in allen elektronischen Dissertationen am Server an (www.ub.tuwien.ac.at/diss/, Abb. 1).

Mittels eines einfachen Perl-Programmes werden aus den einzelnen OCR-Seiten der Dissertation Files generiert, die pro Absatz eine Zeile enthalten, welcher die Aleph-interne Nummer des Dokuments und die Seitennummer im pdf vorangestellt ist. Diese Quasi-Indexfiles enthalten den für die Suche etwas strukturierten und abgespeckten OCR-Text. In der Anzeige wird der Suchbegriff hervorgehoben und via AC-Nummer zum Volltext der Dissertation verlinkt. Die Seitenangabe ist deshalb notwendig, weil über den URL nicht eine bestimmte Seite im pdf aufgerufen werden kann (Abb. 2).

Somit wird pro Suchbegriff als keyword in context eine Liste aller jener Absätze ausgegeben, die den Suchbegriff enthalten. Beim Link "Zum Volltext" gelangt man in das Originaldokument. Beim Adobe Acrobat Reader etwa braucht man danach nur die Seitennummer einzutippen und gelangt damit zur genauen Seite, welche den Suchbegriff enthält.

Die "Suchmaschine" ist ein etwa einseitiges Perl-Script, das neben einer Prüfung der Eingabebegriffe, deren farbiger Hervorhebung und der Verlinkung der Treffer mit dem Originaldokument ein kostenfreies Tool zur Freitextsuche namens agrep - eine umfangreichere und flottere Variante des grep (get regular expression) Kommandos - benutzt. Pro Dissertation wird ein Textfile (Indexfile) von maximal 500 KB duchsucht. Somit ist auch bei einem Datenbestand von mehreren Jahren noch eine schnelle Freitextsuche gewährleistet. Die Hardware ist ein AMD Athlon K7 XP 1.2 mit Red Hat Linux, 512 MB und mehreren Festplatten mit insgesamt etwa 100 GB.

abb1

Abb. 1

abb2

Abb. 2

Die Qualität der gescannten Daten (incl. Formeln, Tabellen usw.) ist zufriedenstellend. Auf alle Fälle ist die Zugänglichkeit der Dissertationen enorm verbessert worden und wir hoffen, dass möglichst alle Dissertantinnen und Dissertanten von dieser Form der Veröffentlichung ihrer Dissertation Gebrauch machen.

-

  1. Eine geringe Anzahl österreichischer Dissertationen erfuhr auch eine Drucklegung in Verlagen. In dem im Online-Katalog verzeichneten Dissertationen der TU Wien sind es etwa 5 % der approbierten Dissertationen, die z.B. im Verlag der wiss. Gesellschaften Österreichs, im österreichischen Kunst- und Kulturverlag, im VDI-Verlag und auch im Selbstverlag diverser Universitätsinstitute im Druck erschienen sind.
  2. 1913 erschien ein deutscher Ministerialerlass, der den Druck der Dissertation zur Pflicht machte.
  3. Vorreiter an der TU Wien waren einige Institute der Fakultät für Elektrotechnik, die einfach die Dateien der an ihren Instituten entstandenen Dissertationen auf dem Institutsserver gespeichert haben und anbieten.
  4. Degenhardt, Eileen: "Elektronische Dissertationen" in Bibliotheken. Hannover, Dipl.-arb. FH, 1997. S. 19.
  5. BMWF-GZ 62 348/3-15/86, Schreiben an das österreichische Normungsinstitut bez. Gestaltung von Dissertationen und Hochschulschriften.
  6. UG 2002, § 82. (1)
  7. UG 2002, § 86. (1)
  8. In Österreich gab es erste Pläne, Dissertationen online zur Verfügung zu stellen, bereits 1999 an der Universität Innsbruck. Dabei war eine Zusammenarbeit mit dem Verlagswesen ("Books on demand") angedacht. Dieses "Integrierte Publikationskonzept für die Universität Innsbruck" konnte in der Folge nicht realisiert werden. An der Wirtschaftsuniversität Wien existiert seit 2002 als Gemeinschaftsprojekt der Universitätsbibliothek und der Abteilung für Informationswirtschaft eine "elektronische Publikationsplattform für wissenschaftliche Publikationen der Wirtschaftsuniversität Wien. Hier werden forschungsbezogene Publikationen der WU (derzeit Working Papers und Dissertationen [mit Stand 31.12.2003 waren 23 Dissertationen erfasst!]) im Volltext über das WWW zugänglich gemacht." (Aus: Projektbericht ePubWU 2001-2003, Wien 2004, S. 1.)
  9. http://www.wienerzeitung.at/frameless/wissen.htm?ID=M17&Menu=198459 (16.2.2004)
  10. Dagegen spricht auch nicht der dringende Wunsch, dass Archivexemplare in gedruckter Form weiterhin an die Bibliotheken abgeliefert werden müssen. Die auf elektronischen Speichermedien vorhandenen Dateien haben bekanntlich (noch) nicht die nötige Speichersicherheit, die das Gedruckte aufzuweisen hat!


Seitenanfang | ZIDline 10 - Juni 2004 | ZID | TU Wien