Unser Motto: Perpetual Beta

Die vorhandenen Bibliothekskatalogsysteme sind aufgrund der Rahmenbedingungen ihrer historischen Entwicklung und ihrer monolithischen Konzeption wenig flexibel an aktuelle Suchstandards und die Verwaltung elektronischer Medien anzupassen. Das hybride Angebot an klassischen Printmedien einerseits und elektronischen Dokumenten anderseits sowie die erhebliche, stetig wachsende Vielfalt an Medientypen und Zugangsvarianten stellen die elektronischen Kataloge der Bibliotheken vor große Herausforderungen. Zur Erschließung dieses Medien-Mixes bedarf es neuer moderner Suchsysteme [3,5,17].
In Bibliotheken ist bisher übliche Praxis, den Nachweis verschiedener Medientypen über viele unterschiedliche externe Systeme abzuwickeln. Die Problematik dieser heterogenen Nachweissituation ist Kunden kaum transparent zu machen. Durch ihre Recherche-Erfahrungen mit Suchmaschinen wie Google erwarten Nutzer demgegenüber ein einfaches und einheitliches Suchinterface für alle Fragestellungen und einen möglichst direkten Zugriff auf die relevanten Volltexte.
Die E-LIB der SuUB Bremen bietet auf Basis von selbst entwickelter Suchmaschinentechnologie bereits seit 2004 einen einheitlichen Katalog elektronischer und gedruckter Medien. Im Sinne eines "One-Stop-Shop-Portals" werden dabei alle wesentlichen verfügbaren Medien und Dienste der Bibliothek unter einer Suchoberfläche angeboten, um die übliche heterogene Nachweissituation der verschiedenen Medientypen soweit wie möglich aufzulösen.
Das Projekt verfolgt das Ziel, alle lokalen Bestände vor Ort und alle für Bremer Nutzer im Zugriff extern verfügbaren Medien in einem einzigen Retrievalsystem zur Verfügung zu stellen und neu entwickelte Verfahren zur Unterstützung von assoziativen Suchprozessen anzubieten [1,2,6-11]. In dem von der Bibliothek kontrollierten Suchraum der Bremer E-LIB finden sich derzeit ca. 37 Mio. Nachweise - zu über 90% elektronische Volltexte.
Die E-LIB Bremen versteht sich gleichzeitig als Produktivsystem und Entwicklungsumgebung für neue Services zur Unterstützung von Retrievalvorgängen. Im Rahmen des Informatikjahrs 2006 gewann das System gemeinsam mit zwei anderen Projekten den vom BMBF geförderten bundesweiten Wettbewerb Bibliotheksinnovation 2006.
Die Suchtechnik basiert auf einem lokal gepflegten Gesamtindex von heterogenen, aggregierten Metadaten (local indexing). Die Organisation dieser Daten erledigt das System CiXbase, das neben der Anwendung in Bremen u.a. auch in der Schweiz an der ETH Zürich (NEBIS) [14] eingesetzt und weiterentwickelt wird. Typische Vorteile einer Suchmaschine unter Nutzung eines lokalen Gesamtindexes sind die hohe Antwortgeschwindigkeit, die homogene Trefferpräsentation der Suchmaschine und eine ausgeglichene Gewichtung aller Ressourcen. Die erweiterte lokale Datensammlung eröffnet zusätzliche Möglichkeiten, die vorhandenen Nachweise als eine Wissensbasis für neue Formen der Treffermengenanalyse zu nutzen, die während der Suche auf der Menge der Resultate prozessiert werden können. Dazu gehören z.B. klassische Drill-Down Techniken (facettierte Suche), die eine formale und inhaltliche Filterung erzielter Treffersets erlauben und die bereits in vielen modernen Suchmaschinen zum Standard gehören.
Eine wichtige neue Strategie der E-LIB ist die kontextsensitive Unterstützung der Nutzer durch verschiedene Zusatzfunktionen, die auf Basis einer statistischen und computerlinguistischen Auswertung der Metadaten von Treffersets angeboten werden.
Im Kontext der Open Archive Initiative stellen etwa 2400 universitäre Dokumentenserver weltweit Ihre Open Access Publikationen online zur Verfügung. Die Metadaten dieser Medien stehen freundlicherweise über das Projekt BASE der UB Bielefeld in der E-LIB Suchmaschine zur Verfügung (Herzlichen Dank dafür an die Kollegen/innen der UB Bielefeld!). Der Nachweis dieser frei verfügbaren Open Access Dokumente im Bibliothekskatalog ist ein Novum und dient neben der Erschließung dieser Medien auch dem Marketing von Open Access als Publikationskultur.
Alle Metadaten der Artikelebene ermöglichen einen Direktlink auf den Volltext bei den Verlagen. Die Zugriffslinks sind bereits in der Trefferliste verfügbar. Für lizenzpflichtige E-Medien werden Informationen über die Zugriffskonditionen angeboten. Das Gesamtangebot von Nachweisen wird durch Integration weiterer Metadatenpakete kontinuierlich erweitert. 
Abb.: ca. 60 Mio. Medien sind in der integrierten Suche der E-LIB verfügbar -
über 90% als elektronische Volltexte
Zum Aufbau der lokalen Nachweisbasis werden unterschiedliche Typen und Formate von Metadaten importiert und nach ressourcenspezifischen Anpassungen zu einem einheitlichen XML-flat-file homogenisiert. Der vereinheitlichte Metadatenpool wird dann unter Verwendung von Algorithmen aus der Suchmaschinentechnik indexiert (statistical balanced B*-Trees) und dient anschließend als Basis für die Suchmaschine. Die Trefferpräsentation einer Suchanfrage erfolgt in Form von XML-strukturierten Metadaten an den Browser des Kunden. Die XML-Daten werden clientseitig über eine XSL-Transformation anhand einer mitgelieferten Layoutvorlage in eine HTML-Präsentation umgewandelt. Die vollständige Trennung von Struktur und Layout ermöglicht eine nahezu vollständige Interoperabilität der verfügbaren Metadaten und vereinfacht ihre Weitergabe an andere Informationssysteme sowie in Gegenrichtung die Integration externer Services.
Sinnvolle Exportformate für Zitate sind dabei in erster Linie verschiedene bibliographische Datenbankformate wie RIS, Endnote etc. Der Datenaustausch mit einer Literaturverwaltungssoftware verläuft immer dann besonders elegant, wenn die Daten innerhalb einer Browsersession an ein ebenfalls Web-basiertes System direkt übergeben werden können. Metadaten der E-LIB Bremen können auf Knopfdruck direkt an web-basierte Systeme wie RefWorks, Bibsonomy, del.icio.us oder Connotea übergeben werden.
Die Präsentation der Metadaten im XML-Format RSS erlaubt die plattformunabhängige Bereitstellung von Literaturzusammenstellungen bzw. Rechercheergebnissen als RSS-Feed, um Nutzern die Möglichkeit zu eröffnen, sich gezielt, über neue Medien zu bestimmten Themen zu informieren.
Exportmöglichkeiten für bibliographische Metadaten:
Die offene Display-Architektur ermöglicht weiterhin einfache Erweiterungen der eigenen Ergebnispräsentation durch Integration von Webservices externer Anbieter und damit die Realisierung von Mashup-Funktionen. Unter Nutzung eines experimentellen Dienstes der Verbundzentrale des GBV (SeeAlso) können Zusatzinformationen zu Buchtiteln von externen Anbietern durch Übergabe der ISBN-Nummer als Identifier bezogen werden. In der Exemplaranzeige können so z.B. Direktverweise zur Beschreibung des Titels in der Google-Buchsuche, bei LibraryThing oder der Wikipedia präsentiert werden - soweit bei diesen externen Diensten Informationen zu dem jeweiligen Titel verfügbar sind.
Die Suchmaschine präsentiert ihre Ergebnisse in zweispaltigem Design: neben der Trefferliste in der linken Hauptspalte werden in der zweiten Spalte im rechten Drittel der Anzeige Zusatzfunktionen wie Drill-Down und Empfehlungsdienste angeboten - die Eingabezeile der Suchmaschine steht während des gesamten Suchprozesses immer zur Verfügung.
Die Suchfunktion der E-LIB ist seit November 2010 komplett in die neue Webseitenstruktur der Bilbliothekshomepage integriert. Auf allen Webseiten aus dem Bibliotheksangebot ist der Suchschlitz immer verfügbar und auf jeder Ergebnispräsentation der Suchmaschine sind die Menüfunktionen der Bibliothekswebseite verfügbar.

Die Recherche in einem großen Suchraum liefert jedoch oft unübersichtliche Treffermengen. Der Suchprozess muss daher durch geeignete Verfahren zur Präzisierung von Sucheingaben unterstützt werden. Neben formalen und inhaltlichen Drill-Down-Funktionen zur Einschränkung der Ergebnisse finden sich in der E-LIB Bremen eine Reihe von weiteren Empfehlungsassistenten, die ebenfalls auf statistischen Verfahren der Treffermengenanalyse beruhen. Während der Recherche erhält der Nutzer damit erweiterte Möglichkeiten zur Modifikation der Suchstrategie im Sinne einer "Entdeckenden Suche" [16]. Die thematische Suche verläuft danach als mehrstufige, iterative Navigation in einem semantischen Netz, das durch die Gesamtheit aller vorhandenen Sacherschließungselemente der bibliographischen Daten gebildet wird.
Dazu wird das Material an kontrolliertem Vokabular einer Treffermenge analysiert, statistisch ausgewertet und anschließend zeitgemäß optisch aufbereitet als Tag Cloud präsentiert. Das Ergebnis der Analyse bzw. das Relevanzprofil der resultierenden Tag Cloud ist dabei sowohl vom gewählten Begriff, als auch vom vorhandenen Titelmaterial und dessen inhaltlichen Erschließungselementen abhängig.
Wichtigste Funktionen des Suchinterfaces

Abb.: Tag Cloud-Auswertung für das Thema "Resistenz gegen Malaria" und
Datenbankempfehlung für "Englischunterricht"
Das Ranking sortiert die Suchergebnisse einer Anfrage im Idealfall nutzergerecht in der Reihenfolge absteigender Relevanz bezogen auf die Sucheingabe.
Im Kontext bibliothekarischer Suchmaschinentechnik beruht das Ranking bisher weitgehend auf rein textstatistischen Verfahren (TF/IDF - Termfrequenz und inverse Dokumenthäufigkeit). Dabei wird die Ähnlichkeit und Häufigkeit der Anfragebegriffe mit den entsprechenden Begriffen der Dokumenttitel und -beschreibungen verglichen, statistisch analysiert und gewichtet. Textstatistische Verfahren berücksichtigen dabei allerdings bisher viele, für ein Relevanz Ranking interessante Parameter noch nicht - darunter z.B. die Aktualität und Popularität der Medien. Dies sind Faktoren, die bei bekannten Internetsuchmaschinen einen erheblichen Anteil der Rankingberechnung ausmachen. In der Literatur sind seit neuestem bereits theoretische Ansätze für weitere, nicht-klassische Rankingverfahren für Bibliotheksysteme beschrieben[18].
Die E-LIB Bremen setzt seit Sommer 2011 zusätzlich auf eine Modifikation des Treffer-Rankings über Aktualitäts- und Popularitätsfaktoren der Medien wie Klickstatistik, Auflagen- und Exemplarzahl. Bei gleicher textstatistischer Relevanz werden dabei die Titel mit einer auffälligen Nutzerklickstatistik, hoher erreichter Auflagenzahl oder vielen in Bremen vorhandenen Exemplaren gegenüber anderen Titeln in der Gesamt-Relevanzbewertung leicht bevorzugt. Als Konsequenz werden diese Titel in der Kurzanzeige vor anderen Titeln angezeigt.
Bei der Suche nach "Biochemie" kann auf diese Weise bei vielen Treffern und einer sehr hohen Anzahl von textstatistisch gleich zu bewertenden Titeln die am Standort wichtigen und stark nachgefragten Lehrbücher zu Beginn einer Trefferpräsentation angezeigt werden[20].
Die Analyse und geeignete Behandlung von 0 Treffer Ergebnissen ist ein besonders vielversprechendes Einsatzgebiet von Rechercheassistenten. Keine oder nur geringe Trefferzahlen sind in der Regel entweder auf das Fehlen entsprechender Titel in der Datenbasis oder auf Rechtschreibfehler in den Eingabebegriffen zurückzuführen. Die Suchmaschine der E-LIB verfügt dazu über eine Rechtschreibkontrolle unter Nutzung des Prinzips des Levenshtein-Distanz Algorithmus, die aufgrund des vorhandenen Indexmaterials mehrsprachig arbeiten kann.

Abb.: Rechtschreibkorrektur einer falschen Eingabe und Vorschläge für verwandte Suchbegriffe
In speziellen Fällen sind die gesuchten Medien in der lokalen Datenbasis jedoch nicht vorhanden. Die E-LIB Bremen lädt bei 0 oder geringen Trefferzahlen überregional verfügbare Nachweise aus dem Verbundsystem des GBV via SRU nach und bietet so bei den einzelnen Titeln die Bestellfunktion auf Knopfdruck und ohne Medienbruch. Auf diese Weise ist es auch möglich, Treffer aus externen bibliographischen Nachweissystemen unter Berücksichtigung der Zugangskonditionen direkt zum lokalen Trefferset zu kombinieren.

Abb.: Bei fehlendem Bestand in der Wissensbasis der Bremer E-LIB können Treffer aus dem Verbundkatalog des GBV automatisch nachgeladen werden
Zukünftig wird die intelligente Kombination von lokalem Metaindex und "Federated Search"-Techniken die jeweiligen Vorteile beider Verfahren ausnutzen, die sich so optimal gegenseitig ergänzen können.
Universitätsbibliotheken operieren im Bereich der Informationsversorgung nicht mehr isoliert auf dem Campus. Anbieter anderer Dienstleistungen (wie z.B. universitäre Lernsysteme) sollen zukünftig auf Bibliotheksdienste automatisch aufsetzen können. Dies erfordert eine neue service-orientierte Architektur der Schnittstellen der Bibliothekssysteme, die auch außerhalb der Bibliothekswelt verstanden wird.
Die E-LIB verfolgt das Ziel, neben den klassischen Such-Diensten auch neue Sichten auf die verfügbare Metadatensammlung anzubieten, um Literaturdatenmanagement auf dem Campus optimal zu unterstützen. Um die Angebote der E-LIB Bremen direkt und ohne Umwege auch im Kursmanagementsystem der Universität Bremen (Stud.IP) nutzen zu können, steht die Suchfunktion der E-LIB über eine SRU-Schnittstelle innerhalb dieser Arbeitsumgebung bereit. Dabei werden die Resultate einer Recherche im Look&Feel der Lernumgebung präsentiert.

Da die Suchmaschine mehrere Millionen elektronische Medien - darunter auch Tausende von E-Books mit Direktzugang bereitstellt, ist die Zusammenstellung rein elektronischer Semesterapparate auf Basis dieses Dienstes leicht möglich [9,10].
Neben der reinen Suchfunktion sind viele der E-LIB Dienste so modular aufgebaut, dass Sie als eigenständige Services von externen Systemen integriert und nachgenutzt werden können, dazu zählen z.B. die Tag Cloud Umfeldanalyse und die Erkennung des fachlichen Kontextes von Anfragen, die Grundlage für die Datenbankempfehlungen sind.
Wenn die vorhandene Datenbasis eine entsprechende Größe erreicht, fachlich umfassend und gleichmäßig verteilt ist, kann man davon ausgehen, dass die Dienste einen gewissen Grad der Unabhängigkeit vom lokal vorhandenen Bestand erreichen können und damit universell in anderen Systemen nachnutzbar sind.
Die Fachzuordnung einer Anfrage über die E-LIB wird derzeit bereits produktiv durch den Katalog der UB Heidelberg (HEIDI) und den Katalog des Projekts Beluga der SUB Hamburg nachgenutzt.