In einer Zeit, in der immer mehr Inhalte schnell und automatisiert durch KI entstehen, brauchen Verlage eine ausgewogene Mischung aus klassisch erarbeiteten und schnell produzierten Inhalten, um ihre Zielgruppen nachhaltig zu binden. Diese beiden Ansätze stehen nicht im Widerspruch – sie ergänzen sich und stärken gemeinsam das publizistische Angebot, erläutert Arkadius Nowakowski im folgenden Interview: „Durch den Einsatz moderner Retrievaltechnologien können RWS-Verlage ihren Nutzern erheblichen Mehrwert bieten, der über die bloße Bereitstellung digitaler Inhalte hinausgeht.“
RWS-Verlage bieten schon lange digitale Inhalte in Datenbanken an. Welchen Mehrwert können diese Verlage ihren Nutzern durch den Einsatz moderner Retrievaltechnologien bieten?

Arkadius Nowakowski
Durch den Einsatz moderner Retrievaltechnologien können RWS-Verlage ihren Nutzern erheblichen Mehrwert bieten, der über die bloße Bereitstellung digitaler Inhalte hinausgeht. Eine intelligente Suche, die spezifisch auf juristische Bedürfnisse zugeschnitten ist, ermöglicht eine effiziente Erkennung von Paragraphen und Aktenzeichen. Benutzer von juristischen Portalen geben innerhalb der Suchmaske unterschiedliche Konstellationen aus Gesetzeskürzeln – wie GG, BGB oder EStG – zusammen mit Paragraphen- und Artikelnummern ein. Dabei hängt die Zusammensetzung der Suchphrase von persönlichen Gewohnheiten ab, was dem Suchsystem eine hohe Flexibilität bei gleichzeitiger Gewährleistung einer schnellen Antwortzeit abverlangt. Die Infopilot-Suche implementiert eine Erweiterung der Standard-Solr-Suche. Hierbei können Paragraphen und Aktenzeichen gefunden werden, welche die integrierte Solr-Seach-Engine von Haus aus nicht finden kann. Zeitglich wird die Suchdauer um 30% bis 50% reduziert. Bei einem perfekten Treffer wird der gesuchte Paragraph bzw. Artikel, nahezu unmittelbar nach der Sucheingabe, im InfoPilot-Lesebereich angezeigt. Beispielsweise führt die Eingabe einer der Sucheingaben “Art. 3 Abs 2 ESTG”, “3 ESTG” oder “ESTG § 3” zum sofortigen Öffnen von Paragraph 3 im Gesetz ESTG. Dies beschleunigt den Rechercheprozess erheblich und sorgt dafür, dass Nutzer schnell und präzise die benötigten Informationen finden.
Darüber hinaus profitieren Endnutzer wie Anwälte und Richter von angereicherten Inhalten, beispielsweise durch Passivzitierung. Durch die Passivzitierung kann man alle Inhalte, welche auf das aktuelle Dokument verweisen, auflisten und auch Kategorisieren, zum Beispiel nach Dokumenttypen wie Zeitschriften, Bücher, Onlineartikel usw. Dies hilft dem Benutzer weiter hilfreiche Dokumente schnell zum aktuell recherchierten Thema zu finden.
Durch Anbindung verschiedener Quellen kann nicht nur klassischer Verlagscontent (Bücher/Zeitschriften ) integriert werden sondern auch Inhalte aus Online-CMS-Systemen, News-Feeds oder beliebigen REST-Schnittstellen. Damit greift der Kunde immer auf aktuelle Informationen aus allen dem Verlag zugänglichen Inhalten zu.
Ein weiterer bedeutender Vorteil ist die Bereitstellung von Schnittstellen für den Buchhandel. Hierbei wird eine nahtlose Integration und Verfügbarkeit von Inhalten über zusätzliche Kanäle außerhalb der Verlagsportale ermöglicht, die den Zugang und die Distribution von Verlagsinhalten erheblich erleichtert. Buchhandelsplattformen erhalten einen gesicherten Zugriff auf die Verlagsinhalte und können über das eigene Shopsystem Verkäufe mit den eigenen Endkunden abwickeln. Hierbei müssen Endkundenaccounts, mit dem der Buchhandel arbeitet, nicht explizit auf der InfoPilot-Plattform angelegt werden, was den Verwaltungsaufwand für den Verlag minimiert.
Schließlich bietet die Integration von personalisierten Chatbots über ein RAG-System mit selbst gehorstetem LLM den Endnutzern eine interaktive und maßgeschneiderte Unterstützung Chatbots können juristische Fachfragen kontextualisiert beantworten, komplexe Sachverhalte zusammenfassen und als intelligente Assistenten den Rechtsanwender bei seiner täglichen Arbeit unterstützen – immer auf Basis der qualitätsgesicherten Verlagsinhalte und unter Wahrung höchster Datenschutzstandards. Das Verhalten des Chatbots wird einmalig eingerichtet. Durch vom Verlag gelieferten Testdaten wird das Chatbot-Verhaltens für den Umgang mit den Verlagsdaten optimiert. Nach dieser initialen Konfigurationsphase kann der Verlag seine Werke neu Produzieren wobei der Chatbot automatisiert mit den aktualisierten Werksdaten gespeist wird.
Die automatisierte Anreicherung der Inhalte führt dazu, dass juristische Fachinformationen umfassender, zugänglicher und nützlicher werden, indem sie in einen größeren Kontext gestellt und mit zusätzlichen Werkzeugen zur effizienten Nutzung ausgestattet werden.
Die zentrale Herausforderung für diesen Mehrwert liegt in der Anreicherung der Inhalte. Was genau bedeutet Anreicherung in Bezug auf juristische Fachinhalte?
Die Anreicherung von juristischen Fachinhalten bezieht sich auf die systematische Erweiterung der bestehenden redaktionellen Daten durch automatisierte Prozesse. Ein zentraler Aspekt dabei ist die automatisierte Linkerkennung und das damit verbundene Importieren aus externen Quellen. In der Praxis werden während der Datenaufbereitung der Volltexte, Referenzen auf aus anderen Quellen verfügbare Rechtstexte erkannt. Referenzierte Rechtstexte werden daraufhin vollautomatisiert importiert und auf der Verlagsplattform dem Endkunden zugänglich gemacht. Die Referenzen im Volltext müssen hierbei nicht als explizite Links vorliegen. Für den Verlag genügt es, ein Gesetz mit Paragraphen oder Artikeln im Volltext zu erwähnen – der InfoPilot Workflow übernimmt den Rest. Natürlich ist auch eine vereinfachte Variante implementiert, bei der Fachvokabular, Themengebiete/Kategorien erkannt und automatisch verlinkt werden.
Verlagskunden haben hierdurch zwei Vorteile. Der referenzierte Volltext kann direkt innerhalb der Verlagsplattform in einer parallelen Ansicht gelesen werden. Das Feature “paralleles Lesen” zeigt im Splitscreen den Verlagscontent und den importierten Rechtstext nebeneinander an. Der Anwender ist somit in der Lage einfach den Überblick zu behalten. Zusätzlich greifen unterstützend für importierte Rechtstexte Standard-Features wie die Volltextsuche, Lesezeichen und der Textmarker. Letzterer ermöglicht das Erstellen von persönlichen Notizen, die bei Bedarf auch mit den Mitarbeitern des Endkunden geteilt werden können. Nicht nur Endkunden ziehen einen Nutzen aus dem automatisierten Import von verlinkten externen Quellen. Autoren können sich dank dieser Automatisierung auf ihre Kernkompetenz konzentrieren: die Erstellung qualitativ hochwertiger Fachinhalte, ohne hierbei manuell Links einfügen zu müssen.
Insgesamt führt die automatisierte Anreicherung der Inhalte dazu, dass juristische Fachinformationen umfassender, zugänglicher und nützlicher werden, indem sie in einen größeren Kontext gestellt und mit zusätzlichen Werkzeugen zur effizienten Nutzung ausgestattet werden.
Zusammengefasst bietet die InfoPilot-Plattform eine umfassende Automatisierung der Datenverarbeitung, die es Verlagen ermöglicht, ihre Inhalte aufwandsneutral zu importieren und den Nutzern eine verbesserte Suchfunktion zu bieten.
Was genau leistet die InfoPilot-Plattform in Bezug auf Automatisierung dieser Prozesse?
Die InfoPilot-Plattform spielt eine entscheidende Rolle bei der Automatisierung der Prozesse zur Anreicherung juristischer Fachinhalte. Ein wesentlicher Bestandteil ist die effiziente Datenmigration, die durch Push-Technologien aus externen Systemen ermöglicht wird. Dadurch können Daten schnell und zuverlässig in das System integriert werden. Durch Erweiterungen in Drupal oder WordPress ist es auch möglich, innerhalb des CMS direkt auf den gesamten Verlagscontent zu verlinken, selbst wenn der Verlinkte Content aus einem ganz anderen System stammt. Importierte Daten werden vom InfoPilot Workflow in HTML konvertiert. Dies stellt sicher, dass die Inhalte auf verschiedenen Endgeräten und Plattformen optimal dargestellt werden können. Nach der Umwandlung werden alle Daten in einem speziellen Verlagsschema indexiert, was eine strukturierte und zielgerichtete Suche innerhalb der Plattform ermöglicht.
Ein weiterer Schlüsselprozess ist das Chunking und die anschließende Vektorisierung Daten. Diese Verfahren sorgen dafür, dass die Inhalte in kleinere, verwertbare Einheiten zerlegt und in einem Format gespeichert werden, das eine semantische Suche ermöglicht. Dadurch können Nutzer über einen Chatbot noch präzisere Suchergebnisse erzielen und Inhalte kontextbezogen erschließen.
Zusammengefasst bietet die InfoPilot-Plattform eine umfassende Automatisierung der Datenverarbeitung, die es Verlagen ermöglicht, ihre Inhalte aufwandsneutral zu importieren und den Nutzern eine verbesserte Suchfunktion zu bieten.
Welche konkreten Erfahrungen aus Kundenprojekten habt ihr bei der Einführung und betrieb des InfoPilot gemacht?
Bei der Einführung und dem Betrieb der InfoPilot-Plattform haben wir wertvolle Erfahrungen aus unseren Kundenprojekten gesammelt, die zeigen, wie effektiv die Plattform im Verlagswesen eingesetzt werden kann. In erster Linie ist es von Vorteil, wenn der Verlag bereits mit einer einheitlichen XML-Struktur für seine Daten arbeitet. Diese Standardisierung ermöglicht eine konsistente Datenverarbeitung und erleichtert die Integration in den InfoPilot Workflow, so dass der Kunde selbstständig weitere Werke hinzufügen kann.
Ein weiterer wichtiger Aspekt ist die flexible Nutzung der Inhalte. Statt sich auf ein einzelnes Produkt wie ein Buch zu beschränken, können die Inhalte jetzt in zahlreichen Produkten verwendet werden. Dies maximiert den Wert der vorhandenen Daten und ermöglicht eine vielseitige Anwendung in verschiedenen Applikationen und Kontexten.
Zusätzlich haben wir festgestellt, dass die traditionelle, statische Inhaltsverzeichnisstruktur (TOC) immer mehr durch dynamisch generierte TOCs ersetzt wird, die auf Metadaten basieren. Diese Facetten-TOCs bieten den Nutzern eine individuell zugeschnittene Navigation und erleichtern das Auffinden relevanter Informationen.
Ein besonders beeindruckender Vorteil ist die gesteigerte Effizienz in der Content-Produktion. Dank der InfoPilot-Plattform können Inhalte viel schneller produziert und live geschaltet werden. Dies ist besonders bei aktuellen News von Vorteil, die innerhalb weniger Minuten live verfügbar sein müssen, um den hohen Ansprüchen moderner Nutzer gerecht zu werden. Der Verlag kann hierbei News über ein integriertes CMS bequem, schnell und sicher erstellen.
Insgesamt haben diese Erfahrungen gezeigt, dass die InfoPilot-Plattform nicht nur die Arbeitsabläufe optimiert, sondern auch den Nutzern einen erheblichen Mehrwert bietet, indem sie Flexibilität, Geschwindigkeit und Benutzerfreundlichkeit vereint.
Das Fachlektorat wird weiterhin benötigt. Rechtlich relevante Texte, die neu erstellt werden, sollten, egal wie diese entstehen, immer noch einmal fachlich auf Korrektheit geprüft werden.
Lässt sich alles automatisieren? Oder anders gefragt: Für welche Aufgaben wird das Know-how eines Fachlektorats benötigt?
Das Fachlektorat wird weiterhin benötigt. Rechtlich relevante Texte, die neu erstellt werden, sollten, egal wie diese entstehen, immer noch einmal fachlich auf Korrektheit geprüft werden. Dies gilt insbesondere, wenn Artikel mit Hilfe von KI erstellt werden. Vom Gericht veröffentlichte Entscheide oder von Regierungen veröffentlichte Texte können aber direkt übernommen werden, da diese von der bereitstellenden Instanz geprüft wurden und mit der Veröffentlichung gültig sind.
Euer Vortrag trägt auf dem CrossMediaForum trägt den „Automatisierter XML-Workflow für Verlage: Unterstützung in der Verarbeitung, Erweiterung, Erschließung und On-Demand Distribution juristischer Inhalte“. Was wird die Hauptbotschaft sein?
In einer Zeit, in der immer mehr Inhalte schnell und automatisiert durch KI entstehen, brauchen Verlage eine ausgewogene Mischung aus klassisch erarbeiteten und schnell produzierten Inhalten, um ihre Zielgruppen nachhaltig zu binden. Diese beiden Ansätze stehen nicht im Widerspruch – sie ergänzen sich und stärken gemeinsam das publizistische Angebot.
Arkadius Nowakowski arbeitet bei SHI und ist Referent auf dem CrossMediaForum.