Korpus und Infrastruktur
Der Aufgabenbereich Korpus und Infrastruktur ist Teil des WBÖ-Projekts, das im Langzeitprojekt Sprachdynamik in Österreich (DynAT) des ACDH angesiedelt ist. Der Fokus des Aufgabenbereichs liegt auf den Prozessen der Datengenerierung (insbesondere in Form von Bild- und Volltextdigitalisierungen historischer analoger Daten), der Datenaufbereitung (primär in Form von Datenanreicherungen, Annotationen und Verlinkungen) sowie der Open-Access-Publikation aller Daten.
Das Herzstück bildet – neben den Wörterbuchartikeln – die digitale WBÖ-Belegdatenbank. Sie basiert auf den Handzetteln des analogen WBÖ-Handzettelkatalogs, der ab den 1910er Jahren erstellt wurde. Der Großteil dieser Belegsammlung (ab der Buchstabenstrecke D) wurde in den 1990ern und frühen 2000ern erstmals digital in TUSTEP erfasst und ab 2016 ins XML/TEI-Format überführt. Die Daten beinhalten in erster Linie Angaben zu Lemma, Bedeutung und Lautung sowie Herkunftsort und Sammler bzw. Sammlerin der Belege. Seit 2020 ist die Belegdatenbank (ab Buchstabenstrecke D) online zugänglich und damit für Forschungsfragen über die lexikographische Arbeit hinaus verfügbar.
Seit 2017 wird der gesamte Handzettelkatalog zusätzlich im digitalen Bildformat erfasst. Die Scans werden in der Handzettel-Datenbank gespeichert und mit den entsprechenden Einträgen in der Belegdatenbank verknüpft. In den kommenden Jahren erfolgt eine KI-gestützte Digitalisierung der Buchstabenstrecken A–C, sodass zukünftig der komplette Handzettelbestand in der Belegdatenbank verfügbar sein wird. Im Zuge der Retrodigitalisierung der bereits gedruckten WBÖ-Bände wird die aufgebaute XML-Datenbank zukünftig ebenfalls mit der Belegdatenbank verknüpft.
Darüber hinaus widmet sich der Aufgabenbereich der Anreicherung und Integration neuer Datenbestände, die im Rahmen weiterer WBÖ-Aktivitäten entstanden sind (z. B. Korpus Österreichische Dialektaufnahmen im 20. Jahrhundert) oder weiter entstehen (z. B. Das ABC der Dialekte).
Die fortwährende Optimierung der Daten sowie deren Kuration für das hauseigene Repositorium ARCHE (A Resource Centre for the HumanitiEs) wird durch die Forschungseinheit DH Forschung und Infrastruktur (DHRI) des ACDH unterstützt.