TEI Dictionaries

Der vorliegende Eintrag soll einen Leitfaden für die Basiskodierung von Wörterbuchartikeln mit TEI P5 darstellen. Anhand einiger praktischer Beispiele soll ein Überblick über eine mögliche Kernkodierung gegeben werden.

Schema erstellen mit Roma
Ein Schema oder eine DTD zur Wörterbuchkodierung kann mit Hilfe von Roma erstellt werden. Roma ist eine Anwendung zur Erstellung von P5-kompatiblen Schemas und Dokumentationen und ist in einer Online-Version verfügbar.

Dabei kann eine ODD-Spezifikation in eine DTD oder ein Schema in der gewünschten Zielsprache (RELAX NG oder W3C Schema) transformiert werden. Hierzu wird unter http://tei.oucs.ox.ac.uk/Roma/ der Menüpunkt Open existing customization gewählt und das entsprechende ODD-Dokument geladen. Im nächsten Schritt kann die Spezifikation entweder weiter modifiziert werden (beispielsweise durch das Hinzufügen oder Entfernen einzelner Element) oder direkt in ein Schema oder eine DTD transformiert werden. Unter dem Menüpunkt Schema kann das gewünschte Format gewählt und das Schema fertig gestellt werden.

Roma ermöglicht aber auch die direkte Erstellung eines Schemas oder einer DTD mit Hilfe des Menüpunktes Build schema. Im nächsten Schritt können unter Modules die gewünschten TEI-Module nach Belieben zusammengestellt werden, sowie einzelne Elemente je nach Bedarf hinzugefügt oder auch entfernt werden. So wird man beispielsweise für ein Schema zur Wörterbuchkodierung, den bereits voreingestellten und empfohlenen TEI-Modulen noch das Modul dictionaries hinzufügen. Unter Schema wird schließlich wieder das gewünschte Format gewählt und die DTD oder das Schema wird erstellt.

Der Wörterbucheintrag
Die Grundstruktur eines Wörterbucheintrages besteht im Allgemeinen aus zwei Teilen:


 * 1) 	Das Stichwort
 * 2) 	Die Bedeutungsangabe(n)

Diese werden jeweils in eigenen Blöcken kodiert. Hinzu kommen meist noch grammatische Angaben und gegebenenfalls weitere Informationen wie beispielsweise Verwendungsweise, etymologische Angaben, etc. Die einzelnen Wörterbucheinträge werden jeweils mit kodiert.

Die Basis für die Kodierung eines Wörterbucheintrages sieht also wie folgt aus:

... das Stichwort?
Das Stichwort eines Wörterbuchartikels wird mit kodiert.

Zum Stichwort gehörige Informationen werden ebenfalls innerhalb des -Blocks zusammengefasst. Bei diesen Informationen kann es sich beispielsweise um grammatische Angaben handeln:

Abändern ,    v.   

Es können jedoch auch Angaben zur Orthographie, Aussprache, Silbentrennung, etc. kodiert werden:

Abarbeiten

Mögliche Elemente:
 * Orthographie
 * Aussprache
 * Trennungsmöglichkeit
 * Silbentrennung
 * Betonung

... die Bedeutungsangabe(n)?
Die Wortbedeutung wird mit kodiert. Hat ein Wort mehrere Bedeutungen, wird jede Bedeutung in einem eigenen Block erfasst. Die Bedeutungsangaben werden mit Hilfe des Attributs n nummeriert.

I)         ...        1) Ein wenig ändern, anders einrichten. ...       2) ...          ...     II) ...

Die verschiedenen Arten von Bedeutungsangaben werden unterschiedlich kodiert:


 * Definitionen werden mit kodiert

...       Abarbeiten ...        Durch Arbeit losbringen ...         ...


 * Beispiele und Übersetzungen werden mit kodiert. Durch das Attribut type wird markiert ob es sich um ein Beispiel oder um eine Übersetzung handelt. Der Text selbst wird mit oder kodiert. Wenn eine Quellenangabe vorliegt, wird verwendet, die Quelle wird in einem - Element (unstrukturiert) oder einem  - Element (strukturiert) spezifiziert.

→Für Beispiele wird  verwendet

Abändern ...          In diesem Aufsatze muss noch manches abgeändert werden.

Beispiel mit Quellenangabe:

...       Abändern ...          «Die Farbe des Gesieders scheint bei dem Kampfhahn eben so abzuändern, wie bei dem Hausgeflügel.« quote> Funke. ...

→Für Übersetzungen wird  verwendet


 * Andere Arten von Bedeutungsangaben (z. B. Synonyme) werden mit kodiert

...       Abartig ...       abartend , abgearted , ...

Auch innerhalb von können Angaben zur Grammatik mit Hilfe von  kodiert werden.

... grammatische Angaben?
Grammatische Angaben zu einem Wort werden unter  zusammengefasst. Sie können sowohl im -Block als auch im -Block vorkommen, um die entsprechende Verwendung zu beschränken.

Informationen zur Wortklasse und zu Unterkategorien werden mit Hilfe der Elemente und kodiert:

Abändern ,  v.      I)             trs.             ...     ...

Zur Kodierung von Genus, Numerus und Kasus stehen die Elemente, und zur Verfügung:

...       Die Abänderung ...

 </gramGrp>

Die Person, die Zeit und der Modus werden durch, und kodiert:

 <number value="singular"/ </gramGrp>

Zur Verfügung stehen außerdem noch die Elemente und <iType>, mit denen Kollokationen und die Flexionsklasse markiert werden können.

... Ableitungen, Komposita, Redewendungen, etc.?
Ableitungen, Komposita oder Redewendungen zu einem Stichwort können als verwandte Einträge mit <re> als Eintrag innerhalb eines kodiert werden.

Abändern ...      ...       <re>  </gramGrp> Die Abänderung. </re> ...

... etymologische Angaben?
Angaben zur Etymologie werden mit kodiert.

Die Elemente, und dienen der genaueren Erläuterung der Herkunft, zusätzlich kann auch noch das Element Verwendung finden.

... Verwendungsweise, Erklärungen, Kommentare?
Die Verwendungsweise von Wörtern und sonstige Kennzeichnung werden durch

...     die alte Benennung aller großer Raubvögel, besonders aber des Adlers, die noch in N. D. üblich ist und bei Dichtern vorkömmt. ...

und

<lbl type="wordformation">Verkleinerungswort

kodiert.

Kommentare und Erklärungen werden mit kodiert:

Abändern ...               ...        Wenn in der Kanzleisprache abändern für aufheben oder widerrufen gebraucht wird, so ist dies ein Mißbrauch. ...

... Verweise und Querverweise?
Innerhalb des Wörterbucheintrages wird häufig eine verkürzte Version des Stichworts verwendet. Diese Verweise auf das Stichwort werden mit <oRef> (Verweis auf die orthographische Form) oder mit <oVar> (Variante der orthographischen Form) kodiert.

...      Der Lachbaum ...      die <oVar><oRef/>-bäume</oVar> ...

Querverweise werden unter <xr> zusammengefasst und je nach Bedarf mit </xr> ...

Links

 * TEI Homepage
 * TEI P5: Dictionaries