KIM-KOS

KIM-AG-IM,DCUB  KIM-intern

Begutachtung/Zertifizierung von Knowledge Organisation Systems (KOS) in KIM

= Worum geht es? =

Im Kontext von KIM II AP 1.3 wird untersucht, ob die "Kriterien für die Zertifizierung von Metadatenprofilen" erweitert werden müssen oder ob es notwendig ist, einen für kontrollierte Vokabulare spezifischen Kriterienkatalog zu erarbeiten.

Kontrollierte/Strukturierte Vokabulare = Knowledge Organisation Systems (KOS)
 * Thesauri
 * Klassifikationen
 * Schlagwortnormdateien
 * usw.

= Grundlagen =


 * Z 39.19 - 2005


 * SKOS Simple Knowledge Organization System Primer


 * DCAM


 * KIM-Zertifizierungskriterien

controlled vocabulary
"A list of terms that have been enumerated explicitly. This list is controlled by and is available from a controlled vocabulary registration authority. All terms in a controlled vocabulary must have an unambiguous, non-redundant definition. NOTE: This is a design goal that may not be true in practice; it depends on how strict the controlled vocabulary registration authority is regarding registration of terms into a controlled vocabulary. At a minimum, the following two rules must be enforced: NOTE: This rule does not apply to synonym rings.
 * 1) If the same term is commonly used to mean different concepts, then its name is explicitly qualified to resolve this ambiguity.
 * 1) If multiple terms are used to mean the same thing, one of the terms is identified as the preferred term in the controlled vocabulary and the other terms are listed as synonyms or aliases."

term
"One or more words designating a concept."

Diksussion: Müssen wir in unserem Kontext unterscheiden zwischen "terms"
 * in Form von "properties" oder "Metadatenterme" = dienen der Darstellung von properties wie Titel, Autor, Entstehungszeitraum usw.?
 * in Form von "Termen" oder "Deskriptoren" = dienen der Darstellung eines Konzepts?

concept
"A unit of thought, formed by mentally combining some or all of the characteristics of a concrete or abstract, real or imaginary object. Concepts exist in the mind as abstract entities independent of terms used to express them."

Z 39.19-2005 nennt vier Prinzipien
"There are four important principles of vocabulary control that guide their design and development. These are:
 * eliminating ambiguity
 * controlling synonyms
 * establishing relationships among terms where appropriate
 * testing and validation of terms"

Ziel dieser Prinzipien ist es, sicherzustellen, dass jeder Term nur eine Bedeutung hat und dass nur ein einziger Term verwendet werden kann, um ein bestimmtes Konzept zu repräsentieren. Diese Prinzipien sollen das Retrieval (precision und recall) verbessern.

Diskussion:
 * Sind dies Prinzipien, die in unserem Kontext berücksichtigt werden müssen?
 * Wenn ja, welche Prinzipien sollen berücksichtigt werden?
 * Wenn ja, wie granular muss her geprüft werden?

List
"A list (also sometimes called a pick list) is a limited set of terms arranged as a simple alphabetical list or in some other logically evident way. Lists are used to describe aspects of content objects or entities that have a limited number of possibilities. Examples include geography (e.g., country, state, city), language (e.g., English, French, Swedish), or format (e.g., text, image, sound)."

Synonym Ring
"While a synonym ring is considered to be a type of controlled vocabulary, it plays a somewhat different role than the other types covered by this Standard. Synonym rings cannot be used during the indexing process. Rather, they are used only during retrieval. Use of synonym rings ensures that a concept that can be described by multiple synonymous or equivalent terms will be retrieved if any one of the terms is used in a search. A synonym ring, therefore, is a set of terms that are considered equivalent for the purposes of retrieval. Synonym rings usually occur as sets of flat lists. A synonym ring allows users to access all content objects or database entries containing any one of the terms. Synonym rings are generally used in the interface in an electronic information system, and provide access to content that is represented in natural, uncontrolled language."

Taxonomy
"A taxonomy is a controlled vocabulary consisting of preferred terms, all of which are connected in a hierarchy or polyhierarchy."

Thesaurus
"A thesaurus is a controlled vocabulary arranged in a known order and structured so that the various relationships among terms are displayed clearly and identified by standardized relationship indicators. Relationship indicators should be employed reciprocally."

Diskussion: Müssen diese Typen bei der Begutachtung von kontrollierten Vokabularen berücksichtigt werden? s. dazu auch weiter unten den Abschnitt "Beziehungen"

= Vier Thesen zu kontrollierten Vokabularen und Metadaten =

Jedes Metadatenprofil/Metadatenschema ist ein kontrolliertes/strukturiertes Vokabular
 * Beispiel


 * DCMES = kontrolliertes Vokabular zur Beschreibung von Ressourcen

= kontrolliertes/strukturiertes Vokabular ist ein "description set"? - s. DCMI Description Set Model

Ein kontrolliertes Vokabular stellt die Werte/values zur Verfügung, die im Zusammenhang mit einem bestimmten Metadatenterm in einer bestimmten Anwendung verwendet werden dürfen
 * Beispiel aus SKOS


 * ex1:platypus rdf:type skos:Concept;
 * skos:prefLabel "platypus"@en.


 *  rdf:type foaf:Document;
 * dct:subject ex1:platypus.

= kontrolliertes/strukturiertes Vokabular ist ein DCAM-"vocabulary encoding scheme"? - s. DCMI Description Set Model ?

Metadaten werden verwendet um kontrollierte Vokabulare als solche zu beschreiben.
 * Beispiel aus SKOS


 * ex:animalThesaurus rdf:type skos:ConceptScheme;
 * dct:title "Simple animal thesaurus";
 * dct:creator ex:antoineIsaac.

= kontrolliertes/strukturiertes Vokabular ist eine DCAM-"described resource"? s. DCMI Resource Model

Metadaten werden verwendet, um den Content eines kontrollierten Vokabulars darzustellen. Hier braucht es laut Z 39.19 - 2005 :


 * a metadata element set to describe the concepts, terms, and relationships;
 * a set of relationship definitions;
 * and a metadata schema for representing relationships among terms.

= kontrolliertes Vokabular ist ein DCAM-"vocabulary"? s. DCMI Vocabulary Model

Diskussion:
 * Stimmen diese Thesen?
 * wenn ja, auf welcher dieser Ebenen wird KIM kontrollierte Vokabulare begutachten?

= Kompatibilität mit DCAM und/oder SKOS =

DCMI vocabulary model (s. DCAM)
"The abstract model of the vocabularies used in DC metadata descriptions is as follows:
 * A vocabulary is a set of one or more terms. Each term is a member of one or more vocabularies.
 * A term is a property (element), class, vocabulary encoding scheme, or syntax encoding scheme.
 * Each property may be related to one or more classes by a has domain relationship. Where it is stated that a property has such a relationship with a class and the property is part of a property/value pair, it follows that the described resource is an instance of that class.
 * Each property may be related to one or more classes by a has range relationship. Where it is stated that a property has such a relationship with a class and the property is part of a property/value pair, it follows that the value is an instance of that class.
 * Each resource may be an instance of one or more classes.
 * Each resource may be a member of one or more vocabulary encoding schemes.
 * Each class may be related to one or more other classes by a sub-class of relationship (where the two classes are defined such that all resources that are instances of the sub-class are also instances of the related class).
 * Each property may be related to one or more other properties by a sub-property of relationship. Where it is stated that such a relationship exists, the two properties are defined such that whenever the sub-property is part of a property/value pair describing a resource, it follows that the resource is also described using a second property/value pair made up of the property and the value.
 * Each syntax encoding scheme is a class (of literals).

strukturelle Konformität der Terme (s. KIM Zertifizierungskriterien)
Die in den Aussagenschemas definierten und annotierten sowie die in kontrollierten Vokabularen verwendeten Terme müssen konform sein mit Termen, die auf dem DCMI Abstract Model basieren. ...

Die folgenden Anforderungen sind verpflichtend:


 * Dem Term ist ein korrekter URI zugwiesen.
 * Der Term ist explizit als einer der folgenden Typen von Metadatentermen deklariert:
 * als RDF-Eigenschaft, bzw. (im Dublin-Core-Kontext) Element ( oder eine Subklasse derselben) oder
 * als Klasse ( oder eine Subklasse derselben) oder
 * als RDF Datentyp bzw. (im Dublin-Core-Kontext) syntaktisches Kodierungsschema ( oder eine Subklasse desselben) oder
 * als ein semantisches Kodierungsschema ( oder eine Subklasse desselben).

Die folgende Anforderung wird empfohlen:


 * Terme sind als RDF-Schema deklariert (Beispiele hierfür: DCMI Metadata Terms und Dublin Core Collection Description Terms ).

semantische Konformität der Terme (s. KIM Zertifizierungskriterien)
Die in den Aussagenschemas definierten und annotierten sowie die in kontrollierten Vokabularen verwendeten Terme müssen ausreichend beschrieben sein. Eine eindeutige Definition muss die verwendeten Terme voneinander abgrenzen, um semantische Überschneidungen zwischen den Termen zu vermeiden.

Die folgende Anforderung ist verpflichtend:


 * Die Terme sind eindeutig definiert und semantisch klar voneinander abgegrenzt.

Es wird empfohlen, dass Terme aus bereits vorhandenen Vokabularen übernommen werden. Ist dies der Fall, dann ist die folgende Anforderung verpflichtend:

Nutzungsrichtlinien im vorliegenden Beschreibunssatzprofil dürfen den Geltungsbereich des Terms zwar semantisch verfeinern, aber nicht ausweiten.)
 * Die Terme sind im vorliegenden Beschreibungssatzprofil derart definiert und annotiert, dass die Semantik im vorliegenden Beschreibungssatzprofil der Semantik des Originalumfelds nicht widerspricht? (Die

Anforderungen aus dem SKOS-Kontext
The fundamental element of the SKOS vocabulary is the concept. Concepts are the units of thought [WillpowerGlossary]—ideas, meanings, or (categories of) objects and events—which underlie many knowledge organization systems [SKOS-UCR]. As such, concepts exist in the mind as abstract entities which are independent of the terms used to label them.

SKOS introduces the class skos:Concept, which allows implementors to assert that a given resource is a concept. This is done in two steps:
 * 1) by creating (or reusing) a Uniform Resource Identifier (URI [URI]) to uniquely identify the concept.
 * 2) by asserting in RDF, using the property rdf:type, that the resource identified by this URI is of type skos:Concept.


 * For example:


 *  rdf:type skos:Concept.

Diskussion:
 * Ist Kompatibilität mit DCAM das Ziel der Zertifizierung?
 * Ist Kompatibilität mit SKOS das Ziel der Zertifizierung?

= Records =

"An individual record should be created for every term" s. Z 39.19-2005 Z 39.19 - 2005

Das würde bedeuten:

Ein kontrolliertes Vokabular besteht aus einem oder mehr Datensätzen, mittels derer die "Terme" beschrieben werden. (s. hier wieder das Problem mit der Unterscheidung zwischen "Metadatentermen" und "Konzepttermen".

Z 39.19-2005 nennt verschiedene Metadatenterme (properties), die bei der Beschreibung der "Konzeptterme" verwendet werden könnten/sollten/müssten.

Hier ein Versuch, einige dieser properties den SKOS-properties gegenüberzustellen

Diskussion:


 * Wird KIM Vorgaben machen, welche properties bei der Beschreibung von "Konzepttermen" verpflichtend sind? (z. B. Mindestanforderung: URI, Label, Definition?)
 * Wenn ja: wird KIM ein Metadatenprofil erstellen?
 * Oder nur auf SKOS verweisen?
 * Oder auf andere Möglichkeiten verweisen?

= Beziehungen =

Wir unterscheiden bei den oben genannten properties zwischen properties, die Beziehungen darstellen und den übrigen properties.

Z 39.19-2005 unterscheidet drei Arten von Beziehungen:

a) Equivalency b) Hierarchy c) Association

und weist diesen die entsprechenden properties zu:


 * Equivalency = Use bzw. UsedFor
 * Hierarchy = Broader Term bzw. Narrower Term
 * Association = Related Term

Die Verwendung dieser Beziehungen und der damit verbundenen Metadatenterme ist u. a. abhängig von den oben genannten Typen von kontrollierten Vokabularen. S. dazu Z 39.19-2005 Appendix B

Dabei gilt "List" = keine Beziehungen "Synonym Ring" = Equivalence "Taxonomy" = Hierarchy "Thesaurus" = Equivalence, Hierarchy und Association

Diskussion: Welche Bedeutung hat das für die Begutachtung von kontrollierten Vokabularen?

= Referenzen =