Subj3ct.com and the impact of semantic handshakes
May 15th, 2009
Auf der TMRA 2006 habe ich einen Vortrag über “the Impact of Semantic Handshakes” gehalten. Das vollständige Paper gibt es hier oder hier. Die Prämisse des Vortrags ist, dass die globale Festlegung eines eindeutigen PSIs (oder anderen Identifiers) pro Aussagegegenstand nicht durchsetzbar ist, ja jeder Versuch in diese Richtung zum Scheitern verurteilt sein muss.
Vielmehr ist mein Vorschlag, lokale Entscheidungen über die Identität von PSIs für eine globale, terminologische Harmonisierung zu nutzen. Umfangreiche Experimente haben gezeigt, dass diese “Normierung von unten” funktioniert, wenn jeder Autor mind. zwei unterschiedliche Identifier für einen Aussagegegenstand nutzt. In den Simulationen zeigten diese lokalen “Semantic Handshakes” eine eindrucksvolle globale Wirkung.
Voraussetzung für dieses Vorgehen ist es jedoch, dass die lokalen Semantic Handshakes auch zueinander finden. Und hier sind wir diese Woche einen großen Schritt weiter gekommen. Graham Moore und Kal Ahmed von NetworkedPlanet haben subj3ct.com released. Subj3ct.com ist eine Registry für PSI, also Identifier für Aussagegegenstände. Die Registry wird über ATOM-Feeds gefüttert und kann über APIs genutzt werden. Subj3ct ist eine großartige Sache, auf die die Community schon lange gewartet hat. Jetzt gilt es die Idee einer PSI Registry auch mit Leben zu füllen. Das Portal des Topic Maps Labs füttert bereits seit heute Subj3ct.com mit PSIs.
Aus der Perspektive der Idee der “Semantic Handshakes” ist das Spannendste, das subj3ct.com nach lokalen Handshakes dürstet. Nehmen wir bspw. den aktuellen Feed-Eintrag den das Topic Maps Lab Portal für Kal Ahmed ausgibt (den gesamten Personen-Feed gibt es hier):
<entry>
<title>Kal Ahmed</title>
<id>http://www.topicmapslab.de/people/Kal_Ahmed</id>
<updated>2009-01-14T16:47:52Z</updated>
<summary>Is involved in TM4J etc.</summary>
<link href="http://www.topicmapslab.de/people/Kal_Ahmed" rel="SubjectIdentifier"/>
<link href="http://www.topicmapslab.de/people/Kal_Ahmed" rel="SubjectRepresentation"/>
<link href="http://www.techquila.com/psi/techquila/#kal_ahmed" rel="EquivalentIdentifier"/>
<link href="http://www.topicmapslab.de/people/Kal_Ahmed" rel="alternate"/>
</entry>
In diesem Eintrag veröffentlicht das Topic Maps Lab, dass die PSI http://www.topicmapslab.de/people/Kal_Ahmed und http://www.techquila.com/psi/techquila/#kal_ahmed den gleichen Aussagegegenstand referenzieren. Ich bin sehr gespannt, was Subj3ct.com aus diesen extrem wertvollen Informationen macht. Jetzt da es subj3ct.com gibt, kann ich meine Empfehlung nur unterstreichen: für jeden Topic sollen immer zwei Subject Identifier zugewiesen werden und natürlich subj3ct.com mit diesen Informationen gefüttert werden.
July 10th, 2009 at 07:11 AM Ich finde den Dienst von Subj3ct.com auch toll und ab der nächsten Version wird Topincs ebenfalls seine Handshakes über einen entsprechenden Feed bereitstellen [1,2]. Trotzdem möchte ich auch an dieser Stelle ein Problem ansprechen, dass ich auch schon mal im englischen Verteiler angesprochen habe [3,4]. Bei einer solch aggressiven Verbreitung von Handshakes wird die Bedeutung eines lokalen Handshakes enorm. Wie können wir verhindern, dass die "gesamte" Topic-Map nicht ein Turm von Babel wird? Das Problem ist einfach, dass falsche Handshakes, das System so beeinflussen, dass Aussagen an einem Gegenstand landen wo sie nicht hingehören. In diesem Zusammenhang stelle ich mir die Frage, ob es für eine anarchische Verwendung von Topic Maps nicht besser wäre, wenn zwischen Inhalts-Topic-Maps und Kleber-Topic-Maps unterschieden würde. Ein Topic-Map ist genau dann eine Inhalts-Topic-Map, wenn jedes Topic durch genau einen SI identifiziert ist und dieser auch vom Autor der Topic-Map kontrolliert wird. Bei so einer solchen Topic-Map kann ein Konsument recht sicher sein, dass alle Aussagen auch so gemeint sind, wie sie notiert sind. Im Unterschied dazu ist eine Kleber-Topic-Map eine, die nur Handshakes beinhaltet, dass heißt sie beinhaltet nur Topics mit mindestens zwei SIs und auch keinerlei Aussagen über diese Topics. Eine solche Topic-Map hat einen ganz anderen Stellenwert im System und ist mit deutlich mehr Vorsicht zu genießen, wie auch Topic-Maps, bei denen der Autor fremde PSIs verwendet. Dies kann natürlich auch gut gehen. Ob es gut geht ist vom "Distanz" des Kontextes des Produzenten und des Konsumenten des PSIs abhängig. Wenn diese diesselbe Sprache sprechen, dieselbe Bildung genießen, in der selben Zeit und im selben Land leben, dann steht einem Verständnis nichts entgegen. Wenn diese Distanz wächst, wird die Wahrscheinlichkeit eines Missverständnisses größer. [1] http://www.topincs.com/issues/449 [2] http://www.topincs.com/issues/416 [3] http://www.petesbox.net/pipermail/topicmapmail/2009q1/007454.html [4] http://www.petesbox.net/pipermail/topicmapmail/2009q1/007457.html