Heute, am 25.03.2009, hatte ich gemeinsam mit Marco Büchler die Möglichkeit, unsere Arbeiten zu Argumentation Trails auf der TMS 2009 vorzustellen.

View more presentations from Lutz Maicher.

Die populäre Erdős-Zahl beschreibt die Distanz zwischen Mathematikern in einem Ko-Autoren-Netzwerk. Das grundsätzliche Problem dabei ist den kürzesten Pfad zwischen A und B zu finden. Das selbe Problem kann auf Wort- oder Konzeptnetzwerke angewandt werden. Basierend auf Kookkurrenzen als Kanten in diesen Graphen besteht zwischen zwei Konzepten einer Domäne, wie z.B. Korkenzieher und Oslo, zumeist eine Menge an verschiedenen Pfaden. Für diese Verbindungen müssen mehrere Knoten der Netzwerke traversiert werden. Es steht jedoch immer die Frage nach dem kürzesten und relevantesten Pfad von A nach B. Diese Pfade nennen wir Argumentation Trails, da sie einen sinnvollen Argumentationsleitfaden für A—>B bieten sollten. Um Argumentation Trails in Topic-Maps-Infrastrukturen nutzen zu können, werden diese als Topic Maps repräsentiert. Die Trails können dann bspw. für sensemaking oder augmented storytelling genutzt werden.

Weitere Informationen zu dem Paper gibt es im Portal des Topic Maps Labs.

Am 23.03.2009 hatte ich die Gelegenheit, ein einführendes Topic Maps Tutorial im Rahmen der TMS 2009 in Leipzig zu geben. Die TMS ist eine Konferenz zum Einsatz von “Text Mining Services” in Wissenschaft und Wirtschaft. Die (englischsprachigen) Folien des Tutorials können hier angeschaut werden.

Heute ist nun der Konferenztag der Topic Maps Conference 2009 in Oslo. Das Motto der diesjährigen Konferenz ist “Cultur of Sharing”. Rund 120 Teilnehmer finden sich seit 9.00 Uhr im Felix Konferansecenter zusammen. Das Center liegt mitten in Aker Brygge, ein neuer, hipper Stadtteil direkt am (Yacht-)Hafen von Oslo.

Wie bereits durch Are Gulbransen angekündigt, zielt die diesjährige Konferenz stärker auf den norwegischen Markt. Das führt dazu, dass auch die beiden Keynotes in Norwegisch sind.

Die Konferenz startet mit der Keynote von Tommy Nordeng mit dem Titel Why is it so hard to share, and why don’t we do as we say?. So weit ich es dem englischsprachigen Abstract entnehmen kann spricht er über NDLA. Dies ist ein norwegisches, öffentlich finanziertes Projekt, um die “culture of sharing” zu unterstützen. Hier kommen Themen wie Creative Commons, Open Source and lebenslanger Zugriff auf Informationen zusammen. In NDLA sollen RDF- und Topic Maps-basierte Lösungen ineinander greifen. Mehr Details kenne ich nicht, denn diese verstecken sich hinter dem Norwegisch des Vortrags.

Der erste englischsprachige Vortrag ist zugleich ein Höhepunkt des heutigen Tages. Graham Moore spricht über seine Ideen, wie die Future Topic Maps world aussehen könnten. Als erster diskutiert Graham den aktuellen Erfolg von Topic Maps.

  1. Topic Maps haben das Contentmanagement verbessert.
  2. Topic Maps ist eine “holistische” Integrationstechnologie, die die Sicht auf die Dinge verändert hat.
  3. Topic Maps erlauben es, die Daten so zu organisieren, wie die Nutzer es erwarten.

Das Problem ist jedoch, dass Topic Maps nur in “small” (single webseite) und “medium” (enterprise) erfolgreich sind. Aber “large” ist das Web – und hier sind Topic Maps nicht angekommen. Mit Topic Maps können heute bessere Silos für Informationen gebaut werden. Aber diese Silos sind nicht verbunden – at the large scale. Im “GREP-Projekt” wird basierend auf dem SD-Protokoll (Ergebnis der Topic Maps Coder Challenge auf der TMRA 2008) schon der erste Schritt getan, aber es fehlt die Möglichkeit des globalem Austausches.

Jetzt beginnt Grahan seine Wünsche und Herausforderungen für “Gloablising Topic Maps” zu beschreiben

  1. Das alle, die sich für ein bestimmtes Thema interessieren, bei verschiedenen TM-Servers diese Informationen anfragen können.
  2. Die Barriere für die Veröffentlichung von Subject Identifiern muss sinken.
  3. LinkedData Topic Maps einfach funktionieren sollen.
  4. Ontologien besser durch Menschen gefunden werden können.
  5. Lokale Applikationen Informationen aus dem TMWeb nutzen können.
  6. Das alles gut mit Google, Yahoo und Live Search funktioniert.
  7. Die Identität von Aussagegegenständen und die Adressierung von Topics muss gelöst werden.

Besonders wichtig für Graham ist ein “Global Scale Subject Identity Resolution service”. Folgender Lebenszyklus wird skizziert:

  1. Veröffentliche Subject Identier
  2. Finde Subject Identifier
  3. Veröffentlicher Aussage über Aussagegegenstände
  4. Entdecke die Gleichheit von Subject Identifiers
  5. Finde und Verbinde mit anderen Repräsentationen

Um diesen Lebenszyklus umzusetzen, sollte der Service die folgenden Aufgaben übernehmen:

  1. Registriere Subject Identifier, mit Name und Beschreibung
  2. Registriere Webadresse der Representation
  3. Retrieve Subject Identifier
  4. Search Text und URIS um identifier zu finden
  5. Manage Provenance

In diesem Zusammenhang führt Graham den den Begriff des “Subject Identity Record” ein. In diesem Record werden alle Informationen, die zu einem Identifier verfügbar sind gespeichert und abfragbar gemacht.

Das führt direkt zu der Frage, wie diese Infrastruktur global skalieren kann. Am 29.04.2009 wird NetworkedPlanet einen “root authority service” veröffentlichen. Später soll ein “discovery service” installiert werden. Im April 2009 sollen White Papers zu den Protokollen veröffentlich werden, damit nicht nur NetworkedPlanet die Infrastruktur implementiert. Denn erst dann kann diese Idee skalieren.

Der Vortrag war voll mit Information, es lohnt sich die Folien im Detail anzuschauen. NetworkedPlant hat zu dem Thema Topic Maps und Web3 einen neuen Blog gestartet.

Im nächsten Vortrag stellt Robert Engels das nationale Projekt Sesam4 vor. Zuerst wird das nationale Projekt vorgestellt. Die Hintergründe des Projekts sind RDF und Semantic Web, aber durch die Beiträge von Stian Danenbarger, Graham Moore und Steve Pepper sind Topic Maps integraler Bestandteil des Projektes geworden. Das Ziel von Robert Engels ist, beide Technologien in einem Projekt einzusetzen – in Bereichen, in den sie jeweils ihre Stärken einbringen können. Das gesamte Projekt geht noch bis 2010 und es wurde eine große “Wunschliste” präsentiert, jedoch keine Ergebnisse.

Danach kommen die Enlightning talks. Als erster Vortragender hatte ich die Möglichkeit, in 8 Minuten und mit 22 Folien das Topic Maps Lab und sein Portal zu beschreiben. Die darauf folgenden Vorträge von Robert Keil und Robert Strind waren in Norwegisch. Gerade der Vortrag von Robert Strind über das Assessment von Topic-Maps-Engines hätte mich sehr interessiert, da dies eng mit der Bachelor-Arbeit von Martin Czygan in Beziehung steht.

Nach der Mittagspause berichtet Jorgen Dalen von der Firma Halogen über Find Documents! No, Find People. Er adressiert das altbekannte Problem, dass das interessantes Wissen eines Unternehmens implizit ist. Daher ist es wichtig, die relevanten Personen in einer Organisation zu finden. Dabei referenziert er zu Marc Granovetters Strength of weak ties. Die vorgestellte Lösung basiert auf TMCore von NetworkedPlanet. Die zentrale Leistung dieser Lösung ist, dass für jeden Suchterm zuerst eine Liste relevanter Mitarbeiter angezeigt werden und erst dann die Liste der relvanten Dokumente. Ein Problem dabei ist, dass die Personen nach ihrer Relevanz geordnet werden müssen. Hier werden verschiedene Modelle (wie z.B. “social distance”, “contribution activity”, “consumption”) vorgestellt, keines ist jedoch ohne Nachteile.

Nach einer kurzen Kaffeepause berichten Peter Brown und Graham Moore über eGov-Share. Die in dem Vortrag adressierte Herausforderung ist die Integration of Information zwischen verschiedenen Institutionen der Europäischen Union. Hierfür werden die Erstellung einer Referenzontologie für die Beschreibung von eGovernment-Ressourcen und ein Protokoll für den Austausch von Informationen vorgeschlagen. Dieses Protokoll ist das bereits oben beschriebene SD-Share. Ontologie und Austauschprotokoll zusammen werden “eGov-Share” genannt. Als Use Case wird die Stadt Worms vorgestellt, die Ihre Dienstleistungsangebote sowohl auf der kommunalen als auch auf der regionalen Webseite veröffentlicht.

Den nächsten Vortrag über cfengine von Marc Burgess habe ich leider verpasst. Arnar Lundesgaard wies mich jedoch beim gestrigen Social Event darauf hin, dass das Projekt sehr interessant ist. Ein Blick drauf lohnt sich auf jeden Fall.

In der abschließenden Keynote spricht Jon Bing, Professor für Rechtsinformatik, über die Repräsentation von legeslativen Regeln in Topic Maps. Da dieser Vortrag in Norwegisch war, kann ich leider wenig darüber berichten.

Die diesjährige Konferenz war deutlich kleiner und relaxter als die letztjährige Konferenz. Ich habe die Atmosphäre genossen und viele interessante Gespräche geführt. Vielen Dank, speziell an Are Gulbrandsen für die Organisation.

Heute habe ich im Rahmen der Topic Maps User Conference 2008 in Oslo die Möglichkeit, ein Tutorial zu ZTM zu besuchen. Entsprechend der offiziellen Webseite ist ZTM a content management system and set of open source libraries for building topic map driven portals. It is written in Python and builds on the Zope 3 ecosystem. Das Tutorial wird gehalten von Arnar Lundesgaard. Das Tutorial ist sehr gut besucht, Topic-Maps-basierte CMS scheinen von großem Interesse zu sein – was ja auch nicht verwunderlich ist.

Zuerst beschreibt Arnar den Fokus des Tutorials, welcher wunderbar durch das Abstract des Tutorials beschrieben ist.

Zope Topic Maps – or ZTM – is an Open Source project to build a user-friendly Topic Maps driven content management system. It is written in Python on top of the Zope application server. First developed in 2001 and now at version 3.0, ZTM has been used as the foundation for several high-profile Norwegian web portals and is probably the world’s most widely used tool for building Topic Maps-based portals. ZTM aims to make Topic Maps publishing accessible to the average user without requiring an understanding of the finer points of the Topic Maps paradigm.

Als Einstieg gibt es eine Demonstration der neuen Webseite der Universität Bergen. Diese Seite basiert komplett auf Topic Maps, natürlich implementiert in ZTM. (Die neue Webseite der Universität Leipzig basiert übrigens auf Typo3 und bleibt der überholten Dokumenten-zentrierung treu.)

Der erste Schritt des Tutorials ist, dass alle Teilnehmer eine funktionierende Instanz von ZTM auf Ihrem Laptop haben. Diese Aufgabe beginnen wir 9.45 Uhr. Leider gibt es auf der ZTM-Seite keine Dokumentation (außer etwas generierter Dokumentation für das ZTM-Package, so wird der etwas aufwändige Installationsprozess nicht so leicht nachzuvollziehen sein. Um 10.30 Uhr ist meine Kopie installiert, jedoch noch nicht konfiguriert. Kurz vor 11.30 Uhr kann ich Topic Maps in Zope anlegen, zehn Minuten später auch der Rest der Gruppe. Und danach ist erst einmal Mittag (um 11.40 Uhr!).

Eine Stunde später geht es weiter und ich sehe die erste Topic Map in ZTM (XTM2-Serialisation gibt es hier). Der generische Topic Maps Browser erinnert sehr an den Omnigator, wie der folgende Screenshot zeigt.

Danach kommt eine Einführung in Topic Maps und Ontologien, vergleichbar zu dem Tutorial, welches ich nächste Woche Montag (23.03.2009) auf der TMS 2009 – Text Mining services halten werde.

Im nächsten Schritt wird die Ontologie in ZTM definiert. Wie die untenstehende Abbildung zeigt, ist der Schemaeditor sehr intuitiv. Besonders gefällt mir, dass man z.B. für einen Occurrence-Typ eines bestimmten Topic-Typs den “Eingabe-Widget” definieren kann. Es kann somit festgelegt werden, ob die entsprechenden Occurrences als Datum, als Auswahlliste, als Textfeld oder etwas anderes eingegeben werden sollen.

Auch die Reihenfolge der Dateneingabe (für das unten abgebildete Formular zur Dateneingabe) wird in dem Schemaeditor festgelegt. Neben den Formularen können auch Wizards definiert werden, um die Nutzer durch den Prozess der Dateneingabe zu führen. Das erinnert mich an das Konzept der Autonomen Topic Maps.

Im nächsten Schritt können jedem Topic bzw. jedem Topic-Typ sogenannte Views zugeordnet werden. Diese Views definieren, wie die entsprechenden Topics in HTML gerendert werden sollen. Auf die Schnelle habe ich nicht gesehen wie man mehrere Views für ein Topic zu spezifizieren kann, um komplexe Seiten zu erstellen, die aus einer Menge von Views (verschiedener Topics) bestehen.

Das Interface, welches Redakteure zu sehen bekommen, heißt Webdesk. Es ist konfigurierbar und deutlich näher an den Nutzern. Auf dem Webdesk wird kein Wissen über Topic Maps benötigt, hier führen Wizards durch die Erstellung der Inhalte. Und es gibt die Möglichkeit, den Redaktionsprozess zu gestalten und verschiedene Aufgaben unterschiedlichen Redakteuren zuzuweisen. So weit geht das Tutorial nicht, aber das Webdesk sieht danach aus (im unteren rechten Bereich).

Das Tutorial hat einen interessanten Einblick in die Funktionsweise von ZTM gegeben. Es ist ein komplexes, flexibles Produkt und es ist Open-Source. Ein Blick darauf lohnt sich auf alle Fälle. Leider ist der Survey in Norwegisch, so kann ich kein Feedback geben. Aber meine offenen Fragen werde ich jetzt bei Tapas und Wein des Social Events diskutieren.

Heute wurde ich durch den aktuellen Newsletter des BMBF auf den Workshop Corporate Semantic Web Workshop am Freitag, d. 20.03.2009 in Berlin aufmerksam. Der Workshop dient vornehmlich der Vorstellung der Ergebnisse aus dem Projekt BIZYCLE und Corporate Semantic Web – Berlin.

BIZYCLE ist ein regionaler Wachstumskern der BMBF-Innovationsinitiative “Unternehmen Region” für die Neuen Länder. Die Konsortialpartner des BIZYCLE Wachstumskerns haben sich zusammengeschlossen, um eine Technologiebasis für die zukünftige Entwicklung von Software für eine umfassende Unternehmenssteuerung durch Komponentenintegration zu schaffen. Quelle: bizycle.de

Die Arbeitsgruppe “Corporate Semantic Web” am Institut für Informatik der Freien Universität Berlin verfügt über national und international beachtete Kompetenz im Bereich semantischer Technologien. Das dort angesiedelte InnoProfile-Projekt Corporate Semantic Web entwickelt generische Lösungen, die Semantic-Web-Technologien für Unternehmen auf einfache Weise nutzbar machen. Um eine breite Akzeptanz dieser Technologien in Unternehmen zu erreichen, werden der wirtschaftliche Aufwand und der Nutzen evaluiert. Quelle: BMBF

Ein Blick auf das Programm zeigt, dass es keinen Vortrag mit direktem Bezug zu Topic Maps geben wird. Es ist jedoch sehr interessant zu sehen, wie semantische Technologien den Einzug in die Unternehmenswelt finden sollen. Besonders der Bezug zu den KMU interessiert uns aus der Perspektive des Topic Maps Labs sehr. Die Anmeldung zu dem Workshop ist kostenlos, die Ankündigung jedoch leider sehr kurzfristig.

Am Donnerstag, d. 17.03.2009 werde ich auf der Topic Maps Conference 2009 in Oslo das Topic Maps Lab Portal vorstellen. Die Folien gibt es bereits jetzt.

View more presentations from Lutz Maicher.

Kürzlich habe ich einen Artikel über Put The Social Web In Context With Glue’s New Browser Plugin gelesen. Die Idee hinter Glue beschreibt das folgende (Werbe-)video ziemlich gut.


Hinter Glue erkenne ich den Umriss der Idee des subject-centric computings. Sowohl das Motto der TMRA 2008 als auch auf das Motto der Topic Maps User Conference 2008 war subject-centric computing. Doch keiner der Vorträge auf den Konferenzen konnte der Idee Schärfe geben.

Natürlich kann auch Glue dies nicht. Aber die Funktionsweise von Glue führt mich dicht an das heran, was ich mir unter subject-centric computing vorstelle.

Doch zuerst ein Blick auf das (vereinfachte) Datenmodell von Glue. Zum Einen gibt es Personen, die miteinander Beziehungen vom Typ “Freundschaft” haben können. Zudem gibt es “Aussagegegentände”, z.B. ein bestimmter Film oder ein Wein. Personen erzeugen zu Aussagegegenständen Beziehungen vom Typ “gefällt mir” aktiv und Beziehungen vom Typ “habe ich auch gesehen” passiv. Und sie können noch Kommentare zu einem Aussagegegenstand erstellen. Das wars, der Rest wird automatisch aus entsprechenden Daten erzeugt.

Was mich dabei nah an die Idee des subject-centric computings bringt ist das “Erkennen” eines Aussagegegenstandes. Mein Stream von besuchten Webseiten wird analysiert, und immer wenn ich auf eine Seite komme, zu dessen Aussagegegenstand Informationen bei Glue vorliegen, bekomme ich die entsprechenden “sozialen” Informationen angezeigt. Das Spannende dabei ist, dass ein Aussagegegenstand – wie z.B. der Film Der Herr der Ringe – auf vielen verschiedenen Webseiten erkannt wird. Alle Repräsentationen des Films im Netz werden dann auf einen Aussagegegenstand bei Glue zurückgeführt.

Das ist sehr aussagegegenstandszentriert. Und was ist daran “computing”. Dass die Daten der aussagegegenstandszentrierten Datenbasis wie ein großer Filter für den Stream an Informationen wirken. Und immer dann, wenn eine Seite besucht wird, die einen bestimmten Aussagegegenstand repräsentiert, wird automatisch ein Statement “X hat Y angeschaut” erzeugt. Und diese Änderung der Datenbasis kann weitere Reaktionen hervorrufen – vieleicht wieder auf Basis solch aussagegegenstandszentrierter Muster. Und spätestens jetzt formt sich ein konkreter Umriss für die Idee des subject-centric computings.