webdesign-hannover.cc
News

Wikipedia CMS mit neuen Funktionen

Hannover, 18.08.06 - Forscher der Universität Karlsruhe machen die Inhalte von Websites, die mit MediaWiki geschrieben sind, zum Beispiel die freie Web-Enzyklopädie Wikipedia, für Maschinen besser auswertbar. Ihr Konzept zur besseren Erschließung der Inhalte geht allerdings nur auf, wenn die Wiki-Autoren aktiv mitarbeiten.

Die Karlsruher Forscher setzen auf eine Kombination aus sozialer und technischer Lösung: Sie hoffen, dass sich auf der Basis ihrer Software Semantic MediaWiki eine Art kollektive Indexierung der Wiki-Artikel durch die Autoren entwickelt. Semantic MediaWiki wird bereits auf mehreren Websites mit begrenztem Datenvolumen erfolgreich eingesetzt, unter anderem zur Erschließung der Bibel-Inhalte. Nun testen die Karlsruher Forscher, ob ihr Programm auch dem gewaltigen Volumen von Wikipedia gewachsen ist. Die Wikimedia Foundation Inc., Betreiber von Wikipedia, stellt ihnen für den Test rund 50 Gigabyte Inhalt der englischen Wikipedia-Ausgabe zur Verfügung und hat Interesse an einer Zusammenarbeit signalisiert.

Semantic MediaWiki ist ein einfach zu bedienendes Werkzeug, das auf leistungsstarken semantischen Wissensmanagement-Technologien aufbaut. Die Autoren können mit dem Werkzeug die Querverweise, die sie in ihrem Text als Weiterleitung zu Hintergrundinformationen angeben, typisieren, also kurz erläutern, sowie Zahlenangaben und Fakten im Text als Attribute kennzeichnen. Bei dem Eintrag zu 'Ägypten' steht dann zum Beispiel der typisierte Link 'ist Land von Afrika', ein Attribut könnte 'Bevölkerung 76,000,000' sein. Dabei soll jeweils die Landessprache des Eintrags verwendet werden können.

Die von den Autoren erzeugten, typisierten Links werden in einer Datenbank als Bezugsgruppen abgelegt; die gekennzeichneten Attribute als feststehende Werte gespeichert. Das versetzt Computer in die Lage, automatisch sinnvolle Antworten auf komplexere Anfragen zu geben; etwa eine Liste zu erzeugen, in der alle Länder von Afrika aufgeführt sind. Die Ländernamen führen als Link zurück zu dem Eintrag, in dem sie stehen.

Das Spannende an der neuen Technologie ist die Möglichkeit zur automatischen Zusammenführung von Informationen, die in den verschiedenen Einträgen verteilt sind. Durch die festgelegten Beziehungen zwischen den Links enthält die automatisch erzeugte Liste immer die gleichen Daten, von welcher Seite aus man sie auch abruft. Die Suchmaschine holt sich die Bevölkerungszahl von Ägypten immer vom Ägypten-Eintrag, so dass keine unterschiedlichen Zahlen in der Wiki-Landschaft kursieren können. Darin steckt ein sehr großes Potenzial zur Bereitstellung von enzyklopädischer Information und Wissen für Menschen auf der ganzen Welt.

Ein mit Semantic MediaWiki erstellter Testeintrag zu Deutschland kann unter http://ontoworld.org/index.php/Germany eingesehen werden.

zur News Übersichtzur News Übersicht

CrawlTrack: free crawlers and spiders tracking script for webmaster- SEO script -script gratuit de détection des robots pour webmaster