dedlfix: HTML5: Best practice bei leeren Elementen?

Beitrag lesen

Tach!

Dafür: Dieselben Argumente, die für XHTML 1 statt HTML 4 sprachen. Polyglottes HTML5 ist als XML verarbeitbar, bspw. nach strengeren Regeln validierbar.

Waren/sind das vorwiegend theoretische Argumente oder hat tatsächlich jemand einen Nutzen von der XML-Nutzbarkeit von Webseiten? Die sind doch üblicherweise nicht dafür gedacht, XML-lesbar (maschinell auswertbar) zu sein. Um auf diese Weise Daten zu extrahieren ist doch viel zu viel unnützer Kram dabei. (Von rechtlichen Aspekten mal ganz abgesehen.) Besser ist es doch, die bereitgestellten APIs zu verwenden, wenn der Betreiber ein Datenabschnorcheln vorgesehen hat.

Suchmaschinen allerdings sind ein etwas anderes Thema. Die sollen ja nicht die reinen Daten sehen, sondern die Seiten so vorgesetzt bekommen, wie sie auch die menschlichen Besucher sehen. Um die Bedeutung der Daten zu erhalten, ist (X)HTML auch nicht sonderlich hilfreich. Da steht dann sowas wie "Liste" im Code, aber den Sinn der Liste, geschweige denn den Sinn der Inhalte, kann man ja aus den HTML-Elementen nicht herauslesen. Die zeichnen den Inhalt nur in Bezug auf die Päsentation aus. Nicht umsonst bilden sich solche Projekte wie Semantic Mediawiki, die die Daten an sich in Beziehung setzen, so dass sie zum Beispiel gezielter durchsuchbar sind. Die Hauptstadt eines Landes ist da schon auf Datenebene als Hauptstadt zu erkennen. Aus einer (X)HTML-Seite ist es hingegen ungleich schwieriger, die Hauptstadt-Information zu extrahieren.

dedlfix.