Kerstin Bischoff: Quellcode und Suchmaschinen-Lesbarkeit

Hallo,
ich habe eine technisch recht einfache Site erstellt. Daten werden in *.xml Datein gehalten. Dargestellt wird das Ganze mit *.xsl.

2 Fragen bekomme ich nicht so recht gelöst.

Wenn ich meine XML-Datein im Browser aufrufe, wird alles sauber dargestellt. Gehe ich auf 'Quellcode anzeigen', sollte ich nicht wie jetzt das xml-Dokument sehen, sondern eine HTML Seite. Welche Einstellungen sind da erforderlich?

Wahrscheinlich hängt dieses Problem auch damit zusammen, dass Google die Seiten im Cache nicht richtig speichern kann. Hat jemand Erfahrung, was man bei XML beachten muss, damit man die Seiten von den Suchmaschinen ordentlich indiziert bekommt?

Danke sehr.
Kerstin Bischoff

  1. Hi,

    wer ist denn bei dir für die Transformation zuständig? Wenn du im Browser noch Zugriff auf den XML-Quelltext hast scheint das ja der Browser zu sein?! Das ist eine ganz heiße Sache, weil das meines Wissens nicht viele Browser mitspielen.
    Was du eigentlich machen müsstest wäre die Transformation vom Server durchführen zu lassen. Dann würde für den Browser oder für Google oder ... alles so aussehen wie immmer, nämlich reiner HTML-Code.

    MfG
    Rouven

    --
    -------------------
    ss:) zu:) ls:& fo:) de:< va:{ ch:? sh:) n4:( rl:? br:$ js:| ie:) fl:(
    1. Hallo,
      ja, das klingt nach einer Lösung. Nun bin ich schon noch ein Anfänger. Wie sag ich denn dem Server, dass er die Transformation durchführt? Oder muss ich das in den jeweiligen xml bzw. xsl Datein definieren?

      Gruß Kerstin

      Hi,

      wer ist denn bei dir für die Transformation zuständig? Wenn du im Browser noch Zugriff auf den XML-Quelltext hast scheint das ja der Browser zu sein?! Das ist eine ganz heiße Sache, weil das meines Wissens nicht viele Browser mitspielen.
      Was du eigentlich machen müsstest wäre die Transformation vom Server durchführen zu lassen. Dann würde für den Browser oder für Google oder ... alles so aussehen wie immmer, nämlich reiner HTML-Code.

      MfG
      Rouven

      1. Hi,

        ich nehme an in deiner XML-Datei steht im Moment irgendwo sowas wie
        <?xml-stylesheet type="text/xsl" href="test.xsl"?>
        also irgendwie sagst du der Datei welches Stylesheet zu ihr gehört.

        Nun, im Moment geht der Browser hin und liest das. Was du eigentlich brauchst ist eine serverseitige Technik, sei es in PHP/JSP/ASP-Skript oder ein Transformator für CGI. Hast du in deinem Webspace irgendwas davon zur Verfügung?

        Eine einfache ASP-Datei könnte z.B. so aussehen:
        <%
        'Load the XML
        set xml = Server.CreateObject("Microsoft.XMLDOM")
        xml.async = false
        xml.load(Server.MapPath("cd_catalog.xml"))

        'Load the XSL
        set xsl = Server.CreateObject("Microsoft.XMLDOM")
        xsl.async = false
        xsl.load(Server.MapPath("cd_catalog.xsl"))

        Response.Write(xml.transformNode(xsl))
        %>

        MfG
        Rouven

        --
        -------------------
        ss:) zu:) ls:& fo:) de:< va:{ ch:? sh:) n4:( rl:? br:$ js:| ie:) fl:(
        1. Hallo Rouven,
          vielen Dank für das Beispiel. Ja genau, sowas wie <?xml-stylesheet type="text/xsl" href="test.xsl"?> habe ich in den XML's verwendet.

          Ich habe auf dem Webserver PHP und CGI zur Verfügung. Gibt es da nicht schon kleine Tools aus dem Open Source Bereich, die genau diese Transformation tun? Das wäre doch sicher praktisch.

          Es würde wahrscheinlich noch ein anderes Problem lösen. Wir möchten eine Suche einbauen, die die eigenen Seiten aktuell durchsucht (incl. PDFs). Da habe ich für XML auch noch nichts gefunden, jede Menge allerdings für HTML.

          Viele Grüße,
          Kerstin

          1. Hi,

            aber das ist ja alles überhaupt kein Problem (wobei etwas googlen geht nächstes Mal auch selber, gell :-) )
            http://php.linux.pt/manual/en/function.xslt-process.php

            MfG
            Rouven

            --
            -------------------
            ss:) zu:) ls:& fo:) de:< va:{ ch:? sh:) n4:( rl:? br:$ js:| ie:) fl:(
            1. Na klar, aber so ein Tipp ist doch immer noch Gold wert und hilft sich zu orientieren ;-))

              Danke,
              Kerstin

              Hi,

              aber das ist ja alles überhaupt kein Problem (wobei etwas googlen geht nächstes Mal auch selber, gell :-) )
              http://php.linux.pt/manual/en/function.xslt-process.php

              MfG
              Rouven

  2. Hallo,

    ich habe eine technisch recht einfache Site erstellt. Daten werden in *.xml Datein gehalten. Dargestellt wird das Ganze mit *.xsl.

    2 Fragen bekomme ich nicht so recht gelöst.

    Wenn ich meine XML-Datein im Browser aufrufe, wird alles sauber dargestellt. Gehe ich auf 'Quellcode anzeigen', sollte ich nicht wie jetzt das xml-Dokument sehen, sondern eine HTML Seite. Welche Einstellungen sind da erforderlich?

    Da du deine XML/XSLT-Tranformation dem Browser überläßt, ist es normal, dass beim "Quelltext anzeigen" der XML-Code angezeigt wird (schließlich ist der die Quelle).

    Wahrscheinlich hängt dieses Problem auch damit zusammen, dass Google die Seiten im Cache nicht richtig speichern kann.

    Das hatdamit überhaupt nichts zu tun.

    »»Hat jemand Erfahrung, was man bei XML beachten muss, damit man die Seiten von den Suchmaschinen ordentlich indiziert bekommt?

    Eine Tranformation die am Server (und nicht im Browser) ausgeführt wird (siehe auch  die Seite http://de.selfhtml.org/xml/intro.htm#parser) denn dann bekommen alle 'user agents' (Browser, Suchmaschinen, etc.) nur noch das HTML zu sehen.

    Grüße
    Thomas

    --
    Surftip: kennen Sie schon Pipolino's Clowntheater?
    http://www.clowntheater-pipolino.net/