samtux: docx auslesen

Hallo!
Ich habe eine .docx Worddatei. In dieser befindet sich Text und eine Tabelle.

Meine Frage ist nun, ob es möglich ist mit PHP die Inhalte der Zellen der Tabelle auszulesen.

samtux

  1. Moin,

    Meine Frage ist nun, ob es möglich ist mit PHP die Inhalte der Zellen der Tabelle auszulesen.

    Eventuell wäre Docvert was für dich.

    Grüße Marco

    --
    Ich spreche Spaghetticode - fließend.
  2. Hallo samtux,

    Ich habe eine .docx Worddatei. In dieser befindet sich Text und eine Tabelle.

    Meine Frage ist nun, ob es möglich ist mit PHP die Inhalte der Zellen der Tabelle auszulesen.

    Das OOXML-Format .docx ist ein ZIP-Container. Das eigentliche Inhaltsdokument liegt unter word/document.xml. Dieses lässt sich extrahieren und mittels Ansätzen wie XSLT oder SimpleXML verarbeiten, was letztlich von den konkreten Inhalten in der XML-Struktur abhängt.

    Grüße,
    Thomas

    1. Hallo samtux,

      Ich habe eine .docx Worddatei. In dieser befindet sich Text und eine Tabelle.

      Meine Frage ist nun, ob es möglich ist mit PHP die Inhalte der Zellen der Tabelle auszulesen.

      Das OOXML-Format .docx ist ein ZIP-Container. Das eigentliche Inhaltsdokument liegt unter word/document.xml. Dieses lässt sich extrahieren und mittels Ansätzen wie XSLT oder SimpleXML verarbeiten, was letztlich von den konkreten Inhalten in der XML-Struktur abhängt.

      Grüße,
      Thomas

      Gibt es das irgendeine fertige Klasse? Die XML-Datei ist ja mehr als komplex...

      1. Mahlzeit,

        Gibt es das irgendeine fertige Klasse? Die XML-Datei ist ja mehr als komplex...

        Das hätte Google schnell beantwortet.

        http://simpleooxml.codeplex.com/
        http://www.phpdocx.com/

        Um nur die ersten beiden Suchtreffer zu nennen ...

        --
        42
        1. http://simpleooxml.codeplex.com/
          http://www.phpdocx.com/

          So wie ich das lese, erstellt das .docx Dateien. Ich möchte sie jedoch lesen.

          1. Mahlzeit,

            So wie ich das lese, erstellt das .docx Dateien. Ich möchte sie jedoch lesen.

            Zumindest beim ersten Link heisst es, sie kann man auch modifizieren. Und IMO gehört zum Modifizieren auch das Lesen.

            Ansonsten bietet Google auch noch den einen oder anderen zusätzlichen Link zum Thema.

            --
            42
          2. Hallo samtux,

            http://simpleooxml.codeplex.com/
            http://www.phpdocx.com/
            So wie ich das lese, erstellt das .docx Dateien. Ich möchte sie jedoch lesen.

            Vielleicht hilft PHP OpenXML API. Dort gibt es auch Code für Tabellen.

            Grüße,
            Thomas