samtux: docx auslesen

Beitrag lesen

Hallo samtux,

Ich habe eine .docx Worddatei. In dieser befindet sich Text und eine Tabelle.

Meine Frage ist nun, ob es möglich ist mit PHP die Inhalte der Zellen der Tabelle auszulesen.

Das OOXML-Format .docx ist ein ZIP-Container. Das eigentliche Inhaltsdokument liegt unter word/document.xml. Dieses lässt sich extrahieren und mittels Ansätzen wie XSLT oder SimpleXML verarbeiten, was letztlich von den konkreten Inhalten in der XML-Struktur abhängt.

Grüße,
Thomas

Gibt es das irgendeine fertige Klasse? Die XML-Datei ist ja mehr als komplex...