Mitleser: Was bedeutet maschinenlesbar

Beitrag lesen

Das ist doch alles eine Frage der Definition. "Maschinenlesbar" besagt doch schon als begriff, dass die Maschine nur irgendwas lesen können muss.

Wenn Du es darauf runterbrechen möchtest: OK. Aber Encoder schrieb:

Der Inhalt eines pdf ist für Menschen gemacht. In einer Auflistung einer Rechnung sind die einzelnen Positionen für dich gut erkennbar, aber ein Programm tut sich schwer darin eine Struktur zu finden.

Darauf schrieb Jörg Reinholz:

Dem kann man begründet widersprechen. Es gibt genug Programme, die das PDF in Graphikformate oder Postskript umwandeln. Es gibt Programme, die können PDF seitenweise neu zusammensetzen und mehr. Hier mal eine liste von meinem Computer:

Darauf schrieb Mitleser:

Klar kann man Inhalte aus PDFs extrahieren, es ist und bleibt aber eine Krücke.

Wenn Du es jetzt auf die reine Begrifflichkeit Maschinenlesbarkeit reduzieren möchtest, OK. Es passt nur nicht zu Deinem Widerspruch zu Encoders korrekter Aussage, dass ein Programm sich schwer tun wird, einzelne Rechnungspositionen aus einem PDF zu extrahieren.