Lupinius: "Tabelle" auslesen

Salve

Ich würde gerne mit PHP eine Tabelle von einer anderen Seite auslesen und in eine MySQL Datenbank speichern.
Beispiel

Meine Probleme dabei:
1. Ich habe noch nie eine Seite so gezielt auslesen zu lassen versucht. Gibt es da irgendwelche Hilfsmittel/-quellen?
2. Als ich mir den Quelltext an geguckt habe bin ich fast umgekippt. Wer kommt auf so etwas?
Wie könnte ich das ganze trotzdem auslesen?
3. Erhalten würde ich gerne ein 12x5 Felder großes Array. Wie könnte ich so ein Array in einer Datenbank speichern?
Ein Eintrag pro Tabellenfeld wäre meine Idee, aber vermutlich zu kompliziert.

--
sh:( fo:| ch:? rl:( br:> n4:? ie:{ mo:) va:) js:| de:> zu:} fl:| ss:) ls:[  
  1. PHP -> fsockopen und strip_tags

    Schlüsselwörter sind die Zahlen 1 bis 12, sowie Montag und Freitag.

    Wie wär's mit Wochentag und den Zahlen 1 bis 12 als Keyfelder?

    1. PHP -> fsockopen und strip_tags

      Alternativ eignet sich ggf. DOM XML zum parsen der Tabelle.

      1. Hello,

        PHP -> fsockopen und strip_tags

        Alternativ eignet sich ggf. DOM XML zum parsen der Tabelle.

        *mmh*
        Sieht schwierig aus. Mach mal vor.
        Dabei können wir alle nur lernen :-)

        Liebe Grüße aus dem schönen Oberharz

        Tom vom Berg

        --
        Nur selber lernen macht schlau
        http://bergpost.annerschbarrich.de
        1. *mmh*
          Sieht schwierig aus. Mach mal vor.
          Dabei können wir alle nur lernen :-)

          Ich hab' mir auf deinen Einwand den Quelltext der Beispielseite grade angesehen, mich überkommt das blanke Grauen. Mein Rat - die Zeit in die Programmierung einer Leistungsfähigen KI stecken die dann die Tabelle parsen soll :D

          1. »» *mmh*
            »» Sieht schwierig aus. Mach mal vor.
            »» Dabei können wir alle nur lernen :-)

            Ich hab' mir auf deinen Einwand den Quelltext der Beispielseite grade angesehen, mich überkommt das blanke Grauen. Mein Rat - die Zeit in die Programmierung einer Leistungsfähigen KI stecken die dann die Tabelle parsen soll :D

            Sofern du auf die <tr> und <td> Tags gehst, sehe ich keine grossen Probleme, zuordnen zu können zu welcher Spalte / Zeile der aktuelle "Datensatz" gehört. Ich würde dass dann aber als einfacher Algorithmus bezeichnen. KI ist meiner Meinung nach übertrieben ausgedrückt. :)

            1. Hello,

              Sofern du auf die <tr> und <td> Tags gehst, sehe ich keine grossen Probleme, zuordnen zu können zu welcher Spalte / Zeile der aktuelle "Datensatz" gehört.

              Wie sieht denn der Algorithmus aus für die mit rowspan belegten Elemente und für die darunterliegenden? Spannend wird es doch besonsers dann, wenn auch noch HTML-Fehler in der Tabelle sind, also wenn z.B. mal eine Tabellenzelle zuviel oder zu wenig in der Zeile steht. Sowas soll ja schon vorgekommen sein.

              Liebe Grüße aus dem schönen Oberharz

              Tom vom Berg

              --
              Nur selber lernen macht schlau
              http://bergpost.annerschbarrich.de
              1. Hello,

                »» Sofern du auf die <tr> und <td> Tags gehst, sehe ich keine grossen Probleme, zuordnen zu können zu welcher Spalte / Zeile der aktuelle "Datensatz" gehört.

                Wie sieht denn der Algorithmus aus für die mit rowspan belegten Elemente und für die darunterliegenden? Spannend wird es doch besonsers dann, wenn auch noch HTML-Fehler in der Tabelle sind, also wenn z.B. mal eine Tabellenzelle zuviel oder zu wenig in der Zeile steht. Sowas soll ja schon vorgekommen sein.

                Liebe Grüße aus dem schönen Oberharz

                Tom vom Berg

                Natürlich wird es erst dann spannend. Doch zu aller erst würde ich davon ausgehen, dass der Code stimmt. Erweitern auf Fehlerbeständigkeit kannst du danach immer noch. Die Aufgabe scheint mir nicht allzu schwierig. Klar ist es eine Herausforderung, aber durchaus machbar. Auch was Rowspan anbelangt. Schlussendlich ist es nur ein eigens gebauter Interpreter.

            2. Ich würde dass dann aber als einfacher Algorithmus bezeichnen. KI ist meiner Meinung nach übertrieben ausgedrückt. :)

              Das ist mir schon klar - allerdings kann ein Algorithmus immer nur definierte Szenarien abarbeiten. Anders kann eine Heuristik auch undefinierte Dinge finden.

              Einen Sammlung aus guten, aufwändigen Algorithmen und Heuristiken kann man sehrwohl als "schwache KI" bezeichnen. Das ist noch weit entfernt von "echter KI" mit eigenem Bewusstsein.

          2. Hello,

            Ich hab' mir auf deinen Einwand den Quelltext der Beispielseite grade angesehen, mich überkommt das blanke Grauen. Mein Rat - die Zeit in die Programmierung einer Leistungsfähigen KI stecken die dann die Tabelle parsen soll :D

            Ein schönes DB-Erfassungsformular basteln und dann einen ALG-II-Betroffenen suchen, der es täglich kontrolliert und eintippt.

            Ich hätte es aber gerne mal beobachtet, was da mit http://at.php.net/domxml herausgekommen wäre.

            Liebe Grüße aus dem schönen Oberharz

            Tom vom Berg

            --
            Nur selber lernen macht schlau
            http://bergpost.annerschbarrich.de
            1. Ein schönes DB-Erfassungsformular basteln und dann einen ALG-II-Betroffenen suchen, der es täglich kontrolliert und eintippt.

              Das ordne ich unter "Humor" ein. ;)

              1. Hello,

                Ein schönes DB-Erfassungsformular basteln und dann einen ALG-II-Betroffenen suchen, der es täglich kontrolliert und eintippt.

                Das ordne ich unter "Humor" ein. ;)

                Ja danke. Schwarzer Humor.
                Ich wollte erst scheiben "einen Chinesen suchen", aber so langsam müssen wir auch mal an uns denken.

                Und es sollte in keiner Weise irgendwelche Abwertung, weder für Chinesen, noch für Betroffene bei uns, enthalten. Es sollte eher darauf hindeuten, dass durch übertriebene (und hier auch grottenschlechte) Automatisierung viel nutzlose Reibungsverluste entstehen. Früher wurde das per Hand erledigt, hat also Arbeitsplätze geschaffen. Dafür ist heute kein Geld mehr da, weil man ja das Programm davon bezahlen muss, dass diese eklige Tabelle erzeugt. Und wo bleibt das Geld? In USA selbstverständlich!

                Liebe Grüße aus dem schönen Oberharz

                Tom vom Berg

                --
                Nur selber lernen macht schlau