ich möchte gerne auf dieser Seite http://www.kvb-koeln.de/qr/609/ die "FAHRPLANUNREGELMÄSSIGKEITEN" auslesen.
Ich kam nicht umhin, eine Python-3-Angeberei zusammenzubasteln:
import requests, lxml.html
r = requests.get("http://www.kvb-koeln.de/qr/609/", headers = {"User-Agent": "Mozilla/5.0 (X11; Linux x86_64; rv:24.0) Gecko/20100101 Firefox/24.0"})
if r.status_code != 200:
print("Fehler: Server antwortete mit {}.".format(r.status_code))
else:
html = lxml.html.fromstring(r.text)
tabelle = html.xpath("//div[@id='content']/div[1]/table[1]")
if len(tabelle) != 1:
print("Fehler: Meldungstabelle nicht auffindbar.")
else:
print(tabelle[0].text_content().strip())
Beachte, dass du eine User-Agent-Zeile mit "anständigem" Browser mitschicken musst, der Server verweigert sonst den Zugriff. Automatisierte Abfragen sieht die KVB offenbar nicht so gern.