Dings: News auslesen

Beitrag lesen

ich möchte gerne auf dieser Seite http://www.kvb-koeln.de/qr/609/ die "FAHRPLANUNREGELMÄSSIGKEITEN" auslesen.

Ich kam nicht umhin, eine Python-3-Angeberei zusammenzubasteln:

import requests, lxml.html  
  
r = requests.get("http://www.kvb-koeln.de/qr/609/", headers = {"User-Agent": "Mozilla/5.0 (X11; Linux x86_64; rv:24.0) Gecko/20100101 Firefox/24.0"})  
  
if r.status_code != 200:  
	print("Fehler: Server antwortete mit {}.".format(r.status_code))  
else:  
	html = lxml.html.fromstring(r.text)  
	tabelle = html.xpath("//div[@id='content']/div[1]/table[1]")  
  
	if len(tabelle) != 1:  
		print("Fehler: Meldungstabelle nicht auffindbar.")  
	else:  
		print(tabelle[0].text_content().strip())  

Beachte, dass du eine User-Agent-Zeile mit "anständigem" Browser mitschicken musst, der Server verweigert sonst den Zugriff. Automatisierte Abfragen sieht die KVB offenbar nicht so gern.