Der Martin: Externen Link erkennen

Beitrag lesen

Hallo,

Ich würde den Nutzer eher zwingen, absolute IRIs anzugeben, also immer mit Domain, mit oder ohne Protokoll.

die Angabe ohne Protokoll-Präfix und ohne führenden Slash ist zwar allgemein üblich, aber technisch nicht ganz korrekt, was dazu führt, dass sie nicht eindeutig als das erkannt werden kann, was sie sein will.

Dann kommt wieder das Problem wie man herausfindet ob es sich um eine Domain handelt?

Genau, das erfordert eine gewisse Heuristik. Denn in einer Angaber wie "example.org/image.png" ist example.org zwar *sehr wahrscheinlich* als Domainname (Hostname) gemeint, es könnte aber theoretisch auch ein Verzeichnis auf dem lokalen Server sein, also "./example.org". Ein weiterer Stolperstein ist, dass manche Leute das häufige Präfix "www." ebenfalls weglassen, wenn sie eine Webadresse irgendwo angeben, denn "das ist ja sowieso klar".

Vielleicht ein Punkt im ersten Teilstring vor dem Slash?

Der ist ein weiteres kleines Indiz, aber auch kein sicheres. Ja, Benutzereingaben fehlertolerant erkennen, korrekt als das erkennen, als was sie gemeint sind, ist eine echte Herausforderung.

So long,
 Martin

--
F: Was sagt der große Keks zum kleinen Keks?
A: Du kannst dich jetzt verkrümeln.
Selfcode: fo:) ch:{ rl:| br:< n4:( ie:| mo:| va:) de:] zu:) fl:{ ss:) ls:µ js:(