bleicher: Sonderzeichen ohne & umschreiben

Шалом, друзі!
gaanz kurze Frage - ist es möglich Sonderzeichen (&,Ü etc.) artgerecht zu umschreiben OHNE das & enthalten ist (also nicht & und änliches)
DiV
MFG
bleicher

--
__________________________-
Menschen an sich , sind nicht schlecht - es sind nur ihre Taten (c).
  1. Hallo,

    gaanz kurze Frage - ist es möglich Sonderzeichen (&,Ü etc.) artgerecht zu umschreiben OHNE das & enthalten ist (also nicht & und änliches)

    Ich nehme mal an, dass der Context html ist, dann würde ich antworten mit: Nein, ist mir nicht bekannt. Sonst müsste es ja eine andere „Escapesequenz“ als & geben, auch im xml-Context und dort gibt es nur die reservierten Zeichen & < > und "

    Aber andererseits: Warum überhaupt kodieren? Wenn das Charset definiert ist und die verwendeten Nicht-Asciizeichen in diesem Charset kodiert sind, gibt es auch keine Probleme (im Context html)

    Gruß
    Olaf

    1. & in links ist invalid.
      und das & durch &amp; z uerstezen verursacht bei mir unter umstände &amp;amp;amp; :( (strreplace x 3)
      MFG
      bleicher

      --
      __________________________-
      Menschen an sich , sind nicht schlecht - es sind nur ihre Taten (c).
      1. Hi,

        und das & durch &amp; z uerstezen verursacht bei mir unter umstände &amp;amp;amp; :( (strreplace x 3)

        das ist aber ein Problem Deiner Logik. "&" ist in HTML *immer* ein Sonderzeichen - im Gegensatz zu Umlauten, die lediglich eine Frage der Zeichenkodierung sind - und müssen *immer* maskiert werden, sofern sie nicht in ihrer Sonderbedeutung gemeint sind.

        Cheatah

        --
        X-Self-Code: sh:( fo:} ch:~ rl:° br:> n4:& ie:% mo:) va:) de:] zu:) fl:{ ss:) ls:~ js:|
        X-Self-Code-Url: http://emmanuel.dammerer.at/selfcode.html
        X-Will-Answer-Email: No
        X-Please-Search-Archive-First: Absolutely Yes
        1. yohoo..ws bleibt mir denn?regexp's sind da wie türklinke am sattel :(
          dan wäre das JS oder PHP freage - wie kan ich &/ö etc maskieren OHNE das das gane bei 2em durchlauf durcheinander kommt :( wobei ich das gefühl ahbe das JS eher geigent ist.
          Wäre es möglich & gleich beim eintippen in textarea in &amp; umzuwandeln?
          MFG
          bleicher

          --
          __________________________-
          Menschen an sich , sind nicht schlecht - es sind nur ihre Taten (c).
          1. n'abend,

            yohoo..ws bleibt mir denn?regexp's sind da wie türklinke am sattel :(
            dan wäre das JS oder PHP freage - wie kan ich &/ö etc maskieren OHNE das das gane bei 2em durchlauf durcheinander kommt :( wobei ich das gefühl ahbe das JS eher geigent ist.

            überlege dir welche & du durch &amp; ersetzen willst.
            Ampersands (&), auf die ein paar Zeichen und ein Semikolon folgen (sprich HTML Entität), wirst du i.d.R. nicht maskieren wollen.

            weiterhin schönen abend...

            --
            Freundlich wie man war, hat man mir Großbuchstaben geschenkt.
            sh:( fo:# ch:# rl:° br:> n4:& ie:{ mo:} va:) de:] zu:} fl:{ ss:? ls:[ js:|
            1. genau - deswegen die frage ob ich den & maskiere (mit JS) wen ich denn über die Tastatur in Textarea eingebe. oder hast du das ganze oben nicht gelesen?
              MFG
              bleicher

              --
              __________________________-
              Menschen an sich , sind nicht schlecht - es sind nur ihre Taten (c).
              1. Hallo,

                genau - deswegen die frage ob ich den & maskiere (mit JS) wen ich denn über die Tastatur in Textarea eingebe.

                wozu willst du _überhaupt_ irgendwas maskieren oder codieren, was jemand in ein <textarea> eingibt? Das ist Text in Reinform, den man im Idealfall auch genau so weiterverarbeiten möchte. Hier etwas umzuschreiben, wäre nicht nur unnötig, sondern meistens auch kontraproduktiv.

                So long,
                 Martin

                --
                Irgendwann in grauer Vorzeit benutzte einer unserer prähistorischen Vorfahren ein Schimpfwort anstelle der Keule.
                Die Zivilisation hatte begonnen.
                1. Hallo,
                  zu dem Thema habe ich auch eine Frage.
                  Ich denke ich muss da keinen neuen Thread aufmachen.
                  Welche Form ist die geeignetere, um Sonderzeichen (insbes. fremdsprachliche Buchstaben) darzustellen,
                  z.B. für à:
                   Name in HTML (&agrave;) oder Unicode in HTML (&#224;)  ?

                  1. Hi Ricardo,

                    Welche Form ist die geeignetere, um Sonderzeichen (insbes. fremdsprachliche Buchstaben) darzustellen, z.B. für à:
                    Name in HTML (&agrave;) oder Unicode in HTML (&#224;)  ?

                    weder das eine noch das andere. Wenn du ein à darstellen willst, schreib auch ein à hin. Solange du eine Zeichencodierung verwendest, die dieses Zeichen enthält (z.B. ISO-8859-1 oder Windows-1252 oder UTF-8), ist alles in Ordnung.

                    Übrigens hat die Schreibweise &#224; nichts mit Unicode zu tun - es ist einfach nur eine numerische Zeichenreferenz.

                    Schönen Abend noch,
                     Martin

                    --
                    Man sollte immer wissen was man sagt
                     - aber auf keinen Fall alles sagen, was man weiß.
                    1. Hi Martin

                      Übrigens hat die Schreibweise &#224; nichts mit Unicode zu tun - es ist einfach nur eine numerische Zeichenreferenz.

                      Da habe ich nur die Begriffe aus
                      SELFHTML
                       verwendet. Ist also SEFHTML an der Stelle fehlerhaft?
                      Gruß Ricardo

                    2. Hi Martin, nochmals ich.

                      weder das eine noch das andere. Wenn du ein à darstellen willst, schreib auch ein à hin. Solange du eine Zeichencodierung verwendest, die dieses Zeichen enthält (z.B. ISO-8859-1 oder Windows-1252 oder UTF-8), ist alles in Ordnung.

                      Falls aber doch irgendwann eine andere Codierung notwendig wäre, müsste alles geändert werden.
                      Dann wäre doch die Zeichencodierung der sicherere Weg, nur dann welche von beiden Codierungen?
                      Gruß
                      Ricardo

                      1. Hello out there!

                        Falls aber doch irgendwann eine andere Codierung notwendig wäre, müsste alles geändert werden.

                        Warum sollte irgendwann eine andere Codierung notwendig werden? UTF-8 und gut is’.

                        Dann wäre doch die Zeichencodierung der sicherere Weg, nur dann welche von beiden Codierungen?

                        HIer meinst du nicht „Zeichencodierung“, sondern „Zeichenreferenz“: Entity-Referenz vs. numerische. Beide sind gleich sicher.

                        Beide sind gleich unnötig.

                        Eine macht den Quelltext besser lesbar.

                        See ya up the road,
                        Gunnar

                        --
                        “Remember, in the end, nobody wins unless everybody wins.” (Bruce Springsteen)
                        1. Hi,

                          Warum sollte irgendwann eine andere Codierung notwendig werden? UTF-8 und gut is’.

                          Wird UTF-8 auch von älteren Browsern erkannt?
                          Gruß
                          Ricardo

                          1. Ergänzung:

                            Und wie kann ich die alten Programme einfach konvertieren?

                    3. Hello out there!

                      Unicode in HTML

                      Übrigens hat die Schreibweise &#224; nichts mit Unicode zu tun

                      Ähm naja ...

                      es ist einfach nur eine numerische Zeichenreferenz.

                      ... auf das Zeichen Nr. 224 in der Unicode-Zeichentabelle.

                      Übrigens heißt es in der http://de.selfhtml.org/html/referenz/zeichen.htm@title=HTML-Zeichenreferenz in SELFHTML „Unicode in HTML“. Ich finde die Spaltenüberschrift aber auch nicht gut.

                      Und noch blöder finde ich, dass dort die unsinnigen dezimalen Zeichenreferenzen angegeben werden, nicht aber die, die man braucht: die hexadezimalen.

                      See ya up the road,
                      Gunnar

                      --
                      “Remember, in the end, nobody wins unless everybody wins.” (Bruce Springsteen)
                      1. n'Abend Gunnar,

                        Übrigens hat die Schreibweise &#224; nichts mit Unicode zu tun
                        Ähm naja ...

                        es ist einfach nur eine numerische Zeichenreferenz.
                        ... auf das Zeichen Nr. 224 in der Unicode-Zeichentabelle.

                        ich habe diese kritische Anmerkung schon erwartet - und zwar genau von dir. ;-)
                        Deswegen habe ich auch ganz bewusst formuliert "die Schreibweise" habe nichts mit Unicode zu tun. Der Code des damit ausgedrückten Zeichens natürlich schon.

                        Und noch blöder finde ich, dass dort die unsinnigen dezimalen Zeichenreferenzen angegeben werden, nicht aber die, die man braucht: die hexadezimalen.

                        ACK.

                        Schönen Abend noch,
                         Martin

                        --
                        F: Was ist schneller: Das Licht oder der Schall?
                        A: Offensichtlich der Schall. Wenn man den Fernseher einschaltet, kommt immer erst der Ton, und dann erst das Bild.
                  2. Hello out there!

                    zu dem Thema habe ich auch eine Frage.
                    Ich denke ich muss da keinen neuen Thread aufmachen.

                    Endlich mal einer, der mitdenkt. ;-)

                    Welche Form ist die geeignetere, um Sonderzeichen (insbes. fremdsprachliche Buchstaben) darzustellen,
                    z.B. für à:

                    'à'.

                    “It is almost always preferable to use an encoding that allows you to represent the characters in their normal form, rather than using character entities or NCRs.” [QA-ESCAPES]

                    Name in HTML (&agrave;) oder Unicode in HTML (&#224;)  ?

                    Wenn’s denn schon eine Zeichenreferenz sein soll; welche wäre denn im Quelltext besser lesbar?

                    See ya up the road,
                    Gunnar

                    --
                    “Remember, in the end, nobody wins unless everybody wins.” (Bruce Springsteen)
                2. wozu willst du _überhaupt_ irgendwas maskieren oder codieren, was jemand in ein <textarea> eingibt? Das ist Text in Reinform, den man im Idealfall auch genau so weiterverarbeiten möchte. Hier etwas umzuschreiben, wäre nicht nur unnötig, sondern meistens auch kontraproduktiv.

                  erklär das dem w3validator!
                  der freut sich über nicht utf-8 seiten nicht :(
                  meine homepage sit ein blog in beta phase momentan) und wen ich neue einträge einfüge , will ich die seite dennoch valid halten.
                  (hätte sich der validator nicht beklagt - war ein hinweis hoer im forum - hätte ich es auch "im originalzustand" gelassen)

                  MFG
                  bleicher

                  --
                  __________________________-
                  Menschen an sich , sind nicht schlecht - es sind nur ihre Taten (c).
                  1. Hello out there!

                    erklär das dem w3validator!
                    der freut sich über nicht utf-8 seiten nicht :(

                    Das ist Quatsch.

                    Allerdings freut er sich nicht, wenn angegebene und tatsächlich verwendete Codierung nicht übereinstimmen – zurecht.

                    See ya up the road,
                    Gunnar

                    --
                    “Remember, in the end, nobody wins unless everybody wins.” (Bruce Springsteen)
                  2. Hallo,

                    wozu willst du _überhaupt_ irgendwas maskieren oder codieren, was jemand in ein <textarea> eingibt? Das ist Text in Reinform, den man im Idealfall auch genau so weiterverarbeiten möchte. Hier etwas umzuschreiben, wäre nicht nur unnötig, sondern meistens auch kontraproduktiv.
                    erklär das dem w3validator!

                    was hat der mit Text zu tun, den jemand in eine textarea eingibt? Das sind Daten, die der Validator nie zu sehen bekommt. Erst wenn du diese Texte in einer Datenbank (egal welche) speicherst, wieder ausliest und als HTML ausgibst, solltest du sie für die Ausgabe als HTML aufbereiten. Nicht vorher.

                    der freut sich über nicht utf-8 seiten nicht :(

                    Wenn sie korrekt gelabelt sind, ist das völlig okay. Will sagen: Liefere dein Dokument in irgendeiner beliebigen anderen Codierung (nicht UTF-8) aus, gib diese verwendete Codierung korrekt im HTTP-Header an und zur Sicherheit auch noch im meta-Element. Dann ist der Validator auch damit zufrieden.

                    meine homepage sit ein blog in beta phase momentan) und wen ich neue einträge einfüge , will ich die seite dennoch valid halten.

                    Das bestätigt, was ich vorher schon sagte: Codiere die Texte angemessen, wenn du sie als HTML wieder ausgibst. Nicht vorher.

                    So long,
                     Martin

                    --
                    Ungeschehene Ereignisse können einen katastrophalen Mangel an Folgen nach sich ziehen.
                      (Unbekannter Politiker)
          2. Hi,

            yohoo..ws bleibt mir denn?regexp's sind da wie türklinke am sattel :(
            dan wäre das JS oder PHP freage - wie kan ich &/ö etc maskieren OHNE das das gane bei 2em durchlauf durcheinander kommt :(

            es gibt keinen zweiten Durchlauf. Führe eine kontextspezifische Kodierung genau dann durch, wenn Du einen Wert in einen Kontext bringst. Nicht früher, nicht später, nicht zwischendurch. Einen zweiten Durchlauf gibt es dann höchstens, wenn Du HTML-Code z.B. als Attributwert im <input value="..."/> haben möchtest - und dann ist die zweite Kodierung auch zwingend nötig.

            Wäre es möglich & gleich beim eintippen in textarea in &amp; umzuwandeln?

            Das wäre Unsinn. Der Wert wurde nicht in einen HTML-Kontext gebracht.

            Cheatah

            --
            X-Self-Code: sh:( fo:} ch:~ rl:° br:> n4:& ie:% mo:) va:) de:] zu:) fl:{ ss:) ls:~ js:|
            X-Self-Code-Url: http://emmanuel.dammerer.at/selfcode.html
            X-Will-Answer-Email: No
            X-Please-Search-Archive-First: Absolutely Yes
      2. & in links ist invalid.

        Ampersands in URI attribute values

      3. Hello out there!

        & in links ist invalid.

        Deshalb ist es ja auch ratsam, in Queries ';' statt '&' als Trennzeichen zu verwenden. HTML401 §B.2.2]

        See ya up the road,
        Gunnar

        --
        “Remember, in the end, nobody wins unless everybody wins.” (Bruce Springsteen)
      4. Hallo bleicher,

        & in links ist invalid.
        und das & durch &amp; z uerstezen verursacht bei mir unter umstände &amp;amp;amp; :( (strreplace x 3)

        warum ersetzt Du das & mehrmals hintereinander, dass es zu diesem Phänomen kommt?

        Gruß
        Olaf