FrankieB: Stoppwortliste

Hallo,

wer kennt eine Zusammenstellung/Liste gängiger Stoppwörter für die deutsche Sprache?

Vielleicht ist der Begriff Stoppwörter auch falsch, was ich meine sind Wörter, welche z.B. in einer einfachen Suche erstmal nicht berücksichtigt werden, also z.B. und, ist, der, die, das, usw.

Wer eine solche Liste zur Verfügung stellen möchte bzw. eine Quelle dazu kennt möge sich bite melden.

Danke.

Grüsse
Frankie

  1. Hi,

    wer kennt eine Zusammenstellung/Liste gängiger Stoppwörter für die deutsche Sprache?

    Vielleicht ist der Begriff Stoppwörter auch falsch, was ich meine sind Wörter, welche z.B. in einer einfachen Suche erstmal nicht berücksichtigt werden, also z.B. und, ist, der, die, das, usw.

    Denka mal selber nach: Artikel und Präpositionen, eventuell noch Personalpronomen.

    Grüße aus Barsinghausen,
    Fabian

    1. Hi,

      Denka mal selber nach: Artikel und Präpositionen, eventuell noch Personalpronomen.

      Natürlich habe ich schon selber nachgedacht, aber vielleicht gibt es ja auch schon eine praxiserprobte Zusammenstellung. Es gibt schliesslich viele Leute welche davon wesentlich mehr Ahnung davon haben als ich.

      Grüsse
      Frankie

      1. Hi,

        Natürlich habe ich schon selber nachgedacht, aber vielleicht gibt es ja auch schon eine praxiserprobte Zusammenstellung. Es gibt schliesslich viele Leute welche davon wesentlich mehr Ahnung davon haben als ich.

        Stimmt. Aber Google wird dir die Liste nicht geben ;-)

        Dazu: Es wird keine allgemeingültige Liste geben. Je nach Zweck werden andere Worte notwendig.

        Tipp: Wenn du ein Wort gefunden zu haben meinst, dann prüf es mit Google, indem du eine Suche nach einer Phrase, die das Wort enthält, durchführst.

        Grüße aus Barsinghausen,
        Fabian

        1. Hi,

          Stimmt. Aber Google wird dir die Liste nicht geben ;-)

          Ich hab' ja auch nicht gegoogelt sondern geselft.

          Dazu: Es wird keine allgemeingültige Liste geben. Je nach Zweck werden andere Worte notwendig.

          Ja, aber es gibt doch Erfahrungswerte, Wortlisten welche z.B. auf der Basis von häufig eingegebenen "Stoppwörtern" beruhen. Natürlich kann ich das auch selbst machen, aber bei einer wenig frequentierten Seite dauert das Ewigkeiten, bis diese Liste einen aussagekräftigen Datenbestand hat.

          Tipp: Wenn du ein Wort gefunden zu haben meinst, dann prüf es mit Google, indem du eine Suche nach einer Phrase, die das Wort enthält, durchführst.

          *kopfschüttel* ... natürlich habe ich das schon gemacht ... aber Du hast mein Anliegen auch noch nicht so recht verstanden. Schade. Ich selbst kann suchen. Es gheht um eine Suche die von _anderen_ ausgeführt werden soll, und da ich nun mal kein Hellseher bin kann ich auch nicht ahnen welche Wörter bzw. Suchbegriffe diese eingeben.

          Grüsse
          Frankie

          1. Hi,

            *kopfschüttel* ... natürlich habe ich das schon gemacht ... aber Du hast mein Anliegen auch noch nicht so recht verstanden. Schade. Ich selbst kann suchen. Es gheht um eine Suche die von _anderen_ ausgeführt werden soll, und da ich nun mal kein Hellseher bin kann ich auch nicht ahnen welche Wörter bzw. Suchbegriffe diese eingeben.

            Nein, das hast du jetzt nicht verstanden. Ich meinte, dass du, wenn du so ein Stoppwort gefunden hast, es überprüfen kannst, indem du bei "für"[1] bei Google nach "Hüte für Hunde"[2] suchst. Wenn Google dann anzeigt "für ist ein häufiges Wort..."., dann scheint das in der Tat ein "Stoppwort" zu sein. Deutlicher?

            [1] Das ist das Wort, dass du für ein Stoppwort hälst.
            [2] Das ist die Phrase, bei der "für" nicht beachtet werden soll.

            Grüße aus Barsinghausen,
            Fabian

            1. Hi,

              Nein, das hast du jetzt nicht verstanden. Ich meinte, dass du, wenn du so ein Stoppwort gefunden hast, es überprüfen kannst, indem du bei "für"[1] bei Google nach "Hüte für Hunde"[2] suchst. Wenn Google dann anzeigt "für ist ein häufiges Wort..."., dann scheint das in der Tat ein "Stoppwort" zu sein. Deutlicher?

              [1] Das ist das Wort, dass du für ein Stoppwort hälst.
              [2] Das ist die Phrase, bei der "für" nicht beachtet werden soll.

              Da ist doch ganau das Problem. "Ich" kann eingeben "was ich will" und die Resultate demenstprechend interpretieren, aber es geht doch um die Eingaben unbekannter Nutzer, deren Suchverhalten ich nicht kenne.

              Grüsse
              Frankie

              1. Hi,

                Nein, das hast du jetzt nicht verstanden. Ich meinte, dass du, wenn du so ein Stoppwort gefunden hast, es überprüfen kannst, indem du bei "für"[1] bei Google nach "Hüte für Hunde"[2] suchst. Wenn Google dann anzeigt "für ist ein häufiges Wort..."., dann scheint das in der Tat ein "Stoppwort" zu sein. Deutlicher?

                [1] Das ist das Wort, dass du für ein Stoppwort hälst.
                [2] Das ist die Phrase, bei der "für" nicht beachtet werden soll.

                Da ist doch ganau das Problem. "Ich" kann eingeben "was ich will" und die Resultate demenstprechend interpretieren, aber es geht doch um die Eingaben unbekannter Nutzer, deren Suchverhalten ich nicht kenne.

                Du musst einfach davon ausgehen, dass für diese Leute die gleichen Stoppwörter gelten. Immerhin geht Google auch davon aus, dass "für" allgemein ein Stoppwort ist.

                Grüße aus Barsinghausen,
                Fabian

                1. hi,

                  Du musst einfach davon ausgehen, dass für diese Leute die gleichen Stoppwörter gelten. Immerhin geht Google auch davon aus, dass "für" allgemein ein Stoppwort ist.

                  Naja, das wusste ich auch schon, hätte ja sein können, daß irgendwer (Du natürlich nicht, zumindest magst Du diese nicht preisgeben) über eine solche Liste verfügt. Selber aufbauen kann ich mir so eine Liste natürlich auch.

                  Vielen Dank.

                  Grüsse
                  Frankie

  2. Hallo,

    wer kennt eine Zusammenstellung/Liste gängiger Stoppwörter für die deutsche Sprache?

    hast du schon mal den Begriff "Stoppwörter" in Google eingegeben? Der erste Treffer ist bei mir eine pdf-Datei, die das zu sein scheint, was du suchst.

    Gruß,
    Peetah

    1. hi,

      hast du schon mal den Begriff "Stoppwörter" in Google eingegeben? Der erste Treffer ist bei mir eine pdf-Datei, die das zu sein scheint, was du suchst.

      Natürlich.

      Konkret geht es mir um Empfehlungen welche auf praxiserprobten Einsatzbeispielen beruhen.

      Naja, ist auch nicht so wichtig. Ich mache es dann halt selbst. Werde meine Erkenntnisse aber auch nicht weitergeben, nein, natürlich werd ich meine Auswertungen weitergeben, aber nur an Personen welche konstruktiv zur Lösung beitragen. "Such bei Google" gehört nicht dazu.

      Grüsse
      Frankie

      1. Hallo FrankieB,

        Naja, ist auch nicht so wichtig. Ich mache es dann halt selbst. Werde meine Erkenntnisse aber auch nicht weitergeben, nein, natürlich werd ich meine Auswertungen weitergeben, aber nur an Personen welche konstruktiv zur Lösung beitragen. "Such bei Google" gehört nicht dazu.

        Dann hast du ein substantielles Problem mit dem Self-Gedanken.

        Grüße aus Barsinghausen,
        Fabian

        1. Hallo Fabian,

          Dann hast du ein substantielles Problem mit dem Self-Gedanken.

          nein, ich habe nur sauer auf den arroganten Hinweis "such' mal bei Google ..." geantwortet. Wenn dies nicht ausreichend deutlich aus meinem Posting hervorging, dann möchte ich die beanstandete Aussage hiermit relativieren und öffentlich verkünden, dass ein persönlicher Angriff gegen Peetah nicht beabsichtigt war.

          Grüsse
          Frankie

          1. Hi Frankie,

            nein, ich habe nur sauer auf den arroganten Hinweis "such' mal bei Google ..." geantwortet. Wenn dies nicht ausreichend deutlich aus meinem Posting hervorging, dann möchte ich die beanstandete Aussage hiermit relativieren und öffentlich verkünden, dass ein persönlicher Angriff gegen Peetah nicht beabsichtigt war.

            Alles klar. Für mich hörte es sich so an, als tätest du Google-Hinweise grundsätzlich als sinnbefreite Besserwisserei ab.

            Grüße aus Barsinghausen,
            Fabian

      2. Hallo Frankie,

        wie soll ich das jetzt verstehen?

        Deine Frage war:

        wer kennt eine Zusammenstellung/Liste gängiger Stoppwörter für die deutsche Sprache?
        [...] also z.B. und, ist, der, die, das, usw.
        Wer eine solche Liste zur Verfügung stellen möchte bzw. eine Quelle dazu kennt möge sich bite melden.

        Mit der Absicht, hilfsbereit zu sein, habe ich in Google einfach mal den Begriff "Stoppwörter" eingegeben und als ersten Treffer ein Ergebnis erhalten, das in der Beschreibung eine Zeile enthält die "a aan als an and at au aus bis by d das de dem den der des det di die" lautet. Das erschien mir genau das zu sein, was du suchst (Liste gängiger Stoppwörter).

        Meine Antwort hast du vielleicht missverstanden, denn ich meinte nicht "Such bei Google, anstatt hier zu fragen", sondern "Hast du schon bei Google den ersten Treffer gesehen, der könnte dir helfen".

        Deine Antwort finde ich persönlich nicht sehr toll, da ich trotz meines guten Willens als nicht "konstruktiv zur Lösung" beitragend abgestempelt werde und gleichzeitig eins ausgewischt bekommen soll, da du mir deine eventuellen wertvollen Auswertungen nicht zur Verfügung stellen willst.

        Gott sei Dank brauche ich erstens keine Stoppwörter-Liste und zweitens wüsste ich ja, wo ich eine herbekommen --> bei Google.

        Gruß,
        Peetah

        1. Hallo Peetah,

          vielleicht hast Du mich mißverstanden. Wenn dies der Fall sein solte tut es mir leid.

          Ich wollte deine Hilsbereitschaft absolut nicht diskreditieren, lediglich der Hinweis auf Google war mir sauer aufgestossen.

          Nix für ungut, Peetah.

          Freundschaft, ja?

          Grüsse

          Frankie

          1. Hallo Frankie,

            Freundschaft, ja?

            alles klar, dann wäre die Sache hiermit erledigt.

            Nächstes Mal rate ich halt zu Altavista... <-- soll ein Scherz sein ;-)

            Gruß,
            Peetah

  3. Hi,

    wer kennt eine Zusammenstellung/Liste gängiger Stoppwörter für die deutsche Sprache?

    Hätten die Herren Kollegensich nicht auf merkwürdige Rechschreibreformen verlassen, wären sie fündig geworden ;-)
    Hier http://www.culturelinks.ch/help/tools/stopwrds.htm ist eine Liste mit Listen.

    Aber mal Scherz beiseite: Logik bringt einen da wirklich weiter:
    Wer braucht denn Stopwörter, frage man sich. Die Antwort ist klar: Suchmaschinen, Textindizierer und andere. Da mandie Stopwortlisten gerne benutzen möchte, muß nicht nur die Liste erhältlich sein, sondern auch die Lizenz stimmen. Eine Suche bei <sourceforge.net> bzw <freshmeat.net> ergibt so einiges aber da ich hinter einem Modem hänge kann ich keine aktuellen Angaben machen, da die Dinger zu groß sind, sie sich nur dafür runterzuladen.
    Einiges habe ich hier, so z.B. swish http://swish-e.org. Die dort eingesetzte Stopwortliste ist von Rainer.Scherg (Rainer.Scherg[hier kommt ein Klammeraffe hin]t-online.de). Da kurz, direkt hier:
    ---snip---
    ab aber als am an auch auf aus
    bei beim bin bis bist
    da dadurch daher dann darum das dass daß dein deine dem den der deren des
    deshalb die dies dieser dieses doch dort du durch
    ein eine einem einen einer eines er es euer eure euren
    für fuer
    haben hatte hatten hattest hattet hätte haette hätten hätten
    hier hinten
    ich ihr ihre im in ist
    ja jede jedem jeden jeder jedes jener jenes jetzt
    kann kannst können könnt könnte konnte koennen koennte könnten koennten
    machen mein meine mit muss muß musst mußt muessen müssen muesst müßt
    muesste müßte
    nach nachdem nein nicht noch nun
    oder
    seid sein seine seit sich sie sind soll sollen sollst sollt solltest
    sonst soweit sowie
    und unser unsere unter über ueber
    vom von vor
    wann warum war waere wäre was weiter weitere welcher welcher
    wenn wer werde werden werdet weshalb
    wie wieder wieso wir wird wirst wo wurde
    zu zum zur zurück
    ---snap---

    Das ist eine recht gute allgemeine Stopwortliste für deutschen Text. Spezielle Listen gibt's bei dem erste Link, den ich ganz oben aufgeführt hatte oder Du mußt Dir eine selber basteln. Das ist relativ einfach: Du brauchst nur eine Korpus der gewünschten Fachliteratur (oder Newsgroup, Fanseite, was weiß ich), der so groß wie möglich sein sollte. Da sortierst Du die Worte absteigend nach Häufigkeit und nimmst die Liste von oben. Du wirst nicht automatisch alle nehmen können, aber so ist es schnell in ein, zwei Minuten getan.
    Auch sollten die Stopwörter einem Stemming unterworfen werden, damit die Liste nicht so lang, wie die oben gepostete wird. Allerdings ist diese Liste wiederum so kurz, das der erforderliche Mehraufwand an Speicher gegenüber der Komplexität eines Stemmings nicht in's Gewicht fällt.

    Vielleicht ist der Begriff Stoppwörter auch falsch, was ich meine sind Wörter, welche z.B. in einer einfachen Suche erstmal nicht berücksichtigt werden, also z.B. und, ist, der, die, das, usw.

    Ja, das nennt man Stopwörter.

    Wer eine solche Liste zur Verfügung stellen möchte bzw. eine Quelle dazu kennt möge sich bite melden.

    Ich habe jetzt einfach mal Deutsch angenommen. Aber bei o.a. Quelle (Swish-e) gibt es noch Stopwortlisten für niederländisch, spanisch und englisch. Wenn Du mehr brauchst, muß Du wahrscheinlich nur rauskriegen, was "Stopwort" und "Liste" in der gewünschten Sprache heißt ;-)

    Ah, hier http://www.gragert.de/magister/anhang_b.html ist auch noch eine.

    so short

    Christoph Zurnieden

    1. Hallo Christoph,

      vielen Dank für deine ausführliche Antwort.

      Hätten die Herren Kollegensich nicht auf merkwürdige Rechschreibreformen verlassen, wären sie fündig geworden ;-)

      Stimmt, das habe ich zugegebenermaßen nicht beachtet ;-)

      Ok, etwas später werde ich deinen Links folgen und mich intensiver in die Thematik einarbeiten.

      Grüsse
      Frankie

      1. Hi,

        vielen Dank für deine ausführliche Antwort.

        Hätten die Herren Kollegensich nicht auf merkwürdige Rechschreibreformen verlassen, wären sie fündig geworden ;-)

        Stimmt, das habe ich zugegebenermaßen nicht beachtet ;-)

        Ja, das passiert schon mal, kann mir auch passieren und ist es oft genug. Nur nie mit der _neuen_ Rechtschreibung ;-)

        Ok, etwas später werde ich deinen Links folgen und mich intensiver in die Thematik einarbeiten.

        Wenn Du so einen Wordsucher für die eigene Liste brauchst, ich hätte einen da, einfach mal fragen. (Könnte ich auch hochladen, aber da ist im Augenblick eher ... äh ... wenig Platz ;-)

        so short

        Christoph Zurnieden

        1. Hallo Christoph,

          Wenn Du so einen Wordsucher für die eigene Liste brauchst, ich hätte einen da, einfach mal fragen. (Könnte ich auch hochladen, aber da ist im Augenblick eher ... äh ... wenig Platz ;-)

          Danke für das Angebot, nehme ich gerne an, meine E-Mail steht ja oben. Würde mich freuen, wenn Du mir diese Liste bei Gelegenheit schickst.

          Was mich bei den - Dank deiner Hilfe - gefundenen Stopwort-Listen jedoch wundert ist, daß diese doch wesentlicher kürzer sind als ich es erwartet hatte. Das soll keine Kritik an diesen Listen sein, mir ist's sogar recht wenn die Liste kurz ist.

          so short

          so long

          Frankie

          1. Hi,

            Wenn Du so einen Wordsucher für die eigene Liste brauchst, ich hätte einen da, einfach mal fragen. (Könnte ich auch hochladen, aber da ist im Augenblick eher ... äh ... wenig Platz ;-)

            Danke für das Angebot, nehme ich gerne an, meine E-Mail steht ja oben. Würde mich freuen, wenn Du mir diese Liste bei Gelegenheit schickst.

            Das ist nur der Generator, keine Liste, die müßtest Du Dir dann selber bauen ;-)
            Aber mit einer fertigen Häufigkeitsverteilung ist das je wirklich nur noch C&P.

            Da ich im Augenblick meinen Webspace überstrapaziert habe (der noch nicht einmal mir, sondern meiner kleinen Schwester gehört ;-) wäre es nett, wenn Du den Code irgendwo bei Dir auf die Seite stellen könntest, auf das Google ihn fände. Sind nur 4309 Bytes, das paßt wahrscheinlich nur bei mir nicht mehr drauf ;-)

            Was mich bei den - Dank deiner Hilfe - gefundenen Stopwort-Listen jedoch wundert ist, daß diese doch wesentlicher kürzer sind als ich es erwartet hatte. Das soll keine Kritik an diesen Listen sein, mir ist's sogar recht wenn die Liste kurz ist.

            Es sind größtenteils _allgemeine_ Listen, die sind alle so kurz. Erst wenn Du spezielle Listen anfertigst kannst Du die länger machen. Aber das lohnt meist nicht, da kannst Du dann eher die Sache umkehren und eine Liste von Wörtern anfertigen, nachdenen Du suchst.

            so short

            Christoph Zurnieden