Hallo,
wie ich auch schon in der englischem Gruppe gesagt habe, gibt es bisher nur Englische und Schwedische Stopp-Worte (Wörter, die im Index nicht berücksichtigt werden sollen).
Dies ist nun die Liste, die ich zusammengestellt habe:
--- 8< ---
# adding stop words
$noadd=array_merge($noadd, array("", "ab", "aber", "abk.", "alle", "allem", "allen", "aller", "alles", "allg.", "als", "also", "am", "an", "andere", "anderem", "anderen", "anderer", "anderes", "andern", "anders", "auch", "auf", "aus", "bei", "bes.", "bez.", "bin", "bis", "bist", "bspw.", "da", "daher", "damit", "dann", "das", "daß", "dass", "dasselbe", "dazu", "dein", "deine", "deinem", "deinen", "deiner", "deines", "dem", "demselben", "den", "denn", "denselben", "der", "derer", "derselbe", "derselben", "des", "deshalb", "desselben", "dessen", "dich", "die", "dies", "diese", "dieselbe", "dieselben", "diesem", "diesen", "dieser", "dieses", "dir", "doch", "dort", "dt.", "du", "durch", "edv", "ehem.", "eigtl.", "ein", "eine", "einem", "einen", "einer", "eines", "einig", "einige", "einigem", "einigen", "einiger", "einiges", "einmal", "er", "es", "etc.", "etwas", "euch", "euer", "eure", "eurem", "euren", "eurer", "eures", "für", "ganz", "ganze", "ganzen", "ganzer", "ganzes", "gegen", "ggf.", "hat", "hier", "hin", "hinter", "ich", "ihm", "ihn", "ihnen", "ihr", "ihre", "ihrem", "ihren", "ihrer", "ihres", "im", "in", "indem", "ins", "ist", "ja", "jede", "jedem", "jeden", "jeder", "jedes", "jene", "jenem", "jenen", "jener", "jenes", "jetzt", "kann", "kein", "keine", "keinem", "keinen", "keiner", "keines", "können", "konnte", "könnte", "mache", "machst", "macht", "machte", "man", "manche", "manchem", "manchen", "mancher", "manches", "mein", "meine", "meinem", "meinen", "meiner", "meines", "mich", "mir", "mit", "nach", "nein", "nicht", "nichts", "noch", "nun", "nur", "o.ä.", "o.g.", "ob", "oder", "ohne", "sein", "seine", "seinem", "seinen", "seiner", "seines", "selbst", "sich", "sicher", "sie", "sind", "so", "solche", "solchem", "solchen", "solcher", "solches", "sollte", "sondern", "u.a.", "u.ä.", "u.g.", "über", "ugs.", "um", "und", "uns", "unser", "unter", "uvm.", "vgl.", "viel", "vielleicht", "vom", "von", "vor", "während", "wann", "warum", "was", "weg", "weil", "weiter", "welche", "welchem", "welchen", "welcher", "welches", "wenn", "wer", "wie", "wieder", "wir", "wo", "z.b.", "zu", "zum", "zur", "zwar"));
--- 8< ---
Mit der Bitte um Feedback.
Cheers,
Rudy
Hallo
Hallo zusammen,
Ergänzungsvorschlag:
-------------
anstatt
aufgrund
dich
gemäß
kaum
schon
sowie
statt
-------------
gruß
Philip
Guter Vorschlag
Hi Rudy,
vielen Dank für das Erarbeiten. Ich finde den Vorschlag gut und bin gespannt, was die anderen dazu meinen. Zur Info: Die Stopp-Worte sind die Worte, die beim Indizieren und beim Suchen automatisch gefiltert werden, damit nur inhaltlich Relevantes berücksichtigt wird.
An dieser Stelle sei auch noch einmal auf die Quelle (deutsche Version) hingewiesen, die Henrik bereits für die Schwedische Liste benutzt hat. Dort gibt es noch etwas Inspiration.
Viele Grüße
Stefan