207 Wortformen in der deutschen Schriftsprache machen 50% der ganzen Schriftsprache aus (Quelle Wikipedia). Wer also 207 Wörter schreiben kann, kann schon die hälfte des deutschen Textes schreiben. Für einen Textparser brauchte ich eine Java Methode die checkt, ob ein Wort in dieser Liste ist.
Also mal eben eine Java-Zweizeiler um das zu überprüfen.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 |
/** * Testet ob das Wort eines der 207 häufigsten in der Deutschen Sprache ist * * @param wort das zu überprüfende Word * @return true wenn das Wort eines der TOP 207 Wörte ist, sonst false */ public static boolean isTop207DeWort(String wort) { // 207 Häufigsten Wörter in Deutschland // https://de.wikipedia.org/wiki/Liste_der_h%C3%A4ufigsten_W%C3%B6rter_der_deutschen_Sprache // das sind gleich 50% des Textes ArrayList<String> stopWoerter = new ArrayList<>(Arrays.asList("die", "der", "und", "in", "zu", "den", "das", "nicht", "von", "sie", "ist", "des", "sich", "mit", "dem", "dass", "er", "es", "ein", "ich", "auf", "so", "eine", "auch", "als", "an", "nach", "wie", "im", "für", "man", "aber", "aus", "durch", "wenn", "nur", "war", "noch", "werden", "bei", "hat", "wir", "was", "wird", "sein", "einen", "welche", "sind", "oder", "zur", "um", "haben", "einer", "mir", "über", "ihm", "diese", "einem", "ihr", "uns", "da", "zum", "kann", "doch", "vor", "dieser", "mich", "ihn", "du", "hatte", "seine", "mehr", "am", "denn", "nun", "unter", "sehr", "selbst", "schon", "hier", "bis", "habe", "ihre", "dann", "ihnen", "seiner", "alle", "wieder", "meine", "zeit", "gegen", "vom", "ganz", "einzelnen", "wo", "muss", "ohne", "eines", "können", "sei", "ja", "wurde", "jetzt", "immer", "seinen", "wohl", "dieses", "ihren", "würde", "diesen", "sondern", "weil", "welcher", "nichts", "diesem", "alles", "waren", "will", "herr", "viel", "mein", "also", "soll", "worden", "lassen", "dies", "machen", "ihrer", "weiter", "leben", "recht", "etwas", "keine", "seinem", "ob", "dir", "allen", "großen", "jahre", "weise", "müssen", "welches", "wäre", "erst", "einmal", "mann", "hätte", "zwei", "dich", "allein", "herren", "während", "paragraph", "anders", "liebe", "kein", "damit", "gar", "hand", "herrn", "euch", "sollte", "konnte", "ersten", "deren", "zwischen", "wollen", "denen", "dessen", "sagen", "bin", "menschen", "gut", "darauf", "wurden", "weiß", "gewesen", "Seite", "bald", "weit", "große", "solche", "hatten", "eben", "andern", "beiden", "macht", "sehen", "ganze", "anderen", "lange", "wer", "ihrem", "zwar", "gemacht", "dort", "kommen", "welt", "heute", "frau", "werde", "derselben", "ganzen", "deutschen", "lässt", "vielleicht", "meiner")); return stopWoerter.contains(wort.toLowerCase()); } |
Und zwei kleine JUnit 5 Test Methoden. Das Wort Liebe ist auch in der TOP-207-Liste enthalten. Also „Die Liebe versagt nie!“ und kommt häufig vor 😉 …
Alles GRÜN:
Love never fails! …