{"id":13319,"date":"2019-07-05T05:05:11","date_gmt":"2019-07-05T03:05:11","guid":{"rendered":"http:\/\/blog.wenzlaff.de\/?p=13319"},"modified":"2019-07-15T20:31:52","modified_gmt":"2019-07-15T18:31:52","slug":"207-wortformen-in-der-deutschen-schriftsprache-machen-50-der-ganzen-schriftsprache-aus","status":"publish","type":"post","link":"http:\/\/blog.wenzlaff.de\/?p=13319","title":{"rendered":"207 Wortformen in der deutschen Schriftsprache machen 50% der ganzen Schriftsprache aus!"},"content":{"rendered":"<p>207 Wortformen in der deutschen Schriftsprache machen 50% der ganzen Schriftsprache aus (Quelle <a href=\"https:\/\/de.wikipedia.org\/wiki\/Liste_der_h%C3%A4ufigsten_W%C3%B6rter_der_deutschen_Sprache\" rel=\"noopener noreferrer\" target=\"_blank\">Wikipedia<\/a>). Wer also 207 W\u00f6rter schreiben kann, kann schon die h\u00e4lfte des deutschen Textes schreiben. F\u00fcr einen Textparser brauchte ich eine Java Methode die checkt, ob ein Wort in dieser Liste ist.<\/p>\n<p><a href=\"http:\/\/blog.wenzlaff.de\/wp-content\/uploads\/2019\/06\/Die-liebe-versagt-nie-2019.png\"><img loading=\"lazy\" decoding=\"async\" src=\"http:\/\/blog.wenzlaff.de\/wp-content\/uploads\/2019\/06\/Die-liebe-versagt-nie-2019.png\" alt=\"Love never fails\" width=\"2732\" height=\"2048\" class=\"aligncenter size-full wp-image-13320\" srcset=\"http:\/\/blog.wenzlaff.de\/wp-content\/uploads\/2019\/06\/Die-liebe-versagt-nie-2019.png 2732w, http:\/\/blog.wenzlaff.de\/wp-content\/uploads\/2019\/06\/Die-liebe-versagt-nie-2019-300x225.png 300w, http:\/\/blog.wenzlaff.de\/wp-content\/uploads\/2019\/06\/Die-liebe-versagt-nie-2019-768x576.png 768w, http:\/\/blog.wenzlaff.de\/wp-content\/uploads\/2019\/06\/Die-liebe-versagt-nie-2019-1024x768.png 1024w\" sizes=\"auto, (max-width: 767px) 89vw, (max-width: 1000px) 54vw, (max-width: 1071px) 543px, 580px\" \/><\/a><\/p>\n<p>Also mal eben eine Java-Zweizeiler um das zu \u00fcberpr\u00fcfen.<!--more--><\/p>\n<pre class=\"lang:java decode:true \" >\r\n       \/**\r\n\t * Testet ob das Wort eines der 207 h\u00e4ufigsten in der Deutschen Sprache ist\r\n\t * \r\n\t * @param wort das zu \u00fcberpr\u00fcfende Word\r\n\t * @return true wenn das Wort eines der TOP 207 W\u00f6rte ist, sonst false\r\n\t *\/\r\n\tpublic static boolean isTop207DeWort(String wort) {\r\n\r\n\t\t\/\/ 207 H\u00e4ufigsten W\u00f6rter in Deutschland\r\n\t\t\/\/ https:\/\/de.wikipedia.org\/wiki\/Liste_der_h%C3%A4ufigsten_W%C3%B6rter_der_deutschen_Sprache\r\n\t\t\/\/ das sind gleich 50% des Textes\r\n\t\tArrayList&lt;String&gt; stopWoerter = new ArrayList&lt;&gt;(Arrays.asList(\"die\", \"der\", \"und\", \"in\", \"zu\", \"den\", \"das\",\r\n\t\t\t\t\"nicht\", \"von\", \"sie\", \"ist\", \"des\", \"sich\", \"mit\", \"dem\", \"dass\", \"er\", \"es\", \"ein\", \"ich\", \"auf\",\r\n\t\t\t\t\"so\", \"eine\", \"auch\", \"als\", \"an\", \"nach\", \"wie\", \"im\", \"f\u00fcr\", \"man\", \"aber\", \"aus\", \"durch\", \"wenn\",\r\n\t\t\t\t\"nur\", \"war\", \"noch\", \"werden\", \"bei\", \"hat\", \"wir\", \"was\", \"wird\", \"sein\", \"einen\", \"welche\", \"sind\",\r\n\t\t\t\t\"oder\", \"zur\", \"um\", \"haben\", \"einer\", \"mir\", \"\u00fcber\", \"ihm\", \"diese\", \"einem\", \"ihr\", \"uns\", \"da\",\r\n\t\t\t\t\"zum\", \"kann\", \"doch\", \"vor\", \"dieser\", \"mich\", \"ihn\", \"du\", \"hatte\", \"seine\", \"mehr\", \"am\", \"denn\",\r\n\t\t\t\t\"nun\", \"unter\", \"sehr\", \"selbst\", \"schon\", \"hier\", \"bis\", \"habe\", \"ihre\", \"dann\", \"ihnen\", \"seiner\",\r\n\t\t\t\t\"alle\", \"wieder\", \"meine\", \"zeit\", \"gegen\", \"vom\", \"ganz\", \"einzelnen\", \"wo\", \"muss\", \"ohne\", \"eines\",\r\n\t\t\t\t\"k\u00f6nnen\", \"sei\", \"ja\", \"wurde\", \"jetzt\", \"immer\", \"seinen\", \"wohl\", \"dieses\", \"ihren\", \"w\u00fcrde\",\r\n\t\t\t\t\"diesen\", \"sondern\", \"weil\", \"welcher\", \"nichts\", \"diesem\", \"alles\", \"waren\", \"will\", \"herr\", \"viel\",\r\n\t\t\t\t\"mein\", \"also\", \"soll\", \"worden\", \"lassen\", \"dies\", \"machen\", \"ihrer\", \"weiter\", \"leben\", \"recht\",\r\n\t\t\t\t\"etwas\", \"keine\", \"seinem\", \"ob\", \"dir\", \"allen\", \"gro\u00dfen\", \"jahre\", \"weise\", \"m\u00fcssen\", \"welches\",\r\n\t\t\t\t\"w\u00e4re\", \"erst\", \"einmal\", \"mann\", \"h\u00e4tte\", \"zwei\", \"dich\", \"allein\", \"herren\", \"w\u00e4hrend\", \"paragraph\",\r\n\t\t\t\t\"anders\", \"liebe\", \"kein\", \"damit\", \"gar\", \"hand\", \"herrn\", \"euch\", \"sollte\", \"konnte\", \"ersten\",\r\n\t\t\t\t\"deren\", \"zwischen\", \"wollen\", \"denen\", \"dessen\", \"sagen\", \"bin\", \"menschen\", \"gut\", \"darauf\", \"wurden\",\r\n\t\t\t\t\"wei\u00df\", \"gewesen\", \"Seite\", \"bald\", \"weit\", \"gro\u00dfe\", \"solche\", \"hatten\", \"eben\", \"andern\", \"beiden\",\r\n\t\t\t\t\"macht\", \"sehen\", \"ganze\", \"anderen\", \"lange\", \"wer\", \"ihrem\", \"zwar\", \"gemacht\", \"dort\", \"kommen\",\r\n\t\t\t\t\"welt\", \"heute\", \"frau\", \"werde\", \"derselben\", \"ganzen\", \"deutschen\", \"l\u00e4sst\", \"vielleicht\", \"meiner\"));\r\n\r\n\t\treturn stopWoerter.contains(wort.toLowerCase());\r\n\r\n\t}\r\n<\/pre>\n<p>Und zwei kleine JUnit 5 Test Methoden. Das Wort <strong>Liebe<\/strong> ist auch in der TOP-207-Liste enthalten. Also &#8222;Die Liebe versagt nie!&#8220; und kommt h\u00e4ufig vor \ud83d\ude09 &#8230;<\/p>\n<p><a href=\"http:\/\/blog.wenzlaff.de\/wp-content\/uploads\/2019\/06\/Bildschirmfoto-2019-06-23-um-19.52.31.png\"><img loading=\"lazy\" decoding=\"async\" src=\"http:\/\/blog.wenzlaff.de\/wp-content\/uploads\/2019\/06\/Bildschirmfoto-2019-06-23-um-19.52.31.png\" alt=\"\" width=\"733\" height=\"180\" class=\"aligncenter size-full wp-image-13321\" srcset=\"http:\/\/blog.wenzlaff.de\/wp-content\/uploads\/2019\/06\/Bildschirmfoto-2019-06-23-um-19.52.31.png 733w, http:\/\/blog.wenzlaff.de\/wp-content\/uploads\/2019\/06\/Bildschirmfoto-2019-06-23-um-19.52.31-300x74.png 300w\" sizes=\"auto, (max-width: 733px) 100vw, 733px\" \/><\/a><\/p>\n<p>Alles GR\u00dcN:<\/p>\n<p><a href=\"http:\/\/blog.wenzlaff.de\/wp-content\/uploads\/2019\/06\/Bildschirmfoto-2019-06-23-um-20.04.20.png\"><img loading=\"lazy\" decoding=\"async\" src=\"http:\/\/blog.wenzlaff.de\/wp-content\/uploads\/2019\/06\/Bildschirmfoto-2019-06-23-um-20.04.20.png\" alt=\"\" width=\"416\" height=\"335\" class=\"aligncenter size-full wp-image-13323\" srcset=\"http:\/\/blog.wenzlaff.de\/wp-content\/uploads\/2019\/06\/Bildschirmfoto-2019-06-23-um-20.04.20.png 416w, http:\/\/blog.wenzlaff.de\/wp-content\/uploads\/2019\/06\/Bildschirmfoto-2019-06-23-um-20.04.20-300x242.png 300w\" sizes=\"auto, (max-width: 416px) 100vw, 416px\" \/><\/a><\/p>\n<p>Love never fails! &#8230;<\/p>\n","protected":false},"excerpt":{"rendered":"<p>207 Wortformen in der deutschen Schriftsprache machen 50% der ganzen Schriftsprache aus (Quelle Wikipedia). Wer also 207 W\u00f6rter schreiben kann, kann schon die h\u00e4lfte des deutschen Textes schreiben. F\u00fcr einen Textparser brauchte ich eine Java Methode die checkt, ob ein Wort in dieser Liste ist. Also mal eben eine Java-Zweizeiler um das zu \u00fcberpr\u00fcfen.<\/p>\n","protected":false},"author":2,"featured_media":0,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[3409,220,5,2953,2658],"tags":[3713,3652,2178,3712,3714,3653,2878],"class_list":["post-13319","post","type-post","status-publish","format-standard","hentry","category-2018-09","category-anleitung","category-java","category-junit-5","category-test-thema","tag-die-liebe-versagt-nie","tag-haeufigkeit","tag-java","tag-liebe","tag-love-never-fails","tag-top-207","tag-woerter"],"_links":{"self":[{"href":"http:\/\/blog.wenzlaff.de\/index.php?rest_route=\/wp\/v2\/posts\/13319","targetHints":{"allow":["GET"]}}],"collection":[{"href":"http:\/\/blog.wenzlaff.de\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"http:\/\/blog.wenzlaff.de\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"http:\/\/blog.wenzlaff.de\/index.php?rest_route=\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"http:\/\/blog.wenzlaff.de\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=13319"}],"version-history":[{"count":0,"href":"http:\/\/blog.wenzlaff.de\/index.php?rest_route=\/wp\/v2\/posts\/13319\/revisions"}],"wp:attachment":[{"href":"http:\/\/blog.wenzlaff.de\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=13319"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"http:\/\/blog.wenzlaff.de\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=13319"},{"taxonomy":"post_tag","embeddable":true,"href":"http:\/\/blog.wenzlaff.de\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=13319"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}