{"id":14100,"date":"2020-02-23T20:00:22","date_gmt":"2020-02-23T19:00:22","guid":{"rendered":"http:\/\/blog.wenzlaff.de\/?p=14100"},"modified":"2020-06-26T18:24:19","modified_gmt":"2020-06-26T16:24:19","slug":"excel-internet-adressen-in-5-minuten-ueberpruefen-mit-dem-de-wenzlaff-linkchecker","status":"publish","type":"post","link":"http:\/\/blog.wenzlaff.de\/?p=14100","title":{"rendered":"Internet Adressen bzw. Links in Excel-Dateien in 5 Minuten \u00fcberpr\u00fcfen mit dem de.wenzlaff.linkchecker"},"content":{"rendered":"<p>Manchmal hat man in einer Excel-Tabelle eine oder mehrere Spalten mit Internet-Adressen (URLs) deren G\u00fcltigkeit man \u00fcberpr\u00fcfen will, da viele Adressen sich doch schnell \u00e4ndern. Dh. ist die Adresse noch erreichbar oder ist eine ung\u00fcltige Adresse (Broken Links) eingegeben. Man k\u00f6nnte nun einen VB-Macro schreiben der das tut, oder aber das <strong>de.wenzlaff.linkchecker<\/strong> Programm starten, das eine Spalte in einer Excel-Datei automatisch validiert und alle nicht erreichbaren bzw. falschen Adressen ausgibt. So kann mit einen Aufruf die ganze Datei \u00fcberpr\u00fcft werden.<br \/>\n<a href=\"http:\/\/blog.wenzlaff.de\/wp-content\/uploads\/2020\/02\/Linkchecker-scaled.jpg\"><img loading=\"lazy\" decoding=\"async\" src=\"http:\/\/blog.wenzlaff.de\/wp-content\/uploads\/2020\/02\/Linkchecker-1024x768.jpg\" alt=\"\" width=\"525\" height=\"394\" class=\"aligncenter size-large wp-image-14114\" srcset=\"http:\/\/blog.wenzlaff.de\/wp-content\/uploads\/2020\/02\/Linkchecker-1024x768.jpg 1024w, http:\/\/blog.wenzlaff.de\/wp-content\/uploads\/2020\/02\/Linkchecker-300x225.jpg 300w, http:\/\/blog.wenzlaff.de\/wp-content\/uploads\/2020\/02\/Linkchecker-768x576.jpg 768w, http:\/\/blog.wenzlaff.de\/wp-content\/uploads\/2020\/02\/Linkchecker-1536x1151.jpg 1536w, http:\/\/blog.wenzlaff.de\/wp-content\/uploads\/2020\/02\/Linkchecker-2048x1535.jpg 2048w\" sizes=\"auto, (max-width: 525px) 100vw, 525px\" \/><\/a><br \/>\nDas wollen wir mal an einem Beispiel auf einem Raspberry Pi ausf\u00fchren. Das w\u00fcrde analog nat\u00fcrlich auch auf Windows oder einem Mac laufen.<\/p>\n<p>Wir haben diese Excel Testdatei. Die 3. Spalte, also Spalte C enth\u00e4lt Internet-Adressen die alle \u00fcberpr\u00fcft werden sollen. Alle anderen Spalten sind nicht relevant. Die Excel-Datei wir auch nicht ver\u00e4ndert. <\/p>\n<p><a href=\"http:\/\/blog.wenzlaff.de\/wp-content\/uploads\/2020\/02\/Bildschirmfoto-2020-02-23-um-11.32.05.png\"><img loading=\"lazy\" decoding=\"async\" src=\"http:\/\/blog.wenzlaff.de\/wp-content\/uploads\/2020\/02\/Bildschirmfoto-2020-02-23-um-11.32.05-1024x650.png\" alt=\"\" width=\"525\" height=\"333\" class=\"aligncenter size-large wp-image-14108\" srcset=\"http:\/\/blog.wenzlaff.de\/wp-content\/uploads\/2020\/02\/Bildschirmfoto-2020-02-23-um-11.32.05-1024x650.png 1024w, http:\/\/blog.wenzlaff.de\/wp-content\/uploads\/2020\/02\/Bildschirmfoto-2020-02-23-um-11.32.05-300x190.png 300w, http:\/\/blog.wenzlaff.de\/wp-content\/uploads\/2020\/02\/Bildschirmfoto-2020-02-23-um-11.32.05-768x488.png 768w, http:\/\/blog.wenzlaff.de\/wp-content\/uploads\/2020\/02\/Bildschirmfoto-2020-02-23-um-11.32.05.png 1090w\" sizes=\"auto, (max-width: 525px) 100vw, 525px\" \/><\/a><\/p>\n<p>Voraussetzung ist, das auf dem Rechner Java installiert ist. Also ein <strong>java -version<\/strong> muss eine g\u00fcltige Version >= 8 liefern und wer den aktuellen SNAPHOT holt, braucht mind. Java 11:<!--more--><\/p>\n<p>Folgende drei Schritte sind n\u00f6tig nun n\u00f6tig.<br \/>\n1. Das Programm downloaden.<br \/>\n2. Auspacken und<br \/>\n3. starten.<\/p>\n<p>Hier nun die Details:<\/p>\n<p>Wir holen uns das Programm <strong>de.wenzlaff.linkchecker<\/strong> in ein neues Verzeichnis:<\/p>\n<p># Verzeichnis anlegen<br \/>\nmkdir excel-link-checker<br \/>\ncd excel-link-checker<\/p>\n<p># Das Programm aus dem Blog <a href=\"http:\/\/blog.wenzlaff.de\/wp-content\/uploads\/2020\/02\/linkchecker-0.0.4.zip\">linkchecker-0.0.4<\/a> im Zip-Archive holen oder \u00fcber obigen Link downloaden.<\/p>\n<p><strong>wget http:\/\/blog.wenzlaff.de\/wp-content\/uploads\/2020\/02\/linkchecker-0.0.4.zip<\/strong><\/p>\n<p># Zip-Archive auspacken<\/p>\n<p><strong>unzip linkchecker-0.0.4.zip<\/strong><\/p>\n<p># Im Archiv sind das Programm und eine Excel Testdatei. In der Testdatei wollen wir die zweite Spalte (Spalten z\u00e4hlen ab 0) validieren<br \/>\n# Dazu rufen wir Java auf mit dem -jar Befehlt und dem geladenen jar. Dann kommt als erster Parameter die Spalten Nr. und als letztes der Excel-Dateiname<\/p>\n<p><strong>java -jar de.wenzlaff.linkchecker-0.0.4-SNAPSHOT-jar-with-dependencies.jar 2 test-excel.xlsx<\/strong><\/p>\n<p>Das Ergebniss, mit den drei falschen Adressen wird ausgegeben:<\/p>\n<pre class=\"lang:default decode:true \" >\r\nLese alle Zeilen aus der Excel Datei test-excel.xlsx\r\nValidiere die 2. Spalte in der Excel-Datei mit Namen: C\r\nAnzahl der Spalten der Tabelle: 3\r\nVerwende Blatt wenzlaff.de\r\nEingelesen Zeile [id=Nr., Internet]\r\nEingelesen Zeile [id=1, http:\/\/www.kleinhirn.eu]\r\nEingelesen Zeile [id=2, http:\/\/www.diese-d-gibt-es-wirklich-nicht-777.de]\r\nEingelesen Zeile [id=3, http:\/\/www.wenzlaff.info]\r\nEingelesen Zeile [id=4, httt:\/\/falsche.url]\r\nEingelesen Zeile [id=5, http:\/\/www.wenzlaff.de]\r\n6 gelesene Zeilen aus der Tabelle test-excel.xlsx\r\nChecke nun den Online Status aller URLs ...\r\nFehler Nr. 1 Fehler no protocol: Internet in Zeile: Zeile [id=Nr., Internet] mit URL: null\r\nFehler Nr. 2 ZeilenId: 2\t ERROR,    , www.diese-d-gibt-es-wirklich-nicht-777.de\r\nFehler Nr. 3 Fehler unknown protocol: httt in Zeile: Zeile [id=4, httt:\/\/falsche.url] mit URL: null\r\nOnline Check abgeschlossen.<\/pre>\n<p>Was fehlt noch? Weitere Funktion erw\u00fcnscht? Gern anregungen an meine E-Mail oder per Pull Request auf <a href=\"https:\/\/github.com\/IT-Berater\/TWLinkChecker\" rel=\"noopener noreferrer\" target=\"_blank\">Github<\/a>. Das <a href=\"https:\/\/github.com\/IT-Berater\/TWLinkChecker\" rel=\"noopener noreferrer\" target=\"_blank\">Github<\/a> Projekt enth\u00e4lt auch den ganzen Java Quellcode.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Manchmal hat man in einer Excel-Tabelle eine oder mehrere Spalten mit Internet-Adressen (URLs) deren G\u00fcltigkeit man \u00fcberpr\u00fcfen will, da viele Adressen sich doch schnell \u00e4ndern. Dh. ist die Adresse noch erreichbar oder ist eine ung\u00fcltige Adresse (Broken Links) eingegeben. Man k\u00f6nnte nun einen VB-Macro schreiben der das tut, oder aber das de.wenzlaff.linkchecker Programm starten, das &hellip; <\/p>\n<p class=\"link-more\"><a href=\"http:\/\/blog.wenzlaff.de\/?p=14100\" class=\"more-link\"><span class=\"screen-reader-text\">\u201eInternet Adressen bzw. Links in Excel-Dateien in 5 Minuten \u00fcberpr\u00fcfen mit dem de.wenzlaff.linkchecker\u201c <\/span>weiterlesen<\/a><\/p>\n","protected":false},"author":2,"featured_media":0,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[220,2769,5,3187,1023,7],"tags":[3913,999,4019,2310,3911,3907,3910,3909,3912,324,2178,4020,4018,3908],"class_list":["post-14100","post","type-post","status-publish","format-standard","hentry","category-anleitung","category-excel","category-java","category-office","category-raspberry-pi","category-tools","tag-broken-links-in-excel","tag-check","tag-check-excel-links","tag-excel","tag-excel-autom-url-ueberpruefung","tag-excel-url-validation","tag-excel-url-validieren","tag-excel-validieren","tag-find-broken-links","tag-github","tag-java","tag-link-checker","tag-twlinkchecker","tag-url-ueberpruefung"],"_links":{"self":[{"href":"http:\/\/blog.wenzlaff.de\/index.php?rest_route=\/wp\/v2\/posts\/14100","targetHints":{"allow":["GET"]}}],"collection":[{"href":"http:\/\/blog.wenzlaff.de\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"http:\/\/blog.wenzlaff.de\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"http:\/\/blog.wenzlaff.de\/index.php?rest_route=\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"http:\/\/blog.wenzlaff.de\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=14100"}],"version-history":[{"count":0,"href":"http:\/\/blog.wenzlaff.de\/index.php?rest_route=\/wp\/v2\/posts\/14100\/revisions"}],"wp:attachment":[{"href":"http:\/\/blog.wenzlaff.de\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=14100"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"http:\/\/blog.wenzlaff.de\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=14100"},{"taxonomy":"post_tag","embeddable":true,"href":"http:\/\/blog.wenzlaff.de\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=14100"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}