{"id":1220,"date":"2012-01-31T12:59:16","date_gmt":"2012-01-31T10:59:16","guid":{"rendered":"http:\/\/www.tutego.de\/blog\/javainsel\/?p=1220"},"modified":"2012-01-31T12:59:16","modified_gmt":"2012-01-31T10:59:16","slug":"thema-der-woche-java-smart-and-simple-web-crawler","status":"publish","type":"post","link":"https:\/\/www.tutego.de\/blog\/javainsel\/2012\/01\/thema-der-woche-java-smart-and-simple-web-crawler\/","title":{"rendered":"Thema der Woche: Java &quot;Smart and Simple Web Crawler&quot;"},"content":{"rendered":"<p><a href=\"http:\/\/java.net\/projects\/crawler\/\">http:\/\/java.net\/projects\/crawler\/<\/a> ist ein Web-Crawler in Java. Die API k\u00f6nnte zwar viel einfacher sein, aber dennoch ist mit Hilfe der beigef\u00fcgten Beispiele (<a href=\"http:\/\/java.net\/projects\/crawler\/downloads\/directory\/1.3.0) schnell\">http:\/\/java.net\/projects\/crawler\/downloads\/directory\/1.3.0) schnell<\/a> ein Programm implementiert.<\/p>\n<p>Aufgabe: Liste die ersten 5 Links auf, die von der Hauptseite spiegel.de in den den Bereich <a href=\"http:\/\/www.spiegel.de\/thema\/\">http:\/\/www.spiegel.de\/thema\/<\/a> f\u00fchren. \u00dcberlege dazu ein Fragment wie<\/p>\n<p>LinkFilterUtil.and( new ServerFilter( \u201c..\u201d ),&#160; new BeginningPathFilter( &quot;\/\u2026\/&quot; ) )<\/p>\n<p>zu nutzen.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>http:\/\/java.net\/projects\/crawler\/ ist ein Web-Crawler in Java. Die API k\u00f6nnte zwar viel einfacher sein, aber dennoch ist mit Hilfe der beigef\u00fcgten Beispiele (http:\/\/java.net\/projects\/crawler\/downloads\/directory\/1.3.0) schnell ein Programm implementiert. Aufgabe: Liste die ersten 5 Links auf, die von der Hauptseite spiegel.de in den den Bereich http:\/\/www.spiegel.de\/thema\/ f\u00fchren. \u00dcberlege dazu ein Fragment wie LinkFilterUtil.and( new ServerFilter( \u201c..\u201d ),&#160; new [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_jetpack_memberships_contains_paid_content":false,"footnotes":"","_links_to":"","_links_to_target":""},"categories":[13],"tags":[],"class_list":["post-1220","post","type-post","status-publish","format-standard","hentry","category-die-wochentliche-dosis-java"],"jetpack_featured_media_url":"","jetpack_sharing_enabled":true,"_links":{"self":[{"href":"https:\/\/www.tutego.de\/blog\/javainsel\/wp-json\/wp\/v2\/posts\/1220","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.tutego.de\/blog\/javainsel\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.tutego.de\/blog\/javainsel\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.tutego.de\/blog\/javainsel\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/www.tutego.de\/blog\/javainsel\/wp-json\/wp\/v2\/comments?post=1220"}],"version-history":[{"count":1,"href":"https:\/\/www.tutego.de\/blog\/javainsel\/wp-json\/wp\/v2\/posts\/1220\/revisions"}],"predecessor-version":[{"id":1221,"href":"https:\/\/www.tutego.de\/blog\/javainsel\/wp-json\/wp\/v2\/posts\/1220\/revisions\/1221"}],"wp:attachment":[{"href":"https:\/\/www.tutego.de\/blog\/javainsel\/wp-json\/wp\/v2\/media?parent=1220"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.tutego.de\/blog\/javainsel\/wp-json\/wp\/v2\/categories?post=1220"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.tutego.de\/blog\/javainsel\/wp-json\/wp\/v2\/tags?post=1220"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}