在线时间:8:00-16:00
迪恩网络APP
随时随地掌握行业动态
扫描二维码
关注迪恩网络微信公众号
并不是专业做网页抓取的爬虫的,只是之前在一个做的挺烂的网站上帮人刷票起步逐渐学习了网页抓取的工具。 1 open("http://www.ruby-lang.org/en") {|f| 2 f.each_line {|line| p line} 3 p f.base_uri # <URI::HTTP:0x40e6ef2 URL:http://www.ruby-lang.org/en/> 4 p f.content_type # "text/html" 5 p f.charset # "iso-8859-1" 6 p f.content_encoding # [] 7 p f.last_modified # Thu Dec 05 02:45:02 UTC 2002 8 }
1 open("http://www.ruby-lang.org/en/", 2 "User-Agent" => "Ruby/#{RUBY_VERSION}", 3 "From" => "[email protected]", 4 "Referer" => "http://www.ruby-lang.org/") {|f| 5 # ... 6 }
Nokogiri是一个gem,据说在此之前还有另一个工具Hpricot,只是简单了解了一下,并不赘述。 |
2023-10-27
2022-08-15
2022-08-17
2022-09-23
2022-08-13
请发表评论