HTML – 如何使用Nokogiri解析Google搜索结果?

我需要帮助从Google搜索结果中提取网址,并被告知要使用Nokogiri.我安装了它并阅读了Nokogiri文档,但不知道从哪里开始 – 这对我来说都是希腊语.

我知道我要找的是每个结果的URL,每个结果都存在于< cite>之间.标签.到目前为止,我能够弄清楚如何做的是拉取搜索结果,但我只是不知道如何从文件中提取特定数据.这是我所拥有的极少量代码:

serp = Nokogiri::HTML(open("http://www.google.com/search?num=100&q=stackoverflow"))
请享用 :)

require 'open-uri'
require 'nokogiri'

page = open "http://www.google.com/search?num=100&q=stackoverflow"
html = Nokogiri::HTML page

html.search("cite").each do |cite|
  puts cite.inner_text
end

还看看nokogiri tutorials

相关文章
相关标签/搜索