2008-12-03から1日間の記事一覧

ページをクロールする時に必要なAタグのみ取得するXPath

10/4 追記:メールも弾くよう改良 getElementsByTagName('a')で全部取ってくるくらいなら、XPathでフィルタリングしたい! ということで、 /html/body//a[not(contains(@href, "#")) and not(starts-with(@href, "javascript:")) and not(starts-with(@href,…