node.js + jQuery で Web scraping

jsdomとjQueryつかって富豪的にホクホクできるらしい。セレクタさえ丹念に集めれば Readability/Instapaper のようにコンテンツのテキストだけ抽出するようなこともさほど難しくないか。

var jsdom = require("jsdom"),
    fs = require("fs");
var jquery = fs.readFileSync("./jquery.js");

jsdom.env({
  html : 'http://atnd.org/events/26373',
  src  : [ jquery ],
  done : function (err, window) {
    var $ = window.$;
    $("ol.a-b > li").each(function () {
      console.log( $("a", this).text() );
    });
  }
});