Pure Javascriptのhtmlparser

別けあってPure Javascriptのhtmlparserを探していたところ。

http://ejohn.org/blog/pure-javascript-html-parser/

上記のようなのものが見つかりました。
実際に使ってみると getElementByIdが使えなかったり、DoctypeがあるとParseに失敗したりなど。
ちょっと不具合があったので少し手を加えてみました。

http://gist.github.com/591455

 var dom = HTMLtoDOM(htmlString);
  dom.getElementById('id');
 dom.getElementsByTagName('name');

こんな感じで。