(5)

はじめて、REXML を使いHTMLからの変換スクリプトを作っているのだが、


$ ./html2hiki-xml.rb tutorial-ja-utf8.html > hiki.txt
/usr/lib/ruby/1.8/rexml/parsers/baseparser.rb:311:in `pull': Missing end tag for 'p' (got "body") (REXML::ParseException)
Line: 1770
Position: 73489
Last 80 unconsumed characters:
from /usr/lib/ruby/1.8/rexml/parsers/streamparser.rb:16:in `parse'
from /usr/lib/ruby/1.8/rexml/document.rb:171:in `parse_stream'
from ./html2hiki-xml.rb:198


いやーん、どこで閉じ間違っているんだろ?


作りかけの 正規表現変換スクリプトでやっちゃった方が早いかなー?