Rubyでpdfのテキストを取得(その他メモ)

origami

非常に高性能なpdfパーサ。
なのですが、日本語テキストを取ろうとするとかなりむずかしい。
Ruby で PDF と戯れるの巻 - Qiita
あたりを参照。

poppler

できることは限定されていますが、日本語テキストの取得だけならこれで十二分。
もう一つのエントリに書きましたのでそちらを見てください。
Rubyでpdfのテキストを取得(poppler gem編) - 別館 子子子子子子(ねこのここねこ)