2014-04-01から1日間の記事一覧

Rubyでpdfのテキストを取得(poppler gem編)

実はpoppler gemを使うまでにいろんなpdfを扱うgemを確認してました。でも上手く行かなかったのです。 Ruby/Popplerを使えば、テキストがポンと出てきます。gem i popplerでインストール出来ます。 require "poppler" document = Poppler::Document.new("kei…

Rubyでpdfのテキストを取得(その他メモ)

origami 非常に高性能なpdfパーサ。 なのですが、日本語テキストを取ろうとするとかなりむずかしい。 Ruby で PDF と戯れるの巻 - Qiita あたりを参照。 Google Code Archive - Long-term storage for Google Code Project Hosting. File: README — Document…