2009年12月16日水曜日

PDFからTEXTの抽出

ロックのかかっていないPDFファイルからテキストを抽出するのはacroreadで
ファイル(F)->テキストとして保存(V)
optionでCUIからできないかと思ったが-toPostScriptでPSファイルにできるだけでした。

ちなみにそのPDFファイルはpdftotextではちゃんと抽出できませんでした。

0 件のコメント:

コメントを投稿