TOP > Up > Today


Date:  Thu, 29 Nov 2012 17:41:25 +0900
From:  no@ann.co.jp
Subject:  [pasml 345986] Re: PDFのテキスト化について
To:  pasml@ann.co.jp
Message-Id:  <201211290841.qAT8fP4O008938@ns.pas2.jp>
X-Mail-Count: 345986

名前: ZONE BBSから
質問:http://pasokoma.jp/51/lg510780#510799
携帯:http://pasokoma.jp/m?num=510799&ope=v
--
youyouさんは No.510797「Re:PDFのテキスト化について」で書きました。

8桁の数字を抽出したいPDFファイルは画像形式,文章(テキスト)形式のどちらですか?
Adobe Readerで開き数字部分をドラッグし右クリックするとコピーできますか?
コピーの選択肢が出るなら文章(テキスト)形式となります。

文章(テキスト)形式なら、↓のソフトでテキストファイル化できるか確認を。
・xdoc2txt
http://www31.ocn.ne.jp/~h_ishida/xdoc2txt.html
複数のPDFファイルを一括変換できるので効率良く作業が進められそうです。

画像形式なら、↓のサイトでオンライン変換を試してください。
・Free Online OCR
http://www.free-online-ocr.com/
期待通りに変換できたとしても一括変換できないのが難点です。

有償ソフトなら、↓なのが安価で良いかも。
・いきなりPDF to Data Ver.2|PDF読取ソフト|ソースネクストサイト
http://www.sourcenext.com/product/pc/ikp/pc_ikp_000860/
こちらはテキストファイルに出力する機能は無いようです。

いずれのソフトもサイトも使用したことがありませんので、自己責任で試してください。
上記はテキストファイル化するための手法ですので、テキストファイルから8桁の数字を
抽出してCSVファイル化するのは手作業になります。
ExcelでVBAを使えば8桁の数字抽出を自動化することも不可能では無いでしょう。
--
== 掲示板URL: http://pasokoma.jp/bbs ==
   配信の停止: http://pasokoma.jp/taikai
   本メールマガジンへの返信はなさらないで下さい
== 投稿はパソコン困りごと掲示板でお願い致します ===
    

TOP > Up > Today