[リストへもどる]
一括表示
タイトルxdoc2txtでのPDF変換でPDFバージョンによる違い
記事No396
投稿日: 2009/06/17(Wed) 13:28:49
投稿者ita
初めまして、itaと申します。
xdoc2txt.exeをいつも重宝しています。ありがとうございます。
当方では、xdoc2txtをPDFからのテキスト抽出で活用させて頂いていますが、PDFファイルのバージョンにより2ページ以降が抽出できない現象(1ページだけと見なされているようです)があります。
・正常にテキスト抽出できるのは、「PDF バージョン1.4」(Acrobat Distiller7.0.5)
・1ページだけとなるのは、「PDF バージョン1.5」(Acrobat Distiller9.0.0)
ですが、これは既知の事でしょうか?
それとも私のPC環境にもよるものでしょうか?
よろしくお願いします。

xdoc2txt.exeのバージョン:1.33

タイトルRe: xdoc2txtでのPDF変換でPDFバージョンによる違い
記事No397
投稿日: 2009/06/18(Thu) 08:57:56
投稿者hishida
> 初めまして、itaと申します。
> xdoc2txt.exeをいつも重宝しています。ありがとうございます。
> 当方では、xdoc2txtをPDFからのテキスト抽出で活用させて頂いていますが、PDFファイルのバージョンにより2ページ以降が抽出できない現象(1ページだけと見なされているようです)があります。
> ・正常にテキスト抽出できるのは、「PDF バージョン1.4」(Acrobat Distiller7.0.5)
> ・1ページだけとなるのは、「PDF バージョン1.5」(Acrobat Distiller9.0.0)
> ですが、これは既知の事でしょうか?
> それとも私のPC環境にもよるものでしょうか?
> よろしくお願いします。
>
> xdoc2txt.exeのバージョン:1.33

(1)PC環境が問題になることはありません。
(2)PDFのバージョンというよりは、そのPDF文書の個別の問題だと思います。
個別に調査しないと何ともいえません。

タイトルRe^2: xdoc2txtでのPDF変換でPDFバージョンによる違い
記事No399
投稿日: 2009/06/19(Fri) 08:52:12
投稿者ita
hishidaさん

回答ありがとうございました。

> (1)PC環境が問題になることはありません。
> (2)PDFのバージョンというよりは、そのPDF文書の個別の問題だと思います。
> 個別に調査しないと何ともいえません。

了解しました。
READMEをよくよく見ると「PDF1.3の仕様が元」であると記載されていたことから1.4以降は怪しいということでしょうか?(今回は1.5だし)

(READMEの抜粋)
◎ Adobe PDF

・PDF1.3の仕様を元に開発しています。1.4以降の文書でもテキストに関しては表示できる
 と考えられます。
・次のアプリケーションで生成したPDFについて動作確認を行いました。

Acrobat PDFWriter 3.0/4.0/5.0
Acrobat PDFMaker 5.0
Acrobat Distiller 3.0/4.0/5.0/6.0
Acrobat Web Capture 5.0
Adobe PageMaker 6.0J/6.5J
Adobe Illustrator 5.5J/8.0
Adobe InDesign 2.0J
FrameMaker 6.0
pdfTeX
Ghostscript(英語のみ・日本語はだめ)
読んでココVer9(透明テキスト)
読取革命(透明テキスト)
eTypist(透明テキスト)
SkyPDF Driver 1.02
いきなりPDF
OpenOffice.Org.1.1
ActiveReports 2.0J
easyPDF 3.1
Jaws PDF Creator
eXPert PDF
JustSystem PDF Creater