EBシリーズサポート掲示板(終了:閲覧のみ可)
このフォームからは投稿できません。
name
e-mail
url
subject
comment

[記事リスト] [新着記事] [ワード検索] [過去ログ] [管理用]

記事No : 609
タイトル xdoc2txtでpptから抽出されない
投稿日: 2010/09/30(Thu) 15:22:04
投稿者koma

現在、社内で全文検索を導入しようとしている中で、フィルターをいろいろ検証していたのですが、ある特定のPowerPoint文書からワードが抽出できないケースがあり、原因が掴めない状況で困っています。

<使用環境>
Windwos XP SP3
MS Office Pro 2003 (2007互換機能パックもインストール済)
※昔、Office2000を使っていてアンインストールした経緯あり
xdoc2txt 1.37 (2010/05/16版)


<実行形式>
xdoc2txt aaa.ppt > aaa.txt
でやった結果です。

<現象>
ケース1.全く読めないpptがある。
aaa.txtの中身が空っぽで出力される。(当然aaa.pptは中身が沢山詰まった文書です)

ケース2.一部のテキストボックスが読めないpptがある。
一部の読めるテキストボックスから抽出されたワードだけが、aaa.txtへ出力される。

ケース3.上記のケース1とケース2のテストを何度となくやっていると、ケース2の一部は読めていたテキストボックスも読めなくなり、ケース1と同じように出力が空っぽになる。

上記のテストに使用したppt文書は、壊れたファイルとかではありません。普通に読み書き可能な正常なPowerPoint文書です。
※もし調査の為に必要であれば、pptファイルを送付することは可能です。

以上、よろしくお願い致します。


- 関連一覧ツリー (▼ をクリックするとツリー全体を一括表示します)