[リストへもどる]
一括表示
タイトルLingoes ld2形式をStarDict ifo形式に変換する方法
記事No3010
投稿日: 2019/09/16(Mon) 22:46:02
投稿者KuroiRuka
Lingoesは公式辞書compiler, decompilerを出していません。非公式decompilerとしてLingoesConverterがあります。PHPプログラムですが、コンパイル済のconverter.exeが含まれますので、これを実行します。

Input fileとしてConcise English Dictionary.ld2を指定した場合、word encodingとしてUTF-8、definition encodingとしてUTF-8を指定すると、Output fileとしてConcise English Dictionary.txtを出力。

Input fileとしてVicon English-Japanese Dictionary.ld2を指定した場合、word encodingとしてUTF-8、definition encodingとしてUTF-16LEを指定すると、Output fileとしてVicon English-Japanese Dictionary.txtを出力。

txtファイルの中身は、単語{tab}タグ付意味説明、の繰り返し。
タグはLingoes独自タグとconverter.exe独自タグで、適宜置換(置換テーブル略)、保存。
txtファイルをStarDictEditor.exeにTab file形式で読み込み、一旦コンパイル。
コンパイル後のifoファイルをStarDictEditor.exeに読み込み、Textual StarDict dictionary形式でデコンパイル。
デコンパイル後のxmlファイルをエディタで読み込み、<definition type="m">を<definition type="h">に置換、保存。
xmlファイルをStarDictEditor.exeにTextual StarDict dictionary形式で読み込み、コンパイルし完成。

ご要望あれば、置換テーブル、アップします。

タイトルRe: Lingoes ld2形式をStarDict ifo形式に変換する方法
記事No3012
投稿日: 2019/09/22(Sun) 12:00:43
投稿者りんご
有益な情報を頂きありがとうございます。

変換は各自で行うことが前提ですが、置換テーブルを頂けると作業効率がかなり上がると思います。

置換テーブルのアップをぜひお願いいたします。

タイトルRe^2: Lingoes ld2形式をStarDict ifo形式に変換する方法
記事No3016
投稿日: 2019/09/23(Mon) 13:24:10
投稿者KuroiRuka
興味をもってくださり、ありがとうございます。Lingoes→StarDictの正規表現置換テーブルです。HTML特殊文字が数値文字参照形式で表示されていますので、hhttps://tech-unlimited.com/escape.htmlにコピペして復元してください。

旧文字列→新文字列:コメント
</C><C>.+?</C>→</C>:複数形で単数形の意味をリピート、を削除
</??[CFIL]>→空欄:削除
<&#202; N="(.+?)">(.+?)</&#202;>→<a href="\1">\2</a>
<H>→[[:区別のため2つにしておく。発音記号途中に[が入る例があるため
</H>→]]:区別のため2つにしておく
</??[NP]>→<BR>

</Q><Q>→</LI><LI>
<Q>→<OL><LI>
</Q>→</LI></OL>

<span style="font-size:8pt;">(.+?)</span>→<font size="70%">\1</font>
<span style="font-size:12pt;">(.+?)</span>→<font size="100%">\1</font>

<(/??)strong>→<\1B>:htmlタグの強調

<span style="color:#c00000">(.+?)</span>→<font color="#c00000">\1</font>
<span style="color:#009900">(.+?)</span>→<font color="#009900">\1</font>

<ul><li>→<UL><LI>:ないみたい
</li></ul>→</LI></UL>:ないみたい
<li>→<LI>:ないみたい
</li>→</LI>:ないみたい

<(/??)em>→<\1I>:htmlタグのイタリック

<br />→<BR>
<BR>(<BR>)+→<BR>:連続改行をまとめる

他にもあるかもしれません。

タイトルRe^3: Lingoes ld2形式をStarDict ifo形式に変換する方法
記事No3019
投稿日: 2019/09/25(Wed) 02:30:28
投稿者りんご
こちらも開示頂きまして、ありがとうございます。
ありがたく利用させて頂きます。