[リストへもどる]
一括表示
タイトルEBStudio 2.0.5 外字重複割り当て
記事No1008
投稿日: 2018/01/05(Fri) 00:50:17
投稿者Chen
いつもお世話になっております。
EBStudio 2.0.5でxhtml形式(utf-8、utf-16両方テストしました)の中国語ソースファイルを変換してみましたが、たくさんの外字が重複割り当てされています。
下記の通り、139個目以降
<key>hC856</key><string>&#22681;</string>
<key>hC856</key><string>&#257;</string>
<key>hC857</key><string>&#20979;</string>
<key>hC858</key><string>&#21035;</string>
<key>hC858</key><string>а</string>
<key>hC859</key><string>&#275;</string>
<key>hC859</key><string>&#20004;</string>
<key>hC85A</key><string>&#26869;</string>
<key>hC85A</key><string>&#225;</string>
<key>hC85B</key><string>&#224;</string>
<key>hC85B</key><string>&#26472;</string>
<key>hC85C</key><string>&#34108;</string>
<key>hC85C</key><string>&#462;</string>
<key>hC85D</key><string>&#24577;</string>
<key>hC85D</key><string>&#593;</string>
<key>hC85E</key><string>&#38701;</string>
<key>hC85E</key><string>с</string>
<key>hC85F</key><string>о</string>
<key>hC85F</key><string>&#38654;</string>
......
ご確認お願いいたします。

タイトルRe: EBStudio 2.0.5 外字重複割り当て
記事No1009
投稿日: 2018/01/05(Fri) 10:11:46
投稿者hishida
> いつもお世話になっております。
> EBStudio 2.0.5でxhtml形式(utf-8、utf-16両方テストしました)の中国語ソースファイルを変換してみましたが、たくさんの外字が重複割り当てされています。
> 下記の通り、139個目以降
(略)
> ......
> ご確認お願いいたします。

EBStudio2では次の範囲で外字の割り当てを行います。
半角 A121〜
全角 B121〜
半角の外字の個数が約1500個を越えると、全角外字用の範囲を書き潰してしまって、このような症状になるようです。

暫定的な回避方法は、ダミーの外字フォントファイルを指定して、全角外字の開始範囲を後ろにずらすことです。

dummyGaiji.xml
----------------------
<?xml version="1.0" encoding="Shift_JIS"?>
<gaijiData xml:space="preserve">

<!--x=8 y=16 -->
<fontSet size="8X16" start="A121">

<fontData>
        
        
        
        
        
        
        
        
        
        
        
        
        
        
        
        
</fontData>

</fontSet>

<!--x=16 y=16 -->
<fontSet size="16X16" start="D121">
<!--  -->
<fontData>
                
                
                
                
                
                
                
                
                
                
                
                
                
                
                
                
</fontData>

</fontSet>

</gaijiData>
---------------------

これで全角外字の開始位置がD121以降になります。

ただ全角外字の領域をオーバーラップしてつぶしてしまうことはバグなので、次回の版で修正します。

タイトルRe^2: EBStudio 2.0.5 外字重複割り当て
記事No1010
投稿日: 2018/01/05(Fri) 13:25:05
投稿者Chen
> > いつもお世話になっております。
> > EBStudio 2.0.5でxhtml形式(utf-8、utf-16両方テストしました)の中国語ソースファイルを変換してみましたが、たくさんの外字が重複割り当てされています。
> > 下記の通り、139個目以降
> (略)
> > ......
> > ご確認お願いいたします。
>
> EBStudio2では次の範囲で外字の割り当てを行います。
> 半角 A121〜
> 全角 B121〜
> 半角の外字の個数が約1500個を越えると、全角外字用の範囲を書き潰してしまって、このような症状になるようです。
>
> 暫定的な回避方法は、ダミーの外字フォントファイルを指定して、全角外字の開始範囲を後ろにずらすことです。
>
> dummyGaiji.xml
> ----------------------
> <?xml version="1.0" encoding="Shift_JIS"?>
> <gaijiData xml:space="preserve">
>
> <!--x=8 y=16 -->
> <fontSet size="8X16" start="A121">
>
> <fontData>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
> </fontData>
>
> </fontSet>
>
> <!--x=16 y=16 -->
> <fontSet size="16X16" start="D121">
> <!-- -->
> <fontData>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
> </fontData>
>
> </fontSet>
>
> </gaijiData>
> ---------------------
>
> これで全角外字の開始位置がD121以降になります。
>
> ただ全角外字の領域をオーバーラップしてつぶしてしまうことはバグなので、次回の版で修正します。
早速ご返事ありがとうございます。
教えていただいた方法で重複は解消しました。
ただ、実際には半角の外字が100個(中国語の発音PinYin)前後しかありませんが。
もう一つ問題に気づきました。
波ダッシュ「〜」が表示されていません。
この記号は外字割り当ての必要がないと思われますが、本文中空白の箇所のタグ情報を確認したら、外字として扱われています。
例::「&hA124;大」(本来は「〜大」)
外字マップを確認すると、下記のように欠落しています。
<key>hA123</key><string>&#257;</string>
<key>hA125</key><string>а</string>
手動で付け足せば問題ないですが。
合わせてご確認よろしくお願いいたします。

タイトルRe^3: EBStudio 2.0.5 外字重複割り当て
記事No1011
投稿日: 2018/01/08(Mon) 16:09:32
投稿者hishida
> ただ、実際には半角の外字が100個(中国語の発音PinYin)前後しかありませんが。

2.0.6をリリースしました。
・半角か全角かの判定をUnicodeの範囲で行っていますが、明らかにLatin系のコード範囲以外はデフォルトで全角と判定するようにしたので、意図しないコードが半角になるケースは減ったと思います。
・外字の開始コードを指定できるようしました。
・半角と全角の範囲がオーバーラップした場合は割り当てを中止するようにしました。

> もう一つ問題に気づきました。
> 波ダッシュ「〜」が表示されていません。
> この記号は外字割り当ての必要がないと思われますが、本文中空白の箇所のタグ情報を確認したら、外字として扱われています。
0x7eなら外字とは判定しないのですが、Chenさんのhtmlソースがわからないので、なんとも言えないですね。

タイトルRe^4: EBStudio 2.0.5 外字重複割り当て
記事No1012
投稿日: 2018/01/09(Tue) 13:32:29
投稿者Chen
> > ただ、実際には半角の外字が100個(中国語の発音PinYin)前後しかありませんが。
>
> 2.0.6をリリースしました。
> ・半角か全角かの判定をUnicodeの範囲で行っていますが、明らかにLatin系のコード範囲以外はデフォルトで全角と判定するようにしたので、意図しないコードが半角になるケースは減ったと思います。
> ・外字の開始コードを指定できるようしました。
> ・半角と全角の範囲がオーバーラップした場合は割り当てを中止するようにしました。
>
> > もう一つ問題に気づきました。
> > 波ダッシュ「〜」が表示されていません。
> > この記号は外字割り当ての必要がないと思われますが、本文中空白の箇所のタグ情報を確認したら、外字として扱われています。
> 0x7eなら外字とは判定しないのですが、Chenさんのhtmlソースがわからないので、なんとも言えないですね。

早速2.0.6リリースいただき、ありがとうございます。
2.0.6版での変換をご確認しました。外字重複割り当て問題は解決しました。

波ダッシュ「〜」はu+FF5Eです。
2.0.6版では、「〜」は表示されていますが、外字マップには出力されていません。
例:タグ情報の「&zB124;附」箇所は「〜附」として表示されていますが、コピー/貼り付けしてみると、「〜」は抜けています。
外字マップを確認すると、
<key>zB17D</key><string>&#20041;</string>
<key>zB17E</key><string>&#12310;</string>
<key>zB221</key><string>&#12311;</string>
<key>zB222</key><string>&#39295;</string>
zB124はありませんでした。
ご確認お願いいたします。

タイトルRe^5: EBStudio 2.0.5 外字重複割り当て
記事No1013
投稿日: 2018/01/09(Tue) 13:34:49
投稿者Chen
> > > ただ、実際には半角の外字が100個(中国語の発音PinYin)前後しかありませんが。
> >
> > 2.0.6をリリースしました。
> > ・半角か全角かの判定をUnicodeの範囲で行っていますが、明らかにLatin系のコード範囲以外はデフォルトで全角と判定するようにしたので、意図しないコードが半角になるケースは減ったと思います。
> > ・外字の開始コードを指定できるようしました。
> > ・半角と全角の範囲がオーバーラップした場合は割り当てを中止するようにしました。
> >
> > > もう一つ問題に気づきました。
> > > 波ダッシュ「〜」が表示されていません。
> > > この記号は外字割り当ての必要がないと思われますが、本文中空白の箇所のタグ情報を確認したら、外字として扱われています。
> > 0x7eなら外字とは判定しないのですが、Chenさんのhtmlソースがわからないので、なんとも言えないですね。
>
> 早速2.0.6リリースいただき、ありがとうございます。
> 2.0.6版での変換をご確認しました。外字重複割り当て問題は解決しました。
>
> 波ダッシュ「〜」はu+FF5Eです。
> 2.0.6版では、「〜」は表示されていますが、外字マップには出力されていません。
> 例:タグ情報の「&zB124;附」箇所は「〜附」として表示されていますが、コピー/貼り付けしてみると、「〜」は抜けています。
> 外字マップを確認すると、
> <key>zB17D</key><string>&#20041;</string>
> <key>zB17E</key><string>&#12310;</string>
> <key>zB221</key><string>&#12311;</string>
> <key>zB222</key><string>&#39295;</string>
> zB124はありませんでした。
> ご確認お願いいたします。

ごめんなさい。外字マップは次の通りです。
<key>zB122</key><string>&#32512;</string>
<key>zB123</key><string>&#20146;</string>
<key>zB125</key><string>&#29241;</string>
<key>zB126</key><string>&#21478;</string>
zB124はありませんでした。

タイトルRe^5: EBStudio 2.0.5 外字重複割り当て
記事No1018
投稿日: 2018/01/18(Thu) 19:27:14
投稿者hishida
> 波ダッシュ「〜」はu+FF5Eです。
> 2.0.6版では、「〜」は表示されていますが、外字マップには出力されていません。
> 例:タグ情報の「&zB124;附」箇所は「〜附」として表示されていますが、コピー/貼り付けしてみると、「〜」は抜けています。

FF5Eが外字になること自体は仕様です。

UnicodeのU+FF00 〜 FF60 (半角・全角形)が外字に割り当てられた時にマップが出力されないというbugがありましたので、2.0.7で修正しました。

http://ebstudio.info/manual/EBStudio2/EBStudio2.html

タイトルRe^6: EBStudio 2.0.5 外字重複割り当て
記事No1019
投稿日: 2018/01/19(Fri) 09:31:56
投稿者Chen
> > 波ダッシュ「〜」はu+FF5Eです。
> > 2.0.6版では、「〜」は表示されていますが、外字マップには出力されていません。
> > 例:タグ情報の「&zB124;附」箇所は「〜附」として表示されていますが、コピー/貼り付けしてみると、「〜」は抜けています。
>
> FF5Eが外字になること自体は仕様です。
>
> UnicodeのU+FF00 〜 FF60 (半角・全角形)が外字に割り当てられた時にマップが出力されないというbugがありましたので、2.0.7で修正しました。
>
> http://ebstudio.info/manual/EBStudio2/EBStudio2.html

2.0.7リリース、ありがとうございます。
同じソースを変換して、FF5Eが割り当てられたことが確認できました。
2.0.7の外字mapと2.06と比べて確認したら、ff5eを含めて、次の3文字多くなった。
ufeff 表示に影響しない?
uff5e 前回気づいた波ダッシュ「〜」
uff0d 前回気づかなかったハイフンマイナス記号
これで外字割り当ての重複と抜けが解決できたと思われます。
本当にありがとうございました。