一括表示 |
---|
小学館故事ことわざ辞典のEPWING化にチャレンジしています。 |
ここでお尋ねするのは趣旨違いかなと考えながら、重ねて具体的に書くと以下の事を行っています。 |
>スクリプトのコードがあっていないような気が 以下の説明は、スクリプト、kotowaza.txt ともに、シフトJISだと仮定しています。 質問1 漢字を削る → s/\p{Han}//g; で出来ますが、これを使うためには 文字コードをきちんと指定する必要があります。 use encodeing 'cp932'; open IN, '<:encoding(cp932)', 'kotowaza.txt'; がおまじないです。 質問2 ジャンプ先のタグ → 気にせずに、全ての項目にタグを付けてしまってはどうでしょう? 重複するかもしれませんが。下の例参照。 use encoding 'cp932'; $flg = 1; open IN, '<:encoding(cp932)', 'kotowaza.txt'; while(<IN>){ (中略) $kana =~s/\p{Han}//g; #← 漢字を削る # $kana =~s/[亜-K]//g; (中略) print "<dt id=\"$kanji\">$kanji"; #← タグをつける |
nopty さん レス、感謝します。 |
>【】内がからになってしまいました。 |
上田さん ありがとうございました。 |
noptyさん ありがとうございます。 |