|
![]() ![]() ![]() ![]() ![]() | |
![]() "𐌂" の文字は、UTF-16で4バイトになってしまうんだそうだ。 まぁ、UTF-32の存在意義から考えて、UTF-16の範囲では表せない文字があるはずで、サロゲートペアみたいなモンがUTF-16にも存在するはず・・・というのは想像できる範囲のはずだったのだが、想像出来ていなかったなぁ。色んな箇所で、「文字数×2=バイト数」を前提としたUnicodeプログラムを書いてしまっている気がする。 Windows 2000/XPまでならば、そうしたUTF-16で4バイトになってしまう文字が入力されることがなかった(難しかった)ようなんだが、Vista以降では普通に入力できるんだそうだし、こりゃ、ちゃんと対応しないとダメだよなぁ。 [MBID:dvuks9c2wz/TWID:521450749834715136] 目次の表示: ブログではないので、コメント機能とトラックバック機能は提供していません。ご質問・ご意見等はメール、フィードバックまたはTwitter等からお願いします。いただいたご質問・ご意見などは、この「管理人のひとこと」の記事に追加、あるいは新規の記事にする形で一部または全文をそのまま、あるいは加工させていただいた上で、ご紹介させていただく場合があります。 当サイトでは掲載内容による不具合等に関する責任を持ちません。また、内容の正確性についての保証もありませんので、情報をご利用の際は、利用者の自己責任で確認をお願いします。 |
- 最近の更新 - |
|
3278962 (+0216)[+0255] Copyright© 2010-2025 INASOFT |