INASOFT 管理人のひとことフリーソフトダウンロードサイト「INASOFT」の管理人 矢吹拓也 が日々の「ひとこと」を語るページです。 2021年1月1日より、旧ブログ(blog.inasoft.org)からお引越ししました。 ・INASOFT Webサイト: https://www.inasoft.org/ ・管理人のふたこと(長文記事/寄稿文): https://www.inasoft.org/talk/ 2022年7月下旬より再び本業多忙化してきているため、更新頻度は落ちます。 [2022/7/24 19:32] Tweet ■『禰󠄀豆子』に含まれる特殊な文字コードを自前のシステムで扱えるか確認2022年 2月 3日(木) 0:00:00 |
RSS配信中 | |
先日Twitterで、 (煉󠄁獄杏寿郎の「煉󠄁」、鬼舞辻󠄀無惨の「辻󠄀」も異体字セレクタ案件を使っている) という話を目にしました。 ソフトウェアの対応というのは結構大変です。Windowsの標準コンポーネントを使っている場合は、とりあえず入力と表示は問題なくできます(そこから文字列を取り出して扱おうとするのはさておき)。ただ、エディタのような、独自に入力と表示を行う仕組みを持つ場合は、大変です。「竈門禰󠄀豆子」の表記は、手元にあるソフトでは、メモ帳では表示できますが、サクラエディタでは表示できませんでした。 さて、自前で作成した、この「管理人のひとこと」のシステムで扱えるのかな?ということが気になりました。 この「管理人のひとこと」システムの背後には、さくらインターネットで準備しているデータベースが控えており、そこの文字コードをきちんと設定したっけ?ということが気になりまして。 いちおう手元の環境(PCとスマホ)では、正しく表示されているように見えるので、どうやら正しく設定されているようですね。 ちなみに、『禰󠄀豆子』は、内部的にはUTF-8で「E7A6B0EDAD80EDB480E8B186E5AD90」と表されるようです。 禰󠄀だけバイト表現が長いのは、この異体字セレクタというやつのせい。禰だと「E7A6B0」になります。 ちなみに、 他にも、文字コード上、扱いが特殊になる文字と言えば、以前(2014年)にも、𡈽[F0A188BD:UTF-8で4バイト]、𠮟[F0A0AE9F:UTF-8で4バイト]であったり、絵文字(✌[UTF-8でE29C8C]など)を扱えるかの実験も行いましたっけね。この先のネタで、ヒエログリフ(𓈍[UTF-8でF093888D]など)も扱う予定。 また、かつてShift-JISを多用していた時代には「表」(SJISで955Cとなり、文字コード0x5Cが登場する※)が正しく扱えるかというのもありましたっけ。 ※0x5c(\) …… 一部プログラミング言語でのエスケープ文字として扱われたり、Windowsでのディレクトリ区切り記号として使われるため、例えば「表」を含むファイル名をうまく扱えないソフトウェアが存在した。 【追記】製作・公開しているアプリケーションの方だとどうだろう? 基本的に、Windows NT以降では、アプリケーションがUTF-16対応して、かつ、OSの機能に頼り切って作っていれば、だいたいなんとかなるようですね。 NTFSがUnicodeの範囲内の文字なら大体ファイル名として使えるとあって、禰󠄀豆子だろうが絵文字だろうがヒエログリフだろうが、ファイル名になる…ということは、アラームを鳴らすためにwavファイルを選択できるようにしたアプリケーションも、禰󠄀豆子や絵文字やヒエログリフを扱えることが求められます。 なので、アラーム機能を持ち、wavファイルを選択することができる「マウスのお供」は、禰󠄀豆子や絵文字やヒエログリフへの対応が求められます。OS機能に頼り切りの「マウスのお供」なら、上記の通り、無事に扱うことができていました。 この条件を満たさない、初期の頃の疑似シリーズや、「いじくるつくーる」「すっきり!! デフラグ」は、多分、禰󠄀豆子や絵文字やヒエログリフは扱えないだろうなと思われます。 目次の表示: ブログではないので、コメント機能とトラックバック機能は提供していません。ご質問・ご意見等はメール、フィードバックまたはTwitter等からお願いします。いただいたご質問・ご意見などは、この「管理人のひとこと」の記事に追加、あるいは新規の記事にする形で一部または全文をそのまま、あるいは加工させていただいた上で、ご紹介させていただく場合があります。 当サイトでは掲載内容による不具合等に関する責任を持ちません。また、内容の正確性についての保証もありませんので、情報をご利用の際は、利用者の自己責任で確認をお願いします。 |
- 最近の更新 - |
|
3212234 (+0145)[+0218] Copyright© 2010-2024 INASOFT |