INASOFT 管理人のひとこと


フリーソフトダウンロードサイト「INASOFT」の管理人 矢吹拓也 が日々の「ひとこと」を語るページです。
2021年1月1日より、旧ブログ(blog.inasoft.org)からお引越ししました。
・INASOFT Webサイト: https://www.inasoft.org/
・管理人のふたこと(長文記事/寄稿文): https://www.inasoft.org/talk/
2022年7月下旬より再び本業多忙化してきているため、更新頻度は落ちます。 [2022/7/24 19:32]

目次 | ←前へ / 2022-02-03 00:00 / 次へ→ / 最新へ⇒

■『禰󠄀豆子』に含まれる特殊な文字コードを自前のシステムで扱えるか確認

2022年 2月 3日(木) 0:00:00



RSSRSS配信中
https://www.inasoft.org/



先日Twitterで、

(鬼滅の刃の登場キャラクター)『禰󠄀豆子』の『禰󠄀』の文字コードは、「禰+異体字セレクタU+E0100」で表される特殊なもの。
(煉󠄁獄杏寿郎の「煉󠄁」、鬼舞辻󠄀無惨の「辻󠄀」も異体字セレクタ案件を使っている)

という話を目にしました。

ソフトウェアの対応というのは結構大変です。Windowsの標準コンポーネントを使っている場合は、とりあえず入力と表示は問題なくできます(そこから文字列を取り出して扱おうとするのはさておき)。ただ、エディタのような、独自に入力と表示を行う仕組みを持つ場合は、大変です。「竈門禰󠄀豆子」の表記は、手元にあるソフトでは、メモ帳では表示できますが、サクラエディタでは表示できませんでした。

竈門禰󠄀豆子はメモ帳では表示できるが、サクラエディタでは表示できない

さて、自前で作成した、この「管理人のひとこと」のシステムで扱えるのかな?ということが気になりました。

この「管理人のひとこと」システムの背後には、さくらインターネットで準備しているデータベースが控えており、そこの文字コードをきちんと設定したっけ?ということが気になりまして。

いちおう手元の環境(PCとスマホ)では、正しく表示されているように見えるので、どうやら正しく設定されているようですね。

ちなみに、『禰󠄀』は、内部的にはUTF-8で「E7A6B0EDAD80EDB480E8B186E5AD90」と表されるようです。

禰󠄀だけバイト表現が長いのは、この異体字セレクタというやつのせい。だと「E7A6B0」になります。

ちなみに、
煉󠄁E78589EDAD80EDB481異体字セレクタ
辻󠄀E8BEBBEDAD80EDB480異体字セレクタ
です。

他にも、文字コード上、扱いが特殊になる文字と言えば、以前(2014年)にも、𡈽[F0A188BD:UTF-8で4バイト]、𠮟[F0A0AE9F:UTF-8で4バイト]であったり、絵文字([UTF-8でE29C8C]など)を扱えるかの実験も行いましたっけね。この先のネタで、ヒエログリフ(𓈍[UTF-8でF093888D]など)も扱う予定。

竈門禰󠄀豆子

また、かつてShift-JISを多用していた時代には「表」(SJISで955Cとなり、文字コード0x5Cが登場するが正しく扱えるかというのもありましたっけ。

※0x5c(\) …… 一部プログラミング言語でのエスケープ文字として扱われたり、Windowsでのディレクトリ区切り記号として使われるため、例えば「表」を含むファイル名をうまく扱えないソフトウェアが存在した。

【追記】製作・公開しているアプリケーションの方だとどうだろう?

基本的に、Windows NT以降では、アプリケーションがUTF-16対応して、かつ、OSの機能に頼り切って作っていれば、だいたいなんとかなるようですね。

NTFSがUnicodeの範囲内の文字なら大体ファイル名として使えるとあって、禰󠄀豆子だろうが絵文字だろうがヒエログリフだろうが、ファイル名になる…ということは、アラームを鳴らすためにwavファイルを選択できるようにしたアプリケーションも、禰󠄀豆子や絵文字やヒエログリフを扱えることが求められます。

OS機能に頼り切りの「マウスのお供」なら禰󠄀豆子が扱える

なので、アラーム機能を持ち、wavファイルを選択することができる「マウスのお供」は、禰󠄀豆子や絵文字やヒエログリフへの対応が求められます。OS機能に頼り切りの「マウスのお供」なら、上記の通り、無事に扱うことができていました。

この条件を満たさない、初期の頃の疑似シリーズや、「いじくるつくーる」「すっきり!! デフラグ」は、多分、禰󠄀豆子や絵文字やヒエログリフは扱えないだろうなと思われます。



目次 | ←前へ / 2022-02-03 00:00 / 次へ→ / 最新へ⇒


目次の表示:


ブログではないので、コメント機能とトラックバック機能は提供していません。ご質問・ご意見等はメールフィードバックまたはTwitter等からお願いします。いただいたご質問・ご意見などは、この「管理人のひとこと」の記事に追加、あるいは新規の記事にする形で一部または全文をそのまま、あるいは加工させていただいた上で、ご紹介させていただく場合があります。
当サイトでは掲載内容による不具合等に関する責任を持ちません。また、内容の正確性についての保証もありませんので、情報をご利用の際は、利用者の自己責任で確認をお願いします。本ページは公開から1年半後の任意のタイミングで削除される予定です。


- 最近の更新 -



3212234 (+0145)[+0218]

Copyright© 2010-2024 INASOFT