INASOFT 管理人のひとこと


フリーソフトダウンロードサイト「INASOFT」の管理人 矢吹拓也 が日々の「ひとこと」を語るページです。
2021年1月1日より、旧ブログ(blog.inasoft.org)からお引越ししました。
・INASOFT Webサイト: https://www.inasoft.org/
・管理人のふたこと(長文記事/寄稿文): https://www.inasoft.org/talk/
2022年7月下旬より再び本業多忙化してきているため、更新頻度は落ちます。 [2022/7/24 19:32]

目次 | ←前へ / 2014-08-21 00:00 / 次へ→ / 最新へ⇒

■改行コード変換のバージョンアップ予定

2014年 8月21日(木) 0:00:00 [さくらのブログから転記]



RSSRSS配信中
https://www.inasoft.org/



8月17日の正式版公開 の追記の方でも書きましたが、改行コード変換について、どうも「UTF-32」関連のコードがうまく動かないことが分かってきましたので、次のバージョンからはUTF-32関連の機能を削除しようかと考えています。

ってか、ずいぶん前に動作テストした気でいたのですが、どうやら、別ソフト(複数行置換)に対してテストをした物と勘違いしていたらしく、たぶん、これまで一度も正常に動いたことの無い機能だったみたい。思い込みの力は恐ろしい...

Windowsの文字コードの取り扱いに関する、UTF-32の機能は .NET Framework 上だけで有効な物らしく、ネイティブな実行環境ではサポートされていないみたいなんですね。

ちなみに、UTF-32は、Unicodeのすべての文字を、直接的にコードで表現できる唯一のコードなんだそうですが、1文字=必ず4バイトというのは、あまりにも非効率的すぎてほとんどの人が使っていないんだとか。

ほとんどの人が使っていないのなら、その機能を維持し続ける必要もなさそうですね。

ちなみに知らなかったのですが、UTF-16にも、UTF-8のようなサロゲートペアの仕掛けがあったんですね。

(詳細はググってね)

そりゃそうか。32bitないと表現しきれない文字があるというのに、16bitの世界だけですべての文字が表現できるわけがない。ただ、滅多にないので、表舞台に出てくることが無いんでしょうね。

今、僕の作っているUnicode関連のプログラムは、「1文字=2バイト」を前提に作られているものが多いですね。

(Windows XPのメモ帳も、そういう前提で作られているのだとか)

たぶん、いくつかの処理が崩壊するっぽい。やばい。やばいけど・・・とりあえず即対処は勘弁を。

というわけで、遠からず、改行コード変換は次のバージョンを出そうかと考えています。




目次 | ←前へ / 2014-08-21 00:00 / 次へ→ / 最新へ⇒


目次の表示:


ブログではないので、コメント機能とトラックバック機能は提供していません。ご質問・ご意見等はメールフィードバックまたはTwitter等からお願いします。いただいたご質問・ご意見などは、この「管理人のひとこと」の記事に追加、あるいは新規の記事にする形で一部または全文をそのまま、あるいは加工させていただいた上で、ご紹介させていただく場合があります。
当サイトでは掲載内容による不具合等に関する責任を持ちません。また、内容の正確性についての保証もありませんので、情報をご利用の際は、利用者の自己責任で確認をお願いします。本ページは公開から1年半後の任意のタイミングで削除される予定です。


- 最近の更新 -



3129813 (+0275)[+0470]

Copyright© 2010-2024 INASOFT