INASOFT 管理人のひとこと


フリーソフトダウンロードサイト「INASOFT」の管理人 矢吹拓也 が日々の「ひとこと」を語るページです。
2021年1月1日より、旧ブログ(blog.inasoft.org)からお引越ししました。
・INASOFT Webサイト: https://www.inasoft.org/
・管理人のふたこと(長文記事/寄稿文): https://www.inasoft.org/talk/
本業の方のお仕事が再び忙しくなりつつあるので、断続的にしばらく更新が止まることがあります。

目次 | ←前へ / 2016-08-27 00:07 / 次へ→ / 最新へ⇒

■Windowsでパイプに流す文字列の文字コードは何にするのが良いか…

2016/ 8/27 0:07:08


RSSRSS配信中

https://www.inasoft.org/








昨日、コピペテキスト修飾除去でPython3.4直接呼び出しを止めてパイプ経由での文字列渡しをするということを考えていることを書いたわけですが、いざ、具体的に実装しようとした場合、パイプから文字列を読み込んで解釈するプログラムは、どんな文字コードが来ることを期待しているのか…ということに迷いが生じました。

普通にやっていると、Shift-JIS(正確にはCP932)で文字列をやりとりしときゃーいいのかなぁ…なんて、軽く思ってしまいます。

ただし、「コピペテキスト修飾除去」は、内部的にはUTF-16LEで動作しているので、可能ならこのままパイプに流し込みたい。

いや、まてよ。最近の流行を考えると、UTF-8に対応させておくというのも重要か。

そういうことなので、パイプに流す文字列の文字コードは「Shift-JIS」「UTF-16LE」「UTF-8」の3種類を準備するってのが、利用者にとって利便性が高いかな、と考えています。

ところで、Windowsの世界では、「UTF-16LE」を指して「Unicode」と呼ぶことが多いですね。

実際、このソフトの解説でも、そのように書いていることがあります。

「USBメモリ」を「USB」と呼んだり「Wikipedia」を「Wiki」って呼ぶみたいな感じで、なんだか気持ち悪いのですが、一般的にそう認識している人が多いのも確かで(Windowsに付属するソフトがそう呼んでいるし)、多くの人に分かりやすく意識してもらうために、どういう名前で載せるのが良いのか、ちょっと悩みますね。

自分の気持ち悪い感情を捨ててでも、一般的な表記にするか。

あるいは正確を期した表記にするか(一般的な表記ではないので、分からない人から質問が来るかもしれない)。

まぁ、「UnicodeかUTF-16LEかで質問を出してくる」リテラシーレベルの人が、「文字コードを選択しようと考えるシチュエーション」に陥るというのも、おかしな話でもありますかね。




目次 | ←前へ / 2016-08-27 00:07 / 次へ→ / 最新へ⇒


目次の表示:


ブログではないので、コメント機能とトラックバック機能は提供していません。ご質問・ご意見等はメールフィードバックまたはTwitter等からお願いします。いただいたご質問・ご意見などは、この「管理人のひとこと」の記事に追加、あるいは新規の記事にする形で一部または全文をそのまま、あるいは加工させていただいた上で、ご紹介させていただく場合があります。
当サイトでは掲載内容による不具合等に関する責任を持ちません。また、内容の正確性についての保証もありませんので、情報をご利用の際は、利用者の自己責任で確認をお願いします。本ページは公開から1年半後の任意のタイミングで削除される予定です。




2555348 (+0492)[+0556]

Copyright© 2010-2021 INASOFT