LC_CTYPE
– Gforth の起動時点で、この環境変数の値に “UTF-8” が含まれるときは、Gforth は文字列の内部表現に UTF-8 エンコーディングを用い、また入出力のエンコーディングも UTF-8 であると見なす。そうでなければ、8 ビットのエンコーディングを用いる (xchar と Unicode を参照)。この環境変数が設定されていない場合、Gforth はLC_ALL
を同様に参照し、これもまた設定されていなければ、LANG
を同様に参照する。
で、
xc は、スタック要素として表現される拡張文字 (xchar) である。セルサイズは 1 であり、符号なしセルのサブセットと見なされる。なお、UTF-8 は 31 ビットまでのコードポイントしか表現できない。また、セルサイズが 16 ビットになるシステム上の Gforth では、UTF-8 のうち UCS-2 として表現可能なサブセットにしか対応しない。
と言うことで、32bit以上なら日本語もふつーに通るようである。
0 件のコメント:
コメントを投稿