2011年10月25日火曜日

gforth で日本語

LC_CTYPE – Gforth の起動時点で、この環境変数の値に “UTF-8” が含まれるときは、Gforth は文字列の内部表現に UTF-8 エンコーディングを用い、また入出力のエンコーディングも UTF-8 であると見なす。そうでなければ、8 ビットのエンコーディングを用いる (xchar と Unicode を参照)。この環境変数が設定されていない場合、Gforth は LC_ALL を同様に参照し、これもまた設定されていなければ、LANG を同様に参照する。

で、

xc は、スタック要素として表現される拡張文字 (xchar) である。セルサイズは 1 であり、符号なしセルのサブセットと見なされる。なお、UTF-8 は 31 ビットまでのコードポイントしか表現できない。また、セルサイズが 16 ビットになるシステム上の Gforth では、UTF-8 のうち UCS-2 として表現可能なサブセットにしか対応しない。 

と言うことで、32bit以上なら日本語もふつーに通るようである。

0 件のコメント: