ActiBookアプリアイコンActiBookアプリをダウンロード(無償)

  • Available on the Appstore
  • Available on the Google play

概要

TET5

10.2.4 Unicode変換関数C++ string convert_to_unicode(wstring inputformat, string input, wstring optlist)C# Java String convert_to_unicode(String inputformat, byte[ ] input, String optlist)Perl PHP string convert_to_unicode(string inputformat, string input, string optlist)C const char *TET_convert_to_unicode(TET *tet,const char *inputformat, const char *input, int inputlen, int *outputlen, const char *optlist))任意のエンコーディングの文字列を、さまざまな形式のUnicode文字列へ変換します。inputformat入力文字列の解釈を指定するUnicodeテキスト形式またはエンコーディング名:> Unicodeテキストの各形式:utf8・ebcdicutf8・utf16・utf16le・utf16be・utf32> 168ページの10.1.4「エンコーディング名」に従ったエンコーディング名>キーワードautoは右記の動作を指定します:入力文字列にUTF-8かUTF-16のBOMがある場合には、それを用いて正しい形式が決定され、そうでない場合はカレントシステムコードページと見なされます。input Unicodeへ変換したい文字列。inputlen(C言語バインディングのみ)入力文字列の長さをバイト単位で。inputlen=0ならば、ヌル終端文字列を与える必要があります。outputlen(C言語バインディングのみ)返される文字列の長さ(バイト単位で)を格納させたいメモリ位置へのCスタイルポインタ。optlist表10.5に従ってオプションを指定したオプションリスト:>入力フィルタオプション:charref・escapesequence> Unicode変換オプション:bom・errorpolicy・inflate・outputformat戻り値詳細バインディング指定した引数とオプションに従って入力文字列から生成されたUnicode文字列。入力文字列が、指定した入力形式に従っていない(無効なUTF-8文字列など)ときは、errorpolicy=returnであれば空の出力文字列が返され、errorpolicy=exceptionであれば例外が発生します。この関数はUnicode文字列変換全般に有用でしょう。これは、適当なUnicode変換機能を提供していない環境で作業するユーザの利便のために提供されています。Cバインディング:返される文字列は、最大10エントリを持つリングバッファに格納されます。10個を超える文字列が変換されたときには、バッファは再利用されますので、10個を超える文字列を同時に利用したい場合には、クライアント側でその文字列を複製しておく必要があります。たとえばprintf( )文1個の中にはこの関数への呼び出しを最大10個まで引数として入れることができます。10個を超える文字列が同時に使用されないならば、その戻り文字列は互いに独立であることが保証されているからです。C++バインディング:inputformatとoptlistは通常通りwstringとして渡す必要がありますが、inputと戻りデータはstring型を持つ必要があります。Pythonバインディング:UTF-8の戻り値は文字列として返ります。Python 3:非UTF-8の戻り値はバイト列として返ります。10.2一般関数177