Anaplan では Unicode がサポートされていますが、一部の制御文字は例外です。ただし、インポートする文字の種類によって影響が異なる場合があります。
Unicode の面
Unicode には、組み合わさってさまざまなスクリプトや言語の幅広い文字を作成するコード ポイントが用意されています。
Unicode のコード ポイントは次のいずれかを基準にブロックに分けられます。
- 基本多言語面 (BMP): アルファベットを使用する一般的なスクリプトと言語用です。
- 16 の追加多言語面 (SMP): それほど一般的ではないスクリプトと絵文字、BMP 外の複雑な表意文字をサポートしています。
各面に含まれる文字の詳細については、Unicode のコード チャートを参照してください。
多言語面の影響
Anaplan では、BMP の文字は長さが 1、SMP の文字は長さが 2 になります。
この長さは、Classic エンジンの LEFT、LENGTH、MID、RIGHT の各関数の動作に影響します。各関数では SMP の文字が BMP の 2 文字と同等と見なされます。
さらに、この長さはリスト アイテム名 (又は、モジュール名などの定義可能な他の名前) の 60 文字の制限にも影響します。リスト アイテムでは名前の制限が 60 文字となっていますが、SMP の文字はこの制限では 2 文字としてカウントされます。
正規化
アクセントなどのバリアントを含む文字をインポートする場合は、データを正規化する必要があります。これによりエラーが減り、一貫性が維持されます。たとえば、一部の計算関数では、エンコーディングが異なる同等の文字が通常は別の形で処理されます。
インポートでサポートされていない制御文字
次の Unicode コード ポイントとそれらを表す制御文字は Anaplan モデルにインポートできません。
Unicode コード ポイント | 文字の説明 |
0000 | Null 文字 |
0001 | 見出しの先頭 |
0002 | テキストの先頭 |
0003 | テキストの末尾を表す文字 |
0004 | 転送終了文字 |
0005 | 問い合わせ文字 |
0006 | 肯定応答文字 |
0007 | ベル文字 |
0008 | バックスペース |
000B | 垂直タブ |
000C | フォーム フィード |
000E | シフト アウト |
000F | シフト イン |
0010 | データ リンク エスケープ |
0011 | デバイス制御 1 |
0012 | デバイス制御 2 |
0013 | デバイス制御 3 |
0014 | デバイス制御 4 |
0015 | 否定応答文字 |
0016 | 同期アイドル |
0017 | 転送ブロックの終わり |
0018 | キャンセル文字 |
0019 | メディアの終わり |
001A | 置換文字 |
001B | エスケープ文字 |
001C | ファイル分離文字 |
001D | グループ区切り |
001E | レコード分離文字 |
001F | ユニット分離文字 |