Google Cloud Storage (GCS) からデータをインポートするための接続を Anaplan Data Orchestrator で作成します。次に、その接続を使用してデータを抽出し、ソース データセットを作成します。
接続を作成する前に、次のものが必要です。
- Google Cloud Platform でホストされている GCS バケット
- 以下を持つユーザー:
- Google Cloud Platform (GCP) のサービス アカウント メール
- GCP 秘密鍵
- バケットとオブジェクトに対して少なくとも読み取り権限を持つバケット名
- バケットのサブセットへのフォルダー パス
- Data Orchestrator アプリケーションへのアクセス権
詳細については、Google Cloud のドキュメントを参照してください。
Google Cloud Storage への接続の作成
接続を作成するには以下を実行します。
- 左上のナビゲーション メニューから [Data Orchestrator] を選択します。
- 左側のパネルから [Connections] を選択します。
- [Create connection] を選択します。
- [Create connection] ページで [Google Cloud Storage] を選択してから [Next] を選択します。
コネクターが見つからない場合は、[Find...] フィールドに検索ワードを入力します。 - [Connection details] ページで次の詳細を入力し、[Next] を選択します。
- Name (名前):接続の名前を作成します。名前には英数字とアンダースコアを使用できます。
- Description (説明):必要に応じて、接続に関する説明を入力します。
- [Connection credentials] ページで Google の認証情報を入力してから [Next] を選択します。
- GCP Service Account Email (GCP のサービス アカウント メール):GCP のサービス アカウント メールを入力します (例:
XXXXXXXXXXX-compute@developer.gserviceaccount.com)。 - GCP Private Key (GCP 秘密鍵):GCP 秘密鍵を入力します。
例:
- GCP Service Account Email (GCP のサービス アカウント メール):GCP のサービス アカウント メールを入力します (例:
-----BEGIN PRIVATE KEY-----
************************************************************
...(Base64 形式の秘密鍵の内容) ...
... 複数の行 ...
-----END PRIVATE KEY-----
- Bucket name (バケット名):データが保存されている GCS バケット (例:
GCS-EXAMPLE-BUCKET)。 - 接続テストが完了したら、[Done] を選択します。
Google Cloud Storage 接続からのデータの抽出
Google Cloud Storage 接続からデータを抽出して、ソース データを Data Orchestrator に追加できます。抽出したデータから、ソース データセットを作成します。
データを抽出するには以下を実行します。
- 左上のナビゲーション メニューから [Data Orchestrator] を選択します。
- 左側のパネルから [Source data] を選択します。
- [Add data] → [From connection] を選択します。
- [Dataset details] ページで次の詳細を入力し、[Next] を選択します。
- Connection (接続):作成した GCS 接続を選択します。
- Dataset name (データセット名):データセットの名前を入力します。
- Description (説明):必要に応じて、データセットの説明を入力します。
- Path name (パス名):ファイル パス パターンを指定します (デフォルトのパターン: /**/*.csv)。
- Column Separator (列の区切り文字)次のオプションから区切り文字を選択します:[Tab]、[Comma]、[Semicolon]、[Other]。[Other] を選択した場合はカスタム区切り文字を指定します。
- Text Delimiter (テキストの区切り文字):CSV 内のテキストを囲むために使用する文字を指定します (例:
")。 - Header Row (ヘッダー列):ヘッダーが配置される行番号を指定します (例:
1)。 - First Data Row (データの一行目):実際のデータが始まる行番号を指定します (例:
2)。
- [Choose an upload type] ページで次の詳細を入力し、[Next] を選択します。
- [Load type] を選択します。
- Full replace (完全置換):データセット全体を新しいデータに置き換えます。
- Append (追加):以前のレコードを削除または更新せずに、新しいファイル又は更新されたファイルのレコードを既存のデータセットに追加します。
- Incremental (増分):新規または更新されたファイルからレコードを取得し、一致する主キーに基づいてデータセット内の既存のレコードを更新し、一致しない主キーを持つレコードを追加します。
- インポートする列を選択します。
- 読み込みタイプとして [Incremental] を選択した場合、[Primary Key (PK)] は必須です。システムでは PK を使用して既存のレコードを識別および更新します。[Cursor Field] が自動的に選択され、パターンに一致するファイルの最終更新日が表示されます。これにより、新しいファイル又は更新されたファイルのみが同期に含まれるようになります。
- 読み込みタイプとして [Append] を選択した場合、システムでは自動的に [Cursor Field] を選択します。したがって、設定する必要はありません。これにより、新しいデータをシームレスに追加し、同期を維持できます。
- [Load type] を選択します。
- 確認ダイアログで [Create] を選択します。