Amazon S3 からデータをインポートするための接続を Anaplan Data Orchestrator で作成します。次に、その接続を使用してデータを抽出し、ソース データセットを作成します。
S3 データを Data Orchestrator に接続するには、S3 認証情報が必要です。認証情報の詳細については、S3 のドキュメントを参照してください。
接続を作成するには、あらかじめ CSV ファイルを S3 にアップロードしておく必要があります。
S3 への接続の作成
S3 データを Data Orchestrator に接続するには、S3 認証情報が必要です。認証情報の詳細については、S3 のドキュメントを参照してください。
接続を作成するには以下を実行します。
- 左上のナビゲーション メニューから [Data Orchestrator] を選択します。
- 左側のパネルで [Connections] を選択します。
- [Create connection] を選択します。
- [Create connections] ページで [S3] を選択し、[Next] を選択します。
コネクターが見つからない場合は、[Find...] フィールドに検索ワードを入力します。 - [Connection details] ページで次の詳細を入力し、[Next] を選択します。
- Name (名前):接続の名前を作成します。名前には英数字とアンダースコアを使用できます。
- Description (説明):接続に関する説明を入力します。
- [Connection Credentials] ページで S3 の認証情報を入力し、[Next] を選択します。
- AWS Key (AWS キー):アクセス キー ID (例:
AKIAIOSFODNN7EXAMPLE
)。 - AWS Secret Key (AWS シークレット キー):シークレット アクセス キー (例:
wJalrXUtnFEMI/K7MDENG/bPxRfiCYEXAMPLEKEY
)。 - Bucket (バケット):データが保存されている S3 バケット (例:
S3-EXAMPLE-BUCKET
)。
- AWS Key (AWS キー):アクセス キー ID (例:
- 接続テストが完了したら、[Done] を選択します。
Amazon S3 接続からのデータの抽出
Amazon S3 接続からデータを抽出して、ソース データを Data Orchestrator に追加できます。抽出したデータから、ソース データセットを作成します。
データを抽出するには以下を実行します。
- 左上のナビゲーション メニューから [Data Orchestrator] を選択します。
- 左側のパネルから [Source data] を選択します。
- [Add data] → [From connection] を選択します。
- [Dataset details] ページで次の詳細を入力し、[Next] を選択します。
- 接続
- データセット名
- 説明
- Path Name (パス名) (以下補足情報を参照)
- Column Separator (列の区切り文字)
- Text Delimiter (テキストの区切り文字)
- Header Row (ヘッダー列)
- First Data Row (データの一行目)
- [Choose an uploaded type] ページで次の詳細を入力し、[Next] を選択します。
- [Load type] を選択します。
- Full replace (完全置換):現在読み込まれているデータを新しいデータに完全に置換します。
- Append (追加):新しいデータを現在のテーブルの末尾に追加します。
- Incremental (増分):データを取得し、以前に読み込まれた内容の増分を更新します。
- インポートする列を選択します。
- [Load type] を選択します。
注記:
_ab
フィールドは Data Orchestrator によって追加され、ユーザー データではありません。- 読み込みタイプとして [Incremental] を選択した場合 (部分置換):
- [Primary key] チェックボックスをオンにします。ここでは複数のチェックボックスをオンにすることができます。
- Data Orchestrator では、
_ab
フィールドをカーソル キーとして使用して変更内容を識別します。値は完全置換には使用されません。 - [Cursor Field] はあらかじめ選択されています。
- 読み込みタイプとして [Append] を選択した場合:
- Data Orchestrator では、
_ab
フィールドをカーソル キーとして使用して変更内容を識別します。値は完全置換には使用されません。 - [Cursor Field] はファイルの最終更新日に基づいて、事前に選択されています。
- Data Orchestrator では、
- 確認ダイアログで [Create] を選択します。
Amazon S3 データ抽出のパス名
データを S3 接続から抽出する際に、パス名の入力が求められます。バケットに同じファイル名パターンのファイルが含まれている場合は、「*.CSV
」と入力して、同じファイル名パターンのすべてのファイルをアップロードできます。
例
S3 バケットの名前が SALES_DATA
で、SALES_wk01.CSV
、SALES_wk02.CSV
、SALES_wk03.CSV
というファイルがあります。[Path name]に「Sales_Files/Sales_*.CSV
」と入力すると、三つのファイルすべてが Data Orchestrator にアップロードされます。
後で同じファイル名パターンでさらにファイルをバケットに追加する場合は、データを同期して新しいファイルをアップロードできます。