Amazon S3 からデータをインポートするための接続を Anaplan Data Orchestrator で作成します。次に、その接続を使用してデータを抽出し、ソース データセットを作成します。

S3 データを Data Orchestrator に接続するには、S3 認証情報が必要です。認証情報の詳細については、S3 のドキュメントを参照してください。

接続を作成するには、あらかじめ CSV ファイルを S3 にアップロードしておく必要があります。

S3 データを Data Orchestrator に接続するには、S3 認証情報が必要です。認証情報の詳細については、S3 のドキュメントを参照してください。

接続を作成するには以下を実行します。

  1. 左上のナビゲーション メニューから [Data Orchestrator] を選択します。
  2. 左側のパネルで [Connections] を選択します。
  3. [Create connection] を選択します。
  4. [Create connections] ページで [S3] を選択し、[Next] を選択します。
    コネクターが見つからない場合は、[Find...] フィールドに検索ワードを入力します。
  5. [Connection details] ページで次の詳細を入力し、[Next] を選択します。
    • Name (名前):接続の名前を作成します。名前には英数字とアンダースコアを使用できます。
    • Description (説明):接続に関する説明を入力します。
  6. [Connection Credentials] ページで S3 の認証情報を入力し、[Next] を選択します。
    • AWS Key (AWS キー):アクセス キー ID (例: AKIAIOSFODNN7EXAMPLE)。 
    • AWS Secret Key (AWS シークレット キー):シークレット アクセス キー (例: wJalrXUtnFEMI/K7MDENG/bPxRfiCYEXAMPLEKEY)。
    • Bucket (バケット):データが保存されている S3 バケット (例: S3-EXAMPLE-BUCKET)。
  7. 接続テストが完了したら、[Done] を選択します。

Amazon S3 接続からデータを抽出して、ソース データを Data Orchestrator に追加できます。抽出したデータから、ソース データセットを作成します。

データを抽出するには以下を実行します。

  1. 左上のナビゲーション メニューから [Data Orchestrator] を選択します。
  2. 左側のパネルから [Source data] を選択します。
  3. [Add data] → [From connection] を選択します。
  4. [Dataset details] ページで次の詳細を入力し、[Next] を選択します。
    • 接続
    • データセット名
    • 説明
    • Path Name (パス名) (以下補足情報を参照)
    • Column Separator (列の区切り文字)
    • Text Delimiter (テキストの区切り文字)
    • Header Row (ヘッダー列)
    • First Data Row (データの一行目)
  5. [Choose an uploaded type] ページで次の詳細を入力し、[Next] を選択します。
    1. [Load type] を選択します。
      • Full replace (完全置換):現在読み込まれているデータを新しいデータに完全に置換します。
      • Append (追加):新しいデータを現在のテーブルの末尾に追加します。
      • Incremental (増分):データを取得し、以前に読み込まれた内容の増分を更新します。
    2. インポートする列を選択します。

 注記:

  • _ab フィールドは Data Orchestrator によって追加され、ユーザー データではありません。
  • 読み込みタイプとして [Incremental] を選択した場合 (部分置換): 
    • [Primary key] チェックボックスをオンにします。ここでは複数のチェックボックスをオンにすることができます。
    • Data Orchestrator では、_ab フィールドをカーソル キーとして使用して変更内容を識別します。値は完全置換には使用されません。 
    • [Cursor Field] はあらかじめ選択されています。
  • 読み込みタイプとして [Append] を選択した場合:
    • Data Orchestrator では、_ab フィールドをカーソル キーとして使用して変更内容を識別します。値は完全置換には使用されません。 
    • [Cursor Field] はファイルの最終更新日に基づいて、事前に選択されています。
  1. 確認ダイアログで [Create] を選択します。

データを S3 接続から抽出する際に、パス名の入力が求められます。バケットに同じファイル名パターンのファイルが含まれている場合は、「*.CSV」と入力して、同じファイル名パターンのすべてのファイルをアップロードできます。

S3 バケットの名前が SALES_DATA で、SALES_wk01.CSVSALES_wk02.CSVSALES_wk03.CSV というファイルがあります。[Path name]に「Sales_Files/Sales_*.CSV」と入力すると、三つのファイルすべてが Data Orchestrator にアップロードされます。 

後で同じファイル名パターンでさらにファイルをバケットに追加する場合は、データを同期して新しいファイルをアップロードできます。