Amazon S3 からデータをインポートするための接続を Anaplan Data Orchestrator で作成します。次に、その接続を使用してデータを抽出し、ソース データセットを作成します。

接続を作成する前に、次のものが必要です。

  • AWS 又は S3 互換クラウド サービスでホストされている S3 バケット
  • アクセス キー ID とシークレット アクセス キーがあり、バケットとオブジェクトに対して少なくとも読み取り権限を持つユーザー

以下を実行します。

  • バケットのサブセットへのアクセスを制限する場合は、プレフィックス又はフォルダー パスを指定します。
  • CSV ファイルを UTF-8 でエンコードします。

S3 データを Data Orchestrator に接続するには、S3 認証情報が必要です。認証情報の詳細については、S3 のドキュメントを参照してください。

接続を作成するには以下を実行します。

  1. 左上のナビゲーション メニューから [Data Orchestrator] を選択します。
  2. リストからデータスペースを選択します。
  3. 左側のパネルで [Connections] を選択します。
  4. [Create connection] を選択します。
  5. [Create connections] ページで [S3] を選択し、[Next] を選択します。
    コネクターが見つからない場合は、[Find...] フィールドに検索ワードを入力します。
  6. [Connection details] ページで次の詳細を入力し、[Next] を選択します。
    • Name (名前):接続の名前を作成します。名前には英数字とアンダースコアを使用できます。
    • Description (説明):接続に関する説明を入力します。
  7. [Connection Credentials] ページで S3 の認証情報を入力し、[Next] を選択します。
    • AWS Key (AWS キー):アクセス キー ID (例: AKIAIOSFODNN7EXAMPLE)。 
    • AWS Secret Key (AWS シークレット キー):シークレット アクセス キー (例: wJalrXUtnFEMI/K7MDENG/bPxRfiCYEXAMPLEKEY)。
    • Bucket (バケット):データが保存されている S3 バケット (例: S3-EXAMPLE-BUCKET)。
  8. 接続テストが完了したら、[Done] を選択します。

Amazon S3 接続からデータを抽出して、ソース データを Data Orchestrator に追加できます。抽出したデータから、ソース データセットを作成します。

データを抽出するには以下を実行します。

  1. 左上のナビゲーション メニューから [Data Orchestrator] を選択します。
  2. リストからデータスペースを選択します。
  3. 左側のパネルから [Source data] を選択します。
  4. [Add data] → [From connection] を選択します。
  5. [Dataset details] ページで次の詳細を入力し、[Next] を選択します。
    • 接続
    • データセット名
    • 説明
    • Path Name (パス名) (以下補足情報を参照)
    • Column Separator (列の区切り文字)
    • Text Delimiter (テキストの区切り文字)
    • Header Row (ヘッダー列)
    • First Data Row (データの一行目)
  6. [Choose an upload type] ページで次の詳細を入力し、[Next] を選択します。
    1. [Load type] を選択します。
      • Full replace (完全置換):現在読み込まれているデータを新しいデータに完全に置換します。
      • Append (追加):新しいデータを現在のテーブルの末尾に追加します。
      • Incremental (増分):データを取得し、以前に読み込まれた内容の増分を更新します。
    2. インポートする列を選択します。
      • 読み込みタイプとして [Incremental] を選択した場合、[Primary Key (PK)] は必須です。システムでは PK を使用して既存のレコードを識別および更新します。[Cursor Field] が自動的に選択され、パターンに一致するファイルの最終更新日が表示されます。これにより、新しいファイル又は更新されたファイルのみが同期に含まれるようになります。
      • 読み込みタイプとして [Append] を選択した場合、システムでは自動的に [Cursor Field] を選択します。したがって、設定する必要はありません。これにより、新しいデータをシームレスに追加し、同期を維持できます。
  7. 確認ダイアログで [Create] を選択します。

データを S3 接続から抽出する際に、パス名の入力が求められます。バケットに同じファイル名パターンのファイルが含まれている場合は、「*.CSV」と入力して、同じファイル名パターンのすべてのファイルをアップロードできます。

S3 バケットの名前が SALES_DATA で、SALES_wk01.CSVSALES_wk02.CSVSALES_wk03.CSV というファイルがあります。[Path name]に「Sales_Files/Sales_*.CSV」と入力すると、三つのファイルすべてが Data Orchestrator にアップロードされます。 

後で同じファイル名パターンでさらにファイルをバケットに追加する場合は、データを同期して新しいファイルをアップロードできます。