Amazon S3 からのデータのインポート

S3 データを Data Orchestrator に接続するには、S3 認証情報が必要です。認証情報の詳細については、S3 のドキュメントを参照してください。

接続を作成するには以下を実行します。

左上のナビゲーションメニューから [Data Orchestrator] を選択します。
リストからデータスペースを選択します。
左側のパネルで [Connections] を選択します。
[Create connection] を選択します。
[Create connections] ページで [S3] を選択し、[Next] を選択します。
コネクターが見つからない場合は、[Find...] フィールドに検索ワードを入力します。
[Connection details] ページで次の詳細を入力し、[Next] を選択します。
- Name (名前):接続の名前を作成します。名前には英数字とアンダースコアを使用できます。
- Description (説明):接続に関する説明を入力します。
[Connection Credentials] ページで S3 の認証情報を入力し、[Next] を選択します。
- AWS Key (AWS キー):アクセスキー ID (例: AKIAIOSFODNN7EXAMPLE)。
- AWS Secret Key (AWS シークレットキー):シークレットアクセスキー (例: wJalrXUtnFEMI/K7MDENG/bPxRfiCYEXAMPLEKEY)。
- Bucket (バケット):データが保存されている S3 バケット (例: S3-EXAMPLE-BUCKET)。
接続テストが完了したら、[Done] を選択します。

Amazon S3 接続からデータを抽出して、ソースデータを Data Orchestrator に追加できます。抽出したデータから、ソースデータセットを作成します。

データを抽出するには以下を実行します。

左上のナビゲーションメニューから [Data Orchestrator] を選択します。
リストからデータスペースを選択します。
左側のパネルから [Source data] を選択します。
[Add data] → [From connection] を選択します。
[Dataset details] ページで次の詳細を入力し、[Next] を選択します。
- Connection (接続):作成した S3 接続を選択します。
- Dataset name (データセット名):データセットの名前を入力します。
- Description (説明):必要に応じて、データセットの説明を入力します。
- Path name (パス名):ファイルパスパターンを指定します (デフォルト: /**/*.csv) 以下の「Amazon S3 データ抽出のパス名」セクションの追加情報を参照してください。
- Column Separator (列の区切り文字):次のオプションから区切り文字を選択します:[Tab]、[Comma]、[Semicolon]、[Other]。[Other] を選択した場合はカスタム区切り文字を指定します。
- Text Delimiter (テキストの区切り文字):CSV 内のテキストを囲むために使用する文字を指定します (例: ")。
- Header Row (ヘッダー列):ヘッダーが配置される行番号を指定します (例: 1)。
- First Data Row (データの一行目):実際のデータが始まる行番号を指定します (例: 2)。
- Escape Character (エスケープ文字):エスケープ文字を指定するか、フィールドを空白のままにします。
  - CSV ファイルのデータフィールドにテキストの一部として引用符とカンマが含まれている場合、そのフィールドを単一の値として処理するためにエスケープ文字を指定する必要があります。
    - 例: "\"Hello, example, 1\""フィールドに「\」を入力します。
    - 例: "#"Hello, example, 2#""
      フィールドに「#」を入力します。
  - CSV ファイルのデータフィールドにエスケープ文字が含まれていない場合は、そのフィールドを空白のままにします。
    エスケープ文字が不要な例: "Hello, example, 0"
[Choose an upload type] ページで次の詳細を入力し、[Next] を選択します。
1. [Load type] を選択します。
  - Full replace (完全置換):現在読み込まれているデータを新しいデータに完全に置換します。
  - Append (追加):新しいデータを現在のテーブルの末尾に追加します。
  - Incremental (増分):データを取得し、以前に読み込まれた内容の増分を更新します。
2. インポートする列を選択します。
  - 読み込みタイプとして [Incremental] を選択した場合、[Primary Key (PK)] は必須です。システムでは PK を使用して既存のレコードを識別および更新します。[Cursor Field] が自動的に選択され、パターンに一致するファイルの最終更新日が表示されます。これにより、新しいファイル又は更新されたファイルのみが同期に含まれるようになります。
  - 読み込みタイプとして [Append] を選択した場合、システムでは自動的に [Cursor Field] を選択します。したがって、設定する必要はありません。これにより、新しいデータをシームレスに追加し、同期を維持できます。
確認ダイアログで [Create] を選択します。

データを S3 接続から抽出する際に、パス名の入力が求められます。バケットに同じファイル名パターンのファイルが含まれている場合は、「*.CSV」と入力して、同じファイル名パターンのすべてのファイルをアップロードできます。

S3 バケットの名前が SALES_DATA で、SALES_wk01.CSV、SALES_wk02.CSV、SALES_wk03.CSV というファイルがあります。[Path name]に「Sales_Files/Sales_*.CSV」と入力すると、三つのファイルすべてが Data Orchestrator にアップロードされます。

後で同じファイル名パターンでさらにファイルをバケットに追加する場合は、データを同期して新しいファイルをアップロードできます。

詳細については、コミュニティ記事「Setup your ADO Demo using an AWS S3 Connection」(AWS S3 接続を使用した ADO デモのセットアップ) を参照してください。

Amazon S3 からのデータのインポート

S3 への接続の作成

Amazon S3 接続からのデータの抽出

Amazon S3 データ抽出のパス名

例

communityLink.title

title

caseportalLink.text

registrationLink.text

callLink.text