Skip to content

AWS DataPipeline S3 Redshift 読み込みに必要なものをインストール

Posted on:2019年2月13日 at 00:00

CSV 読み込み、Redshift 書き出しに必要なもの

DataPipeline で起動する EC2 の aws-cli は古い場合があるのでアップデートを入れておく Redshift と連携するなら postgresql もインストールしておく

#!/bin/bash
echo 'aws-cli postgresql install start'
sudo yum update aws-cli -y
sudo yum install postgresql -y
(sudo easy_install pip) && (sudo pip install --no-cache-dir --upgrade awscli)
echo 'python3 install and pip requests boto3 install start'
sudo yum install -y python3 python3-devel && \
sudo python3 -m pip install --upgrade pip && \
sudo python3 -m pip install requests boto3

EC2ResourceObj の image id も明示的に指定したほうが良い。