Redshift

A cluster is a fully managed data warehouse that consists of a set of compute nodes. Each cluster runs an Amazon Redshift engine and contains one or more databases.

クラスターの起動

詳細設定

クラスターの起動

クラスターのエンドポイント

connect
うお!なんだこれ

IAMロール

run query

COPY users FROM 's3://awssampledbuswest2/tickit/allusers_pipe.txt'
CREDENTIALS 'aws_iam_role=arn:aws:iam::363059336304:role/Redshift-Role'
DELIMITER '|';

S3からimport
凄い

SELECT userid, firstname, lastname, city, state
FROM users
WHERE likesports AND NOT likeopera AND state = 'OH'
ORDER BY firstname;

割と早いですね。
ここでもCSVをS3に保存して処理してます♪