Amazon Redshift SpectrumはS3上に置かれたファイルを直接クエリすることができる。ファイルのRedshiftへのロードは不要。DWHのローカルディスク内に保存されたデータ以外に対しても、Redshiftの分析を拡張できる。これによってデータをS3に格納しておくことで、Redshift上のデータの増加を抑制できる。
クエリはRedshiftにストアされたデータとS3上に置かれたデータの任意の組み合わせを参照することが可能。Spectrum は必要に応じて何千ものインスタンスにスケールアウトされるため、データサイズに関係なくクエリが迅速に実行される。Spectrumの費用はクエリによってS3から読み取られたデータサイズに依存する。このため、CSVファイルよりも列指向フォーマットでデータを保存した方がコスパは高い。