Amazon Web Services: Redshift

データウェアハウスサービス。

データウェアハウスは、日々の大量の業務の利用データなどのログデータと、管理システムのこと。最近はビックデータと言われていて、このデータウェアハウスから関連性を分析する。

各データから関連性を導きだし、「金曜の夜コンビニで漫画を買う 20 代男性はアイスを買うことが多い」みたいな法則を単純集計では見えなかったところを明らかにする作業とそのシステム。

ビッグデータと言われる所以は、テラバイト〜ペタバイトを超える巨大なデータテーブルを Hadoop で扱えるようになったから。
Redshift もペタバイト対応をうたっている。

いわゆる IT 企業や、マーケティング・広告会社の分析基盤などだけでなく、様々な IT を活用した企業でもデータウェアハウスが活躍している。