📗

大量のイベントデータをバッチ処理する

システムデザインで大量のイベントデータをバッチ処理するユースケースとしては、リアルタイム性が要求されないデータを集計することが多いです。イベントデータとしてはユーザーの行動ログ、システムメトリクス、IoTデバイスからのセンサーデータなどがあげられます。この章では、大量のデータを分散バッチ処理する技術や、どのように扱うかについて離していきます。

MapReduceとApache Hadoop

MapReduceは、2004年にGoogleから発表されたデータ処理の代表的なモデルです。彼らの論文「MapReduce: Simplified Data Processing on Large Clusters」において、関数型プログラミングでよく使用されるmap関数とreduce関数から着目を得て開発されたものです。
すべてを見るには

返金は購入日から1日以内に申し出て下さい。詳細はこちらからご確認ください。
また、このコンテンツ以外の他の永久アクセス権は付与されない事はご注意下さい。

支払いはによって保護されています

購入コードをお持ちの場合は、こちらから購入コードを入力して購入してください。
(Stripeのクーポンコードではありません)

購入済の方はこちらからログインしてください