こんにちは、Red Hat SSA の小杉です。
本日は LinkedIn のレポートを深く読み、 LinkedIn がなぜ Apache Kafka を作ったのかについて見てみたいと思います。
なお、LinkedIn で利用されているアクティビティデータは顧客が UI を操作したことに着目した"イベント"です。
Netflix でも Apache Kafka を使ったデータパイプラインを構築しており、そこでは以下の”イベント"を大量に扱っています。
- ビデオ視聴活動
- UI アクティビティ
- エラー
- パフォーマンスイベント
- トラブルシューティングと診断イベント