- 大規模データセットのためのアルゴリズムとデータ構造
-
マイナビ出版
デジェラ・メジェドヴィッチ エミン・タヒロヴィッチ イネス・デドヴィッチ 岡田佑一- 価格
- 4,180円(本体3,800円+税)
- 発行年月
- 2024年07月
- 判型
- B5
- ISBN
- 9784839984168
|
ゲスト さん (ログイン) |
|
オンライン書店【ホンヤクラブ】はお好きな本屋での受け取りで送料無料!新刊予約・通販も。本(書籍)、雑誌、漫画(コミック)など在庫も充実
マイナビ出版
デジェラ・メジェドヴィッチ エミン・タヒロヴィッチ イネス・デドヴィッチ 岡田佑一
[BOOKデータベースより]
大規模データシステムの基礎アルゴリズムを豊富な図解で理解!
第1部 ハッシュベースのスケッチ(ハッシュテーブルと現代のハッシュ法についての概説;近似的なデータの存在判定:ブルームフィルターと商フィルター;頻度推定とカウントミンスケッチ ほか)
[日販商品データベースより]第2部 リアルタイム分析(ストリーミングデータの統合と応用;データストリームからのサンプリング;データストリーム上の近似分位数)
第3部 データベースと外部記憶アルゴリズムのためのデータ構造(外部記憶モデルの紹介;データベースのためのデータ構造:B木、Bε木、LSM木;外部メモリーによるソート)
大規模なデータシステムの基礎となるアルゴリズム的要素を理解し、スケール可能なアプリケーションを構築するためのガイドブックです。豊富なイラストでわかりやすく解説します!
確率的データ構造を使用してデータ保存のスペースを節約する方法、ストリーミングデータの処理、ディスク上のデータの操作、データベースシステムにおけるパフォーマンスのトレードオフの理解など、大規模スケールのアプリケーション構築におけるさまざまなアルゴリズム的側面をカバーしています。
[対象読者]
基本的なデータ構造とアルゴリズムを理解している読者を対象としています。各章は伝統的な解決策を示した後、なぜそれが大規模データの場面で機能しないのかを解説しています。
・プログラミングの知識と、確率論の基本を身につけている方
・Pythonや擬似コードを理解する知識がある方。
[構成]
本書は11章にわたり、3つのパートで構成されています。第1部は確率的で簡潔なデータ構造について、第2部はストリーミングデータ構造とアルゴリズムについて、そして第3部は外部記憶データ構造とアルゴリズムについてです。
1章 はじめに
第1部 ハッシュベースのスケッチ
2章 ハッシュテーブルと現代のハッシングについての概説
3章 近似的なデータの存在判定:ブルームフィルターと商フィルター
4章 頻度推定とカウントミンスケッチ
5章 カーディナリティー推定とハイパーログログ
第2部 リアルタイム分析
6章 ストリーミングデータの統合と応用
7章 データストリームからのサンプリング
8章 データストリーム上の近似分位数
第3部 データベースと外部記憶アルゴリズムのためのデータ構造
9章 外部記憶モデルの紹介
10章 データベースのためのデータ構造:B木、Bε木、LSM木
11章 外部メモリによるソート