- 大規模データのマイニング
-
Mining of massive datasets.
共立出版
アナンド・ラジャラマン ジェフリ・D.ウルマン 岩野和生 浦本直彦- 価格
- 6,050円(本体5,500円+税)
- 発行年月
- 2014年07月
- 判型
- B5
- ISBN
- 9784320123755
この商品をご覧のお客様は、こんな商品もチェックしています。
- エルサレムの歴史と文化
-
価格:1,100円(本体1,000円+税)
【2023年05月発売】
- なぜ世界はデジタルになったのか
-
価格:3,190円(本体2,900円+税)
【2023年05月発売】
- アルゴリズムイントロダクション総合版 第4版
-
価格:19,800円(本体18,000円+税)
【2024年11月発売】
- 機械学習 原著第2版
-
価格:16,500円(本体15,000円+税)
【2022年12月発売】
- 共にあることの哲学と現実
-
価格:4,290円(本体3,900円+税)
【2017年11月発売】
[BOOKデータベースより]
1 データマイニング
[日販商品データベースより]2 大規模ファイルシステムとマップレデュース
3 類似したアイテムを探す
4 データストリームのマイニング
5 リンク解析
6 頻出アイテムセット
7 クラスタリング
8 ウェブ上での宣伝
9 推薦システム
ウェブやインターネットコマースの隆盛によって,とてつもなく巨大なデータセットが出現し,そして,データマイニングによってそれらから情報が抽出されている。
巨大なデータに対するマイニングにおいては,従来から知られているアルゴリズムがそのままでは機能しないことが多い。巨大なデータを扱う上でこれまでとは違った処理戦略や技法が必要となる。
本書はデータマイニングにおいて重要な問題の解決に使われてきており,さらに巨大なデータセットに対しても使用できる実用的なアルゴリズムを,データベースやウェブ技術の分野で著名な原著者が解説する。
まず,データマイニングの本質や,データマイニングがどのように扱われているかを概観する。次に,今後非常に大量のデータの解析を行う際に,クラウドコンピューティングとともに重要視されると考えられ,この後の章の議論に必須のものとなるマップレデュースを解説する。その後,類似するアイテムの検索で用いられるシングリング,ミンハッシュや局所性鋭敏型ハッシュ(LSH)を説明する。その次に,すぐに反応しないと消えてしまう,ストリーム形式のデータについて考え,そのあとで検索エンジンに用いられているPageRankという計算手法を扱う。それ以降では,頻出するアイテムセットやクラスターを見つける問題を扱い,最後には,現在のオンライン商店の活動で必須の,推薦システムとオンライン広告という,二つの話題を扱う。
全体として初心者にもわかりやすく詳説されており,大規模なデータに立ち向かう学生のみならず,データサイエンティストを始めとした実務家にも必携の書となろう。