- 在庫状況:出版社よりお取り寄せ(通常3日〜20日で出荷)
- Sparkによる実践データ解析
-
大規模データのための機械学習事例集
Advanced analytics with Spark.オライリー・ジャパン オーム社
サンディ・ライザ ユーリ・ラサーソン ショーン・オーウェン ジョシュ・ウィルス 石川有 玉川竜司- 価格
- 3,740円(本体3,400円+税)
- 発行年月
- 2016年01月
- 判型
- B5
- ISBN
- 9784873117508
[BOOKデータベースより]
本書は、データサイエンスの4人のエキスパートがSparkでの高度な分析方法を解説するとともに、より実践的なデータサイエンスを学ぶ書籍です。ビッグデータ分析におけるSparkの位置づけを紹介し、ベストな結果を得るためのデータの準備やモデルのチューニングについて解説します。またデータクレンジングのユースケースを通じてSparkとScalaによるデータ処理の基本を学習し、Sparkを使った機械学習の基礎や応用分野における広く使われる一般的なアルゴリズムを紹介します。日本語版では付録として高柳慎一氏と牧山幸史氏による「SparkRについて」と千葉立寛氏、小野寺民也氏による「SparkのJVM、システムレベルのチューニングによる高速化」を掲載。高度なデータ解析を習得したいデータサイエンティスト必携の一冊です。
ビッグデータの分析
ScalaとSparkによるデータ分析の紹介
音楽のレコメンドとAudioscrobblerデータセット
決定木を使った森林被覆の予測
K平均クラスタリングを使ったネットワークトラフィックにおける異常の検出
潜在意味解析を使ったWikipediaの理解
GraphXを使った共起ネットワークの分析
ニューヨーク市のタクシーの移動データに対する地理空間及び履歴データ分析
モンテカルロシミュレーションによる金融リスクの推定
ゲノムデータの分析とBDGプロジェクト
PySparkとThunderを使った神経画像データの分析
Sparkの詳細
MLlib Pipelines API
SparkRについて
SparkのJVM、OSレベルのチューニングによる高速化
データサイエンスの4人のエキスパートがSparkでの高度な分析方法を解説するとともに、より実践的なデータサイエンスを学ぶ書籍。高度なデータ解析を習得したいデータサイエンティスト必携の1冊。
ビッグデータを活用するためのデータサイエンスについてSparkを通して学ぶことができる書籍。