- 在庫状況:在庫あり(1〜2日で出荷)
- 入門PySpark
-
PythonとJupyterで活用するSpark2エコシステム
オライリー・ジャパン オーム社
Tomasz Drabas Denny Lee 玉川竜司- 価格
- 3,740円(本体3,400円+税)
- 発行年月
- 2017年11月
- 判型
- B5
- ISBN
- 9784873118185
この商品をご覧のお客様は、こんな商品もチェックしています。
- Amazon Web Services基礎からのネットワーク&サーバー構築 改訂4版
-
価格:2,970円(本体2,700円+税)
【2023年05月発売】
- プログラミングGoogle App Engine
-
価格:3,740円(本体3,400円+税)
【2011年01月発売】
- 実践Vagrant
-
価格:2,860円(本体2,600円+税)
【2014年02月発売】
- データ指向アプリケーションデザイン
-
価格:5,060円(本体4,600円+税)
【2019年07月発売】
- シュプレヒコール脚本集
-
価格:3,080円(本体2,800円+税)
【1996年09月発売】
[BOOKデータベースより]
PythonからSparkを利用するための機能、PySparkを使いこなすテクニックとノウハウ。はじめに高速になったSpark2.0の特徴とアーキテクチャを解説し、構造化及び非構造化データの読み取り、PySparkで利用できる基本的なデータ型、MLlibとMLパッケージによる機械学習モデルの構築を説明。GraphFramesを使ったグラフの操作、ストリーミングデータの読み取り、クラウドへのモデルのデプロイなどの方法を豊富なサンプルと一緒に学ぶ。ローカルでのSpark+Python+Jupyter環境の構築方法も紹介。
1章 Sparkを理解する
[日販商品データベースより]2章 耐障害性分散データセット
3章 DataFrame
4章 データのモデリングの準備
5章 MLlib
6章 MLパッケージ
7章 GraphFrames
8章 TensorFrames
9章 Blazeによるポリグロットパーシステンス
10章 Structured Streaming
11章 Sparkアプリケーションのパッケージ化
Apache SparkをPythonから使うための方法とノウハウを網羅!
PySparkとはSparkを実行するためのPython APIです。インメモリ(ソフトウェアを実行する際、使用するプログラムやデータのすべてをメモリ上に読み込み、ハードディスクなどの外部記憶装置を使わないこと)で高速に分散処理ができるフレームワークで、MLlibという機械学習ライブラリが利用できることなどから注目されています。本書は、Apache SparkをPythonから使うための方法とノウハウを書いた書籍です。