[BOOKデータベースより]
イントロダクション
Rの基礎
データの記述・可視化
関連と因果、データ分析における注意事項
データ倫理
確率
確率分布
標本分布と中心極限定理
点推定・区間推定・仮説検定・p値
機械学習の基礎
回帰モデル
分類
ベイズ線型モデル
決定木とアンサンブル学習
スパース学習
いま必要とされるデータサイエンスの素養がしっかり身につく一冊。
さまざまな場面で入手できるデータを価値に転換することが、データサイエンスの目的です。データサイエンスという言葉は、ビジネスやアカデミーを問わず、いまや多くの場面で聞かれるようになり、それだけ重要性が高まっている概念といえます。本書は、データサイエンスを理解し実践したいと考えている方に必要とされる、データサイエンスの素養がしっかり学べる一冊です。
データサイエンスは、統計的、計算的、人間的という3つの視点の有機的結合という一面があるといわれます。本書では、データ分析に必要な統計学をはじめとする数学を丁寧にフォローし、統計的な考え方が自然に身につくよう配慮しています。また、データを適切に処理するための計算法は、プログラミング言語としてRを用いつつ、近年注目度の高い機械学習を含む具体例を通して納得しながら理解できる構成です。さらに、データの前処理から分析結果のプレゼンテーションまでの過程には人間が関わるという観点で、データを取り扱ううえで心がけるべきことにも言及します。