この商品をご覧のお客様は、こんな商品もチェックしています。
- ストレスに効く 仏教の話
-
価格:1,650円(本体1,500円+税)
【2025年06月発売】
- フッと心を軽くする仏教のことば
-
価格:1,760円(本体1,600円+税)
【2022年08月発売】
- いま世界を動かしている「黒いシナリオ」 グローバリストたちとの最終戦争が始まる!
-
価格:1,760円(本体1,600円+税)
【2022年12月発売】
- わたしが十字架になります
-
価格:1,540円(本体1,400円+税)
【2023年03月発売】
- いま世の中で起きている「本当のこと」
-
価格:1,760円(本体1,600円+税)
【2022年03月発売】
[BOOKデータベースより]
データ分析、機械学習に携わるすべてエンジニアのための必携書。
1 本書について(本書の内容;本書の読者対象 ほか)
[日販商品データベースより]2 テーブルデータの前処理(テーブルデータの前処理;テーブルデータの前処理 ほか)
3 自然言語の前処理(自然言語データの処理の基礎;テキスト読み込み ほか)
4 画像データの前処理(画像認識の流れ;ディレクトリ構成 ほか)
5 業界別データ活用動向(製造業におけるデータ取得と活用;金融業界におけるデータ取得と活用 ほか)
昨今、データ分析や機械学習の手法は高度になり、また多くの分野で使われるようになってきています。しかし日常業務で扱っているデータは、複雑かつ不完全で、構造化されていないものも多くあり、そのままでは機械学習モデルに投入したり、適切に分析をすることができません。
本書では、そういった不完全なデータを、データ分析や機械学習で扱えるように整える、「前処理」に焦点を当てています。
「データサイエンティストの時間の90%はデータの前処理に費やされ、残りの時間は実際のモデルのトレーニングと展開に費やされる」とよく言われますが、それにもかかわらず、前処理をどのようにすれば良いかについては後回しにされがちです。
本書は、「テーブルデータ」「自然言語」「画像」の3種類のデータを取り上げ、それぞれについての前処理を詳細に説明しています。データに対してどのようなコードを書いて処理するか、ということだけにとどまらず、「現場ではまず何を行うか」「複数のアプローチがあり得る場合、どれを選ぶべきか」といった、プロならではの知恵も多く詰め込みました。
データ分析をこれから仕事にしたい人、すでに現場にいるけれども迷うことが多い方にとって、心強い助けとなる1冊です。
<本書の構成>
Chapter1 本書の概要
Chapter2 テーブルデータの前処理
2-1 テーブルデータの前処理
2-2 テーブルデータの前処理
2-3 データの結合と集約
2-4 テーブルデータの理解
2-5 カテゴリカル変数の処理
2-6 欠損値の処理
2-7 データスケーリング
2-8 データ変換
2-9 次元削減法
2-10 特徴量選択
Chapter3 自然言語の前処理
3-1 自然言語データ処理の基礎
3-2 テキスト読み込み
3-3 クレンジング
3-4 形態素解析
3-5 ベクトル化
3-6 オーグメンテーション
Chapter4 画像データの前処理
4-1 画像認識の流れ
4-2 ディレクトリ構成
4-3 画像の撮影
4-4 アノテーション
4-5 画像の読み込みと表示
4-6 切り抜きとリサイズ
4-7 画像の結合とスケーリング
4-8 データの分割
4-9 「データ拡張」で過学習を防ぐ
Chapter5 業界別データ活用動向
5-1 製造業におけるデータ取得と活用
5-2 金融業界におけるデータ取得と活用
5-3 マーケティングにおけるデータ取得と活用
5-4 小売データの取得と活用
※本書のプログラムは、Google Colaboratoryを使って実際に試しながら学べるようになってい