この商品をご覧のお客様は、こんな商品もチェックしています。
- Cloud First Architecture設計ガイド
-
価格:2,200円(本体2,000円+税)
【2016年08月発売】
- 親子で学べるいちばんやさしいプログラミングおうちでスタートBOOK
-
価格:1,540円(本体1,400円+税)
【2019年05月発売】
- 早く仕事を終わらせたいから、プログラミング始めました。
-
価格:1,848円(本体1,680円+税)
【2022年09月発売】
- 読むだけで龍神とつながる本
-
価格:1,980円(本体1,800円+税)
【2024年04月発売】
[BOOKデータベースより]
第1部 Webとデータの技術入門(導入;HTML;XMLとJSON;XPATH;HTTP;AJAX;SQLとリレーショナルデータベース;正規表現と重要な文字列関数)
[日販商品データベースより]第2部 Webスクレイピングとテキストマイニングのためのツールボックス(Webからのスクレイピング;統計的テキスト処理;データ分析プロジェクトの管理)
第3部 事例集(アメリカ上院議員間のコラボレーション・ネットワーク;半構造化されたドキュメントから情報を抜き出す;Twitterによる2014年度アカデミー賞予測;名字の地理的な分布のマッピング;携帯電話のデータを集める;商品レビューのセンチメント分析)
本書は,単にR を使ってインターネットからデータを収集・保存する方法を紹介した入門書ではなく,むしろその後の分析やレポート作成までのすべてのプロセスを効率化あるいは自動化する技法を実践的に解説した専門書である。分析に関連しては,データの前処理に役立つ正規表現や,ドキュメントから統計的な手法によって知見を引き出す技術であるテキストマイニングも取り上げられている。
本書の構成は大きく3つに分かれ,第1部では基本技術に焦点があてられている。R を利用することでWebスクレイピングとデータ操作は簡単に実現できるが,その背景技術について知識を深めておくと,構造の複雑なWebサイトに遭遇した場合でもデータをピンポイントに抽出できるようになる。続く第2部は,ここまで習得した技術の実践編となっており,現実に遭遇するケースのそれぞれに対処する方法が詳しく紹介されている。そして第3部は,やや複雑な研究課題を想定し,データの収集から分析,そして効果的なグラフィクスの作成までを詳細に解説している。
[原著:Simon Munzert, Chistian Rubba, Peter Meissner, Dominic Nyhuis: Automated Data Collection with R: A Practical Guide to Web Scraping and Text Mining, Wiley, 2015.]