- Rによるテキストマイニング
-
tidytextを活用したデータ分析と可視化の基礎
Text Mining with R:A Tidy Approach.オライリー・ジャパン オーム社
ジュリア・シルジ デビッド・ロビンソン 大橋真也 長尾高弘- 価格
- 3,300円(本体3,000円+税)
- 発行年月
- 2018年05月
- 判型
- A5
- ISBN
- 9784873118307
この商品をご覧のお客様は、こんな商品もチェックしています。
- 教育ビジネス
-
価格:1,848円(本体1,680円+税)
【2025年07月発売】
- 良いコード/悪いコードで学ぶ設計入門ー保守しやすい成長し続けるコードの書き方
-
価格:3,520円(本体3,200円+税)
【2025年01月発売】
- 税務会計研究ハンドブック
-
価格:4,730円(本体4,300円+税)
【2024年03月発売】


























[BOOKデータベースより]
「Rの神様」ハドリー・ウィッカムに「Rのデータ分析を変えた」と言わしめた革新的なパッケージ、tidytextの開発者たちによる、データ分析と可視化の基礎を学ぶことができるテキストマイニングの入門書です。取得した生データを、「整理データ原則」に基づいてtidytextで扱いやすい形に変換すると、簡単に既存のツールと組み合わせることができ、効果的にデータ分析や可視化を行うことができます。本書はその原則に基づき、tidytext、dplyr、ggraph、widyrパッケージ等を使って、ジェーン・オースティンの小説や古典、Twitter、ニュースサイト、NASAのメタデータなどを分析していきます。著者たちの豊富な経験と科学的理論に基づいた、明確でシンプルかつ応用力抜群のテキストマイニング手法を提示します。
1章 整理テキスト形式
[日販商品データベースより]2章 整理データを使ったセンチメント分析
3章 単語の出現頻度と特定の文書での出現頻度の分析:tf‐idf
4章 単語間の関係:nグラムと相関
5章 未整理形式へ(から)の変換
6章 トピックモデリング
7章 ケーススタディ:Twitterアーカイブの比較
8章 ケーススタディ:NASAメタデータのマイニング
9章 ケーススタディ:Usenetテキストの分析
「tidy」データの概念に基づいてRでテキストマイニングを行う!
取得した生データをまずは扱いやすいtidyデータに変換してデータ分析を行うことが、最近のRで主流となりつつありますが、本書はそのコンセプトに基づき、著者らが開発した人気のtidydataパッケージを使って、Twitterやニュースサイト、NASAのメタデータなどを分析していきます。著者たちの豊富な経験と科学的理論に基づいた、明確でシンプルなテキストマイニング手法を提示します。