スクレイピング

Rによるテキストマイニング入門

00

著者 : 石田基広
出版社 : 森北出版

本書では、テキストマイニングについて基本的な手法からウェブスクレイピング・トピックモデルなどの応用的な最新の手法までの広い範囲を解説している。第2版ではデータ取得方法についても記載があり、Twitterや青空文庫といったネット上のテキストデータを取得して解析する方法も知ることが出来る。類書よりも初心者が取り組むことを指向しているので、RStudioで操作しながら、読み進めることで研究や実務に導入することが可能となろう。さらに、著者が本書のサポートサイトを用意している。応用的な手法や数学的な裏付けについて勉強するには物足りないかもしれないが、テキストマイニングの勉強を始めるための書籍としては最良の1冊と言える。