R

Rによるテキストマイニング入門

00

著者 : 石田基広
出版社 : 森北出版

本書では、テキストマイニングについて基本的な手法からウェブスクレイピング・トピックモデルなどの応用的な最新の手法までの広い範囲を解説している。第2版ではデータ取得方法についても記載があり、Twitterや青空文庫といったネット上のテキストデータを取得して解析する方法も知ることが出来る。類書よりも初心者が取り組むことを指向しているので、RStudioで操作しながら、読み進めることで研究や実務に導入することが可能となろう。さらに、著者が本書のサポートサイトを用意している。応用的な手法や数学的な裏付けについて勉強するには物足りないかもしれないが、テキストマイニングの勉強を始めるための書籍としては最良の1冊と言える。

できる!傾向スコア分析SPSS・Stata・Rを用いた必勝マニュアル

00

著者 : 康永秀生、笹渕裕介、道端伸明、山名 隼人
出版社 : 金原出版

著者らは臨床疫学の専門家であり、本書は普段は統計解析を行っていない臨床医に向けた書籍である。臨床医への普及率という観点からSPSS、Stata、Rという3種類の統計解析ソフトを用いた解説が収録されている。解析環境があれば、サポートサイトから架空患者のサンプルデータをダウンロードできるので、本書の解析で試すことが可能である。一方で、傾向スコアについて理論背景の説明は手薄い。例えば、類書ではよく解説されている反事実や潜在アウトカムの解説はほとんど無い(「タイムマシン試験」という本書独特の名称で1ページ弱を使って解説されているのみである)。そのため、傾向スコアについて深く知りたいという読者には向いていない。

みんなのR -データ分析と統計解析の新しい教科書

00

著者 : Jared P. Lander
出版社 : マイナビ

現場のデータサイエンティストによって書かれた実践的な R 入門書です。統計解析手法の数学的なロジックについてはほとんど説明されておらず、翻訳も所々誤っているもしくは統計学的に標準的な訳語が使われていないと言う難点がありますが、にも関わらずここで紹介するのは、本書が「データ整形」や「データ結合」等の前処理について非常に重きを置いているからです。多くの「R 本」が分析パッケージ の利用方法やヴィジュアル化を急ぐのに対して、「前処理」と「分析」がバランス良く扱われており、分析へ入る「その前」で躓いている方には一読の価値アリだと思います。