統計学と疫学と時々、助教生活

疫学を専門とする助教の研究に関する備忘録的ページ。

visualization

【2021年夏】データの可視化おすすめ書籍5選|アカデミア版

データの可視化に関する書籍+論文を簡単なレビューとともに紹介したいと思います(2021年9月1日現在)。

【R】gtsummaryで回帰分析の表を結合する(tbl_merge編)

gtsummaryパッケージのtbl_merge関数についてまとめています。

【R】gtsummaryで回帰分析の表を結合する(tbl_stack編)

gtsummaryパッケージのtbl_stack関数についてまとめています。

R package "rworldmap"を使用して世界地図に色をつける

こんにちは。世界地図にデータに基づいて色をつけてたいと思ったことはないでしょうか。プレゼンや研究発表など様々な場面で描画したいと思う機会があるでしょうが、今回はそんな時に自分で作成できるパッケージ'rworldmap'を紹介します。今回は事例として、…

R 時系列データの異常部位検出(近傍法)

今回も先ほど公開した記事と同様に、『入門機械学習による異常検知-Rによる実践ガイド-』(コロナ社、井出剛著、2015)の中にある「7.1 近傍法による異常検知」ということで、この内容をなぞり、最後に時系列データ解析の際に重要になる窓幅(どれだけの地点…

R リッジ回帰モデルと異常検知

今回は、『入門機械学習による異常検知-Rによる実践ガイド-』(コロナ社、井出剛著、2015)の「6.3 リッジ回帰と異常検知(P165-172)」の内容をもとに政府・官公庁データをもとにして作成した都道府県別の10万人あたりの自殺者数を予測するモデルを作成し、…

R package"VennDiagram"でベン図を書く

今日はベン図を描きたいと思います。 (今回は例として、東海三県での多い名字30位についてベン図を書いてみようと思う) パッケージの読み込み library(VennDiagram) まずはベン図で書きたいそれぞれのカテゴリに含まれる要素を書き出す aichi <- c("鈴木","…

R for beginners vol.4 「データの要約とビジュアライゼーション」

今回はデータの整頓から少し分析に近いことを始めます。その中でデータを要約し、図示することが解析の一歩かと思い今回の内容にしています。R for beginners vol.1 「Rの紹介と基本的なコマンド」 jojoshin.hatenablog.comR for beginners vol.2 「データの…

R 役に立つ小技5選 vol.3

今回は第3回目となる『R役に立つ小技5選』についての記事です。 前回と前々回の記事は下にリンクがあるので、ご参照ください。 No.1 Macを使用して、Rでグラフを日本語で書くと、文字化けするのを解消する方法 par(family="Osaka") hist(データ名, xlab="x軸…

R package 'estatapi'を使用して、公開されている政府統計を取得、解析する

今回は先日公開されたばかりのRパッケージ'estatapi'を使用して、政府統計を取得し、可視(グラフ)化する。 ちなみに参照する統計表は様々な行動の時間などを収録している社会生活基本調査ということのみ決めておく。 (注意)横に大きなデータは見づらくて…

R package 'ggmap'を用いたマッピング

今回は'ggmap'と呼ばれるパッケージを使用して、愛知県にあるナゴヤドームへの経路(最寄駅(大曽根駅)から)を図示することにする。 1. 早速、パッケージのインストールと読み出す install.packages("ggmap") library(ggmap) 2. 地名で緯度経度をグーグル…

QCの実行

今回は先日書いたGWASのQCに関して、『Primer to Analysis of Genomic Data using R』の第3章のサンプルデータを使用して実施する。 はじめに ここで使用するデータはヒトではなく、83頭の羊54,977SNPsを使用してトレーニングする。今回のSNPsはイルミナ社の…

R package 'maptools'と'spsurvey'を利用して、カラーマップを作成する。

今回は様々な指標をカラーマップを使用して、地図上に見やすく可視化するコードについてまとめる。 (特別なパッケージとしてはmaptoolsとspsurveyが挙げられる。) 今回は事例として、愛知県の男女の平均寿命を地図上にプロットすることを最終目的とする。 …

R package 'qqman'の基本的な使用法

今回はRのqqmanというパッケージの基本的な使い方をまとめる。 【ページ下部に追記あり(20160922)】 概要 現在、ゲノム全体10万から50万ほどのSNPsと疾患との関連を探索するGWASが可能になっている。そこでその結果を可視化する際に用いるのがマンハッタン…

R package 'fitbitScraper'を使用したVisualization

2017年12月19日現在、fitbitScraperは機能せず...三重大学特任教授・奥村先生のウェブサイトにも掲載されている(https://oku.edu.mie-u.ac.jp/~okumura/stat/fitbit.html)。 現在は下記サイトのようにAPIを使用する方法が主流 qiita.com 今回はウェアラブ…