統計学と疫学と時々、助教生活

疫学を専門とする助教の研究に関する備忘録的ページ。

R programming

R package'nnet'と'MASS'を用いて多項ロジスティック回帰分析を行う

今回はRのパッケージ'nnet'を用いて、多項ロジスティック回帰分析を実施する。 はじめに よく医学の論文で目にするのが「ロジスティック回帰分析」である。このように何も定義していない場合は、結果変数が二値(Yes or No)である二項ロジスティック回帰分…

R package 'ggmap'を用いたマッピング

今回は'ggmap'と呼ばれるパッケージを使用して、愛知県にあるナゴヤドームへの経路(最寄駅(大曽根駅)から)を図示することにする。 1. 早速、パッケージのインストールと読み出す install.packages("ggmap") library(ggmap) 2. 地名で緯度経度をグーグル…

R 役に立つ小技5選 vol.2

今回は先日(2016-02-02)の記事「R 役に立つ小技5選」で紹介したものと同様にRの役に立つちょっとしたコマンドvol.2を紹介する。 jojoshin.hatenablog.com No.1 二つのデータフレームを指定の列で結合し、共通の行のみ残す。 merge(x = データフレーム1, y …

R package 'SKAT'を用いて、SKATを実行する

今回はSNP-set Kernel Association Test(SKAT)と呼ばれるrare-variantの解析手法についてRのパッケージ'SKAT'を用いて、解説する。 追記 20160908に新しいSKATの記事を公開しています。基本的にはこのページの内容を参照していただき、さらに詳しいところ…

R 役に立つ小技5選

今回はデータハンドリングで役に立つ小技を5つだけ紹介する。(個人的に忘れやすいが、意外と役に立つものをpick upする) NO.1 「『不正なマルチバイト文字があります』のエラーを出ないようにする(おそらくmac OS Xのみ)」 このエラーについてはexcelの…

Rでglmを用いてオッズ比を算出するコマンド

今回はRを用いた場合のオッズ比の求め方を記述しておく。 (オッズ比がで求めることができることを知っていれば、簡単に理解できる。) はじめに 医学研究を行う上で、なんらかの指標で群分けしたグループでのある事象のおこりやすさ(オッズ)を比較するこ…

QCの実行

今回は先日書いたGWASのQCに関して、『Primer to Analysis of Genomic Data using R』の第3章のサンプルデータを使用して実施する。 はじめに ここで使用するデータはヒトではなく、83頭の羊54,977SNPsを使用してトレーニングする。今回のSNPsはイルミナ社の…

R package 'maptools'と'spsurvey'を利用して、カラーマップを作成する。

今回は様々な指標をカラーマップを使用して、地図上に見やすく可視化するコードについてまとめる。 (特別なパッケージとしてはmaptoolsとspsurveyが挙げられる。) 今回は事例として、愛知県の男女の平均寿命を地図上にプロットすることを最終目的とする。 …

R package 'qqman'の基本的な使用法

今回はRのqqmanというパッケージの基本的な使い方をまとめる。 【ページ下部に追記あり(20160922)】 概要 現在、ゲノム全体10万から50万ほどのSNPsと疾患との関連を探索するGWASが可能になっている。そこでその結果を可視化する際に用いるのがマンハッタン…

R package 'fitbitScraper'を使用したVisualization

2017年12月19日現在、fitbitScraperは機能せず...三重大学特任教授・奥村先生のウェブサイトにも掲載されている(https://oku.edu.mie-u.ac.jp/~okumura/stat/fitbit.html)。 現在は下記サイトのようにAPIを使用する方法が主流 qiita.com 今回はウェアラブ…