疫学と医療統計学と遺伝学と時々、大学院生活

疫学を専門とする大学院生の研究に関する備忘録的ページ。

mach2datのexample dataを動かす方法

今日はimputationされたGWASデータの解析を行うのツールであるmach2datの使用方法について記述する。 (全く分からず情報系の友人に尋ねたところすぐに返事が来て、できるようになった。大変ありがたい限りである。) mach2datとは machによってインピュテー…

Power Programの紹介

今回はsingle marker analysisでのサンプルサイズとパワーアナリシスに有用なNational Cancer Instituteによって開発されたフリーツールを紹介する。This introduction to the Power program, which is a useful tool to calculate smaple size and power fo…

QCの実行

今回は先日書いたGWASのQCに関して、『Primer to Analysis of Genomic Data using R』の第3章のサンプルデータを使用して実施する。 はじめに ここで使用するデータはヒトではなく、83頭の羊54,977SNPsを使用してトレーニングする。今回のSNPsはイルミナ社の…

ゆったり、やくも

今回は本ブログの一部「時々、大学院生」といった当たりの話題です。実は鳥取県米子市で行われる第26回日本疫学会学術大会に向けて移動しております。もちろん学会での発表がメインなのですが、地方に行くとその地域の乗り物や文化に触れる楽しみがあります…

コーヒー摂取と健康(死亡)との関連

今回は一般的な話題であり、多くの人に興味を持ってもらえる「コーヒーと健康」についてまとめる。実際に、数万人規模を対象とした生活習慣と健康との関連を明らかにできるのも「疫学研究」の醍醐味である。 はじめに 以前からコーヒーを飲むことが健康に良…

R package 'maptools'と'spsurvey'を利用して、カラーマップを作成する。

今回は様々な指標をカラーマップを使用して、地図上に見やすく可視化するコードについてまとめる。 (特別なパッケージとしてはmaptoolsとspsurveyが挙げられる。) 今回は事例として、愛知県の男女の平均寿命を地図上にプロットすることを最終目的とする。 …

GWASにおけるQC(Quality control)の手順

今回はGWASのデータ解析のプロセスの中でも最も重要と言っても過言ではないQuality Controlについてまとめる。 米国Vanderbilt大学(生物統計等で著名な大学)のStephan Turnerらが2011年に発表した「Quality Control Procedures for Genome Wide Associatio…

R package 'qqman'の基本的な使用法

今回はRのqqmanというパッケージの基本的な使い方をまとめる。 【ページ下部に追記あり(20160922)】 概要 現在、ゲノム全体10万から50万ほどのSNPsと疾患との関連を探索するGWASが可能になっている。そこでその結果を可視化する際に用いるのがマンハッタン…

集団の構造化( Population Stratification)

今回は遺伝疫学のトピックの一つである「集団の構造化(population stratification)」についてまとめる。 集団の構造化とは 集団の構造化とは、、、 サンプル集団中に異なる遺伝的背景を持つサンプルが混在している状態をいう。すなわち、人種、民族、地域…

R package 'fitbitScraper'を使用したVisualization

今回はウェアラブルデバイス業界で先端を走るfitbitのfitbit flexのデータをRのパッケージ'fitbitScraper'を使用して解析する。まずはじめに必要になるパッケージを読み込む。 (インストールしてあることを前提とする。) library(fitbitScraper) library(l…

このブログの基本的な使い方

初めまして 大学院で疫学研究に取り組んでいる(保健学を専攻している)学生です。 日々、蓄積されていく個人的な学習と更なる活用の促進を目的として本ブログを開設します。 内容はやや疫学の中でも遺伝的な疫学に偏ることが予想されます。基本的には専門性…