【2021年夏】データの可視化おすすめ書籍５選｜アカデミア版

データの可視化に関する書籍＋論文を簡単なレビューとともに紹介したいと思います（2021年9月1日現在）。

#可視化 #プログラミング言語 #R言語 #データビジュアライゼーション #書評

2021-07-19

【R】gtsummaryで回帰分析の表を結合する（tbl_merge編）

R programming epidemiology visualization

gtsummaryパッケージのtbl_merge関数についてまとめています。

#R (プログラミング言語) #統計解析 #gtsummary #回帰分析

2021-07-19

【R】gtsummaryで回帰分析の表を結合する（tbl_stack編）

R programming epidemiology visualization

gtsummaryパッケージのtbl_stack関数についてまとめています。

#R (プログラミング言語) #統計解析 #回帰分析 #gtsummary

2020-04-30

R package "JM"を使用してJoint modelを実装する。

R programming epidemiology statistics survival analysis

前回は生存解析においてベースラインだけでなく、縦断的に測定している（繰り返し測定、反復測定値ともいう）値の影響も組み込んだ「時間依存性共変量」についてまとめました。今回は、さらに進化した（個人的見解です）Joint modelについて、簡単な紹介とR…

2020-03-19

R package "survival"を使用した生存時間解析（ベースライン情報のみか時間共変量も組み込むか）

R programming epidemiology statistics survival analysis

Rのsurvivalパッケージを使用した生存解析について、時間依存性共変量を組み込んだモデルと通常モデルの比較を行なっています。

2019-08-19

DNAメチル化に基づく生物学的な年齢（Epigenetic Clock theory）【後編】

Genetic epidemiology epidemiology epigenetics

今回は、前回に引き続いて「Epigenetic clock」についてUCLAのDr. Hovarthによるレビューの後半をまとめていきたいと思います。主な内容は、「年齢的な変化との関連」や、「組織・細胞レベルとの関連性」、「介入による若返りは可能？」、「この方法における…

2019-08-17

DNAメチル化に基づく生物学的な年齢（Epigenetic Clock theory）【前編】

epidemiology Genetic epidemiology epigenetics

今回は、「Epigenetic clock」についてUCLAのDr. Hovarthによるレビューをまとめておきたいと思います。この研究がどのような未来をもたらし得るかみてみましょう。その前編として、「Epigenetic clock」はどのような学術的背景から注目されたのか、そしてど…

2019-02-14

予測式：ロジスティック回帰か、それとも機械学習か？

Genetic epidemiology epidemiology statistics

かなり久方ぶりの記事になりますが、今回はJournal of Clinical Epidemiologyに先日アクセプトになった”A systematic review shows no performance benefit of machine learning over logistic regression for clinical prediction models”について、簡単に…

2017-12-04

Mendelian randomization（メンデルランダム化）とは

statistics epidemiology Genetic epidemiology GWAS

今回は、遺伝疫学でも近年注目されているmendelian randomization（以下：MR）について、情報を集約し簡単なまとめをしておきます。MRは、経済学や社会調査の解析において利用されてきた操作変数（instrumental variable）を導入した解析方法の一種でありま…

2017-04-28

R 時系列データの異常部位検出（近傍法）

R programming epidemiology statistics visualization

今回も先ほど公開した記事と同様に、『入門機械学習による異常検知-Rによる実践ガイド-』（コロナ社、井出剛著、2015）の中にある「7.1 近傍法による異常検知」ということで、この内容をなぞり、最後に時系列データ解析の際に重要になる窓幅（どれだけの地点…

2017-04-28

R リッジ回帰モデルと異常検知

R programming epidemiology statistics visualization

今回は、『入門機械学習による異常検知-Rによる実践ガイド-』（コロナ社、井出剛著、2015）の「6.3 リッジ回帰と異常検知（P165-172）」の内容をもとに政府・官公庁データをもとにして作成した都道府県別の10万人あたりの自殺者数を予測するモデルを作成し、…

2017-02-21

アメリカにおける個人の遺伝子検査サービスに関する消費者の意識調査

Genetic epidemiology daily life epidemiology life style Genetic testing

今回は、文献の紹介をするとともに、個人の遺伝子検査サービス前後で消費者の意識がどのように変わっているかを紹介したい。論文のタイトルはDirect-to-Consumer Genetic Testing: User Motivations, Decision Making, and Perceived Utility of Resultsであ…

2017-02-02

R package "BLR"でベイジアンラッソ（Bayesian Lasso regression）

Genetic epidemiology GWAS R programming epidemiology statistics

あけましておめでとうございます（疫学会や予防早期医療創成センターのワークショップ等への参加もあり、一ヶ月ぶりの更新です）。今回はRのパッケージ"BLR"を用いて、ベイジアンラッソを実行する。ちなみに参考にするのは、Cedric Gondroらによる『Genome …

2016-12-26

R データの読み込み（高速化）

GWAS Genetic epidemiology R programming epidemiology

今回はSpringerから出ている『Genome-Wide Association Studies and Genomic Prediction』という本からデータの読み込みについて記述する。GWASなどのゲノムデータは非常に膨大であり、読み込みだけでもかなりの時間を要する。そこで下記のTipsで幾分改善さ…

2016-12-13

PLINKで共変量を加えたassociation testを実行する。

GWAS Genetic epidemiology PLINK epidemiology p-value

今回は、9月22日の記事に加えて、共変量で調整する（その他の細かい設定もする）GWASについてコマンドを記しておく。 jojoshin.hatenablog.com 最も簡単なコマンド plink --bfile データ名 --assoc --out アウトプットするデータ名共変量を加えたロジスティ…

2016-11-25

レアバリアント解析

GWAS Genetic epidemiology Rare variant epidemiology imputation statistics

今回はレアバリアント解析についてまとめた資料を公開しておきます。このスライドの内容内容は、Lee S, et al (2014) Rare-variant association analysis: Study designs and statistical tests. Am J Hum Genet. をもとにしています。他にも日本語の書籍*…

2016-11-19

朝型人間（morningness）の遺伝的な要素とは...

GWAS Genetic epidemiology epidemiology life style

今日は朝型人間（Morningness）を規定する遺伝子の紹介です。（結果が膨大なので、交互作用やpathway解析の部分は省略していますので、もし気になる方は本文をご参照下さい。また、かなり学術的な解説なので、あまりお勧めはしませんが、簡単な解説をご希望…

2016-10-08

R package"VennDiagram"でベン図を書く

epidemiology R programming statistics visualization

今日はベン図を描きたいと思います。 (今回は例として、東海三県での多い名字30位についてベン図を書いてみようと思う) パッケージの読み込み library(VennDiagram) まずはベン図で書きたいそれぞれのカテゴリに含まれる要素を書き出す aichi <- c("鈴木","…

2016-09-27

R 2つのリストを比較する関数（intersect、setdiff）の紹介

epidemiology R programming

今日はリストを比較する時に役にたつコマンドを紹介します。これらは膨大なリストを扱う際に、「共通のものを抽出する」「片方に特有のものを抽出する」などに非常に役に立ちます。早速、実践下記のようにAとBのリストが与えられているとする。 #AとBそれ…

2016-09-24

R package'metap'を使用して、p値の統合をする

epidemiology Genetic epidemiology statistics R programming

こんにちは。今回は異なる環境や場所で行った同様の実験や研究によって導かれたp値を統合しようという試みがあった時の対処法について、Fisher's methodを取り上げて、今回は説明します。 FIsher's methodとは i個あるp値のlogをとった値を足し合わせて、そ…

2016-09-22

PLINKでGWAS（basicなcase/control study）をするコマンド

epidemiology Genetic epidemiology GWAS PLINK

今回はPLINKで典型的なSinge-SNP GWAS（アレルベースのカイ2乗検定）を実施する。元々、plinkが使えるディレクトリ内にbim,bed,famファイルが生成されていることが前提条件である。その他の方法についてはまた別の機会に書くことにする。コマンド plink --b…

2016-09-15

日本人における集団の構造化（Population stratification in Japan）

epidemiology Genetic epidemiology GWAS

こんばんわ。今日は以前の投稿でも取り扱ったGWASのcase-control studyで問題となり得る「集団の構造化（以下PF）」について書きます。今回は『Japanese Population Structure, Based on SNP Genotypes from 7003 Individuals Compared to Other Ethnic Grou…

2016-09-08

R package 'SKAT'を用いて、SKATを実行する vol.2

Genetic epidemiology epidemiology GWAS R programming statistics Rare variant

こんばんは。前回のSKATの記事の内容に少し付け加え（Kernelの種類を増やして検討しただけ）をします。基本的な解析は前回の記事をご参照下さい。 jojoshin.hatenablog.com はじめに前回の記事にも記載した通り、SKAT()は二値のアウトカムには適しておらず…

2016-07-31

企業家精神（entrepreneurship）の遺伝的な要素とは...

epidemiology Genetic epidemiology GWAS life style

だいぶ更新の時期が空きましたが、研究の方が順調に進んでいるという証拠だと個人的にはポジティブに捉えているところです。今回は文献紹介です。特に学術的な「面白さ」というよりは社会的な「面白さ」で題材を選びました。GWASというのはこれまでもご説明…

2016-07-08

Multivariate と Multivariable（どちらも多変量）の違いについて

epidemiology statistics

MultivariateもMultivariableってどっちも「多変量」? こんな疑問を持ったことのある人もいるのではないかと思います。確かに、"Multivariate"と"Multivariable"のどちらも辞書では「多変量」となります。疫学や公衆衛生の分野だけでなく、共変量で調整した…

2016-07-06

罰則付き・正則化回帰モデルについて（About penalized/regularized regression model）

GWAS Genetic epidemiology R programming epidemiology

久しぶりの更新になりました。6月末の北海道でのISEE-ISES AC2016への参加とその後は論文執筆に集中していました。ISEE-ISESのアジア支部総会では、pre-conference workshopにも参加し、distributed lag non linear model（DLNM）という時系列分析の一種を学…

2016-06-07

R for beginners vol.4 「データの要約とビジュアライゼーション」

epidemiology R for beginners R programming statistics visualization

今回はデータの整頓から少し分析に近いことを始めます。その中でデータを要約し、図示することが解析の一歩かと思い今回の内容にしています。R for beginners vol.1 「Rの紹介と基本的なコマンド」 jojoshin.hatenablog.comR for beginners vol.2 「データの…

2016-06-01

mach2datのアウトプット　vol.1

Genetic epidemiology epidemiology GWAS imputation

今日は以前のエントリで解説したインピュテーションされたGWASデータ（調整項目を指定したロジスティック回帰）を解析するmach2datによって出力されるデータの解釈について、記述する。（確か、前回はREAD ME読んでくださいとか言って、解説をしていませんで…

2016-05-24

R package'tableone'のCreateTableOne関数で表1を書く

epidemiology p-value R programming

今回は疫学などヒトを対象とした研究で対象者の特性として、主な変数の要約することが多くありますが、その表1（table1）を描き、csvとして出力できる便利な関数の紹介です。その便利な関数はCreateTableOne()関数です。（パッケージはtableoneと言うもので…

2016-05-23

Rで残差補正された値を求める

epidemiology R programming statistics

Rの例としてよく使用されるirisデータを用いて、残差を簡単に求める。特に今回は例として、Sepal.Length（がくの長さ）とSepal.Width（がくの幅）について、残差を求める head(iris) ## Sepal.Length Sepal.Width Petal.Length Petal.Width Species ## 1 5.…

統計学と疫学と時々、助教生活

疫学を専門とする助教の研究に関する備忘録的ページ。

epidemiology

【2021年夏】データの可視化おすすめ書籍５選｜アカデミア版

【R】gtsummaryで回帰分析の表を結合する（tbl_merge編）

【R】gtsummaryで回帰分析の表を結合する（tbl_stack編）

R package "JM"を使用してJoint modelを実装する。

R package "survival"を使用した生存時間解析（ベースライン情報のみか時間共変量も組み込むか）

DNAメチル化に基づく生物学的な年齢（Epigenetic Clock theory）【後編】

DNAメチル化に基づく生物学的な年齢（Epigenetic Clock theory）【前編】

予測式：ロジスティック回帰か、それとも機械学習か？

Mendelian randomization（メンデルランダム化）とは

R 時系列データの異常部位検出（近傍法）

R リッジ回帰モデルと異常検知

アメリカにおける個人の遺伝子検査サービスに関する消費者の意識調査

R package "BLR"でベイジアンラッソ（Bayesian Lasso regression）

R データの読み込み（高速化）

PLINKで共変量を加えたassociation testを実行する。

レアバリアント解析

朝型人間（morningness）の遺伝的な要素とは...

R package"VennDiagram"でベン図を書く

R 2つのリストを比較する関数（intersect、setdiff）の紹介

R package'metap'を使用して、p値の統合をする

PLINKでGWAS（basicなcase/control study）をするコマンド

日本人における集団の構造化（Population stratification in Japan）

R package 'SKAT'を用いて、SKATを実行する vol.2

企業家精神（entrepreneurship）の遺伝的な要素とは...

Multivariate と Multivariable（どちらも多変量）の違いについて

罰則付き・正則化回帰モデルについて（About penalized/regularized regression model）

R for beginners vol.4 「データの要約とビジュアライゼーション」

mach2datのアウトプット　vol.1

R package'tableone'のCreateTableOne関数で表1を書く

Rで残差補正された値を求める