読者です 読者をやめる 読者になる 読者になる

疫学と医療統計学と遺伝学と時々、大学院生活

疫学を専門とする大学院生の研究に関する備忘録的ページ。

Multivariate と Multivariable(どちらも多変量)の違いについて

epidemiology statistics

MultivariateもMultivariableってどっちも「多変量」?
こんな疑問を持ったことのある人もいるのではないかと思います。確かに、"Multivariate"と"Multivariable"のどちらも辞書では「多変量」となります。疫学や公衆衛生の分野だけでなく、共変量で調整したある変数XのもたらすYへの影響を探索する場合によく用いるのが「多変量」の回帰分析ですが、英語で論文を読んでいると、multivariateやmultivariable、さらにはmultiple regression analysisという記述が見られます。これまであまり気にしていなかったのですが、調べてみたところ興味深い文献があったので、紹介します。

文献の紹介(ちょっとしたコラム)

文献はMultivariate or Multivariable Regression?(URL:http://www.ncbi.nlm.nih.gov/pmc/articles/PMC3518362/pdf/AJPH.2012.300897.pdf)です。著者はアラバマ大学のBertha Hidalgoと、ワシントン大学セントルイスの方で、シアトルにあるUniversity of Washingtonとは違います)のMelody Goodmanです。


結論から言えば、
Multivariable- もしくは Multiple- は、複数の独立変数もしくは応答変数を含むモデル。Multivariate-は、2つもしくはそれ以上の従属変数(アウトカム)を持つモデルと記述しています。(若干、違和感あり)

"multivariate"な解析は、縦断研究のように同一の個人で複数回の測定があるデータなどで用いられると記述している。

この文献で紹介しているのは線形回帰の例で下記のように記述されています。
f:id:ryosukefujii0320:20160708004819j:plain

2010年12月から2011年11月のAm J Public Healthで"multivariate"を評価した結果

Pubmedで30件の論文がヒットした中で、5件は今回の定義通りに用いられていました。内訳としては、4件が縦断調査のデータで、残り1件はnested controlなデータでした。それ以外の25件では、間違った言葉の使い方をしていた。特に2件については"multivariable"と"multivariate"を混同して使用していました。

最後に

この文献にあるように、確かにこの問題はsemanticな問題、つまり言語の問題とも言えますが、このような違いを理解しておくことは重要だと思いました。

参考文献

[1] Van Belle G (2004) Biostatistics: A Methodology for the Health Sciences
[2] Katz HM (2003) Multivariable analysis: a primer for readers of medical research.


20160708
RF