理学療法士国家試験問題解答と解説（研究法編）

はじめに

理学療法士国家試験の研究法に関する問題の解説です。
第 41 回から 60 回までで集めました。

基本的な解説だけでなく，問題の不適切なところについてなどの少し踏み込んだ解説もしています。

第 60 回理学療法士国家試験

午前 11

Parkinson 病患者 30 名に対してリズミカルな運動を導入した。導入 1 週後の歩行速度の変化について，統計処理を実施したところ，有意差（p < 0.05）を認めた。
選択した統計処理で適切なのはどれか。
なお，歩行速度のデータは正規分布を示す。

1．Paired-t 検定
2．一元配置分散分析
3．Kruskal-Wallis 検定
4．Mann-Whitney の U 検定
5．Wilcoxon の符号順位検定

正解 1

解説

歩行速度は比率尺であり，データ数は 30 あり，データは正規分布を示すということなので，パラメトリック検定を行います。
2 群での比較です。
患者それぞれの運動導入前後の歩行速度のデータがあり，導入前後の差のデータがあるので，データには対応があるということになります。
以上のことから，Paired-t 検定（対応のある t 検定）を行います。

この問題の選択肢は第 59 回午前 21 と同じです。
各選択肢の検定方法についてはそちらで簡単に解説しています。

他の類似問題として，第 56 回午後 22，第 55 回午後 21 ，第 50 回午後 49 があります。

検定方法選択の基準を表 1 〜 3¹⁰⁾に示します。

	パラメトリック検定	ノンパラメトリック検定
尺度	比率尺度，間隔尺度	不問
母集団の分布	正規分布	不問
データ数	25 以上（目安）	少なくても良い

表 1: パラメトリック検定とノンパラメトリック検定の選択

	2 群	3 群以上
対応なし	t 検定	分散分析
対応あり	対応のある t 検定	反復測定分散分析

表 2: パラメトリック検定における検定方法の選択

群	2 群	2 群	3 群以上	3 群以上
対応	なし	あり	なし	あり
名義尺度	カイ二乗検定		カイ二乗検定
順序尺度	マン・ホイットニー検定	ウィルコクスンの符号付順位和検定	クラスカル・ウォリス検定	フリードマン検定

表 3: ノンパラメトリック検定における検定方法の選択

目次に戻る

午前 49

無作為化比較試験で正しいのはどれか。

1．観察研究である。
2．交絡因子の影響を小さくできる。
3．インフォームドコンセントは不要である。
4．因子間の相互関係を調べることが目的である。
5．診療録に記載してある過去の記録で調査できる。

正解 2

解説

1．無作為化比較試験は介入研究です。

2．交絡因子を持つ被験者が介入群と対照群にランダムに分かれることになるので，交絡因子の影響は小さくなります。

3．人を対象とする研究であれば，どんな研究デザインであっても，少なくとも，被検者に対して被検者になることについてのインフォームドコンセントが必要です。無作為化比較試験では，例えば，介入群に割り付けられた場合は未知のリスクに晒されるかもしれませんし，対照群に割り付けられた場合は，より効果があるかもしれない治療を受ける機会がなくなります。このように大きな不利益になるかもしれないことを自分で選ぶことができません。この点については特によく説明して同意を得る必要があります。

4．無作為化比較試験の主目的は介入の効果を調べることです。ただし，4 群にすることで因子間（2 つの介入）の相互関係を調べることは可能ですので，この選択肢はやや不適切です。そもそも，「因子間の相互関係を調べる」という表現が曖昧です。

5．過去の記録で調査するのはケースコントロール研究（症例対照研究）です。

無作為化比較試験についての解説はこちらにあります。

目次に戻る

第 59 回理学療法士国家試験

午前 21

対応があり正規分布を示さない連続変数の 2 群間の差を検討するのはどれか。

1．Paired-t 検定
2．一元配置分散分析
3．Kruskal-Wallis 検定
4．Mann-Whitney の U 検定
5．Wilcoxon 符号付順位検定

正解 5

解説

1．Paired-t 検定は，対応があり正規分布を示す連続変数の 2 群間の差を検討するものです。

2．一元配置分散分析は，対応がない正規分布を示す連続変数の 3 群間の差を検討するもので，要因が 1 つの場合に用いるものです。

3．Kruskal-Wallis 検定は，対応がない 3 群間で，順序尺度（カテゴリ変数）である場合や正規分布を示さない連続変数の場合に差を検討するものです。

4．Mann-Whitney の U 検定は，対応がない 2 群間で，順序尺度（カテゴリ変数）である場合や正規分布を示さない連続変数の場合に差を検討するものです。

5．Wilcoxon 符号付順位検定は，対応がある 2 群間で，順序尺度（カテゴリ変数）である場合や正規分布を示さない連続変数の場合に差を検討するものです。

連続変数は間隔尺度と比率尺度で，カテゴリ変数は名義尺度と順序尺度です。

検定方法選択の基準については，第 60 回午前 11にある表 1 〜 3 を参考にしてください。

類似問題として，第 60 回午前 11，第 56 回午後 22，第 55 回午後 21 ，第 50 回午後 49 があります。

目次に戻る

第 58 回理学療法士国家試験

午前 23

観察的研究を研究デザインとするのはどれか。2 つ選べ。

1．コホート研究
2．メタアナリシス
3．無作為化比較対照試験
4．ケースコントロール研究
5．システマティックレビュー

正解 1，4

解説

観察研究は観察してデータを集めることを主体とする研究です。
主には予後や因果関係を調べる研究で，調べようとしている要因の有無による違いを観察します。

介入研究は，治療効果を検証する研究であり，実験的な介入（治療）を行なってどうなるかを調べる研究です。

1．コホート研究は，調べようとしている要因を持つ人の集団と持たない人の集団を追跡し，疾患の発生率や死亡率などが異なるかどうかを観察する研究です。

2．メタアナリシスは，複数の研究結果を統合するために用いる統計的な手法です。

3．無作為化比較対照試験は，効果を検証したい治療を行う群と行わない群を作って効果を比較する研究です。意図的に異なる治療を行う介入研究です。

4．ケースコントロール研究は，疾病がある人の集団とない人の集団において，調べようとしている要因の有無を過去にさかのぼって比較する観察研究です。

5．システマティックレビューとは，特定の臨床的な疑問について，関連する研究を系統的に集め，集めた研究のなかから質の高いものを選び，それらの結果を統合し，まとめたものです。介入の有無による研究デザインの分類とは異なる分類です。

それぞれのデザインの定義を覚えていれば簡単な問題です。
研究デザイン分類については，別の記事でも解説しています。

目次に戻る

第 57 回理学療法士国家試験

出題なし

第 56 回理学療法士国家試験

午後 22

対応がなく正規分布を示さない連続変数の 3 群間の差を検討するのに用いるのはどれか。

1．相関分析
2．分散分析
3．Paired-t 検定
4．Kruskal-Wallis 検定
5．Mann-Whitney の U 検定

正解 4

解説

1．相関分析とは，2 つの変数があり，一方の変数の変化に伴って他方の変数も変化するような関係を分析するものです。

2．分散分析は 3 群間の差を検討する手法ですが，正規分布が前提となります。

3．Paired-t 検定とは，対応のある t 検定のことです。
対応のある 2 群間の差を検討するものです。

4．問題は，正規分布を示さないということなので，ノンパラメトリック検定を選びます。
Kruskal-Wallis 検定（クラスカル・ウォリス検定）は，ノンパラメトリック検定で，対応のない 3 群間の差を検討するものです。

5．Mann-Whitney の U 検定（マン・ホイットニー検定）は，ノンパラメトリック検定で，対応のない 2 群間の差を検定するものです。

検定方法を選択する問題は，他に，第 60 回午前 11，第 59 回午前 21，第 55 回午後 21 ，第 50 回午後 49 があります。

目次に戻る

第 55 回理学療法士国家試験

午前 1

病気 X の有無を調べる検査の感度，特異度，陽性的中率，陰性的中率を表に示す。
正しいのはどれか。2 つ選べ。

感度	80 %
特異度	95 %
陽性的中率	85 %
陰性的中率	90 %

1．病気 X に罹患している人で，検査が正しく陽性と判定された確率は 85 % である。
2．病気 X に罹患していない人で，検査が正しく陰性と判定された確率は 95 %である。
3．病気 X を判定する検査が陽性の場合，真に病気 X に罹患している確率は 80 % である。
4．病気 X を判定する検査が陰性の場合，真に病気 X に罹患している確率は 15 % である。
5．病気 X を判定する検査が陰性の場合，真に病気 X に罹患していない確率は 90 % である。

正解 2，5

解説

定義を覚えていれば簡単な問題です。

1．病気 X に罹患している人のうち，検査が正しく陽性と判定された人の割合を感度と呼びます。

2．病気 X に罹患していない人のうち，検査が正しく陰性と判定された人の割合を特異度と呼びます。

3．病気 X を判定する検査が陽性の場合に，真に病気 X に罹患している割合を陽性的中率と呼びます。

4・5．病気 X を判定する検査が陰性の場合，真に病気 X に罹患していない確率を陰性的中率と呼びます。

感度・特異度・尤度比について以下の記事で詳しく解説しています。
感度，特異度の定義と使いかた
 尤度比の定義と使いかた

目次に戻る

午前 21

臨床研究を実施する上で適切でないのはどれか。

1．研究対象はポスターを用いて募集した。
2．研究の内容について対象者に書面を見せながら口頭で説明した。
3．データ処理を匿名化で行った。
4．得られたデータはパソコンの共有フォルダで保管した。
5．対象者からの研究の同意への撤回請求に応じた。

正解 4

解説

1．ポスターで募集すること自体に問題はありません。ただ，研究内容によっては，より適切な募集方法があるかもしれません。

2．書面を見せながら口頭で説明することになんら問題はないと思います。
書面だけの説明だったとしたら，それは適切ではないかもしれませんが，そういう決まりのようなものがあるのかどうかは分かりませんでした。

3．「データ処理」が具体的に何を指すのかが不明確ですが，守秘義務や個人情報保護の観点から，氏名が不要なら匿名化するのは当然です。
例えば，統計の計算をするのに氏名は要りません。

4．データを共有フォルダに保管すると，データが外部に漏洩する可能性が高まり，守秘義務や個人情報保護の観点から，適切でないということになります。
しかし，共有フォルダにも様々なものがあり，情報が漏洩しにくいようにすることもできますし，そもそも，この選択肢はコンピュータの知識を問う選択肢になっています。
私は，この問題はやや不適切ではないかと思います（別のサイトの記事で少し詳しく書いています）。

5．研究への参加は対象者個人の自由です。

目次に戻る

午後 21

対応のない正規分布を示す連続変数の 2 群間の差を検定するときに用いるのはどれか。

1．Fisher の正確確率検定
2．Kruskal-Wallis 検定
3．log-rank 検定
4．相関分析
5．Student の t 検定

正解 5

解説

1．Fisher の正確確率検定は，対応がない 2 条件間の比率の比較において，サンプルサイズが小さくてカイ二乗検定が使えない場合に用います。

2．Kruskal-Wallis 検定は，正規分布に従わない 3 群以上の中央値を比較します。

3．log-rank 検定は，生存時間解析で使います。

4．相関分析は，2 つの変数間の関係を分析するものです。

5．問題文が Student の t 検定の説明になっています。
問題文には，「平均値」という言葉が使われていませんが，平均値の差を検定すると覚えた方がより正確だと思います。

検定方法を選択する問題は，第 60 回午前 11，第 59 回午前 21，第 56 回午後 22 ，第 50 回午後 49にもあります。

目次に戻る

第 54 回理学療法士国家試験

午後 21

最もエビデンスレベルが高いのはどれか。

1．無作為化比較試験
2．コホート研究
3．症例集積研究
4．症例対照研究
5．症例報告

正解 1

解説

エビデンスレベルとは，診療ガイドラインにおいて，推奨の根拠の確実性（強さ）を表すものです。

理学療法診療ガイドライン³⁾にある，理学療法介入のエビデンスレベルの分類を表に示します。

エビデンスレベル	内容
1	システマティック・レビュー/RCT のメタアナリシス
2	1 つ以上のランダム化比較試験による
3	非ランダム化比較試験による
4a	分析疫学的研究（コホート研究）
4b	分析疫学的研究（症例対照研究，横断研究）
5	記述研究（症例報告やケース・シリーズ）
6	患者データに基づかない，専門委員会や専門家個人の意見

治療効果を調べる研究において，どの研究デザインが信頼性が高いのかを段階づけたものです。
表の上のものほどエビデンスレベルが高いといえます。

1．無作為化比較試験とランダム化比較試験は同じもので，選択肢のなかではこれが一番上です。

3．症例集積研究はエビデンスレベル 5 のケース・シリーズと同じです。

さて，この問題は，何のエビデンスレベルなのかが明記されていません。
ですので，問題としてはやや不正確です。

また，エビデンスレベルを決める大きな要素として研究デザインがありますが，エビデンスレベルは研究デザインだけで決まるものではないということも重要です。

研究デザインについてはこちらでまとめています。

目次に戻る

午後 27

NRS〈numerical rating scale〉で正しいのはどれか。

1．順序尺度である。
2．10 段階で評価する。
3．疼痛の性質を評価する。
4．患者間の比較に有効である。
5．幼児の疼痛評価に使用される。

正解 1

解説

研究法のみに関する問題ではありませんが，研究において重要な尺度水準がでています。

NRS は，疼痛の強さを評価するものです。
無痛 = 0，最強の痛み = 10 として，痛みの強さを 11 段階の整数で表してもらうものです。

患者の主観による数字ですので，数値間の差の大きさは揃っていませんが，順番はあります。
よって順序尺度になります。

尺度水準についてはこちらでまとめています。

目次に戻る

第 53 回理学療法士国家試験

午前 21

研究に関する用語と説明の組合せで正しいのはどれか。

1．母集団 —- 実際の研究の対象となるもの
2．順序尺度 —- 重さ，長さ，時間などの物理量を表す尺度
3．名義尺度 —- 大小関係や程度のような順位を有する尺度
4．交絡因子 —- 2 つの要因の関連をかく乱する他の因子
5．Likert 尺度 —- 階層性を持った質問などに対する回答についての比率尺度

正解 4

解説

1．母集団とは，標本を抽出するときの元の集団です。
例えば，脳卒中片麻痺患者に対する治療の研究をする場合，全ての脳卒中片麻痺患者が母集団で，そこから標本を抽出し，実際の研究としての治療は標本に対して行い，研究結果を母集団に当てはめます。
実際の研究の対象となるものは，母集団ではなく，標本ということになります。
しかし，母集団のことを調べようとしているのですから，母集団も研究対象です。
「実際の研究」という説明が曖昧であり，厳密にはこの問題は不適切問題です。

母集団についてこちらの記事でまとめています。

2．順序尺度は，順番を数値で表したもので，数値間の差の大きさは揃っていないという尺度です。
重さ，長さ，時間を表す数値は，各数値の間隔は一定で，0 は測定したものが無い状態を表し，その 0 からどれくらい離れているかを表していますので，比率尺度です。
「物理量を表す尺度」には様々なものがあり，物理量というだけでどの尺度に分類されるかは決まりません。

3．名義尺度は名前を数字で表したもので，数字としての大小関係や順位を表していません。
ちなみに，「大小関係や程度のような順位を有する尺度」は何か？と問われたとしたら，順序尺度と答えるかもしれませんが，間隔尺度，比率尺度も大小関係や順位を表すことができることを忘れてはいけません。

尺度水準についてはこちらでまとめています。

4．正解の選択肢です。
交絡因子は 2 つの要因の関連をかく乱する他の因子です。
しかし，この説明は，交絡因子の定義としては不十分のような気がします。
また，2 つの要因の関連ではなく，原因と結果の関連をかく乱するといった方が分かりやすいと思います。
交絡因子の例を挙げます。
コーヒーをよく飲む人は，糖尿病になったときに合併症が多いという関係があったとします。
そして，これはコーヒー多飲が合併症の原因なのではなく，コーヒーをよく飲む人には，喫煙者が多く，喫煙によって合併症が起こっているというのが，真の因果関係であったとします。
この場合の喫煙が交絡因子です。

5．Likert 尺度は，アンケートなどで使われるものです。
質問文に対して回答者が最も当てはまる程度を選んでもらいます²⁾。
例えば，「非常に賛成，賛成，どちらともいえない，反対，全く反対」というような選択肢を選んでもらう尺度です。

目次に戻る

午前 22

理学療法診療ガイドライン第 1 版（日本理学療法士協会）における理学療法介入の推奨グレード分類で，「行わないように勧められる科学的根拠がない」に該当する推奨グレードはどれか。

1．A
2．B
3．C1
4．C2
5．D

正解 4

解説

理学療法介入の推奨グレード分類³⁾は以下の通りです。

推奨グレード	内容
A	行うように勧められる強い科学的根拠がある
B	行うように勧められる科学的根拠がある
C1	行うように勧められる科学的根拠がない
C2	行わないように勧められる科学的根拠がない
D	無効性や害を示す科学的根拠がある

診療ガイドラインで推奨するかどうかを決める際には，科学的根拠の強さだけでなく，臨床経験や医療制度なども含めて総合的に判断するのが普通です。
この推奨グレード分類をみると，科学的根拠のみに基づいて判断するものだと誤解する可能性がありますので，注意が必要です。

私個人の意見ですが，理学療法士協会の推奨グレード分類は，推奨の強さがはっきりせず不適切なのではないかと思っています。
例えば，問題文の「行わないように勧められる科学的根拠がない」だと，最終的に勧めるのか勧めないのかが分かりません。

目次に戻る

午後 21

入院患者 100 人の収縮期血圧を集計した標本 A の分布は，中央値や平均値の近くに測定値が集中していた。他の値より極端に小さい値が 1 つあり，再度確認したところ誤記入であることが分かったため，この値を除いて標本 B を作った。
標本 A に比べ標本 B の方が大きい統計量はどれか。

1．分散
2．最大値
3．最頻値
4．平均値
5．標準偏差

正解 4

解説

極端な値（外れ値）を除外したときの統計量の変化を問われています。

1．分散は測定値の散らばり具合を表すものです。
外れ値を除けば散らばり具合は小さくなり，分散も小さくなります。

2．小さい方の値の 1 つがなくなったのですから，最大値は変わりようがありません。

3．最頻値は度数が最も多い測定値のことです。
中央値や平均値の近くに測定値が集中していたのなら，最頻値もその辺りにあるはずですし，1 つしかなかった外れ値が最頻値だということも滅多にないはずです。
よって最頻値は変わりません。

4．小さい値が 1 つなくなれば，平均値は大きくなります。

5．標準偏差は分散の平方根であり，分散と同じように測定値の散らばり具合を表しています。
外れ値を除けば散らばり具合は小さくなり，分散も小さくなります。

目次に戻る

第 52 回理学療法士国家試験

午前 23

対象者を現在の生活習慣から喫煙群と非喫煙群とに分け，喫煙に起因する将来の脳血管障害の発生を明らかにする疫学研究法はどれか。

1．横断研究
2．記述的研究
3．コホート研究
4．症例対照研究
5．無作為化比較試験

正解 3

解説

1．横断研究は，ある集団のある一時点での状態を調査する研究です。
問題文の例でいうと，ある一時点で，タバコを吸っているかどうか，脳血管障害を発症しているかどうかを調べるのが横断研究です。
タバコと脳血管障害の発症のどちらが先であるのかは分かりませんので，因果関係は分かりません。

2．記述的研究とは，症例報告のような現状の説明するだけの研究です。

3．要因を持つ集団と持たない集団を追跡し，要因の有無により，疾患の発生率や死亡率が異なるかどうかを観察するのがコホート研究です。
問題文がほぼコホート研究の説明になっています。
「喫煙に起因する将来の脳血管障害の発生を明らかにする」だと，追跡するということがはっきりしませんので，コホート研究の説明としては弱くなっています。
もし「喫煙に起因する将来の脳血管障害の発生を明らかにする」ことが目的だと解釈してしまうと，選択肢 4・5 の症例対照研究と無作為化比較研究も，目的はこれになりますので，選択肢3・ 4・5 の区別が難しくなります。

4．症例対照研究（ケースコントロール研究）は疾病がある人とない人を集め，ある要因の有無を過去にさかのぼって比較するものです。
問題文の例でいうと，脳血管障害を発症している人と発症していない人を集め，過去にタバコを吸っていたかどうかを調べます。
脳血管障害発症群の方が喫煙率が高ければ，喫煙で脳血管障害を発症するのかもしれないということが分かります。

5．問題は「現在の生活習慣から喫煙群と非喫煙群とに分け」となっており，ランダムに分けていませんから，無作為化比較試験ではありません。
また，問題文には疫学研究とあり，介入研究である無作為化比較試験ではないことが分かります。

無作為化比較試験を問題文の例に当てはめてみます。
対象となる人達をランダムに 2 つのグループに分け，一方にはタバコを吸うよう指示し，もう一方にはタバコを吸わないよう指示します。
そして，タバコを吸わせたグループの方で脳血管障害がより多く発症すれば，タバコを吸うと脳血管障害を発症しやすいということが分かります。
この研究は実験的にわざと脳血管障害を発症させることになりますので，倫理的に実行不可能です。
害があるかどうかを調べるのに，無作為化比較試験は使えません。

研究デザイン分類については，別の記事で解説しています。

目次に戻る

午後 22

陽性尤度比の説明で正しいのはどれか。

1．検査的中率と同義である。
2．陰性尤度比を足すと 1 になる。
3．｢感度 ÷ （1 – 特異度）｣で計算できる。
4．値が小さいほど臨床導入の妥当性が高い。
5．実際の該当者のうち検査で陽性となる割合である。

正解 3

解説

1．検査的中率という用語は見たことがありません。

2．特に意味のない誤った選択肢だと思います。

3．陽性尤度比の定義式です。国試では暗記する必要のある式です。

4．陽性尤度比の値が大きいほど，検査が陽性のときに本当に疾患を持つ人の割合が高くなりますので，検査の有用性は高くなります。有用性の高い検査は臨床で導入する妥当性が高いといえます。

5．感度の説明です。

尤度比を短く簡潔に説明する力は私にはありません。
詳しい解説が以下の記事にあります。
感度，特異度の定義と使いかた
 尤度比の定義と使いかた

目次に戻る

第 51 回理学療法士国家試験

午前 49

介入研究に該当するのはどれか。

1．特定の集団での継続的な治療の観察
2．通常行われている治療の効果判定
3．2 群に分けた治療の前向き比較
4．複数データによる横断的比較
5．過去の治療成績間の比較

正解 3

解説

臨床研究は観察研究と介入研究に分類されます。

観察研究とは，データを集めて観察することを主体とする研究です。
いつも通りの治療を行なって観察するのが原則です。

介入研究は，実験的な介入を行う研究です。
いつも通りの治療ではなく，比較するためにグループ間で治療を変えるなどといった実験的な治療を行います。

1．観察するので介入研究です。
ただし，「治療を観察」して何をするのかが分かりませんので，どの研究に分類されるのかは分かりません。

2．通常行われている治療の効果を判定するのであれば，介入研究ではありません。
通常の治療の効果判定は，通常の臨床で行われていることですから，研究であるのかどうかもはっきりしません。

3．「対象者を効果を検証したい治療を行う群（治療群）と行わない群（対照群）にランダムに分けた」とあれば，介入研究であるとわかるのですが，「2 群に分けた治療」だけだと何を意味するのかがよく分かりません。
しかし，2 群に分けて前向きとくれば，RCT だと考えるのが普通であり，これが介入研究です。

4．「複数データによる横断的比較」だけだと，どんな研究なのかが分かりませんが，おそらく横断研究のことでしょう。
横断研究は観察研究です。

5．「過去の治療成績間の比較」も，これだけだと，どんな研究なのかが分かりません。
過去のある一時点での治療成績を見た横断研究なのかもしれません。

目次に戻る

午後 50

ある疾患に対する運動療法の再発予防効果を検討した研究のメタアナリシスを行った。その結果，運動療法を行った群の効果量は0.78（95 % 信頼区間：0.66 〜 0.90）であった。
これに対する考察で正しいのはどれか。

1．運動療法は生命予後を改善する。
2．運動療法は再発予防効果がある。
3．運動療法は再発危険因子を改善する。
4．このメタアナリシスは統計学的に有意でない。
5．運動療法を行った78 %の人に再発予防効果がある。

正解 2

解説

メタアナリシスは複数の研究結果をまとめるもので，各研究の結果の数字を 1 つの数字にまとめます。
効果量は，効果の大きさを示す数字で，リスク比やリスク差などがあります。

95 % 信頼区間に，差がない（効果がない）ことを表す数値が含まれていたら，統計の検定において有意差がなかったということを意味します。

問題では，効果量として何を使ったのかが示されていません。
ですが，効果量は比で表すか，差で表すかのどちらかです。
つまり，割り算をするか引き算をするかのどちらかです。

例えば，運動療法を行った群での再発率を対照群での再発率で割って，再発率の比を出しているのかもしれません。
それが 0.78 だったのなら，それは対照群で 100 人が再発して，運動療法群では 78 人しか再発していないということであり，運動療法に再発予防効果がそれくらいあるということを意味しています。
もし運動療法群と対照群で再発率が同じであれば，同じ数字で割り算をするのですから，1 という数字になります。

あるいは，各群の数値で引き算をすれば，差がどれくらいあるかを示すことができます。
運動療法群と対照群で効果が同じ（数値が同じ）なら引き算をすると，0 になります。

ようするに，効果量としての 1 か 0 は，効果がないということ意味します。

問題では，効果量の 95 % 信頼区間が 0.66 〜 0.90 で 1 も 0 も含んでいませんので，統計の検定で有意差があり，効果があることが分かったことになります。

第 49 回午後 49にも似たような問題があります。

目次に戻る

第 50 回理学療法士国家試験

午後 49

3 群に分けたグループ間で平均値に差があるかを統計学的に検定する手法で正しいのはどれか。

1．t 検定
2．相関分析
3．分散分析
4．重回帰分析
5．Welth 検定

正解 3

解説

1．t 検定は 2 群間で平均値に差があるかを検定するときに使います。

2．2 つの変数間の関係を分析するものです。

3．分散分析は 3 群間で平均値に差があるかを検定するときに使います。2 群間の場合で使う t 検定とセットで覚えておくといいと思います。

4．調べたい特性が 2 つ以上ある場合の解析を多変量解析といいます。重回帰分析は多変量解析の 1 つで，1 つの変数を複数の変数で表す関係式を作ります。

5．Welth 検定は，母分散が等しくない場合に，2 群間で平均値に差があるかを検定するときに使います。

検定方法を選択する問題は，第 60 回午前 11，第 59 回午前 21，第 56 回午後 22 ，第 55 回午後 21にもあります。

目次に戻る

第 49 回理学療法士国家試験

午前 49

診療ガイドラインについて正しいのはどれか。

1．理学療法に関するガイドラインは存在しない。
2．世界で統一の方法を示したものではない。
3．エビデンスレベルは統計的に計算される。
4．主に評価と診断の妥当性を示している。
5．推奨グレードに従う義務がある。

正解 2

解説

1．例えば，日本理学療法士協会の理学療法診療ガイドライン³⁾があります。

2．国や地域によって，最適な医療は異なりことが多いため，世界で統一の方法を示すのは難しいことが多いと思います。
全世界共通でどこに行っても変わらない医療もあるでしょうが，そもそも，それを決めることができる組織が存在しません。

3．エビデンスレベルは研究が適切に行われたかどうかによって決まります。

4，5．診療ガイドラインは，患者と医療者の意思決定を支援するため，最適と考えられる治療や評価方法を提示するものです。
評価と診断の妥当性を示していますが，それが主ではありません。
意思決定を支援するものであり，従う義務があるものではありません。

目次に戻る

午後 49

2 つのバランス練習の効果を比較するため，オッズ比の 95 % 信頼区間を計算したところ，以下の値が得られた。
効果が有意であるのはどれか。2 つ選べ。

1．0.65 ～ 0.89
2．0.89 ～ 1.39
3．0.65 ～ 1.39
4．1.39 ～ 5.67
5．0.65 ～ 5.67

正解 1，4

解説

基本的なところは，第 51 回午後 50 の解説で述べています。

問題文の「効果が有意であるのはどれ」という文は言葉足らずかもしれません。
「効果についての検定で有意差ありと判定できるのはどれか」ということです。

オッズ比は比ですので割り算で求めます。
効果がなくて差がないときは，同じ数字で割り算をするのでオッズ比は 1 になります。
95 % 信頼区間に 1 が含まれていたら，その検定の結果は有意差なしになります。

ちなみに，統計のことを全く知らなくても，選択肢 1 と 4 の 2 つが 1 をまたいでいないことに気づけば，正解を答えることができます。
そういうセンスもときには必要です。

目次に戻る

第 48 回理学療法士国家試験

午前 49

研究法の説明で正しいのはどれか。

1．前方視研究では対象者の過去の現象を調査する。
2．後方視研究の中で介入研究を行うことができる。
3．ケースコントロール研究は横断研究に含まれる。
4．コホート研究では結果に関連する予測因子を分析する。
5．シングルケーススタディはシングルケースデザインの一種である。

正解 4

解説

1．前方視研究では対象者を追跡し，未来に起こる現象を調査します。

2．介入研究は，介入することでどうなるかを実験する研究です。
そして，後方視研究は過去にどんな介入があったかを調べる研究です。
過去に戻って介入することはできません。

3．ケースコントロール研究は，疾病の要因を過去にさかのぼって探して，予後や因果関係を検討する研究です。
横断研究は，ある集団のある一時点での状態を調査する研究です。
別物ですが，どちらも観察研究に含まれます。

4．コホート研究では，結果に関連すると思われる因子を持つ集団と持たない集団を追跡し，結果が生じる割合を比べることで，予測因子を見つけることができます。
これは正しい説明です。

5．シングルケーススタディはいわゆる症例報告のことです。
シングルケースデザインは，介入研究の 1 つで，1 人の患者に対して異なる治療を行い，効果を比較するものです。
別のものです。

目次に戻る

午後 49

100 人の中に転倒経験者が50 人いて，そのうちの 40 人はバランス検査で異常を指摘されていた。また，検査で異常を指摘されない転倒未経験者は 30 人いる。
この検査の陽性尤度比はどれか。ただし，陽性尤度比は感度 /（1 – 特異度）で表される。

1．0.6
2．0.7
3．0.8
4．1.0
5．2.0

正解 5

解説

この問題でのバランス検査とは，そのバランス検査が陽性であれば，転倒する可能性が高いと判定できる検査であり，問題文の「バランス検査で異常を指摘されていた」ということは，検査が陽性であったということです。
問題文にそういう説明はありませんが，感度・特異度を計算するのであれば，そういうことにしないと問題が成り立ちません。

感度は，転倒した人の中で検査が陽性であった人の割合ですので，
感度 = 40 / 50 = 0.8
です。

特異度は，転倒していない人の中で検査が陰性であった人の割合ですので，
特異度 = 30 / （100 – 50）= 0.6
です。

陽性尤度比は，
感度 /（1 – 特異度）= 0.8 /（1 – 0.6）= 2.0
です。

陽性尤度比の定義は与えられていますので，この問題は感度と特異度の定義を問う問題になっています。
それなら，感度と特異度はどれかという問題にすればいいのに，陽性尤度比の計算をさせています。
それはつまり，0.8 /（1 – 0.6）という小学校の算数の問題が理学療法士国家試験で出題されていることになります。
それでいいのでしょうか？

第 46 回午前 19も同じような問題です。

感度，特異度，尤度比について以下の記事でまとめています。
感度，特異度の定義と使いかた
 尤度比の定義と使いかた

目次に戻る

第 47 回理学療法士国家試験

午前 22

2 群間の差を統計学的に検定する際に，有意差が得られやすくなる要因はどれか。

1．サンプル数が少ない。
2．検出力の設定が大きい。
3．データの妥当性が高い。
4．群内の標準偏差が小さい。
5．順序尺度のデータである。

正解 4

解説

統計学での検定では，本当は差があるのに差がないという判定したり，差がないのに差があると判定したりといった誤りが必ず発生します。
危険率 5% で有意差ありと判定するということは，差がないのに有意差ありと誤って判定する確率を 5% までは認めているということです。

本当は差があるときに，誤りなく（見逃しなく）有意差ありと判定できる確率を検出力（パワー）といいます。

この問題は主に検出力（パワー）をあげる方法を問うています。

1．サンプル数とは，母集団から抽出した標本の集合の数です。
RCT で母集団から介入群と対照群という標本の集合を抽出したのなら，サンプル数は 2 です。
よく似た言葉でサンプルサイズというのもあります。これは標本の集合に含まれる個体の数です⁵⁾。
臨床研究で言うところの症例数で，介入群や対照群に含まれる症例数のことです。

問題は「2 群間の差を統計学的に検定する際に」となっていて，サンプル数は 2 の場合の問題ですので，それが少ない場合を問うのは不自然です。
おそらく，「サンプルサイズが少ない」とすべきところを間違って「サンプル数が少ない」としているのだと思います。

サンプルサイズが小さい（症例数が少ない）と，本当は差があるのに，統計学的には非有意になる可能性が高くなります。

2．検出力の設定をいつするのかというと，サンプルサイズをどれくらいにするかを計算するときです。
つまり，症例を集め始める前に，何例集めるべきかを事前に計画するときです。
そして，サンプルサイズを決める計算式に検出力の設定の数字を入れることになります。
検出力の設定を大きくするということは，真に差があるときに検定でも差があると判定できる確率を大きくするということです。
つまり，検出力の設定を大きくすれば，有意差が得られやすくなります。
すると，この選択肢は正しいということになりますが，正解は 4 になっています。
もしかしたら，検出力を大きく設定して症例数がより多く必要になったのに，症例数が少ないまま研究を進めて，有意差が得られなかったということなのかもしれません。

3．妥当性という言葉には注意が必要です。
狭い意味では，妥当性とは検査がその測定しようとしているものを実際に測定している程度のことです⁷⁾。
測りたいことをちゃんと測れているということであり，真実に使いデータを使うということですので，真に差があれば有意差ありになりやすいですし，真に差がなければ有意差なしになりやすいでしょう。
つまり，検定には関係ありません。

妥当性を広い意味で使うと，誤差が少ないという意味も含まれます。
誤差が少なければ次の選択肢にある標準偏差が小さくなります。
すると，有意差が出やすくなり，この選択肢は正しいということになってしまいます。

4．標準偏差が小さいということは，データのばらつきが小さいということです。
データのばらつきが小さければ検出力が上がり，有意差は出やすくなります。
このことを直観的に説明します。
平均値の差を検定する場合，例えば A 群の平均値は 10 で，B 群の平均値が 20 だったとします。
もし，A 群の個々のデータのほとんどが 10 に近く，B 群は 20 に近い場合，つまり，ばらつきが小さい場合は，検定するまでもなく平均値には差がありそうな気がします。
しかし，ばらつきが大きくて，例えば，A 群の中に 21 のような B 群の平均を超えるような値があったとしたら，平均値に差があるのかどうかは分かりにくくなります。
統計の検定というのは，このようなばらつきの影響を処理して，差があるのかどうかを見ようとするものです。
そのばらつきが大きければ処理は大変になり，有意差は出にくくなりそうな気がします。
正確な説明ではありませんが，なんとなくイメージがつく説明です。

5．尺度が変われば検定方法が変わります。
検定方法によって有意差の出やすさが変わるという話は聞いたことがありません。

ちなみに，この問題を，大学の理学部数学科出身で統計学を教えている大学教授に見てもらう機会があったのですが，その方は，この問題はナンセンスだと言っていました。
その説明は専門的すぎて，私は十分に理解できませんでした（申し訳ありません）。
この問題はおそらく不適切問題です。

目次に戻る

第 46 回理学療法士国家試験

午前 19

100 人の高齢者に対して，バランス検査を行った結果と実際の転倒経験との関係を四分表に示す。
このバランス検査の特異度で正しいのはどれか。

	転倒経験有	転倒経験無
バランス検査陽性	40	20
バランス検査陰性	10	30

1．0.2
2．0.4
3．0.5
4．0.6
5．0.8

正解 4

解説

この問題は，第 48 回午後 49と類似の問題です。

特異度とは，その検査が見つけようとしている疾患等がない人の中で，その検査が陰性になった人の割合です。

この問題では，転倒経験がない人の中で，バランス検査が陰性であった人の割合です。

特異度 = 30 / 50 = 0.6 です。

感度，特異度について解説している記事があります。

目次に戻る

午前 23

比率尺度を用いた評価はどれか。2 つ選べ。
1．Barthel Index
2．Borg Scale
3．Timed Up and Go Test
4．Functional Reach Test
5．Modified Ashworth Scale

正解 3，4

解説

比率尺度は，各数値の間隔は一定で，0 は測定したものが無い状態を表しています。
長さ，質量，時間などの物理の基本単位は比率尺度です。
Timed Up and Go Test は時間を測定し，Functional Reach Test は長さを測定する検査です。

1．Barthel Index の点数は，順番を表していますが，数値間の差の大きさが揃っていませんので，順序尺度です。

2．Borg Scale は主観的な運動強度であり，順番を表していますが，数値間の差の大きさが揃っていないので，順序尺度です。しかし，心拍数とのある程度の相関があることから，間隔尺度として扱う場合もあります。

5．Modified Ashworth Scale は，順番を表していますが，数値間の差の大きさが揃っていませんので，順序尺度です。

尺度水準についてはこちらでまとめています。

目次に戻る

午前 49

用語の説明で誤っているのはどれか。

1．オッズ比：ある事象の起こりやすさを示す尺度
2．第 1 種の過誤：棄却すべき帰無仮説を棄却しない誤り
3．メタアナリシス：複数の研究のデータを統合して全体の結論を導き出す方法
4．バイアス：曝露とアウトカムの関係を誤って評価してしまう研究デザインの不備
5．無作為化比較試験：ランダムに割り付けた対象群間で前向きに効果の差を比較する研究

正解 2

解説

1．オッズ比はある事象の起こりやすさを示す尺度です。
しかし，ケースコントロール研究において算出するオッズ比は異なります。
ケースコントロール研究では，現在起こっている事象に対して，過去の要因の有無を調べます。
その過去の要因が現在の事象に影響しているかどうかを判断するための指標がオッズ比です。
その場合は事象の起こりやすさを示していません。

2．第 1 種の過誤は，棄却すべきでない帰無仮説を棄却する誤りです。
つまり，差がないのに差があるとする誤りです。
棄却すべき帰無仮説を棄却しない誤り，つまり，差があるのに差がないとする誤りは第 2 種の過誤です。
この選択肢が誤りです。

3．メタアナリシスは，統計学の手法の名前で，複数の研究のデータを統合して全体の結論を導き出す方法ですので，誤りではありません。

4．バイアスとは偏りのことです。統計学では，標本の母集団に対する偶然ではないずれのことです。
曝露とアウトカムの関係を誤って評価してしまう原因にはなります。
しかし，研究デザインの不備ではありません。
研究デザインの不備によってバイアスが生じます。
この選択肢も誤りだとすると，複数解答の不適切問題になります。

5．無作為化比較試験では，対象を介入群と対照群にランダムに割り付け，前向きに効果の差を比較します。
この選択肢は誤りではありません。

目次に戻る

午後 47

無作為化比較試験で誤っているのはどれか。

1．群間で基本特性に差のないことが前提となる。
2．介入効果を明らかにすることが目的である。
3．患者の希望によって治療法を割り付ける。
4．質の高いエビデンスが期待できる。
5．高い追跡率が求められる。

正解 3

解説

1，3．基本特性が何であるのかがはっきりしませんが，おそらくは年齢，性別，体重などのようなものでしょう。
無作為化比較試験では，そのような基本特性だけでなく，調べようとしている介入以外は全て同じであることが求められます。
そのために行うことがランダム割り付けです。
介入群と対照群にランダムに分ければ，2 群が同質の集団であることが保証されます。
患者の希望によって割り付けてしまえば，それは無作為化比較試験ではなくなってしまいます。

2．無作為化比較試験は介入研究の一つであり，なんらかの介入による効果を調べる研究です。

4．無作為化比較試験は，介入と効果の因果関係を検証するうえで最も信頼性の高い研究デザインです。
ただし，細かいことですが，「質が高い」という表現は曖昧であり，どんな研究であっても何らかの質の高さが期待できるものですので，無作為化比較試験だけが質の高いエビデンスというわけではありません。

5．高い追跡率とは，対象者の脱落が少ないということです。
無作為化比較試験に限らず，追跡を行う研究では，高い追跡率が求められます。
脱落者が多いと，研究対象の集団の性質が変わってしまいます。

無作為化比較試験についての解説はこちらにあります。

目次に戻る

第 45 回理学療法士国家試験

午前 23

検査の感度を示す説明で正しいのはどれか。
1．測定の精密度
2．実際の患者が検査で陽性となる確率
3．実際の患者でないものが検査で陰性となる確率
4．検査が陽性だった場合に実際の患者である確率
5．検査が陰性だった場合に実際の患者でない確率

正解 2

解説

感度とは，検査で見つけようとしている疾患がある人の中で，その検査が陽性となる人の割合のことです。
よって，選択肢 2 の「実際の患者が検査で陽性となる確率」が正解です。
ただし，「実際の患者」が何を指すのかが曖昧であり，厳密には感度の説明になっていないような気もします。

1．精密度とは，偶然誤差によるばらつきの程度のことです²⁾。
正確度は系統誤差の小ささの程度のことです。

3．実際の患者でないものが検査で陰性となる確率は特異度です。

4．検査が陽性だった場合に実際の患者である確率は陽性的中率です。

5．検査が陰性だった場合に実際の患者でない確率は陰性的中率です。

目次に戻る

午後 25

エビデンスに基づく理学療法を実践する場合に最初に行うのはどれか。

1．検証
2．適用
3．情報収集
4．批判的吟味
5．問題点の定式化

正解 5

解説

エビデンスに基づく理学療法（EBM，EBPT）は 5 つのステップからなります。

Step 1: 患者の問題の定式化
Step 2: 問題についての情報収集
Step 3: 情報の批判的吟味
Step 4: 情報の患者への適応
Step 5: Step 1 〜 4 のプロセスの評価

各ステップの簡単な解説はこちら。

目次に戻る

第 44 回理学療法士国家試験

該当なし

第 43 回理学療法士国家試験

午前 50

順序尺度を用いた評価はどれか。2 つ選べ。

1．BMI
2．ROM
3．MMT
4．FIM
5．10 m 歩行時間

正解 3，4

解説

1．BMI は，値の間隔は一定ですが，0 がありませんので間隔尺度です。

2．ROM は角度です。角度は等間隔で 0 からどれくらい離れているかを表していますから，比率尺度です。

3．MMT は，値の間隔は一定ではありませんが順番は表していますので，順序尺度です。

4．FIM も，値の間隔は一定ではありませんが順番は表していますので，順序尺度です。

5．10 m 歩行時間では，時間を測ります。時間は等間隔で 0 からどれくらい離れているかを表していますから，比率尺度です。

尺度水準についてはこちらでまとめています。

目次に戻る

第 42 回理学療法士国家試験

出題なし

第 41 回理学療法士国家試験

午後 69

EBM（Evidence-based medicine）で正しいのはどれか。

1．医師の指示を重視する医療
2．実証された効果を重視する医療
3．診療情報の管理と守秘を重視する医療
4．患者の希望を重視する医療
5．医療チームの合意を重視する医療

正解 2

解説

EBM は，実証された効果（研究結果からの最善のエビデンス）を重視します。

しかし，実証された効果を最も重視するという意味ではありません。
従来の医療は医療者の臨床的な専門技能や患者の価値観を重視して行われてきましたが，そこに研究結果からの最善のエビデンスも加えて，3 つを均等に扱い，より良い医療を目指そうというものが EBM です。
ですので，選択肢 4 の「患者の希望」も EBM では重視します。
そして，EBM は通常の医療のプロセスですので，他の選択肢にある医師の指示，診療情報の管理と守秘，医療チームの合意も場面に合わせて重視されます。

複数回答になってしまいますので，不適切問題だと思います。

EBM について最低限おさえておきたいところをこちらでまとめています。

目次に戻る

おわりに

医療の世界での研究法は，ほとんどがいわゆる理系になります。
数学が多少必要であり，苦手意識を持つ人も少なくないと思います。
しかし，国家試験ではそんなに難しい問題は出ません。
基本を丁寧におさえていけば，十分に対応できると思います。

参考文献

1）折笠秀樹: 臨床研究デザイン-医学研究における統計入門．真興交易医書出版部, 1998.
2）内山靖（編）: 標準理学療法学専門分野理学療法研究法第2版. 医学書院, 2006.
3）理学療法診療ガイドライン第 1 版
4）小島原典子, 中山健夫, 他（編）: Minds 診療ガイドライン作成マニュアル 2017. 公益財団法人日本医療機能評価機構, 2017.
5）渡邊宗孝, 寺見春惠, 金子翼: PT・OTのための統計学入門. 三輪書店, 1998.
6）正井栄一: 医学・保健学のためのやさしい統計学改訂第2版. 金原出版, 2007.
7）内山靖, 小林武, 他（編）: 臨床評価指標入門適用と解釈のポイント. 協同医書出版社, 2013.
8）名郷直樹: EBM 実践ワークブック-よりよい治療をめざして. 南江堂,1999．
9）名郷直樹：続EBM 実践ワークブック-今，できる限りの医療を. 南江堂, 2002．
10）山本澄子, 谷浩明（監修）: すぐできる！リハビリテーション統計. 南江堂, 2012.

2021 年 2 月 16 日
2021 年 5 月 5 日
2023 年 6 月 3 日
2024 年 6 月 30 日
2025 年 8 月 16 日

はじめに

目次

第 60 回理学療法士国家試験

午前 11

午前 49

第 59 回理学療法士国家試験

午前 21

第 58 回理学療法士国家試験

午前 23

第 57 回理学療法士国家試験

第 56 回理学療法士国家試験

午後 22

第 55 回理学療法士国家試験

午前 1

午前 21

午後 21

第 54 回理学療法士国家試験

午後 21

午後 27

第 53 回理学療法士国家試験

午前 21

午前 22

午後 21

第 52 回理学療法士国家試験

午前 23

午後 22

第 51 回理学療法士国家試験

午前 49

午後 50

第 50 回理学療法士国家試験

午後 49

第 49 回理学療法士国家試験

午前 49

午後 49

第 48 回理学療法士国家試験

午前 49

午後 49

第 47 回理学療法士国家試験

午前 22

第 46 回理学療法士国家試験

午前 19

午前 23

午前 49

午後 47

第 45 回理学療法士国家試験

午前 23

午後 25

第 44 回理学療法士国家試験

第 43 回理学療法士国家試験

午前 50

第 42 回理学療法士国家試験

第 41 回理学療法士国家試験

午後 69

おわりに

参考文献

コメント