京都大学 大学院医学研究科 社会健康医学系専攻

国民生活基礎調査匿名データ 解析実習を行いました (2024年度)

在校生 2025年03月17日

京大SPHの講義「健康情報学II」にて、国民生活基礎調査匿名データの解析実習を行いました。匿名データとは、行政機関等が統計法に基づいて実施した統計調査によって集められた調査票情報を、特定の個人又は法人その他の団体の識別ができないように加工したものです。学術研究及び教育の発展に資すると認められる場合は、一般の方も、利用することができます。今回は、教育目的として、厚生労働省に申出を行い、健康情報学IIにて、匿名データを利用した解析実習を行いました。

【講義名】
・健康情報学II(科目責任者 健康情報学・高橋由光)

【日時・場所】
・2025/1/10(金), 1/17(金) 13:15-16:30
・京大医学部構内G棟3F演習室

【概要】
・統計法および国連の公的統計の基本原則を中心に、公的統計データの二次的利用の規制の必要性および推進のバランス、調査対象の秘密保護について講義を行った。
・国民生活基礎調査(平成22年)匿名データB(世帯票・健康票・所得票・貯蓄票)を用いて、調査票、データレイアウト及び符号表の理解、csvファイルの読込、JMPを用いた記述統計・ロジスティック回帰分析等を行った。
・1名につきスタンドアロンPC 1台を準備した。

【参加人数】
・19名(教員、ティーチングアシスタント(TA)含む)

【参考情報】
厚生労働省 匿名データの提供について
http://www.mhlw.go.jp/toukei/itaku/tokumei.html
Shibuya, et al. BMJ. 2002 Jan 5;324:16.
https://pubmed.ncbi.nlm.nih.gov/11777798/

【講義資料・過去の講義】
講義資料ハンズオンのPDFは過去の講義をご覧ください

2023年度
2022年度
2021年度
2020年度(PDFあり)
2019年度(PDFあり)
2018年度(PDFあり)
2017年度(PDFあり)
2016年度

【参加者の声】
注:「JMP」は統計ソフトの名称

・「初めてデータを使って解析をする」ということを実際にやる機会となり、とても有意義な時間でした。目的の解析をするために、どのようにデータを整える必要があるのかを学ぶことができました。授業ではスライドの手順に沿って進めており、今後は自身で行いたい解析のために、どのような式を立てる必要があるか考えなければならないので、今回の実習を振り返りながら学んでいきたいと思います。

・尺度の種類変更,ラベル作成,ダミー変数のカテゴリ化,欠測処理などの下準備から、単変量・多変量解析の結果を出すところまでを一気に行うことで、データ処理・解析の全体像を把握する大変よい機会になりました。すでに固定されたデータとはいえ、解析の手前までの段階である程度の工程を要するということや、どのような解析をするかをしっかりと念頭に置いた上でハンドリングすることの必要性を痛感しました。また、厚労省へのデータ利用に関する申請〜承認までのプロセスを共有いただき、厳重に管理されていることがよくわかりました。資料が非常にわかりやすく、JMPは初めて触れましたが課題論文と同様の数値を出すところまで到達できました。ありがとうございました。

・生データの前処理の方法からJMPでの解析方法を実際に自分の手で作業しながら学べたことはとても貴重な経験になりました。先ずは生データをきちんと処理することが重要で、それを適切に遂行することで使いやすいデータができることを学びました。JMPの解析ソフトを使用したのも初めてではじめはかなり戸惑いましたが、ソフトの癖をつかんだ後はスムーズに作業ができました。他のデータもスムーズに分析ができるよう、練習を続けたいと思います。ありがとうございました!

・国民生活調査の生データを初めて扱うことができ、とても勉強になった。符号票のようなものも扱ったことがなく、質問調査を行う際のデータの作成方法について自身で研究を行う際の参考にしたいと思った。一方、回答票をみると、疾患の傷病名に関する設問、費用に関する質問などは回答者の自覚・認識によるため回答が難しいと感じ、データの正確な取得のためには今後はマイナンバーデータとの突合なども今後は求められるのではないかと感じた。

・今回の実習は非常に興味深い内容でした。スライドの解説が分かりやすかったため、実習を円滑に進めることができました。特に、データの定義書を参照しながら進める手順を学ぶことができた点が印象に残っています。実際のデータを扱う際には、構造や内容を事前に把握することが重要であると再認識しました。また、現在自身がデータベース研究を実施しているが、データの構造については、もっと早く知っておきたかったと感じました。データの変数やその意義を正しく理解することで、分析やモデル構築の精度が向上することを実感しました。特に、ダミー変数に関する解説は今後の研究に役立つものでした。データのカテゴリカル変数を扱う際、どのように変換し、解釈すべきかを実際に体験することで、今後のデータ分析への応用方法が明確になりました。この経験を今後の研究活動に活かし、より実践的な成果を目指して取り組みたいと思います。

・今回の実習を通じて、初めてデータ解析に触れる貴重な経験ができました。実際にデータを用いて整理することで、データの扱い方に対する具体的なイメージが湧きました。また、解析を行う際の注意点についても学ぶことができ、今後のデータ分析作業において非常に役立つ知識を得られたと感じています。特に、データの前処理や異常値の確認など、細かい点に注意を払う重要性を理解することができました。この経験を活かし、今後もデータ解析のスキルを磨いていきたいと考えています。

・当然ながら国民生活基礎統計を初めて見たが、質問票からのデータであるため国民の主観に関する研究ができそうだと感じた。講義資料により、データと定義書をどのように組み合わせてデータセットを作るのかが分かったため、「国民生活基礎統計を使う」というハードルが下がった。おそらくどんなデータであるかが分からないと、どう使って良いかのイメージもわかず、無闇にハードルが上がっていたのだと思う。実際のデータはもちろん日本語と数字であり、日本語話者であれば語学的な素養も心配ない。日本人研究者が使うべきデータだと思った。

・SPHに入学する前までは、データの機密性や結果の正確性がいかに重要であるか、深く考えたことはなかった。また、分析とはただ解析結果(数字)が重要なのではなく、その分析結果をどの様に活用したいのか目的をもつ必要があると感じた。研究者は、結果から何か実践したいという考えよりも、結果への興味の方が高い人も多いかもしれない。しかし、数字ひとつの操作が、どれだけ結果を異なる方向へと導いてしまうかを理解している研究者や、この統計という学問をまなぶ者が先頭にたち、今後透明性のあるデータ活用の指針を築く必要があると感じた。次に、実際にデータ解析を実施してみた感想だが、難しいというのが率直な感想だ。操作だけでなく、どの情報をぬきだすのか、そして解析するサンプル数などが増加していくと、どこで自分がミスを犯したのか、探し出すのも一苦労の様に感じた。課題研究においても、必ず乗り越えなければならない解析を、一から学ぼうという意欲(危機感)がわいた実習であった。

・常に役立つ知識を得られたと感じています。特に、データの前処理や異常値の確認など、細かい点に注意を払う重要性を理解することができました。この経験を活かし、今後もデータ解析のスキルを磨いていきたいと考えています。

・当然ながら国民生活基礎統計を初めて見たが、質問票からのデータであるため国民の主観に関する研究ができそうだと感じた。講義資料により、データと定義書をどのように組み合わせてデータセットを作るのかが分かったため、「国民生活基礎統計を使う」というハードルが下がった。おそらくどんなデータであるかが分からないと、どう使って良いかのイメージもわかず、無闇にハードルが上がっていたのだと思う。実際のデータはもちろん日本語と数字であり、日本語話者であれば語学的な素養も心配ない。日本人研究者が使うべきデータだと思った。

・SPHに入学する前までは、データの機密性や結果の正確性がいかに重要であるか、深く考えたことはなかった。また、分析とはただ解析結果(数字)が重要なのではなく、その分析結果をどの様に活用したいのか目的をもつ必要があると感じた。研究者は、結果から何か実践したいという考えよりも、結果への興味の方が高い人も多いかもしれない。しかし、数字ひとつの操作が、どれだけ結果を異なる方向へと導いてしまうかを理解している研究者や、この統計という学問をまなぶ者が先頭にたち、今後透明性のあるデータ活用の指針を築く必要があると感じた。次に、実際にデータ解析を実施してみた感想だが、難しいというのが率直な感想だ。操作だけでなく、どの情報をぬきだすのか、そして解析するサンプル数などが増加していくと、どこで自分がミスを犯したのか、探し出すのも一苦労の様に感じた。課題研究においても、必ず乗り越えなければならない解析を、一から学ぼうという意欲(危機感)がわいた実習であった。

・今回国民生活基礎調査のデータに実際に触れ、生活の実態が予想以上に細かく調査されていることを知り興味深く感じました。自身が回答者であればかなり労を要することが予想され、これらのデータが有益に活用されることを願うとともに、これまでにどのように活用されてきたのか、より深く学んでみようと思いました。

・課題研究としてレセプトデータベースを用いていたので、今回の国民生活基礎調査データの解析は新鮮でした。思い出しバイアスが入るものの、社会行動、経済的な項目等、レセプトでは取得できない項目があり興味深かったです。

・本講義を通じて、公的統計(調査)の強みと、その利活用の重要性について深く理解することができました。公的統計の最大の強みは、研究者個人では実現が難しい同一の枠組みの下で、長期間にわたって調査が継続的に実施される点にあると考えます。これには、継続的な予算確保や大規模な調査の実行が必要であり、政府主導で行われる公的統計だからこそ可能な取り組みであると感じています。さらに、公的統計のサンプルサイズの大きさと、そのデータの代表性も大きな強みの一つであると思います。このような特性を理解したことにより、公的統計を積極的に利活用してみたいという動機に繋がりました。

・講義の中では、実際に公的統計を取得し、分析に至るまでの一連のプロセスを疑似体験する機会がありました。この経験を通じて、データを活用する際の心理的ハードルが大きく下がったことを実感しました。特に、公的統計は国民の義務として収集されるものであり、既存のデータを活用しない理由はないと感じています。それどころか、活用されないデータが存在することは非倫理的ですらあるという考えも生まれました。

・一般的には統計の利活用を促進するためには、研究者自身がそのデータを活用する必要性や価値を強く感じることが重要であると思います。そして、そのニーズに応える形でデータが適切に提供されていることが前提となります。しかし、公的統計はその限りではないと思います。長期的かつ統一的なデータの蓄積が強みである為、どちらかと言えばそれを活用するための研究者の知識や理解を求める必要があると思います。つまり、公的統計の持つ可能性を最大限に引き出すには、研究者がデータの特性や強みを正しく理解することが不可欠であるということです。

・本講義では、このような公的統計の特性や利活用方法について学ぶことができました。これにより、今後の研究において公的統計をどのように活用すべきか、具体的なビジョンを描くための基礎を築くことができたと感じています。ありがとうございました。

・国民生活調査の統計データに興味があったので、中身を見ることができてよかった。与えられたデータをJMPを用いて結果を求める授業だった。実際の解析の手順を手を動かして学べるのは貴重な経験でした。

Today’s exercise was fun. However, the laptop I used has a Japanese keyboard layout, which I haven’t used before so I’m a little confused. JMP is the first time I have used this software, and I feel that it is not too complicated to use, as it has many functions. And I realized that it is important to pay attention to the format of input characters in practice, for example, numbers entered with Japanese typing can lead to incorrect results.
This was a valuable experience to use survey data which was collected by the government, and it was also my first time using JMP software. The steps of the data management and analysis were described in detail in the slides, and the software was similar to SPSS, so I was able to work smoothly. I have taken a similar lecture of analyzing government data in Taiwan, but the teacher directly provided a expired practice version of government survey data and focused on how to operate the software. However, in this class, the teacher also introduced the regulations related to using government data and how to apply for access, which importantly reminded us to handle data carefully and learn how to utilize if we need in the future. Although I was already aware of the high security standards and the responsibility of managing government data, this part reinforced how valuable it is to have such an opportunity.

【授業アンケート結果】n=14