京都大学 大学院医学研究科 社会健康医学系専攻

活動報告:京大国際レクチャー:コホート研究におけるデータハーモナイゼーション

一般 2023年07月31日

2023年7月18日夕方、京都大学大学院医学研究科社会健康医学系専攻(京大SPH)で「コホート研究におけるデータハーモナイゼーション」をテーマに国際レクチャーが開催されました。ハイブリッド形式で開催されたこの国際レクチャーに、京大SPHの学生・教員など約30名がオンサイトまたはZOOMで参加しました。バルセロナ大学のAlbert Sanchez-Niubo教授が、ゲストスピーカーとして招待されました。この国際レクチャーの目的は、コホート研究におけるデータのハーモナイゼーションの手法を、研究例を交えて紹介することでした。
 最初に、Sanchez-Niubo教授は、データハーモナイゼーションを行う理由、データハーモナイゼーションを用いた最近の研究プロジェクトを簡単に紹介し、ハーモナイゼーションと統合(integration)の違いについて説明してくださいました。ハーモナイゼーションを行う理由は、近年のコンピュータと通信技術の急速な発展により、異なるコホート研究の大規模なデータセットを組み合わせる新しいプロジェクトが可能となった為です。ハーモナイゼーションには、サンプルサイズ及び統計的検出力の増加、結果の一般化可能性や再現性の向上、対象者の多様性が増すことによる効果の異質性の上昇など、統計学的な利点があります。よって、ハーモナイゼーションを用いることで、より壮大な研究テーマを提案することができると説明しました。
本セミナーで紹介されたハーモナイゼーションの方法論は、Horizon 2020研究プログラムの助成を受けたSYNCHROSと呼ばれる欧州プロジェクトの一環として実施された研究の成果でした。本プロジェクトの最大の目的は、ヨーロッパ及び世界におけるコホートと人口調査の連携を調整・支援することだそうです。
次に、ハーモナイゼーションの具体的な方法についてお話しいただきました。異なる研究プロジェクトのコホートデータを組み合わせて研究を計画する場合、4つの段階を踏む必要があります。 第一段階はstrategyの確立で、ProspectiveとRetrospective Ex-ante, Retrospective Ex-postの3つに区別されます。Prospectiveは多施設研究で典型的な方法です。この戦略を用いる場合、すべての研究が同じ研究デザイン、調査、メタデータを共有なければなりません。Retrospective Ex-anteを用いる場合、研究は独立して実施されますが、同じような標準的な収集ツールや操作手順を共有します。一方、Retrospective Ex-post戦略を用いる場合、研究はデザイン上比較可能性がなく、異なる標準収集ツールや実施手順を用いています。よって均一性を保つためには、綿密なデータ処理の手続きが必要になります。どのような戦略であれ、研究プロジェクトのリサーチクエスチョンから導き出された最終データセットに含まれる可能性のある変数のリストであるDataSchemaを設計することが重要です。次の段階は、DataSchemaがコホート間で評価されるハーモナイゼーション・プロセスです。 データ処理には5つのタイプがあり、1. Algorithmic transformation, 2. Simple calibration model, 3. Standardization model, 4. Latent variable model, 5. Multiple imputation modelに分類されます。第三段階は、ハーモナイズされたデータを管理するシステムを決定することで、Centralized Data SystemとFederated Data Systemの2つがあります。最終段階は、ハーモナイズされたデータをどのように分析するかであり、3つのタイプがあります。メタ・アナリシス(Meta-analysis)とは、同じ変数を扱った複数の研究の結果を組み合わせたものです。プール分析(Pooled analysis)とは、データをプールした後、個人レベルで実施できる分析です。連携分析(Federated analysis)とは、個人レベルのデータをローカルサーバーに残したまま中央化した分析方法です。連携分析では、DataSHIELDを使用可能です。
プレゼンテーションの後半では、ATHLOS研究について説明がありました。ATHLOSプロジェクトは、欧州連合(EU)のHorizon 2020による5年間のプロジェクトです。その主な課題は、健康長寿の決定要因と軌跡を明らかにすることを目的に、健康長寿のハーモナイズされた尺度を開発することです。その実現のため、18の国際的な縦断研究のデータがハーモナイズされました。 ATHLOS研究では、Ex-anteとEx-post retrospectiveの混合ハーモナイゼーションが用いられ、その詳細について説明がありました。
最後に、データ調和に関する3つのアドバイスをいただきました。第一に、そのようなデータがどのように収集されたかと、研究ごとの個別データの質を理解すること。第二に、系統的なハーモナイゼーションの手順と品質管理を厳密に徹底することです。既存の研究は異質性が高いため、無理にハーモナイゼーションするとバイアスがかかった変数ができる可能性があります。したがって、全ての研究でハーモナイゼーションに適していない変数が見つかることがあります。3つ目は、適切な文書化です。再現性と長期的な使用を実現するために、詳細なハーモナイゼーション・レポートを作成すべきとしました。
講義の後、学生からは、うつ病尺度のデータ調和やデータの利用方法について質問がありました。
最後に、社会疫学の近藤教授から本レクチャーに対する感謝の言葉が述べられ、データハーモナイゼーションに有用なリソースが多く存在していると知ることができたので、それらを活用した今後の研究に期待するという言葉で締めくくられ、閉会となりました。