外れ値評価値を検出するための分析手法 - 江蘇タッチディスプレイ株式会社

BMC Medical Research Methodology volume 23、記事番号: 177 (2023) この記事を引用

112 アクセス

メトリクスの詳細

疫学研究や医学研究では、研究参加者の曝露や転帰の測定値を得るために評価者に依存することが多く、関連性の有効な推定値はデータの品質に依存します。測定誤差を調整するための統計的手法が提案されているにもかかわらず、それらは検証不可能な仮定に依存していることが多く、それらの仮定が違反されると偏った推定値につながる可能性があります。したがって、データ収集段階でデータ品質を向上させるために、潜在的な「外れ値」評価値を検出する方法が必要です。

この論文では、評価結果が対応する評価者よりも高いまたは低い傾向がある「外れ値」の評価者を検出するための 2 段階のアルゴリズムを提案します。最初の段階では、回帰モデルを当てはめることによって評価者の効果が得られます。第 2 段階では、「異常値」評価者を検出するために仮説検定が実行されます。ここでは、各仮説検定の検出力とすべての検定における誤検出率 (FDR) の両方が考慮されます。私たちは、提案された方法を評価するために広範なシミュレーション研究を実施し、難聴の危険因子を調べるための疫学研究である聴力保全研究の聴覚評価部門のデータ収集段階で潜在的な「異常値」の聴覚学者を検出することによって方法を説明します。看護師の健康調査 II。

私たちのシミュレーション研究は、私たちの方法が真の「異常値」評価者を検出できるだけでなく、真の「正常」評価者を誤って拒否する可能性が低いことを示しています。

当社の 2 段階の「外れ値」検出アルゴリズムは、「外れ値」評価者を効果的に検出できる柔軟なアプローチであるため、データ収集段階でデータ品質を向上できます。

査読レポート

危険因子と疾患転帰との関係を調査する多くの医学および疫学研究は、研究参加者間で関心のある曝露や転帰を測定するために複数の評価者（臨床医や技術者など）に依存しています。たとえば、難聴に関する大規模な疫学研究では、通常、純音聴力検査の測定は、音響処理されたブースで複数の聴覚学者または訓練を受けた技術者によって行われます[1、2、3]。同様に、視力に関する大規模な研究では、臨床環境で複数の評価者によって視力検査が実施されることがよくあります[4、5]。さらに、複数の評価者によるデータ収集に関連する潜在的な問題は、検査測定値を取得するために自動聴力計 [6] などの人間以外の検査方法によって収集されたデータに依存する研究にも及ぶ可能性があります。危険因子と疾患転帰との関連性を正確に推定することは、使用される統計手法だけでなく、データ自体の品質にも依存します。低品質で収集されたデータから生じる測定誤差を調整するために多くの分析方法が提案されていますが、それらの方法は通常、検証不可能な仮定に依存しており [7]、推定の精度が犠牲になります。したがって、統計分析段階で品質の悪いデータによって引き起こされるバイアスを調整するには、統計的手法を使用するよりも、より品質の高いデータを収集することが優先されます。この論文では、曝露や結果の測定に関する問題を迅速に発見して対処できるように、データ収集段階での品質管理の方法を提案します。

私たちの研究は、米国の登録女性看護師 116,430 人で構成される進行中のコホート研究である看護師健康研究 II (NHS II) の参加者における難聴の危険因子の調査である聴覚保存研究 (CHEARS) によって動機付けられています。 1989 年の入学時点で 25 ～ 42 歳 [8]。 CHEARS 聴覚評価アーム (AAA) は、聴力レベルのデシベル (dB HL) で測定される純音空気伝導および骨伝導聴力閾値 (最初に知覚される純音の音の強さ) の縦方向の変化を評価しました。従来の周波数の全範囲 (0.5 ～ 8 kHz) [9]。ベースライン検査は、自己申告による聴力状態が「非常に良い」、「非常に良い」、または「少し難聴」のいずれかで、全米にある 19 か所の CHEARS 検査施設のいずれかの近隣に居住する 3,749 人の女性を対象に実施されました [9]。 3,136 人の参加者 (84%) に対して 3 年間の追跡検査が完了しました。信頼性の高い聴力測定値を取得するには、他の聴覚学者よりも高いまたは低い聴力検査測定値を示す傾向がある、潜在的な「異常値」の聴覚学者を検出することが重要です。「外れ値」の聴覚学者が特定されると、この聴覚学者が使用したデバイスを検査し、必要に応じてデータ収集段階で早期介入を実行できます。さらに、この外れ値情報はデータ分析のアプローチに重要な意味をもつ可能性があります。

10 \text { dB}\)) coefficient estimate than their counterparts, and Audiologist 4 has a much smaller (\(<10 \text { dB}\)) coefficient estimate than the rest of the audiologists. Moreover, Audiologists 14, 15, 22, 47, 48, 54, 55 and 59 have a mildly different (5-10\(\text { dB}\)) coefficient estimates from the average effect./p>0\). A challenge of this method might be how to select a. We will consider this method in our future research and compare it with the current method. Moreover, when calculating the evaluator-specific significance level, the knowledge of the alternative hypothesis is needed. However, if the prior knowledge is not available, we recommend performing sensitivity analysis for a series of reasonable values of the alternative hypothesis. In addition, the FDR approximation in Eq. (2) holds when the number of hypotheses (M) being conducted is large. However, when M is small, alternatively, we can use the Benjamini-Hochberg (BH) procedure to control the FDR [15]. The BH procedure proceeds by first specifying an FDR level \(\alpha\), and sort the null hypothesis based on p-values in ascending order (\(P_{(1)}, P_{(2)},\ldots , P_{(M)}\)). Then the largest k such that \(P_{(k)}\le \frac{k}{M}\alpha\) is obtained, and the first k null hypotheses will be rejected. The BH procedure can ensure that the FDR is controlled at level \(\alpha\). However, different from our approach, the BH procedure does not consider the power of tests and to be conservative, we might use a relatively larger \(\alpha\) level such as 0.1 when conducting the BH procedure./p>