歴史物語

戦争とテロの名もなき犠牲者を統計で追跡する

戦争や暴動では、犠牲者が何人いるのかが非常に不明瞭であることがよくあります。 人権データ分析グループ 不確実性のマージンを大幅に削減するために、恥ずかしがり屋の種の数を数えるためにも使用される統計手法を導入しています。それは、政治的決断にとって、そして、もしそうなった場合には、その後の正義にとっても重要です。

1999 年 3 月から 6 月にかけて、コソボのアルバニア人に対するセルビア軍によるテロ作戦により、9 千人から 1 万 2 千人の民間人と反乱軍が殺害された。記録された死亡者数はわずか4,400人であったにもかかわらず、少なくとも2002年の報告書はそう結論付けている。そのため、人権データ分析グループ(HRDAG)が作成したこの報告書は懐疑と批判を引き起こした。 5,000 人もの気づかれないままの死亡者はどこで見つかるのでしょうか?

介入するかしないか

それにも関わらず、彼らの推定は 2010 年に平和が回復し、広範な現場調査が可能になった 2 つの調査によって確認されました。 HRDAG は米国に本拠を置く組織で、その中心的な使命は暴力的紛争の最良の記録を維持することです。これは、国際社会が介入するかどうかを決定する際に重要となることがよくあります。そしてもちろんその後も責任者を指名し、可能であれば裁判にかけます。

HRDAG は紛争地域自体に監視員を派遣することはありませんが、可能な限り多くの既存の情報源を使用し、すべてのデータから共同で全体像を導き出します。もちろん、単に犠牲者を集計するだけの問題ではない。たとえば、シリア内戦を参照してください。非常に混沌とした戦いについて、あらゆる種類の援助団体や個人が報告しています。同じ被害者が複数の情報源によって報告されることもあります。他の犠牲者の死については誰も明らかにしません。

完全に間違った写真

HRDAG の研究者であるミーガン・プライス氏は、第 3 回ハイデルベルク賞受賞者フォーラムでこの研究について講演しました。これは、最も重要な数学およびコンピュータ サイエンスの賞の受賞者が集まる、8 月の年次総会です。 「さまざまな当事者が報告する死傷者数を単純に合計すると、紛争について完全に間違った全体像が得られてしまう可能性があります。」それは単なる会計上の重要性を超えたものです。たとえば、ニュースメディアが単純に計算して、別の当事者が争いに加わった後に紛争が激化したと報道するとき。あるいは、新たな開発により毎週の犠牲者の数が大幅に減少したというメッセージを伝えます。これは西側諸国による介入の決定に大きな影響を与える可能性がある。または、武器や資金でどちらかの当事者を支援することもできます。

このような乱雑なデータから合理的に信頼できる推定値を抽出する数学的手法があります。それが、 いわゆる複数システム推定です。 (MSE)。原理的には単純ですが、非常に労力がかかるデータのクリーニングには、重複排除が含まれます。これにより、すべての死亡報告が特定の個人に遡って追跡できるようになります。もちろん、別の名前で何人かが複数回殺害されたデータベースは望ましくありません。 2014年1月までHRDAGはシリア内戦での死傷者の報告を26万件数えていたが、重複を除いた後は9万3千件が残った。これらは文書化されたケースです。実際の死傷者数については何と言えますか?

MSE は、ある動物種 (ウサギなど) の標本の数を地域内にまだ生息しているかを推定するためにかつて開発された数学的手法を使用します。基本原則は捕獲 - 再捕獲です。 まず、できるだけランダムに約 100 羽のウサギを捕まえて、マークを付けます。数週間後、あなたは再び戻ってきて、さらに100羽ほどのウサギを捕まえます。個体数がそれほど多くない場合は、2 回目はすでにタグが付けられているウサギを数匹捕まえることになります。 2 つのサンプル間のこの重複の相対的なサイズから、母集団全体のサイズの推定値が得られます (数式による説明については、上の図のキャプションを参照してください)。明らかに、これは不確実性マージンを伴う推定であり、そのサイズも A、B、M によって異なります。

これは、混乱した暴力的紛争による多くの名前のない犠牲者を数えることができる方法でもあります。このような手法はこれまで、米国の非常に保守的な地域において、タブー視されている集団のHIV感染者数やレズビアンの数を推定するために使用されてきた。また、実践では、MSE が機能し、適度な不確実性を備えた信頼性の高い推定値が得られることが示されています。

重複するサンプル

シリアなどの戦争に置き換えると、現場で犠牲者のデータを一定期間収集するすべての組織がサンプルとなる。複数の情報源が同じ被害者を個別に報告している場合、これは 2 つ以上のサンプル間の重複です。母集団から 3 つ以上のサンプルを取得する場合は、より高度な手法を適用して、一部のサンプルが互いに独立していない可能性があることも考慮できます。たとえば、HRDAG は、コソボやその他多くの紛争で忘れ去られていた死亡者の地図を作成することができました。

ハイデルベルクでの講演の中で、プライス氏はメディアが戦闘の激しさが緩和したと報じたシリア内戦中の段階を例に挙げた。これは報告された死傷者数の単純なカウントに基づいています。 HRDAG の分析では、さまざまなレポート間の重複が減少していることが示されました。計算の結果、戦闘が激化したばかりであることがわかりました。プライス:「メディア報道に頼ると、そのような紛争について完全に間違った結論を導き出す可能性があります。」

残念ながら、HRDAG などの分析には時間がかかります。ニュースメディアが許さない時間、プライスもそれを理解している。それでも彼女は、メディアは自分たちの得意なこと、つまり個人的な話を報道し、被害者の顔を伝えることにもっと限定すべきだと主張する。また、編集部で 1 日かけて作成される武力紛争に関するあらゆる種類の統計やインフォグラフィックは、読者や視聴者がかなり割り引いて受け止めるべきです。