航空航天工程教员梅尔基尔·奥尼克也是一位数学家、历史爱好者,在公开讨论中使用硬科学时,他坚信诚信。所以,当他的新闻推送中突然出现一个故事,说一对研究人员开发了一种统计方法来分析数据集,并据称用它来驳斥克罗地亚一个集中营的大屠杀受害者人数时,这自然引起了他的注意。
奥尼克是伊利诺伊大学香槟分校航空航天工程系的教授。他继续深入研究这项研究,并使用该方法重新分析了来自美国大屠杀纪念馆的相同数据。然后他写了一篇反驳论文,驳斥了研究人员的发现。
Ornik的反驳与原文发表在同一期刊上。他说,编辑要求他列出其他科学家在阅读他的论文时可能会有的一些潜在问题的答案。几周后,该杂志在原始文章上标注,表示他们不赞同或赞同作者的观点,并推荐阅读奥尼克的论文。
奥尼克说:“作为科学家和工程师,我认为我们有责任纠正有缺陷和错误的科学。”“为了让公众和政策制定者相信科学,他们付出了很多努力,所以当一位数学专家说他们有证据时,这就给他们的论点增加了可信度。”但当他们的说法被证明是不正确的,这对科学和社会都是不利的。这就是为什么当科学家发现错误的发现时,挑战它们是特别重要的。”
根据奥尼克的说法,有些人认为集中营要么根本不存在,要么就不是用来杀人的,要么就是目前被广泛接受的受害者人数被大幅夸大了。鉴于现有的大量数据和证据,大多数历史学家都不把这种说法当回事。
奥尼克说:“原始论文的作者声称他们找到了数学证据,证明集中营的受害者名单是捏造的,这具有明显的历史意义。”“我认为,在某种程度上,损害已经造成了,但我觉得有必要记录下我在原始研究中发现的对博物馆原始数据的假设、不准确和滥用。”
论文Ornik提出了一种新的方法来识别一组直方图中的异常。奥尼克说,他并不怀疑原始论文中提出的方法的优点,只是怀疑它在Jasenovac集中营的应用。
奥尼克对论文的结论产生了怀疑,因为研究人员在一个案例中暗示,较小的名单自然有较小的离群值得分,但他们比较了受害者名单大小的得分,声称与Jasenovac有关的得分是有问题的,而Jasenovac是最大的受害者之一。
“我开始观察是否存在某种对大小的偏见,以及他们是否更有可能将问题标记分配到更大的列表中。”事实证明,尽管作者声称,他们是,”奥尼克说。“当他们的方法应用于数据时,较大的列表比较小的列表更容易被计算出问题。”
奥尼克通常在航空航天应用中使用类似的统计分析,他解释了他们的统计论点不成立的另一个原因。
他说,当你看数据,任何东西的集合,你想找出一个异常值,也就是不同的东西时,你需要假设所有的数据都来自同一个来源、相同的分布。按出生年份列出受害者名单。它会产生一个每个人年龄的图表。假设有10%的人年龄超过70岁。现在,这种分布对被驱逐儿童的名单来说就不成立了,因为这个名单,根据定义,在结构上是不同的。它也不同于所有拥有身份证的人的名单。身份证只发给非儿童的人。然而,这些研究人员研究的名单来源广泛,包括孩子的名单、即将结婚的人的名单、战俘的名单——从定义上讲,这些名单不可能来自同一分布。”
奥尼克说,原始论文中的另一个重大错误是,一些重复的列表被视为两个独立的列表。这意味着整个数据库中大约67%实际上是大列表的子列表。
奥尼克说:“大屠杀博物馆在网上公布的7000多份名单没有经过策划。”“例如,有两个列表包含完全相同的数据;一个用西里尔字母,另一个用拉丁字母。但他们把它们当作两份不同的清单。还有其他名单包含相同的名字,但没有办法知道他们是同一个人还是两个同一天出生的名字相同的不同的人。他们本可以删除那些明显重复的严重错误,但剩下的,你需要访问原始的历史数据。”