发新帖
打印 上一主题 下一主题
开启左侧边栏

爆炸新闻:来自严格统计分析的新数据指向宾州蒙哥马利县选举欺诈

[复制链接]
翻译:康州农场 – V, Robensenna, 烟波浩淼

校对: 康州农场 – DiDi

审核:康州农场-Truemanman



概要:

我们发现大量证据,与宾州蒙哥马利县计票数中可能存在选举欺诈相符。

特别是,我们在《纽约时报》 / 爱迪生数据中检查了邮寄选票总数的高度异常更新,这些更新极大地使拜登受益,并且在许多方面都令人怀疑。

概括性地讲,我们的结果表明,在周三清晨至周四上午之间的某个时间,一批新的高度可疑的邮寄投票被添加到计数中。这些选票的分布难以置信:极大地支持拜登并同时损害了川普(后者是通过向乔根森分配更多选票来实现的)。这些邮件选票最终结果与之前的邮件选票(以《纽约时报》数据衡量)和之后的邮寄选票(以该县自己的数据计算)迥异。

主要证据如下:

⦁ 11月5日星期四上午9:09,添加了一大批90,022张邮寄/缺席选票,其中95%支持了拜登,但总投票数仅增加9,534,这意味着亲自投票实际上减少了80,488 。就其本身而言,这是一个非常奇怪的不正常現象,因为选票无法消失,亲自投的票也不能变成邮寄选票。一定是报告的数据出了问题,唯一要问的是究竟出了什么问题?

⦁新一批90,022张邮寄选票看起来与现有邮寄选票完全不同。如果这个更新是一个数据错误,则它必须是一个多维的复杂错误,并且不太可能是简单的打字错误。新批次在四个单独的维度上是难以置信的:

⦁它对拜登的支持程度(超过95%)在统计上是不可能的。因为直到那时为止,同时递送的其它邮寄选票分布是拜登为74.9%。

⦁每对候选人的比较都显示出不可能的变化。这很重要,因为它有助于排除数据中单个错字驱动生成该模式的可能性。

⦁不管之前的数据分布如何,新增批数据本身都是极不可能的,它对乔根森比川普的支持比例(20%),实际上高于美国的每个县。最后一个事实与目的在于使拜登的投票份额“很高,但并非不可能的高” 成一致,与此同时尽量不给川普任何超过绝对必要的选票。

⦁从亲自投票计数中所删除选票的分布更加难以置信(拜登占98.1%),由于以前将真邮寄选票错误地归类为现场投票,因此难以解释总体投票更新。

⦁在《纽约时报》数据库中,这种异常程度极为罕见。蒙哥马利县的亲自投票减少80,488票是整个数据库中第四高的投票减少率。其中一半以上涉及不到100票的变更,而28%涉及仅一票的变更。在剩下的错误中,许多错误可以很容易地理解为上述所排除的示例(例如,简单的投票类型错误分类)。

⦁对这两组数字的独立确认表明,爱迪生的数字是对该县数据的准确反映。爱迪生11月5日(星期三)上午5:43更新时统计的缺席选票总数报告与几分钟后在县数据中统计的缺席选票总数的媒体推特报道非常接近(略低于),表明爱迪的缺席选票总数可能是该县数据的准确反映。同时,11月8日的爱迪生数据快照与11月10日的县数据快照完全匹配。

⦁为了进一步检验该假设,并排除所有可能归因于《纽约时报》 / 爱迪生数据错误的可能性,在发现最初的异常后,我们在区域级别上抓取了该县自己数据的多个快照。这两个快照之间的变化表明,较早到达的邮寄选票(含异常更新)中,拜登的投票份额明显高于同一地区晚些时候计算的邮寄投票。这表明在每个区域内计算的邮寄投票分布都有所变化,并且较早的投票显示出更倾向于拜登的趋势。

将所有这些证据加在一起,就可以很好地进行以下解释:

-选举之夜过后的某个时刻,计数了非常多倾向拜登的的邮寄选票 -这批邮寄选票看起来与《纽约时报》数据此刻前的邮寄选票非常不同,而且看起来也与之后使用该县自己的数据测得的每个分区的计数不同。

-从自由候选人和共和党候选人的相对投票份额而言,这批邮寄选票看上去是难以置信。

-这批邮寄选票的更新很难与简单的数据错误(例如将真实的邮寄选票错误地归类为亲自投票,或者将单个候选总数错误地输入为错字)相容。

这些事实提供了强有力的间接证据,表明蒙哥马利县的邮寄选票存在欺诈行为,需要进一步调查。

《纽约时报》更新的原始数据在这里:

https://ufile.io/iq3d7a0n

县数据的原始数据在这里:

https://ufile.io/vqmshqo3

https://ufile.io/q5penzjs

⦁符合欺诈但在其他解释下令人困惑的一些事实概要

下面描述的事实是使用《纽约时报》的爱迪生数据选举结果中的数据记录的,该数据是由其他研究人员实时帮助抓取的。这种不寻常的变化使我们开始收集该县自己的数据,以了解自那时以来的更新情况,并在最初异常之后的相当一段时间内进行了比较。

其次,我们会全面考虑这些错误是由于爱迪生(数据)或《纽约时报》在收集或发布其数据时的无心之失,或者是该县本身在他们的早期计票中的无心之失。计票过程存在各种无心之失,并且曾经使用过它的任何人都可以很好地理解数据的怪异性。机器可能会损坏,数据可能会被错误地转录。针对政府和数据供应商的代码更新网站可能会出错。真正的选票在点票过程中可能会错误地分类为一种或另一种。即使是出于善意,对早期错误的更正也可能被错误地认为是其他错误。我们必须考虑这些解释是否可以单独或一起地解释同一组事实。我们不会缩简这项任务。

也需要强调–我们几乎毫无疑问地知道,《纽约时报》 /爱迪生数据库中报告的一些数字是错误的。裸露的事实实际上是毫无争议的。主要问题是哪些,为什么。欺诈的一个很好的有效定义是“由于恶意原因输入了错误的数字”,将这些与“由于偶然原因输入的错误数字”区分开是一个挑战。来自该县的其他数据有助于确认这个问题,确保并非所有证据都依赖于《纽约时报》数据。

至少,我们可以放心地声明以下内容。如果所有错误都是数据错误和投票排序中的怪异模式,那么从多个不同数据集的多个不同时间点来看,宾州蒙哥马利县是美国最倒霉的县,因为它存在大量指向欺诈方向的随机错​​误。

以下是十个关键事实的简要概述,紧接着是它们的推导细节:

事实1:11月5日上午9:09分,《纽约时报》报道蒙哥马利县纽的选举结果更新显示,邮件投票增加了90,022票,但总投票只增加了9534票。因此,亲自投票的隐含数量减少了80,488。



事实2:新的一批邮寄选票对拜登的投票率为95.4%,川普为3.7%,然而先前报道的邮件投票对拜登的投票率为74.9%,对川普为24.4%。从统计学上讲,这两个投票结果不可能来自同一批次的选票。另外,候选者中每个成对比较都产生出不同的结果,这意味着不能用候选者总数中的一个错误来解释结果。



事实3:在新批次的邮寄选票中,自由主义者候选人乔·乔根森(Jo Jorgensen)获得的票数是川普所得的20.0%。如果忽略民主党选民,这新的一批投票结果来自全美国第二大支持自由主义者的县的投票人。



事实4:蒙哥马利县的所有邮寄选票都被指示邮寄到相同的邮寄地址。这加强了人们相信应该从大致相同的分布中抽取邮寄选票的理由。

事实5:在选票真实分布的情况下,亲自投票的减少与邮件投票的可疑增加相吻合也是极不可能的。他们的拜登投票率为98.1%,川普的投票率为1.5%,乔根森的投票率为0.8%。这意味着,投票结果不管与以前的邮件投票还是亲自投票都不一样。这使人很难相信,这些是以前被误标为亲自投票的真实邮件投票,只是简单地被转移了——减少的批次代表了事实2和事实3的极端相似版本​​。



事实6:爱迪生的早期缺席投票总数非常接近几分钟后的媒体报道,这表明此前爱迪生的缺席投票总数是对当时县级基础数据的准确反映。同时,11月8日的爱迪生快照与11月10日的县快照完全吻合,因此以后的数字绝对准确。

事实7:宾夕法尼亚州蒙哥马利市的邮寄票数变更相对于宾夕法尼亚州各县的邮寄票数更新而言是异乎寻常的,这意味着该问题并不是该州计票方式的普遍特点。 与之前投票结果相关的是:i)邮件总票数大幅增加;和ii)投拜登的邮件票数大幅增加,并且两者都没有在任何地方被发现。绝大多数更新都很小,并且以零为中心。



事实8:在《纽约时报》数据中发现投票减少是罕见的,发现大幅投票减少甚至更为罕见。宾夕法尼亚州蒙哥马利县在整个数据库中显示为第四大减少票数(亲自投票的80,488票中),其中减少了169票。 28%的此类减少仅涉及1票的更改,而52%的减少涉及不到100票的更改。

事实9:使用该县在被发现异常后收集的数据,我们可以将自11月10日以来计算的新邮寄选票与从该截止期同一选区内的邮件选票(由可疑更新和之前被预先计数的邮寄选票充数)相比较。我们发现,平均而言,旧邮件投票(包括可疑批次)显示出对拜登的支持明显更高,即使与后来添加到同一选区的邮件投票相比也是如此。



事实10:以前的邮件投票显示出对拜登的支持非常一致,即使在选举日投票中投票支持川普的选区也是如此。新的选票显示这种关系的差异更大。

用其他原因进行解释的挑战

作为详细讨论之前的最后一步,将所有事实汇总在一个地方是有用的,这些事实的各个方面很难用其他无辜的错误来解释。请记住,真正的挑战并不是要提供涵盖上面列出的一个或两个事实的解释,而是要涵盖所有这些事实的解释。

–事实2表明,候选人之间的所有成对比较都揭示了新批次邮寄选票的差异。如果这是由于数据错误造成的,这将要求在六个邮寄候选总数中至少存在两个错误(三个候选者,星期四上午之前和之后)。这使得邮寄选票的更改不太可能用简单的“胖手指”错字或抄录错误来解释,因为任何此类错误必定在六次中发生两次。

-事实3意味着很难假设邮件寄的投票号是真实的,但是对于为什么投票最终以非随机顺序进行排序,却有一些无罪的解释。新批次选票本身非常不可能作为美国投票方式的任何合理子集。非随机排序(例如某些邮件选票比其他邮寄选票更早到达并单独存储)无法解释为什么事实1里现场选票总数会下降,或者在事实6中相对于宾夕法尼亚州的其他县而言,该县现场选票的减少是如此罕见。

-事实5显示,被减去的选票也是不合理的,这意味着很难将可疑转变解释为是由于纠正了先前的错误而导致的,即此前的错误是将一组真实的邮寄选票误认为是现场投票。从现场投票总计中删除的选票看起来比添加的新邮寄选票更不像之前的邮件投票分布,但它们看起来也不像当时的现场投票。如果有无辜的理由证明现场选票是真实的但标记不正确,则受影响的选票必须来自现场选票分布的极端部分。

-事实6使得模式不太可能代表宾夕法尼亚州法规或计票系统所共有的一些广泛问题。在宾夕法尼亚州切斯特(Chester),伊利(Erie)和北安普敦(Northampton)还有其他不寻常的邮寄计票更新,我们赞赏其他研究人员对此进行更多探索。但是,大多数邮寄投票的更新是:i)数目较小,和/或ii)将新邮寄批次的双方投票份额于已有分布接近。之后的Edison数据快照与县数据完全匹配,因此,错误肯定不是发生在此刻。

-事实7表示《纽约时报》数据通常似乎没有被此类错误所包括。如果这是数据错误,则它是整个数据库中最大,最令人惊讶的错误之一。

-事实8提供了理由相信早期快照中的爱迪生缺席投票总数可能是正确的,因为它们接近独立确认的数字,指的是相隔几分钟的时间戳,而且我们不知道该县网站更新有多频繁。这并不能证明每个候选人的缺席投票总数也都是正确的,但要简单地断言爱迪生的数字全是错误就变得更加困难。

-事实9和事实10几乎完全排除了整个异常投票模式只是《纽约时报》数据中的错误的可能性。此外,在每个选区中都观察到了变化,因此很难说出差异来自以不同顺序对不同选区进行计数。在该县自己的数据中,在一个选区中,新批次邮件的投票看起来与之前的投票有所不同是有原因的。

-事实9和10也使将异常更新解释为“该县自己的数字出现一些错误而后来纠正”变得很困难。我们在后来的邮寄投票中观察到不寻常的变化是相对于11月10日开始的投票分布而言的,这是在有时间纠正任何较早数据错误之后很长时间了。

-最合理但无辜的替代理由似乎要求《纽约时报》 /爱迪生数据(或它所基于的基础源数据)在令人惊讶众多维度上都是错误的–它列出了错误的缺席投票人数和更新前后的总票数,并且在异常更新前后各个候选人的缺席投票总数中都存在多个错误。这些错误要求蒙哥马利县存在非常不寻常的错误,特别是相对于《纽约时报》数据中的其他异常以及宾夕法尼亚州缺席选票的其他变化而言。最后,独立于上述内容,该县的缺席选票还必须在11月10日前后的针对选区内进行某些无害排序时显示不同分布,其方式与《纽约时报》/ 爱迪生数据中的任何可能错误无关。

关于十个事实的详细证据

事实1:11月5日上午9:09,纽约时报报道的蒙哥马利县选举结果更新,报道的邮寄选票增加了90,022张,但总票数只增加了9,534张。因此,暗示亲自投票数减少了80,488张。

请参阅展示1的爱迪生/《纽约时报》快照,取自《纽约时报》网站报道的选举結果的实时快照(根据爱迪生的数据来源)。

无论何种解释,从11月4日下午7:43到11月5日上午9:09之间的的票数变化,完全不符合公正有序的选票统计报告。 最后附上选举结果历史的原始数据,可疑的更新为红色,之前最后一次的更新为绿色。

在这次可疑的更新中,邮寄选票总数增加了90022张。然而,所有投票总数只增加了9534张。因此,暗示亲自投票的数量实际上减少了80488张。

即使不作进一步的说明,单是这些赤裸裸的事实就表明了明显的违规行为。现有的选票不可能就这样消失,亲自投票也不可能变成邮寄选票

最仁慈的解释是,这只是一些奇怪的故障。现有选票不知何故被归入了错误的类别,或者总数加错了,然后错误被纠正了。这可能是在县级层面,也可能是在爱迪生层面。剖析这些可能性是本研究的工作。然而,数据的错误类型越多,就越难简单地用数据库中一个甚至两个错误的条目来解释事情。

解释:这代表了一种巨大的不规则性,完全不符合任何有序和公平的计票方式。现有的选票不可能就这样消失,亲自投下的选票也不可能转变为邮寄的选票。

事实2:新一批邮寄选票95.4%投给拜登,3.7%投给川普。这与之前统计的邮寄选票有难以置信的差异,后者74.9%投给拜登,24.4%投给川普。此外,每一次候选人的配对比较都会产生不太可能的结果,这意味着不能仅仅用候选人总数中的一个错误来解释结果。

解释:从统计学上讲, 这两组邮递选票不可能来自同一批选民。

到目前为止,邮寄选票中, 拜登(110,944票)占74.9%,川普(36,159票)占24.4%,约尔根森(997票)占0.7%。

根据更新后的数字,如果收到的邮寄选票都是真实的,则在90022张新票中,拜登(85,857票)占95.4%,川普(3,331票)占3.7%,约根森(834票)占0.9%。

换言之,拜登在新一批邮寄选票中的得票率比之前的邮寄选票高出近20.5个百分点,而川普的得票率则低20.7个百分点。

从统计学上看,这两批选票代表的是同一基本分布的抽签,这绝对是不可能的。姑且不考虑自由主义者的投票,如果你有一枚硬币,每次落在人头上的几率是75.4%(当时拜登的两党投票),你将它翻转89,188次,得到85,857个人头的几率是如此之小,以至于Excel没有足够的零来表示它是多么不可能。它只是把它四舍五入到 “零”。

重要的是,比较之前和之后的任意两组邮寄投票时,也有同样的不合理性(虽然不是很显著)。这一点很重要,可以排除其中一个邮寄选票计数在之前或之后出现错误的可能性。如果只有一个数字出错,那么三个比较中就会有两个看起来明显错误,其中一个看起来与偶然性一致。如果所有三个配对比较都显得可疑,那么任何无辜的解释都必须假定在六个数字中至少有两个数字输入错误(三个候选人的邮寄选票计数,包括之前和之后的)。

在比较川普与乔根森之前和之后的选票时,先前的川普“成功”比率是97.316%,即(36,159 /(36,159 + 997)。接下来,将有4,165张新的川普或乔根森选票,其中川普获得3,331票。 Excel中这种结果的二项式概率也被四舍五入为“零”。

比较拜登与乔根森前后得票情况,之前拜登的 “成功率 “为99.109%,即(110,944/(110,944+997)。接下来,进来的是拜登或乔根森的86,691张新票。拜登赢得了其中的85,857张票。这样的结果在excel中的二项式概率是0.0142。与另外两个不同的是,这个数字不属于 “完全不可能 “的范畴,但仍属于 “极不可能 “的范畴

如下所述,还有充分的理由怀疑即使在欺诈性分配的情况下,拜登/乔根森比率也应该是最接近的,但仍不相等。 在欺诈方案中,增加两个组是有利的(因此,两者之间的比较必然看起来不太极端),但增加拜登的数量也是有利的(因此,在两种情况下,两者之间的比较仍然不太可能)。

事实3:在新的邮件投票中,自由主义者候选人乔·乔根森(Jo Jorgensen)获得的票数比川普高20.0%。如果忽略民主党选民,那么一批人将是整个美国第二大支持自由主义者的县。



解释:新批次的邮件投票不仅与旧批次不一致,甚至在内部与对自由主义者和共和党人的相对支持的任何合理估计也不一致。然而,它符合一种平衡的愿望,即希望让拜登获得尽可能高的支持率,同时尽可能少给川普额外的选票。

如果新一批邮寄选票是真实的,那么就自由主义者候选人对共和党候选人的支持率而言,他们来自蒙哥马利县的那部分与美国几乎不同于其他任何地方。自由党候选人乔根森享有20.02%的支持率(834票),与共和党的支持率(3331票)一样多。

在我们上一次更新数据的时候,也就是周日晚上,在整个宾夕法尼亚州,乔根森的支持率是2.3%,大约是川普的1/9。但是,即使这样也低估了这一比率有多诡异。让我们假设这批新的邮寄选票是自由党/共和党的比例为20.02%,作为一个单独的县,票数为90,022张,在全国大部分地区肯定足够大。截至周日晚上,我们拥有3,156个县的选举数据,如果这是一个县,这批新县按自由派与共和党的比例将成为美国第二高的县,仅次于南达科他州的奥加拉拉拉科塔(Ogalala Lakota)。分布的第99个百分位数仅为6.81%。

如果新邮寄投票是真实的,他们将设法吸引有投票权的人,他们对川普和乔根森的相对偏好是整个国家最边缘的。

与其他替代方案相比,这一事实实际上是一种很小的细节,实际上可以对欺诈进行诊断。将自由主义者的投票提高到如此难以置信的水平似乎很奇怪,直到您意识到这是解决如何解决共同问题的解决方案

-尽可能提高拜登的得票数率,但又不至于太荒唐

-还要减少川普的选票,这样两党的差距就会加大?

拜登所有票数全部用完后,剩下的唯一选择就是增加自由主义者的票数。

除了一般的 “数字都是垃圾 “的说法之外,很难对这一事实产生可信的替代解释,这并不能具体预测什么

事实4:蒙哥马利县的所有邮寄选票都被指示邮寄到相同的邮寄地址。这加强了人们认为应该从同一投递中抽出选票的理由

如果计算的邮寄投票前后的分布不同(这几乎是无可争辩的),则如果两个批次都是真实的,则它们必须事先经过某种分类机制,是大意的还是恶意的。换句话说,分布不是随机的,而是前后均等的分布。

我们不知道蒙哥马利县有什么内部流程。但有一条重要的线索,可以排除明显的预分拣,那就是县里的每张邮寄选票都要寄到一个地址。这一点在蒙哥马利县的网站上有记载,在此存档。

如果每张选票在被打开检查和计算之前,最后都放在同一堆,那么这堆选票将是随机的。如果是这样,就真的不可能出现这么大的差异。计算方法正是上面的那个。

在目前的情况下,仍有其他可能的方式可以对邮寄的选票进行分类,例如那些早到和晚到的选票(可能仅通过正常流程发生)或按地点分类(如果不先打开单个信封,似乎很难做到这一点)。然而,这种解释难以解释上述事实3:新一批选票的得票率即使从其本身来看也是不合理的。

事实5在真实的选票分配下,亲自投票的减少与邮寄选票的可疑增加同时发生也是极不可能的。结果选成拜登占98.1%,川普占1.5%,乔根森占0.8%。这让人很难相信这些本来是真正的邮寄选票,之前被误标为亲自投票–减少的批次代表了事实2和事实3的极端版本​​

这个事实主要有助于排除一个特定的选择—邮寄选票的增加和亲自投票的减少是由于周三的计数中有些是被錯誤分类的合法邮寄选票。到目前为止的证据表明,最后加入邮件总数的组合是非常不合理的。这个事实表明了一个清晰的現象–亲自投票中被剔除的内容的分布也是极不合理的。

川普对乔根森的成功率为1,517次试验中的844次胜出,在前几位候选人总票数的邮件和当面分布下,p值均为 “0”(即低于Excel的显示能力)。拜登对川普79,815次试验中的78,971次胜率,在当面和邮件分布下的p值也同样为 “0”。就拜登对乔根森而言,拜登在79,644次试验中的78,971次胜率,在当面分布下的p值为 “0”,在邮件分布下的p值为0.081,是唯一对应 “合理不可能 “而非 “完全不可能 “的数字。

从自由党人相对于共和党人的得票率来看,44%,这个数字肯定是在自由党全国代表大会之外从未见过的。

以选票减少为例,看起来确实是简单的分类错误,宾夕法尼亚州切斯特市(如下图所示)删除了41,695张拜登的亲自投票、9,622张川普的亲自投票和377张乔根森的亲自投票。但这些几乎与之前更新中增加的亲自投票数完全一致。换句话说,将选票添加到错误的类别中可能会被认为是可疑的,但至少不难核算出被转移的总票数。相比之下,在蒙哥马利,这些数字似乎根本没有加起来。如果我们检查一下从早上5点43分以来所有之前的新增票数的总和,拜登增加了80,722票(然后损失了78,971票),川普增加了22,166票(然后损失了844票),乔根森增加了1,121票(然后损失了673票)。

事实6:爱迪生早期的缺席票总数与几分钟后媒体报道的数字非常接近,说明爱迪生早期的缺席票统计是正确的。爱迪生数据最早更新的缺席票数是14.81万张缺席票的统计,时间戳为5日周三早上5点43分(爱迪生数据中,不是基础县数据的时间戳)。媒体推特账号报道了该县截至几分钟后(5:45am)的数字是149,358到149,382张缺席选票的计数(考虑到四舍五入的误差)。鉴于爱迪生快照的具体时间不确定(相对于它被推送到他们的数据库的时间),这给了独立的确认,早期的爱迪生快照缺席投票总数看起来至少是大约正确的。

以下是推特账号@MontcoCourtNews在早上7点36分发布的推文,指的是早上5点45分的县的快照,共239,336张邮票,其中62.41%已被计算。考虑到最后一位数的四舍五入,这相当于149,358张已计入缺席票和149,382张已计入缺席票之间,截至早上5点45分。

爱迪生最早的时间邮戳是在早上5点43分被推送到他们的数据库中的,记录了148,100张已计算的缺席选票。鉴于目前还不清楚他们刷新县网站的频率,也不清楚县里更新基础数据的频率,因此,似乎很有可能在不久前的一段时间,报告的计票数确实是爱迪生的数字。

在11月8日《纽约时报》/爱迪生的最后一次快照中(我们用它来进行比较),我们在11月8日星期日从《纽约时报》上获得的数字与县政府在11月10日的总数字完全吻合,包括亲自投票和缺席/邮寄选票,以及所有三个候选人。這些数字肯定是县政府自己的数字。

事实7:在自选举之夜以来已更新其邮寄选票计数的宾夕法尼亚州县中,没有其他县会看到拜登的邮寄票数与川普的邮寄票数增长有如此大的变化。



解释:这次更新,并不是宾夕法尼亚州选举法或全州范围内的计票程序的玄机所造成的, 因为蒙哥马利县相对于州内其他地区来说 是一个巨大的异常值。要看到这一点,我们可以在《纽约时报》/ 爱迪生数据中比较邮寄选票的每个更新。我们可以根据给定的更新同时在两个维度上的变化来比较给定的更新有多不寻常:

-相对于目前计算的总数,所有邮寄选票总数的总体增加量是多少?

-到目前为止,相对于邮寄选票,新一批邮寄选票中拜登的两党投票份额有何不同?

在数据中,大多数邮寄选票变化在其总体数量上是很小的。也就是说,在选举当晚之后,统计的邮票数量并没有发生大规模的变化

其次,无论怎样变化,一般都会出现新邮寄选票与旧邮寄选票分布相似的情况。

第三,同时违反上述规定的情况更加罕见。如果您只计算一个非常小的批次,则很容易在新批次中产生不寻常的投票份额偏差。计算与旧批次也不同的非常大的批次变得更加令人惊讶。

大多数观察到的宾州邮寄选票的变化并没有表现出这种共同的属性,即a)邮寄选票总数的大幅增加,b)从两党对拜登的支持率来看,与已统计的邮寄选票比例有较大偏差。例如,上面讨论的宾夕法尼亚州切斯特,看起来更像是一个真正的分类错误,因为(除了能够说明总票数),额外的选票似乎来自于和以前非常相似的分布。宾夕法尼亚州蒙哥马利则没有显示任何事实。

事实8:在《纽约时报》数据中发现投票减少是罕见的,发现大幅减少投票甚至更为罕见。宾夕法尼亚州蒙哥马利在整个数据库中显示出第四大减少票数(亲自投票的80,488票中),其中减少了169票。 28%的此类减少仅涉及1票的更改,而52%的减少涉及不到100票的更改。

此外,还值得了解一下《纽约时报》的数据总体上是如何充满错误的。这类错误常见吗?答案是否定的。一般来说,像票数在某些类别中下降这样的严重错误是非常罕见的,总共只有169例。在这一组中,目前异常情况的规模也很惊人。蒙哥马利是第四大选区,仅次于纽约伊利、纽约威彻斯特和纽约皇后区。《纽约时报》/爱迪生的数据确实存在错误,但很少有像目前这样明显的错误。大部分的更正都是非常小的–28%的此类减少涉及的变化只有1票,52%的减少涉及的变化少于100票。

最后,值得观察的是,《纽约时报》其他一些特定类別的大幅减票,看起来正是我們在事实5中所排除的那种简单的真票分类错误。亚利桑那州马里科帕县有两次大规模更新(约4万张选票),在同一次更新中,拜登、川普和乔根森的选票被同時加入邮寄选票和从亲自投票中刪除选票,数量完全相同。这样的错误看起来像是简单的分类错误,而目前的错误则不是。

事实9:使用县发现异常后收集的数据,我们可以比较自11月10日以来的新邮寄选票数与该点之前同一区域内的邮寄选票数(主要由可疑的更新选票组成)。我们发现,与后来添加到同一区域的邮寄选票相比,旧的(可疑)批次平均对拜登的支持明显更高。

我们想从两个关键方面独立确认较早一批邮寄选票的特殊性质。首先,我们想使用该县自己的数据对其进行测试,以确保这与《纽约时报》 / 爱迪生数据无关。理想情况下,自选举开始以来,我们本可以回到过去并开始抓取县的数据,以直接观察实际的异常更新,但机会已经一去不复返了。不过我们却在产生怀疑后,对县政府自己的选区级数据进行了两次快照。第一次是11月10日,第二次是11月14日。但是,在这样一个较晚的时期内查看数据的好处是,从第一次更新后,有足够的时间来纠正错误。其次,县级数据比爱迪生的数据要细得多,因为它会一直放大到各个选区。与11月10日之前的分布比较,11月10日至14日之间的邮件投票是怎样变化?



我们发现,平均而言,在较早的一批邮寄选票中,拜登的得票率相对于同一选区后来增加的票数异常高。图中所有的点都位于右侧,但显示出相当大的垂直变化。

换句话说,早期的邮件统计结果显示,在投票给拜登方面有惊人的统一性。在该县所有431个选区的数据中,拜登的绝对最低分数是59.7%。忽略11月10日之前仅仅统计了5张邮寄选票的一个选区,截至11月10日,在邮寄选票中对拜登支持率最高的是 “诺里斯敦2-2″,在150张邮寄选票中,拜登赢得了98.7%的支持率,这个数字会让萨达姆·侯赛因感到骄傲。顺便说一下,诺里斯敦2-2显示共和党人和自由党人正好各得2票,这与前面讨论的非常奇怪的自由党人与共和党人的比例一致。

同时,新的选票也来了。他们对拜登的支持率有多高呢?他们显示的支持率都明显降低。比如,诺里敦2-2之前统计了148张民主党人的邮寄选票,2张共和党人的邮寄选票,2张自由党人的邮寄选票。仅在共和党和民主党之间,这就像一枚硬币,落在人头上的几率是98.7%。再加上三张票。其中一张是共和党的,两张是民主党的(即66.6%是拜登)。这虽然有些出人意料,但毕竟是极少的新增票数,而且只是一个选区。”切尔滕纳姆5-3 “之前统计了361张民主党的邮票和26张共和党的邮票(即93.3%是拜登)。18张新票得到补充。其中12张是民主党的,6张是共和党的(即66.7%是拜登)。单独来看,每个新增加的票数都只是很少,而且每次也只是一个选区,但其中很多票数看起来很不寻常,旧一批比新一批显示出更多的拜登支持率。我们可以对所有的选区重复同样的分析,比较一下所有选区整体的比例前后有什么不同。对于有统计学倾向的人来说,我们会计算出各选区均值差异的皮尔逊检验的选区级Z值(precinct-level z-scores)。然后我们将它们转换为p值(p-values),并将-ln(p值)之和加在一起,成为一个具有两个度自由度的Chi-squared测试统计量。

当使用选区层面的变化,所有这些变化从整个选区的同一分布中抽取的概率小于0.0001。如果我们采取更简单的测试,即只比较前后所有县级邮寄选票,我们得到前196,801张拜登票与前39,490张川普票。在新的选票中,我们得到3,283张拜登票和752张川普票。用皮尔逊检验,这些来自同一分布的概率是0.00058。不过,选区内测试则更为有力,因为它显示,即使是在同一个很小的地理区域內计算的票数,也出現了变化。

这极有可能表明,即使在盘点后期,邮寄选票数的分配仍然会出现异常情况,并且以某种方式表明,即使在较小的区域内,早期批次对拜登的支持也异常高。

还值得注意的是,我们没有将异常批次与新票进行比较。 我们正在将周三上午之前的邮件投票总数加上异常批次与新的投票进行比较。 我们还只观察到邮件投票的尾数增加,而不是观察到最初可疑批次之后的每次更新。 因此,上面的测试比理想的测试弱得多,理想的测试仅是测试在11月5日星期四进行的新一批邮件投票。 但是即使如此,差异仍然显而易见。

事实10:以前的邮件投票显示出对拜登的支持非常一致,即使在选举日投票中投票支持川普的选区也是如此。新的选票显示这种关系的差异更大。

另一种显示邮寄选票的早期分布有多么不寻常的方法是,将它们与同一选区大选当天的票数分布进行比较。

当查看截至11月10日的计票时,邮寄选票显示,投拜登的票数具有惊人的一致性。就拜登而言,就选举日现场投票份额而言,最低的地区是弗朗肯尼亚5,其中拜登仅获得16.3%的选票。但即使在这里,截至11月10日的邮寄选票中显然还有60.4%的票数流向了拜登!尽管如此,疯狂的共和党选区还是为拜登投出了多数票。之后,当用投票份额图描绘相同的关系时,会有更多的变化。诚然,这些来自较小的批次,因此预期会有更多的异议。但这就是我们执行上述形式测试的原因,以排除以下事实:更新中总共只有很少的投票数在驱动结果(因为个人的z-积分正好促成了这一事实)。最引人注目的事情正好就是各个级别之间的脱节,分配给深红的共和党选区的邮寄选票仍然以压倒性多数投给了拜登。







原文链接:

Explosive: New Data From Rigorous Statistical Analysis Points to Voter Fraud in Montgomery County, PA – Revolver

Gnews 2020.11.23

www.51haoyou.com

GMT-5, 2024-12-29 11:13

© 2005-

快速回复 返回顶部 返回列表