【导读】对死亡的恐惧让最穷凶极恶的死囚也平静下来,在生命的最后时刻,他们想要留给世界的话惊人的一致。
今天是感恩节,不知道这个话题合适不合适。我们经常会提到『死而无憾』这个词。这个词似乎是一种理想状态,几乎100%的人还是做不到的。那么我们的『憾』在哪里?这个问题看似不是难题,不过仔细想想是永远没答案的,人只有在死前的一刻才知道自己的遗憾在哪里,而这个感觉是永远不可能模拟的。当然我们没这么较真儿,也没必要。可能我们经常会假想,假设明天是世界末日,那此时此刻我们想说点儿什么?这个话题被提及太多次,以至于都有点儿俗了,我们很多人都是活的挺随性的人,在大原则不失的前提下,没什么干不出来的事儿,所以也没有太多想干不敢干的壮举。然而有时候可能忽略了上帝给咱们最直接的能力,那就是语言。很多人都说,如果自己下一秒钟生命结束,最大的遗憾就是没能跟他/她/他们说声谢谢,或者,说句我爱你。
美国德州刑事司法部(Texas Department of Criminal Justice)定期更新维护着一个让人无比压抑的数据库,这个数据库整合了1982年至今的531位死囚的临终遗言,还记录下了每一位死囚的名字、性别、人种、罪行等一系列信息。
记录在册的531位死囚来自不同的地区,年龄从20岁跨越到60岁以上,人种、宗教也千差万别。他们中有亲手杀死了自己三个女儿的“杀人狂魔”,也有至死都不肯认罪在遗言中大抱不平的“喊冤人”。然而对死亡的恐惧让最穷凶极恶的死囚也平静下来,在生命的最后时刻,他们想要留给世界的话惊人的一致。
人之将死其言也善?
大数据文摘利用Python编写了网页抓取程序(对用Python抓取网页感兴趣的同学,可以参考大数据文摘已经发布过的《初学指南|用Python进行网页抓取》一文),抓取了所有死囚的遗言及相关信息,部分遗言截图如下所示:
除此之外,我们还抓取了跟死囚相关的个人信息,部分信息截图如下所示:
简单的分析后可以看到,即使最穷凶极恶的死囚面对死亡也表现出了内心最深处的“善意”。
用python爬下了531条死囚的遗言的基础之上,我们提取了除掉类似“I”,”this”等词的实词,对其余的词进行了排序,并制作了相关词云,部分结果显示如下:
从词云图中我们清楚的看到,在死囚遗言中“Love(爱)”是提及最多的词,共被提及739次,“家庭(famili)”、“感谢(thank)”、“道歉(sorry)”、“原谅(forgiv)”、“和平(peac)”是依次提及频率最高的词。
没有不甘心,没有仇恨,“人之将死,其言也善。”这句古老东方的谚语在几百年后地球另一端这531位死囚身上得到了完美的验证。
面对死亡,他们说了什么
此外,我们还对遗言进行了情感分析。通过sentiment将其分为“积极(positive),”“消极(negative)”,和“中立(neutral)”这三类。从分析结果看,所分析的临终遗言几乎都被归为第三类“中立”。
似乎一切风波起落在死亡面前都变成了不值一提的小事,逐条读完这些遗言,我们发现这些被算法识别成neutral的遗言却比任何充斥着抒情词的文章更直指人心。
我们也对这些遗言做了筛选,选取了最短的遗言(1个词、2个字母)、最长的遗言(1268个词)、最混乱的遗言、最“宽容”的遗言、包含高频词最多的遗言、最感人的遗言,并跟大家分享。
最短的遗言
最短的遗言来自一位18岁入狱的死囚Peter Anthony Cantu,他和另外4位同伙奸杀了一位14岁和一位16岁的少女。在遗言中,他只留下了“NO”这个词。
最长的遗言
最长的遗言有1268个词,这份长长的遗言来自一位38岁入狱的黑人Graham Gary。他被指控在一家超市外抢劫并射杀了一位白人男士。
在生命的最后一刻,Gary依然在努力为自己辩解,“我没有杀人,我是无罪的。”
部分遗言:Iwould like to say that I did not kill Bobby Lambert. That I'm an innocent blackman that is being murdered. This is a lynching that is happening in Americatonight. There's overwhelming and compelling evidence of my defense that hasnever been heard in any court of America.”
最混乱的遗言
并非所有人都可以坦然平静面对死亡,Joshua Maxwell在死前的留言已经变得混乱,他似乎在对某个人说话,又似乎在向谁忏悔。
完整遗言:Ido, I want to address you, I am sorry. I don't know who you are. I am sorry Iput you through some things that I can't take back. I am sorry. This isn'tgoing to change anything. Sorry for putting you through this. This is creatingmore victims. I am sorry, I put you through this. I love you man, I love you.This is not gonna change anything. This person shoe did that 10 years ago isn'tthe same person you see today. I hurt a lot of people with decisions I made. Ican't be more sorry than I am right now. I hurt the Lopes family, let this be alesson. Your decisions affect everybody. Look after your sister for me. I amalways gonna be with you. I love you too Shay I love you if your listening I amsorry to be putting everybody through this. This is the end of this, time tomove on. I hope this brings you peace, I am sorry. I told your sister my lastwords. Danielle, you know that I love you. You know that you have my heart,I've enjoyed these times. I love you little hef.
最“宽容”的遗言
Ronald O'Bryan因在圣诞节糖果里放毒药毒死自己的亲生儿子而被判死刑。他在遗言中宽容的写道:“即将对我执行的死刑是错误的,但我原谅你们,因为人人都会犯错,而我们不能因为一个错误而质疑正义。”
完整遗言:Whatis about to transpire in a few moments is wrong! However, we as human beings domake mistakes and errors. This execution is one of those wrongs yet doesn’tmean our whole system of justice is wrong. Therefore, I would forgive all whohave taken part in any way in my death. What is about to transpire in a fewmoments is wrong! However, we as human beings do make mistakes and errors. Thisexecution is one of those wrongs yet doesn’t mean our whole system of justiceis wrong. Therefore, I would forgive all who have taken part in any way in mydeath.
包含高频词最多的遗言
Yosvanis Valle在28岁被捕入狱,罪名是抢劫并射杀了一位西班牙男士。他的遗言包含了大量“love”、“sorry”“family”等高频词,善意和愧疚满满,可以被看做死囚遗言中的范文。
完整遗言:Iam sorry, I never wanted to kill your family. I never wanted to kill yourfamily or these people. I am sorry for the way I talk in English. I did it tomyself. I was forced to do it. I was a gang member. I never wanted to kill yourbrother. I was forced to do this. I blame myself. I am not going to blamenobody. I got my mother and my family too. I was forced. I tell you from myheart. I am sorry with all my heart. That's the reality of life, I am sorry. Igot to pay for it. To my family, I love you, be strong. They have family too;the way they suffer is the way I am suffering. I am asking you to go and givethem hugs. Please accept their hugs. Be strong in the Lord. I love you sister.I love you all, please go and try and talk to the family. I love my family. Iunderstand why I am paying this price. Do not have any excuses for notextending your love. I am ready Warden, I am sorry everybody, I did it. Thankyou brother, don't hate nobody, I feel good. I love my family, I love youJesus. Be strong mama, I love you sister. I love Jesus. Warden I am ready.
最感人的遗言
在一家飞机修理棚射杀了4人的Lester Leroy Bower写下了我们认为最感人的遗言。Lester平静地接受了即将到来的死亡,并诚挚的感谢了自己的辩护律师和家人。“到了离开的时候了,而我不会说再见,直到我们再次相见。”
"Much has beenwritten about this case, not all of it has been the truth. But the time is overand now it is time to move on. I want to thank my attorneys for all that theyhave done. The have afforded me the last quarter of a century. I would like tothank my wife, my daughters, family and friends for unwavering support, and allof the letters and well wishes over the years. Now it is time to pass on. Ihave fought the good fight, I held the faith. I am not going to say goodbye, Iwill simply say until we meet again. I love you very, very much. Thank youWarden."
在死囚中有近20%(110人)没有留下遗言或者拒绝留下遗言。我们无法猜透他们的心思,恐惧害怕、绝望无助亦或平静等待这最终时刻的来临。
人在临刑之前确实不一定会悔改,不一定会觉得自己哪儿错了。当然,相当一部分的囚犯的确没做错过任何事,只不过他们选择了一个太激进太冲动的太不合时宜的方式来解决问题。他们的"善"是对亲人说的,对爱人说的,对朋友说的,对那些"没有他们不行"的生者说的。走的人痛苦几秒,留下的人可能痛苦几年,几十年,甚至痛苦到他们自己走的时候。
衡量一个句子有多"emotinal",算法大致上是这么办的:把句子拆成单个的词,去掉冠词和人称以及一些口头语(统称为stopwords),只留下一句话里的"核心词",然后针对这些词来做一系列的分析(这儿就不具体展开了)。然而我发现,有的时候一句话的精华就在这些stopwords上。
举个最极端但是最简单的例子吧:I Love You.
我这个人泪点高到自己都有点儿害怕,但是看了这条遗言,立刻起身去厕所哭了一会儿,尤其是看到了这个连不会英语的人都会说的单词"Okay"的时候。
Hey, don't y'all worry aboutme, okay?
推荐视频:麦浚龙《写得太多》
再不想说谎再不需要天国
宁愿让你更识希冀更想起最初
文字没有了人类突然哑了
留待我用颦用笑令你会有更多感觉
慾念愿望听得太多
越会想重头开始的走过
感官都开了以後没烦嚣
但我竟听到谁在唱歌
原来恋爱统统统统写得太多
令我证明而爱得很少
所以恳求你可以应承我感觉
雪花可结果暖风可以释放
然後让你看穿真理看得到最初
文字没有了人类突然哑了
留待我用神用窍令你会有更多感觉
慾念愿望听得太多
越会想重头开始的走过
感官都开了以後没烦嚣
愿你听得到云在唱歌
原来恋爱统统统统写得太多
令我证明而爱得很少
所以恳求你可以应承我感觉
微尘浮过细腻经过
不需要描述太多
然而一切慾念愿望听得太多(遗憾更多)
越会想重头开始的走过(再踏天堂)
感官都开了以後没烦嚣
愿你的感觉像你最初
原来恋爱统统统统写得太多
令我证明而爱得很少(想更多)
所以恳求你可以应承我感觉
所以应承你可以恳求我感觉
创作团队:BDD-DS-20151028
文本分析:纪思亮、孙强
可视化展现:米格机、席雄芬
撰文:姚佳灵、纪思亮
项目管理:姚佳灵
纪思亮(美国):北卡教堂山统计硕士毕业,现为硅谷某家startup的data scientist,主要领域为情感分析,语义分析等等。对社交网络数据挖掘和音乐分析特别感兴趣。不上班儿的时候都在街拍和填词。有喜欢粤语歌,喜欢吃刨冰的小伙伴,随时骚扰:)
孙强(美国):资深生物信息专家,现在服务于美国国立癌症研究所,从事癌症基因组数据库管理工作。热爱大数据,加入大数据文摘志愿者行列一年有余,愿以文会友,广结大数据善缘。旅居美国多年,与能干的太太和三个可爱的女儿定居于大华府地区。
姚佳灵(马拉西亚):目前是家庭主妇。拥有计算机软件学士和工商管理硕士学位,对数据分析和处理很感兴趣,正在努力学习中,希望能在大数据领域和大家多多交流,一起工作。联系方式:yaojialing@gmail.com
席雄芬(北京):北京邮电大学无线信号处理专业研究生在读,主要研究图信号处理,对基于社交网络的图数据挖掘感兴趣,希望借助此平台能认识更多的从事大数据方面的人,结交更多的志同道合者。
这次项目是大数据文摘翻译志愿者内部组队,未来,我们愿意做新的尝试,与广大朋友一起协作。将选题、数据收集、数据分析、可视化展现、文章撰写、项目管理环节逐步开放,有能力愿意参与的朋友,请后台留言报名,格式:姓名、擅长技能。每个团队3-7人,持续时间约1个月。这将是一个全球协作的项目团队,我们一起做些有趣有价值的事,认识一些优秀的朋友。(via 搜狐科技,作者:大数据文摘)