titanic数据集(关于泰坦尼克号的资料)
本文目录
关于泰坦尼克号的资料
泰坦尼克号(英文RMS Titanic),台湾和香港称为铁达尼号,是20世纪初英国制造的一艘在当时世界最大的豪华客轮,在当时被称为是“永不沉没的”,但却在1912年4月15日从南安普顿至纽约的处女航中,在北大西洋撞上冰山而沉没,由于缺少足够的救生艇,1500人葬生海底,造成了在和平时期最严重的一次航海事故,也是迄今为止最著名的一次。派拉蒙电影公司与20世纪福克斯电影公司於1997年将「铁达尼号」的事件改编为电影,在全球各地上映,轰动全球。 建造过程 泰坦尼克号建造于北爱尔兰的最大城市贝尔法斯特的哈南德·沃尔夫造船厂。船体于1911年5月31日下水。她也是白星航运(White Star Line)公司在同一造船厂建造的奥林匹克级汽船的第2艘船。在当时是最大最有声望的载人游船。泰坦尼克号有260米长,28米宽,总重46329吨 (净重21831吨) , 动力3000匹马力, 航速23~24里。尽管她包含了更多的空间导致了更大的总吨数。她的船体还是和她的姊妹船奥林匹克号一模一样大。船上有899名船员,可以运载3300名乘客。因为她也运送邮件,所以也叫皇家邮汽船泰坦尼克号。同样硕大无比的4个烟囱中只有3个真正工作。剩下那个是个陪衬,唯一的实际用途是作为主厨房的烟囱。 泰坦尼克号在当时是无可比拟的奢华。尽管她不是第一艘提供甲板游泳池,健身房,浴室和升降梯的船,她竭尽全力提供了以前从未见过的服务水平。对头等舱的乘客,她提供了3台升降机;作为一种革新,她给二等舱的乘客提供了一台升降机。经济舱的乘客仍然需要爬楼梯。她最著名的一个特点就是她豪华的楼梯了。詹姆士·卡梅伦在他的电影中忠实的再现了这个楼梯。 泰坦尼克号被认为是一个技术成就的定点作品。16个水密(不进水的)舱防止她沉没。一个船员在航行中对一个2等舱女乘客西尔维亚·考德威尔说:「就是上帝亲自来,他也弄不沉这艘船。 处女航 铁达尼号于1912年4月10日从英国英格兰南部港口城市南安普顿出发,开往美国纽约。船长叫爱德华·史密斯,於日正午离开了南安普顿(Southampton)港, 预定渡过北大西洋, 直达美国纽约。当她即将启航时,另一艘定期航船纽约号因为水中移动的体积庞大,造成水流大量回填的吸引力几乎撞上了她的船体,导致了一小时的误点。启程后,铁达尼号先穿过英吉利海峡停泊在法国瑟堡,接纳了更多旅客,之后又停泊在了爱尔兰的昆士敦(Queenstown,皇后城),最终她载着1324乘客和892名甲板工作人员驶向纽约。铁达尼号将乘客分为三个等级。三等舱位在船身较下层也最便宜,这一类的乘客身分多为计画在大西洋对岸营造新生活的移民;二等舱与一般客房的装潢摆设,其实具备与当时其他一般船只的头等舱一样的等级,许多二等舱乘客原先是在其他船只上定位头等舱,却因为了铁达尼的航行,将煤炭能源转移给铁达尼号而作罢;一等舱是整艘船只最为昂贵奢华的部分,当时世界最富有的几位名人就在这趟旅程上。较为有名的是当时的百万富翁(理论上是以英镑或是以美金计算)约翰 雅各布 和他的妻子,企业家Benjamin Guggenheim,梅西百货公司的老板Isador and Ida Staus, the 「不沉的」Molly Brown and others. 而白星邮轮的主管级人物 J. Bruce Ismay 以及总设计师汤玛士.安德鲁 Thomas Andrews 也在这艘船的头等舱旅行。 在4月14日晚上,她撞上了一座冰山。在与冰山碰撞的过程中,由於判断失误在高速航行下进行紧急转弯,结果变成转弯加上前进的同时,冰山在船底划下长长的一道裂缝,不但右舷水线下的铆丁因此一撞击松脱,六个水密舱进水。最后由於进水量太多,造成船身倾斜达到接近船身铅垂(垂直於水平面)的惊人状况,又因为倾斜使得水可以继续灌入。最后船身支撑不住重量,当时在水面上的一半船身便折断并且落下,随后伴随著1522人沉入海底。 在船的左舷,救生船只装载妇女和儿童。在右舷,则是妇女优先逃生之后允许男性登艇。所以,在右舷获救的人数比在左舷获救的多。 许多乘客虽然逃离了船身,但因为未能搭上救生船,而在沉船时一起被吸进海内,或者是泡在冰冷的海水中失温而死。 事故的后果和影响 和大众的想法不一致的是:泰坦尼克号沉没时的确使用了国际通用的摩尔斯电码遇难信号SOS,但这不是SOS最早使用的例子。在1906年的柏林外的大海上,国际无线电通讯会议第一次提议了SOS信号。1908年国际社会认可了这个提议并慢慢开始广泛使用,这已经是泰坦尼克号沉没的四年前了。然而,英国的无线电操作员很少使用SOS信号,他们更喜欢老式的CQD遇难信号. 泰坦尼克号的无线电首席官员约翰.乔治.菲利普一直在发送CQD遇难信号,直到下级无线电操作员哈罗德.布莱德建议他:发送SOS吧,这是新的呼叫信号,这也可能是你最后的机会来发送它了!然后菲利普在传统的CQD求救信号中夹杂sos信号。求救信号最终在第二天早上被加利福尼亚号收到,因为她并没有24小时都监听无线电。 这场灾难震惊了国际社会。因为它向一些人证明了:人和人们的技术成就无法于自然的力量相比。 在当时的炼钢技术并不十分成熟,炼出的钢铁在现代的标准根本不能造船。铁达尼号上所使用的钢板含有许多化学杂质硫化锌,加上冰冷浸泡在冰冷的海水中,使得钢板更加脆弱。 就是过了1个世纪后的今天,几个关于泰坦尼克号和它的沉没的荒诞说法仍然存在。一个是:她的舵太小了,大一点的舵可以避免这场灾难。大点的舵的可能会拯救她,当时她的舵的尺寸按法律上说,就其船身尺寸而言不算小。事实上,按今天对轮船的规定看,泰坦尼克号的舵的尺寸仍然是合格的。另一种说法是:泰坦尼克号上的救生船不够。实际上,她的救生船数量是符合英国的法律规定的,该项法律定的数量不是基于乘客数,而是基于船的吨位。当时所有船的救生船数量都远远低于需要的数量,当时救生船的目的那时不是用来装下全体乘客的;它们只是用来从一艘下沉的船上转移乘客到另一艘救援船上。泰坦尼克号的沉没永久性的改变了这种救生策略。事实上,即使她有可以装下更多的救生船来装载所有的乘客,仍然有可能不确保会有更多的人获救,因为在她下沉时,船员们没有时间来放下所有的救生船!还有一种说法是:机械组的船员坚持他们的岗位到了最后。1988年出版的一本书也提到这个让它永垂不朽了。事实是,机械舱在1:15AM就被淹没了。在下沉的最后时刻,机械师们和烧炉工人们和其他成百的人一样站在尾部的甲板上,困在船上,没有获救的任何希望。 另一方面,铁达尼号的沈船形式亦有很多说法。包括全船沈没;船身近第2及第3支烟囱中间折开,然后各自以垂直沈没;船身近第3及第4支烟囱中间折开,然后前船身部分拖著船尾,船尾垂直下沈。直至1985年,当著名科学家巴拉德在纽芬兰东南约380英里海域找到铁达尼号残骸,分别是前2支烟囱的船头部分,以及第四支烟囱之后的船尾部分,就初步证明了第3个理论.而这个理论在其后由詹姆斯·卡梅伦执导电影「铁达尼号」体验出来。当时大家都认为,由於第3支烟囱的船身部分已经被炸毁成碎片,永远找不到这一部分。但是在2005年8月由History Channel赞助的考古队伍,在船尾残骸后500米找到这船身部分,残骸约12米乘27米,船底的红色油漆还清楚可见。这个发现更推翻了过去20年的「双截论」。科学家相信铁达尼号,是折开3截后沈没. 泰坦尼克号的沉没极大的影响了船的制造和无线电电报通讯。 1913年12月12日,英国伦敦因此召开了第一届海上生命安全国际大会。大会制定的条约导致了国际冰山检测组织的形成和资金投入。改组织的美国海岸警卫队的下属部门,直到今天她还在检测和报告北大西洋的可能威胁航船的冰山。条约也一致达成一个新规定:所有的载人船只应该有足够的救生船来装载所有的在船上的人,并且适当的相关训练也应该进行。还有就是无线电通讯应该24小时开通,加上一个2级备用电源,这样就不会漏掉呼救的信号。条约也同意:从船上发送任何火箭必须被解释为一种求救信号。 2006年5月,最后一名见证事件的女性生还者逝世,终年99岁。目前尚有两名女生还者仍然存活,但她们在意外时还不到一岁,因此不会对事件有回忆。
R语言自学笔记-2内置数据集
#b站视频——R语言入门与数据分析 #内置数据集 #固定格式的数据(矩阵、数据框或一个时间序列等) #统计建模、回归分析等试验需要找合适的数据集 #R内置数据集,存储在,通过 help(package="datasets") #通过data函数访问这些数据集 data() #得到新窗口 前面:数据集名字 后面:内容 #包含R所有用到的数据类型,包括:向量、矩阵、列表、因子、数据框以及时间序列等 #直接输入数据集的名字就可以直接使用这些数据集 #输出一个向量 rivers #是北美141条河流长度 #这些数据集的名字都是内置的,一般我们在给变量命名时最好不要重复 #否则数据集在当前对话中会被置换掉 #例如 rivers《-c(1,2,3) rivers #不过影响不大 #再使用data函数重新加载这个数据集就可以了 data("rivers") rivers #一些常用内置数据集 #默认介绍页面只有名字和介绍,并没有给出数据分类 #哪些是向量、矩阵、数据框等? #查看数据集除了直接敲数据集名字显示数据之外 #还可以使用help函数查看每个数据集具体的内容 help("mtcars") euro #欧元汇率,长度为11,每个元素都有命名 #输出向量的属性信息 names(euro) #将5个数据构成一个数据框 向量 state.abb #美国50个州的双字母缩写 state.area #美国50个州的面积 state.name #美国50个州的全称 因子 state.division #美国50个州的分类,9个类别 state.region #美国50个州的地理分类 # state《-data.frame(state.name,state.abb,state.area,state.division,state.region) state state.x77 #美国50个州的八个指标 state.x77 VADeaths #1940年弗吉尼亚州死亡率(每千人) volcano #某火山区的地理信息(10米×10米的网格) WorldPhones #8个区域在7个年份的电话总数 iris3 #3种鸢尾花形态数据 #以上矩阵→适合画热图 heatmap(volcano) #这里只是作为一个演示,还需要对这个图进行一些调整 #更复杂的数据结构 Titanic #泰坦尼克乘员统计,是一个数组 UCBAdmissions #伯克利分校1973年院系、录取和性别的频数 crimtab #3000个男性罪犯左手中指长度和身高关系 HairEyeColor #592人头发颜色、眼睛颜色和性别的频数 occupationalStatus #英国男性父子职业联系 #类矩阵 eurodist #欧洲12个城市的距离矩阵,只有下三角部分 Harman23.cor #305个女孩八个形态指标的相关系数矩阵 Harman74.cor #145个儿童24个心理指标的相关系数矩阵 #R中内置最多的数据集——数据框 cars #1920年代汽车速度对刹车距离的影响 iris #3种鸢尾花形态数据 mtcars #32辆汽车在11个指标上的数据 rock #48块石头的形态数据 sleep #两药物的催眠效果 swiss #瑞士生育率和社会经济指标 trees #树木形态指标 USArrests #美国50个州的四个犯罪率指标 women #15名女性的身高和体重 #列表 state.center #美国50个州中心的经度和纬度 #类数据框 Orange #桔子树生长数据 #时间序列数据,和数据框类似,不同的是具有时间序列的顺序,是数据分析中非常常见的格式 #能反映出变化情况以及变化的趋势等 #因此有很多专门的方法用于时间序列的数据分析 co2 #1959-1997年每月大气co2浓度(ppm) presidents #1945-1974年每季度美国总统支持率 uspop #1790–1970美国每十年一次的人口总数(百万为单位) #除了内置数据集之外,许多R扩展包中也内置了很多数据集 #这些数据集作为扩展包的函数使用的案例 #加载R包之后这些数据集也同样被加载进来 #例如MASS包中的Cars93数据 #包含了27个变量,是1993年93辆汽车的型号指标 install.packages("MASS") library("MASS") help("Cars93") #使用data函数在参数package中等于对应R包的名字,即可列出每个R包中包含的数据集 #ex data(package="MASS") #显示R中所有可用的数据集 data(package=.packages(all.available = TRUE)) #不加载R包使用其中的数据集 data(Chile,package="car") Chile #》 data(Chile,package="car") #Warning message: # In data(Chile, package = "car") : data set ‘Chile’ not found #》 Chile #Error: object ’Chile’ not found install.packages("car") library("car") help("Chile")
pandas怎么把波士顿矩阵的90%作为训练集
间:2020-07-20 13:38:32来源:亿速云阅读:249作者:小猪这篇文章主要讲解了如何用pandas划分数据集实现训练集和测试集,内容清晰明了,对此有兴趣的小伙伴可以学习一下,相信大家阅读完之后会有帮助。1、使用model_select子模块中的train_test_split函数进行划分数据:使用kaggle上Titanic数据集划分方法:随机划分# 导入pandas模块,sklearn中model_select模块import pandas as pdfrom sklearn.model_select import train_test_split# 读取数据data = pd.read_csv(’.../titanic_dataset/train.csv’)# 将特征划分到 X 中,标签划分到 Y 中x = data.ilocy = data.loc# 使用train_test_split函数划分数据集(训练集占75%,测试集占25%)x_train, x_test, y_train,y_test = train_test_split(x, y, test_size=0.25, ramdon_state=0)缺点:1、数据浪费严重,只对部分数据进行了验证2、容易过拟合2、k折交叉验证(kfold)原理:将数据集划分成n个不相交的子集,每次选择其中一个作为测试集,剩余n-1个子集作为 训练集,共生成 n 组数据使用方法:sklearn.model_select.KFold(n_splits=5,shuffle=False,random_state=0)参数说明:n_splits:数据集划分的份数,shuffle:每次划分前是否重新洗牌 ,False表示划分前不洗牌,每次划分结果一样,True表示划分前洗牌,每次划分结果不同random_state:随机种子数(1)shuffle=False 情况下数据划分情况# 不洗牌模式下数据划分情况
更多文章:
beatssolo和studio的区别(录音师Studio和SOLO HD区别是什么)
2024年6月13日 14:00
惠普1010支持win10吗(win10系统装HP1010打印机提示找不到指定模块如何解决)
2024年9月16日 05:00
华为畅享9plus玩游戏卡吗(华为畅享9plus可以流畅玩妄想山海吗)
2024年3月23日 04:30
联想thinkpad425(联想Thinkpad E-425 笔记本能换显卡吗)
2024年6月11日 21:20
飞利浦剃须刀hq6070如何拆卸(飞利浦电动剃须刀HQ6075怎样折装)
2024年5月6日 22:20
华硕笔记本vivobook(华硕vivobook只有c盘吗)
2024年9月6日 04:50
pointing的意思(英文point是什么意思,point翻译解释,point中文意思,point用法及读音)
2024年3月17日 22:50
小米11se什么时候上市(小米11se微信视频聊天为什么很卡)
2024年9月7日 07:10
小米电视能当电脑显示器吗(小米电视 能连接电脑当显示器(或投影仪)用吗)
2024年10月8日 03:10