下载

字段说明

记录乘客的Id编号。经过了解后：

并没有查到其构成具有特别的实际意义（如身份证的构成每一位都是有实际意义的）；
仅作为唯一标识来定位到某一乘客身上（唯一值同总数据量一样）；
因此认为不具有分析的价值，过后也会将它进行删除处理。

描述乘客是否存活

描述用户所属的等级，总共分为三等，用1、2、3来描述，其中：

描述乘客的全名。例如上例中的 Rugg, Miss. Emily 中：

提示：在登记乘客姓名时全都是用这种方法进行记录的；

描述乘客的性别，其中：

描述乘客的年龄，其中有部分缺失值，需要用一些手段将她们补全，具体的方法方在下面数据清洗中；

描述乘客登船所使用的船票编号。虽然它没有编码上的规律，不存在缺失值，但是唯一值可以看到，同之前唯一定位的乘客编号不同，也就是说可能会有人重复使用船票的情况，具体处理会在数据清洗中介绍，我会找到资料支撑和这一想法；

描述乘客上传所花费的费用；

描述用户所住的船舱编号。由两部分组成，仓位号和房间编号，如C88中，C和88分别对应C仓位和88号房间。本字段缺失值较多，具体处理方法会在后面的数据清洗部分进行介绍。

描述乘客上船时的港口，包含三种类型：