2.2 数据类型
Tableau支持字符串、日期/日期时间、数字和布尔数据类型。这些数据类型会以正确的方式自动进行处理。如果创建自己的计算字段,就需要注意如何在公式中使用和组合不同的数据类型,如不能将字符串与数字相加。此外,许多在定义计算时可供使用的函数仅适用于特定数据类型,如DATEPART()函数只能接受日期/日期时间数据类型作为参数。
2.2.1 主要的数据类型
数据源中的所有字段都具有一种数据类型。数据类型反映了该字段中存储信息的种类,如整数、日期和字符串。字段的数据类型在“数据”窗格中由图标标识。Tableau Desktop主要数据类型的图标如图2-1所示。
图2-1 Tableau Desktop主要数据类型的图标
下面介绍Tableau支持的数据类型。
1.字符串(STRING)
字符串是由零个或更多字符组成的序列。例如,"Wisconsin" "ID-44400"和"Tom Sawyer"都是字符串,字符串通过单引号或双引号进行识别。引号字符本身可以重复包含在字符串中,如"O""Hanrahan"。
2.日期时间(DATE/DATETIME)
日期或日期时间,如"January 23,1972"或"January 23,1972 12:32:00 AM"。如果要将以长型格式编写的日期解释为日期/日期时间,就要在两端放置#符号。例如,"January 23,1972"被视为字符串数据类型,而#January 23,1972#被视为日期/日期时间数据类型。
3.数值型
Tableau中的数值可以为整数或浮点数。对于浮点数,聚合的结果可能并非总是完全符合预期。例如,可能发现SUM函数返回值为-1.42e-14,求和结果正好为0,出现这种情况的原因是数字以二进制格式存储,有时会以极高的精度级别舍入。
4.布尔型(BOOLEAN)
包含TRUE或FALSE值的字段,当结果未知时会出现未知值。例如,表达式7>Null会生成未知值,会自动转换为Null。
此外,还有地理型,可以根据需要将省市字段转换为具有经纬度坐标的字段。
2.2.2 更改数据类型
在日常工作中,Tableau可能会将字段标识为错误的数据类型。例如,可能会将包含日期的字段标识为整数而不是日期,可以在“数据源”页面上更改曾经作为原始数据源一部分的字段的数据类型。
在“数据源”页面单击字段的字段类型图标,从下拉列表中选择一种新数据类型,如图2-2所示。
如果使用数据提取,就要确保在创建数据提取之前已经进行所有必要的数据类型更改,否则数据可能不准确。例如,Tableau把原始数据源中的浮点字段解释为整数,生成的浮点字段部分精度会被截断。
如果要在“数据”窗格中更改字段的数据类型,就要单击字段名称左侧的字段类型图标,然后从下拉列表中选择一种新数据类型,如图2-3所示。
图2-2 在“数据源”页面更改数据类型
图2-3 在“数据”窗格更改数据类型
若要在视图中更改字段的数据类型,则要在“数据”窗格中右击某个字段,选择“更改数据类型”,然后选择适当的数据类型,如图2-4所示。
此外,由于数据库中数据的精度比Tableau可以建模的精度高,因此将这些值添加到视图中时,状态栏右侧将显示一个精度警告对话框。
图2-4 在“数据”视图更改数据类型