我之前写过关于String Type should not be used in key column
错误的文章,文章链接地址为:String Type should not be used in key column
但是,这次的错误比较特殊,和上述博文的错误不大相同,所以,顺便也记录下。
1. 复现错误
今天,在写创建doris表的SQL语句:
CREATE TABLE IF NOT EXISTS test3.test (
`id` int COMMENT 'ID',
`aa` string COMMENT '测试aa',
`bb` string COMMENT '字段bb'
) ENGINE = olap UNIQUE KEY(`id`, `aa`) PARTITION BY RANGE(`aa`) (
FROM
('2023-10-13') TO ('2023-10-14') INTERVAL 1 DAY
) DISTRIBUTED BY HASH(`id`) BUCKETS 10 PROPERTIES("replication_num" = "1");
咋一看,SQL
语句没有任何问题,但在执行时,却报出如下错误:
即String Type should not be used in key column[aa].
2. 分析错误
将错误String Type should not be used in key column[aa].
,翻译成中文字符串类型不应在键列 [aa] 中使用
。
也就是说,aa
的字段类型不应该是string类型,为什么这么说呢?
因为aa
是分区字段,而分区字段对应的是分区时间,即 FROM ('2023-10-13') TO ('2023-10-14') INTERVAL 1 DAY
。
3. 解决错误
既然aa
是分区字段对应的时间,那么,就应该使用doris
的其他字段类型。
doris
的字段类型如下所示:
字 段 类 型 | 字 节 大 小 | 取 值 范 围 |
TINYINT | 1 字节 | 范围:-2^7 + 1 ~ 2^7 - 1 |
SMALLINT | 2 字节 | 范围:-2^15 + 1 ~ 2^15 - 1 |
INT | 4 字节 | 范围:-2^31 + 1 ~ 2^31 - 1 |
BIGINT | 8 字节 | 范围:-2^63 + 1 ~ 2^63 - 1 |
LARGEINT | 16 字节 | 范围:-2^127 + 1 ~ 2^127 - 1 |
FLOAT | 4 字节 | 支持科学计数法 |
DOUBLE | 12 字节 | 支持科学计数法 |
DECIMAL[(precision, scale)] | 16 字节 | 保证精度的小数类型。默认是DECIMAL(10, 0) ,precision: 1 ~ 27 ,scale: 0 ~ 9,其中整数部分为 1 ~ 18,不支持科学计数法 |
DATE | 3 字节 | 范围:0000-01-01 ~ 9999-12-31 |
DATETIME | 8 字节 | 范围:0000-01-01 00:00:00 ~ 9999-12-31 23:59:59 |
CHAR[(length)] | 定长字符串 | 长度范围:1 ~ 255。默认为 1 |
VARCHAR[(length)] | 变长字符串 | 长度范围:1 ~ 65533 |
BOOLEAN | 1字节 | 0 代表 false,1 代表 true |
HLL | 1~16385 个字节 | hll 列类型,不需要指定长度和默认值,长度根据数据的聚合程度系统内控制,并且 HLL 列只能通过 配套的hll_union_agg、Hll_cardinality、hll_hash 进行查询或使用 |
BITMAP | bitmap | 列类型,不需要指定长度和默认值。表示整型的集合,元素最大支持到 2^64 - 1 |
STRING | 变长字符串 | 0.15 版本支持,最大支持 2147483643 字节(2GB-4),长度还受 be 配置string_type_soft_limit, 实际能存储的最大长度取两者最小值。只能用在 value 列,不能用在 key列和分区、分桶列 |
因而,我们应该使用date
类型,即如下代码所示:
CREATE TABLE IF NOT EXISTS test3.test (
`id` int COMMENT 'ID',
`aa` date COMMENT '测试aa',
`bb` string COMMENT '字段bb'
) ENGINE = olap UNIQUE KEY(`id`, `aa`) PARTITION BY RANGE(`aa`) (
FROM
('2023-10-13') TO ('2023-10-14') INTERVAL 1 DAY
) DISTRIBUTED BY HASH(`id`) BUCKETS 10 PROPERTIES("replication_num" = "1");
如此便可执行成功: