1
Clickhouse 时间日期函数
3 注:所有的时间日期函数都可以在第二个可选参数中接受时区参数。示例:Asia / Yekaterinburg。在这种情况下,它们使用指定的时区而不是本地(默认)时区。
5 SELECT
6 toDateTime('2016-06-15 23:00:00') AS time,
7 toDate(time) AS date_local,
8 toDate(time, 'Asia/Yekaterinburg') AS date_yekat,
9 toString(time, 'US/Samoa') AS time_samoa
11 ┌────────────────time─┬─date_local─┬─date_yekat─┬─time_samoa──────────┐
12 │ 2016-06-15 23:00:00 │ 2016-06-15 │ 2016-06-16 │ 2016-06-15 09:00:00 │
13 └─────────────────────┴────────────┴────────────┴─────────────────────┘
16 常用时间函数:
18 now() // 2020-04-01 17:25:40 取当前时间
19 toYear() // 2020 取日期中的年份
20 toMonth() // 4 取日期中的月份
21 today() // 2020-04-01 今天的日期
22 yesterday() // 2020-03-31 昨天的额日期
23 toDayOfYear() // 92 取一年中的第几天
24 toDayOfWeek() // 3 取一周中的第几天
25 toHour() //17 取小时
26 toMinute() //25 取分钟
27 toSecond() //40 取秒
28 toStartOfYear() //2020-01-01 取一年中的第一天
29 toStartOfMonth() //2020-04-01 取当月的第一天
31 formatDateTime(now(),'%Y-%m-%d') // 2020*04-01 指定时间格式
32 toYYYYMM() //202004
33 toYYYYMMDD() //20200401
34 toYYYYMMDDhhmmss() //20200401172540
35 dateDiff()
36 ......
38 SELECT
39 toDateTime('2019-07-30 10:10:10') AS time,
41 -- 将DateTime转换成Unix时间戳
42 toUnixTimestamp(time) as unixTimestamp,
44 -- 保留 时-分-秒
45 toDate(time) as date_local,
46 toTime(time) as date_time, -- 将DateTime中的日期转换为一个固定的日期,同时保留时间部分。
48 -- 获取年份,月份,季度,小时,分钟,秒钟
49 toYear(time) as get_year,
50 toMonth(time) as get_month,
52 -- 一年分为四个季度。1(一季度:1-3),2(二季度:4-6),3(三季度:7-9),4(四季度:10-12)
53 toQuarter(time) as get_quarter,
54 toHour(time) as get_hour,
55 toMinute(time) as get_minute,
56 toSecond(time) as get_second,
58 -- 获取 DateTime中的当前日期是当前年份的第几天,当前月份的第几日,当前星期的周几
59 toDayOfYear(time) as "当前年份中的第几天",
60 toDayOfMonth(time) as "当前月份的第几天",
61 toDayOfWeek(time) as "星期",
62 toDate(time, 'Asia/Shanghai') AS date_shanghai,
63 toDateTime(time, 'Asia/Shanghai') AS time_shanghai,
65 -- 得到当前年份的第一天,当前月份的第一天,当前季度的第一天,当前日期的开始时刻
66 toStartOfYear(time),
67 toStartOfMonth(time),
68 toStartOfQuarter(time),
69 toStartOfDay(time) AS cur_start_daytime,
70 toStartOfHour(time) as cur_start_hour,
71 toStartOfMinute(time) AS cur_start_minute,
73 -- 从过去的某个固定的时间开始,以此得到当前指定的日期的编号
74 toRelativeYearNum(time),
75 toRelativeQuarterNum(time);
77 获取未来时间的函数:
79 -- 第一种,日期格式(指定日期,需注意时区的问题)
80 WITH
81 toDate('2019-09-09') AS date,
82 toDateTime('2019-09-09 00:00:00') AS date_time
83 SELECT
84 addYears(date, 1) AS add_years_with_date,
85 addYears(date_time, 0) AS add_years_with_date_time;
87 -- 第二种,日期格式(当前,本地时间)
88 WITH
89 toDate(now()) as date,
90 toDateTime(now()) as date_time
91 SELECT
92 now() as now_time,-- 当前时间
93 -- 之后1年
94 addYears(date, 1) AS add_years_with_date,
95 addYears(date_time, 1) AS add_years_with_date_time,
97 -- 之后1月
98 addMonths(date, 1) AS add_months_with_date,
99 addMonths(date_time, 1) AS add_months_with_date_time,
101 --之后1周
102 addWeeks(date, 1) AS add_weeks_with_date,
103 addWeeks(date_time, 1) AS add_weeks_with_date_time,
105 -- 之后1天
106 addDays(date, 1) AS add_days_with_date,
107 addDays(date_time, 1) AS add_days_with_date_time,
109 --之后1小时
110 addHours(date_time, 1) AS add_hours_with_date_time,
112 --之后1分中
113 addMinutes(date_time, 1) AS add_minutes_with_date_time,
115 -- 之后10秒钟
116 addSeconds(date_time, 10) AS add_seconds_with_date_time,
118 -- 之后1个季度
119 addQuarters(date, 1) AS add_quarters_with_date,
120 addQuarters(date_time, 1) AS add_quarters_with_date_time;
122 获取过去时间的函数:
124 WITH
125 toDate(now()) as date,
126 toDateTime(now()) as date_time
127 SELECT
128 subtractYears(date, 1) AS subtract_years_with_date,
129 subtractYears(date_time, 1) AS subtract_years_with_date_time,
130 subtractQuarters(date, 1) AS subtract_Quarters_with_date,
131 subtractQuarters(date_time, 1) AS subtract_Quarters_with_date_time,
132 subtractMonths(date, 1) AS subtract_Months_with_date,
133 subtractMonths(date_time, 1) AS subtract_Months_with_date_time,
134 subtractWeeks(date, 1) AS subtract_Weeks_with_date,
135 subtractWeeks(date_time, 1) AS subtract_Weeks_with_date_time,
136 subtractDays(date, 1) AS subtract_Days_with_date,
137 subtractDays(date_time, 1) AS subtract_Days_with_date_time,
138 subtractHours(date_time, 1) AS subtract_Hours_with_date_time,
139 subtractMinutes(date_time, 1) AS subtract_Minutes_with_date_time,
140 subtractSeconds(date_time, 1) AS subtract_Seconds_with_date_time;
142 SELECT toDate('2019-07-31', 'Asia/GuangZhou') as date_guangzhou;
143 SELECT toDate('2019-07-31'), toDate('2019-07-31', 'Asia/Beijing') as date_beijing;
145 -- 亚洲只能加载上海的timezone???
146 SELECT toDateTime('2019-07-31 10:10:10', 'Asia/Shanghai') as date_shanghai;
148 计算连个时刻在不同时间单位下的差值
150 -- 第一种:指定时间计算差值示例
151 WITH
152 toDateTime('2019-07-30 10:10:10', 'Asia/Shanghai') as date_shanghai_one,
153 toDateTime('2020-10-31 11:20:30', 'Asia/Shanghai') as date_shanghai_two
154 SELECT
155 dateDiff('year', date_shanghai_one, date_shanghai_two) as diff_years,
156 dateDiff('month', date_shanghai_one, date_shanghai_two) as diff_months,
157 dateDiff('week', date_shanghai_one, date_shanghai_two) as diff_week,
158 dateDiff('day', date_shanghai_one, date_shanghai_two) as diff_days,
159 dateDiff('hour', date_shanghai_one, date_shanghai_two) as diff_hours,
160 dateDiff('minute', date_shanghai_one, date_shanghai_two) as diff_minutes,
161 dateDiff('second', date_shanghai_one, date_shanghai_two) as diff_seconds;
163 -- 第二种:本地当前时间示例
164 WITH
165 now() as date_time
166 SELECT
167 dateDiff('year', date_time, addYears(date_time, 1)) as diff_years,
168 dateDiff('month', date_time, addMonths(date_time, 2)) as diff_months,
169 dateDiff('week', date_time, addWeeks(date_time, 3)) as diff_week,
170 dateDiff('day', date_time, addDays(date_time, 3)) as diff_days,
171 dateDiff('hour', date_time, addHours(date_time, 3)) as diff_hours,
172 dateDiff('minute', date_time, addMinutes(date_time, 30)) as diff_minutes,
173
dateDiff('second', date_time, addSeconds(date_time, 35)) as diff_seconds;
1 -------------------------------------------------
2 --------------------------------------------------
3 ---------------Clickhouse基础知识:函数学习-------------
4 --官址学习文档:https://clickhouse.yandex/docs/zh/
5 --------------------------------------------------
6 --------------------------------------------------
11 ----------------------------------------------------------------------------
12 -- DBeaver6.1.2操作快捷键:
13 -- 常用快捷键须知:(Ctrl + Shift + L 显示快捷键列表)
14 -- 1.删除光标所在行:Ctrl + D
15 -- 2.复制光标所在行:Ctrl + Alt + ↓
16 -- 3.移动光标所在行:Ctrl + Shift + ↑/↓
17 -- 4.缩小SQL编辑器的文本字体大小:Ctrl + -/+
18 -- 5.查找:Ctrl + F
19 -- 6.选中上或下的SQL执行语句:Alt + ↑/↓
20 -- 7.执行当前光标所在SQL语句(无论是否格式化过,前提是此SQL语句和上一条有空行或者上一条SQL语句有分号“;”隔开)
21 ----------------------------------------------------------------------------
23 -- 零、检测函数类型(clickhouse中数据的类型)
24 SELECT toTypeName(0);-- UInt8(三位数为8)
25 SELECT toTypeName(-0);-- Int8
26 SELECT toTypeName(-343);-- Int16
27 SELECT toTypeName(12.43); -- Float64(默认浮点型的数据为64),所以一般在处理浮点型的数据的时候尽量转成toFloat32(12.43)
28 SELECT toTypeName(12.34343); -- Float64
29 SELECT toTypeName(toDateTime(1502396027)); -- DateTime
31 -- 一、算数函数
32 -->>>>>> 算数函数(数学上的计算)
33 --求和
34 SELECT plus(12, 21), plus(10, -10), plus(-10, -10);
35 --差值
36 SELECT minus(10, 5), minus(10, -10),minus(-10, -10);
37 --积
38 SELECT multiply(12, 2), multiply(12, -2), multiply(-12, -2);
39 --平均值
40 SELECT divide(12, 4), divide(10, 3), divide(2, 4), divide(-4, -2), divide(-4, 2), divide(-4.5, 3);
41 SELECT intDiv(10, 3), divide(10, 3); -- 3, 3.333(保留四位有效数字)
42 SELECT divide(10, 0), divide(-10, 0); -- 出现无穷大字符“ ∞ ”或“ -∞ ”
43 SELECT divide(0, 0); -- 特殊字符(类似乱码)
44 SELECT intDivOrZero(10, 0); -- 0
45 --求余数
46 SELECT modulo(10, 3); --1
47 SELECT modulo(10.5, 3); --1
48 --取反
49 SELECT negate(10), negate(-10); -- -10 10
50 --绝对值
51 SELECT abs(-10), abs(10);
52 --最大公约数
53 SELECT gcd(12, 24), gcd(-12, -24), gcd(-12, 24);
54 --最小公倍数
55 SELECT lcm(12, 24), lcm(-12, -24), lcm(-3, 4);
57 -- 二、比较函数
58 -->>>>>> 比较函数(始终返回0表示false 或 1表示true)
59 SELECT 12 == 12, 12 != 10, 12 == 132, 12 != 12, 12 <> 12;
60 SELECT equals(12, 12), notEquals(12, 10), equals(12, 10), notEquals(12,123);
61 SELECT greater(12, 10), greater(10, 12
), greater(12, 12);-- 前者是否大于后者
62 SELECT greaterOrEquals(12,10), greaterOrEquals(12,12);-- 前者是否大于或等于后者
63 SELECT less(12, 21), less(12, 10), less(120, 120);-- 前者是否小于后者
64 SELECT lessOrEquals(12, 120), lessOrEquals(12, 12);-- 前世是否小于或等于或者
66 -- 三、逻辑函数
67 -->>>>>> 逻辑操作符(返回0表示false 或 1表示true)
68 SELECT 12==12 or 12!=10;
69 SELECT 12==12 and 12!=10;
70 SELECT not 12, not 0;
71 SELECT or(equals(12, 12), notEquals(12, 10)); --函数表示法:或
72 SELECT and(equals(12, 12), notEquals(12, 10));--函数表示法:且
73 SELECT not(12), not(0);
75 -- 四、类型转换函数
76 -->>>>>> 类型转换函数部分示例:
77 SELECT toInt8(12.3334343), toFloat32(10.001), toFloat64(1.000040);
78 SELECT toString(now());
79 SELECT now() AS now_local, toString(now(), 'Asia/Yekaterinburg') AS now_yekat;
80 SELECT now() AS now_local, toDate(now()), toDateTime(now()), toUnixTimestamp(now());
82 SELECT
83 '2016-06-15 23:00:00' AS timestamp,
84 CAST(timestamp AS DateTime) AS datetime,
85 CAST(timestamp AS Date) AS date,
86 CAST(timestamp, 'String') AS string,
87 CAST(timestamp, 'FixedString(22)') AS fixed_string;
89 WITH
90 toDate('2019-01-01') AS date,
91 INTERVAL 1 WEEK AS interval_week,
92 toIntervalWeek(1) AS interval_to_week,
93 toIntervalMonth(1) AS interval_to_month
94 SELECT
95 date + interval_week,
96 date + interval_to_week,
97 date + interval_to_month;
99 WITH
100 toDateTime('2019-01-01 12:10:10') as datetime,
101 INTERVAL 1 HOUR AS interval_hour,
102 toIntervalHour(1) as invterval_to_hour
103 SELECT
104 plus(datetime, interval_hour),
105 plus(datetime, invterval_to_hour);
107 -- 五、时间日期函数
108 --->>>>>> 时间日期函数
109 SELECT
110 toDateTime('2019-07-30 10:10:10') AS time,
111 -- 将DateTime转换成Unix时间戳
112 toUnixTimestamp(time) as unixTimestamp,
113 -- 保留 时-分-秒
114 toDate(time) as date_local,
115 toTime(time) as date_time,-- 将DateTime中的日期转换为一个固定的日期,同时保留时间部分。
116 -- 获取年份,月份,季度,小时,分钟,秒钟
117 toYear(time) as get_year,
118 toMonth(time) as get_month,
119 -- 一年分为四个季度。1(一季度:1-3),2(二季度:4-6),3(三季度:7-9),4(四季度:10-12)
120 toQuarter(time) as get_quarter,
121 toHour(time) as get_hour,
122 toMinute(time) as get_minute,
123 toSecond(time) as get_second,
124 -- 获取 DateTime中的当前日期是当前年份的第几天,当前月份的第几日,当前星期的周几
125 toDayOfYear(time) as "当前年份中的第几天",
126 toDayOfMonth(time) as "当前月份的第几天",
127 toDayOfWeek(time) as "星期",
128 toDate(time, 'Asia/Shanghai') AS date_shanghai,
129 toDateTime(time, 'Asia/Shanghai') AS time_shanghai,
130 -- 得到当前年份的第一天,当前月份的第一天,当前季度的第一天,当前日期的开始时刻
131 toStartOfYear(time),
132 toStartOfMonth(time),
133 toStartOfQuarter(time),
134 toStartOfDay(time) AS cur_start_daytime,
135 toStartOfHour(time) as cur_start_hour,
136 toStartOfMinute(time) AS cur_start_minute,
137 -- 从过去的某个固定的时间开始,以此得到当前指定的日期的编号
138 toRelativeYearNum(time),
139 toRelativeQuarterNum(time);
141 SELECT
142 toDateTime('2019-07-30 14:27:30
') as time,
143 toISOYear(time) AS iso_year,
144 toISOWeek(time) AS iso_week,
145 now() AS cur_dateTime1, -- 返回当前时间yyyy-MM-dd HH:mm:ss
146 today() AS cur_dateTime2, -- 其功能与'toDate(now())'相同
147 yesterday() AS yesterday, -- 当前日期的上一天
148 -- timeSlot(1) AS timeSlot_1, -- 出现异常!!将时间向前取整半小时
149 toDate(time) as getY_M_d;
151 -- 目前只有这三种格式,没有什么toYYYY(),toYYYddmm()之类的函数,不要想当然。
152 SELECT
153 now() as nowTime,
154 -- 将Date或DateTime转换为包含年份和月份编号的UInt32类型的数字(YYYY * 100 + MM)
155 toYYYYMMDDhhmmss(nowTime),
156 toYYYYMMDD(nowTime),
157 toYYYYMM(nowTime);
159 -- formatDateTime(Time, Format[,Timezone])函数引用
160 SELECT
161 now() as now_time,
162 toDateTime('2019-07-31 18:20:30') AS def_datetime,
163 formatDateTime(now_time, '%D') AS now_time_day_month_year,-- 07/30/19
164 -- toDateTime('2019-07-31 18:20:30', 'Asia/Shanghai') AS def_datetime1, -- 指定时区
165 formatDateTime(def_datetime, '%Y') AS def_datetime_year, -- 2019(指定日期为2019年)
166 formatDateTime(def_datetime, '%y') AS def_datetime_year_litter, -- 19(指定日期为19年,Year, last two digits (00-99),本世纪的第19年)
167 formatDateTime(def_datetime, '%H') AS hour24, -- 18 下午六点
168 formatDateTime(def_datetime, '%I') AS hour12, -- 06下午六点
169 formatDateTime(def_datetime, '%p') AS PMorAM, -- 指定时间是上午还是下午
170 formatDateTime(def_datetime, '%w') AS def_datetime_get_curWeek,-- 3(指定日期为星期三)
171 formatDateTime(def_datetime, '%F') AS def_datetime_get_date,-- 2019-07-31
172 formatDateTime(def_datetime, '%T') AS def_datetime_get_time,-- 18:20:30
173 formatDateTime(def_datetime, '%M') AS def_datetime_get_minute,-- 20(得到指定事件的“分”,minute (00-59))
174 formatDateTime(def_datetime, '%S') AS def_datetime_get_second;-- 30(得到指定事件的“秒”,second (00-59))
178 -- 1.跳转到之后的日期函数
179 -- 第一种,日期格式(指定日期,需注意时区的问题)
180 WITH
181 toDate('2019-09-09') AS date,
182 toDateTime('2019-09-09 00:00:00') AS date_time
183 SELECT
184 addYears(date, 1) AS add_years_with_date,
185 addYears(date_time, 0) AS add_years_with_date_time;
186 -- 第二种,日期格式(当前,本地时间)
187 WITH
188 toDate(now()) as date,
189 toDateTime(now()) as date_time
190 SELECT
191 now() as now_time,-- 当前时间
192 addYears(date, 1) AS add_years_with_date,-- 之后1年
193 addYears(date_time, 1) AS add_years_with_date_time,
194 addMonths(date, 1) AS add_months_with_date,-- 之后1月
195 addMonths(date_time, 1) AS add_months_with_date_time,
196 addWeeks(date, 1) AS add_weeks_with_date,--之后1周
197 addWeeks(date_time, 1) AS add_weeks_with_date_time,
198 addDays(date, 1) AS add_days_with_date,-- 之后1天
199 addDays(date_time, 1) AS add_days_with_date_time,
200 addHours(date_time, 1) AS add_hours_with_date_time,--之后1小时
201 addMinutes(date_time, 1) AS add_minutes_with_date_time,--之后1分中
202 addSeconds(date_time, 10) AS add_seconds_with_date_time,-- 之后10秒钟
203 addQuarters(date, 1) AS add_quarters_with_date, -- 之后1个季度
204 addQuarters(date_time, 1) AS add_quarters_with_date_time;
206 -- 2.跳转到当前日期之前的函数(函数将Date/DateTime减去一段时间间隔,然后返回Date/DateTime)
207 WITH
208 toDate(now()) as date,
209 toDateTime(now()) as date_time
210 SELECT
211 subtractYears(date, 1) AS subtract_years_with_date,
212 subtractYears(date_time, 1) AS subtract_years_with_date_time,
213 subtractQuarters(date, 1) AS subtract_Quarters_with_date,
214 subtractQuarters(date_time, 1) AS subtract_Quarters_with_date_time,
215 subtractMonths(date, 1) AS subtract_Months_with_date,
216 subtractMonths(date_time, 1) AS subtract_Months_with_date_time,
217 subtractWeeks(date, 1) AS subtract_Weeks_with_date,
218 subtractWeeks(date_time, 1) AS subtract_Weeks_with_date_time,
219 subtractDays(date, 1) AS subtract_Days_with_date,
220 subtractDays(date_time, 1) AS subtract_Days_with_date_time,
221 subtractHours(date_time, 1) AS subtract_Hours_with_date_time,
222 subtractMinutes(date_time, 1) AS subtract_Minutes_with_date_time,
223
subtractSeconds(date_time, 1) AS subtract_Seconds_with_date_time;
225 SELECT toDate('2019-07-31', 'Asia/GuangZhou') as date_guangzhou;
226 SELECT toDate('2019-07-31'), toDate('2019-07-31', 'Asia/Beijing') as date_beijing;
227 -- 亚洲只能加载上海的timezone???
228 SELECT toDateTime('2019-07-31 10:10:10', 'Asia/Shanghai') as date_shanghai;
231 -- 计算连个时刻在不同时间单位下的差值
232 -- 第一种:指定时间计算差值示例
233 WITH
234 toDateTime('2019-07-30 10:10:10', 'Asia/Shanghai') as date_shanghai_one,
235 toDateTime('2020-10-31 11:20:30', 'Asia/Shanghai') as date_shanghai_two
236 SELECT
237 dateDiff('year', date_shanghai_one, date_shanghai_two) as diff_years,
238 dateDiff('month', date_shanghai_one, date_shanghai_two) as diff_months,
239 dateDiff('week', date_shanghai_one, date_shanghai_two) as diff_week,
240 dateDiff('day', date_shanghai_one, date_shanghai_two) as diff_days,
241 dateDiff('hour', date_shanghai_one, date_shanghai_two) as diff_hours,
242 dateDiff('minute', date_shanghai_one, date_shanghai_two) as diff_minutes,
243 dateDiff('second', date_shanghai_one, date_shanghai_two) as diff_seconds;
245 -- 第二种:本地当前时间示例
246 WITH
247 now() as date_time
248 SELECT
249 dateDiff('year', date_time, addYears(date_time, 1)) as diff_years,
250 dateDiff('month', date_time, addMonths(date_time, 2)) as diff_months,
251 dateDiff('week', date_time, addWeeks(date_time, 3)) as diff_week,
252 dateDiff('day', date_time, addDays(date_time, 3)) as diff_days,
253 dateDiff('hour', date_time, addHours(date_time, 3)) as diff_hours,
254 dateDiff('minute', date_time, addMinutes(date_time, 30)) as diff_minutes,
255 dateDiff('second', date_time, addSeconds(date_time, 35)) as diff_seconds;
257 -- timeSlot(StartTime, Duration, [,Size])
258 -- 它返回一个时间数组,其中包括从从“StartTime”开始到“StartTime + Duration 秒”内的所有符合“size”(以秒为单位)步长的时间点
259 -- 作用:搜索在相应会话中综合浏览量是非常有用的。
260 SELECT
261 timeSlots(toDateTime('2012-01-01 12:20:00'), toUInt32(600)) as dateTimeArray,
262 dateTimeArray[0] as arr_index_0, -- no result.
263 dateTimeArray[1] as arr_index_1, -- 2012-01-01 20:00:00
264 dateTimeArray[2] as arr_index_2, -- 2012-01-01 20:30:00
265 dateTimeArray[3] as arr_index_3, -- no result.
266 dateTimeArray[4] as arr_index_4; -- no result.
267 -- toUInt32(600) 表示之后间距20秒的时刻
268 SELECT
269 timeSlots(now(), toUInt32(600), 20) as dateTimeArray, -- 类似于:引用地址
270 dateTimeArray[0] as arr_index_0, -- no result.为什么?
271 dateTimeArray[1] as arr_index_1,
272 dateTimeArray[2] as arr_index_2,
273 dateTimeArray[3] as arr_index_3,
274 dateTimeArray[4] as arr_index_4,
275 dateTimeArray[5] as arr_index_5;
276 -- 指定时间为基准,之后每个元素增加20秒
277 SELECT
278 timeSlots(toDateTime('2012-01-01 12:20:00'), toUInt32(600), 20) as cur_dateTimeArray, -- 类似于:引用地址
279 cur_dateTimeArray[0] as arr_index_0, -- no result.为什么?
280 cur_dateTimeArray[1] as arr_index_1, -- 2012-01-01 20:20:00
281 cur_dateTimeArray[2] as arr_index_2, -- 2012-01-01 20:20:20
282 cur_dateTimeArray[3] as arr_index_3, -- 2012-01-01 20:20:40
283 cur_dateTimeArray[4]
as arr_index_4, -- 2012-01-01 20:21:00
284 cur_dateTimeArray[5] as arr_index_5; -- 2012-01-01 20:21:20
287 -- 六、字符串函数
288 --->>>>>> 字符串函数:
289 SELECT
290 length('hello world') as str_length, -- 按照Unicode编码计算长度“你好”的长度为6
291 empty('hello world'),-- 判断字符串是否为空,空为1,非空为0
292 notEmpty('hello world'),
293 lengthUTF8('hello world'), -- 按照实际字符计算长度“你好”为2
294 char_length('hello world'), -- 同 lengthUTF8()
295 character_length('hello world'), -- 同 lengthUTF8(),
296 lower('abcd123--'),--字母全部小写(将字符串中的ASCII转换为小写。)
297 upper('abcd123--'),--字母全部大写(将字符串中的ASCII转换为大写。)
298 lowerUTF8('abcd123-/*\8asd-\\'), -- abcd123-/*8asd-\
299 upperUTF8('abcd123--'), -- ABCD123--
300 isValidUTF8('abcd123--/*\*'); --检查字符串是否为有效的UTF-8编码,是则返回1,否则返回0。
301 SELECT notEmpty(''), notEmpty(NULL), notEmpty('he'); -- 0,空,1
302 SELECT toValidUTF8('\x61\xF0\x80\x80\x80b');
303 -- reverseUTF8():以Unicode字符为单位反转UTF-8编码的字符串。如果字符串不是UTF-8编码,则可能获取到一个非预期的结果(不会抛出异常)
304 SELECT reverse('abcdefg'), reverseUTF8('abcdefg');
305 -- 2.字符串维度自定义安排
306 SELECT format('{1} {0} {1}', 'World', 'Hello'); -- 输出:Hello World Hello
307 SELECT format('{0} {0} {1} {1}', 'one', 'two'); -- 输出:one one two two
308 SELECT format('{} {}', 'Hello', 'World'); -- 输出:Hello World
309 -- 3.字符串拼接 concat(s1,s2,s3,...)
310 SELECT concat('Hello',' ','World', '!');-- Hello World!
311 -- 与concat相同,区别在于,你需要保证concat(s1, s2, s3) -> s4是单射的,它将用于GROUP BY的优化。
312 SELECT concatAssumeInjective('Hello',' ','World', '!');-- Hello World!
313 -- 4.字符串截取:substring(s, offset, length), mid(s, offset, length), substr(s, offset, length)
314 -- 以字节为单位截取指定位置字符串,返回以‘offset’位置为开头,长度为‘length’的子串。‘offset’从1开始(与标准SQL相同)。‘offset’和‘length’参数必须是常量。
315 SELECT
316 substring('abcdefg', 1, 3),-- abc
317 substring('你好,世界', 1, 3),-- 你
318 substringUTF8('你好,世界', 1, 3); -- 你好,
319 -- 5.字符串拼接:appendTrailingCharIfAbsent(s, c)
320 -- 如果‘s’字符串非空并且末尾不包含‘c’字符,则将‘c’字符附加到末尾。
321 SELECT
322 appendTrailingCharIfAbsent('good','c'), -- goodc
323 appendTrailingCharIfAbsent('goodccc','c'); -- goodccc
324 -- 6.字符串编码转换:convertCharset(s, from, to) 返回从‘from’中的编码转换为‘to’中的编码的字符串‘s’。
325 SELECT
326 convertCharset('hello', 'UTF8','Unicode'),-- ��h
327 convertCharset('hello', 'Unicode', 'UTF8'),-- 桥汬�
328 convertCharset('hello', 'Unicode', 'ASCII'),--
329 convertCharset('hello', 'ascii', 'ascii'),--hello
330 convertCharset('hello', 'UTF8','UTF8');-- hello
331 SELECT
332 base64Encode('username+password'),-- dXNlcm5hbWUrcGFzc3dvcmQ=
333 base64Decode('dXNlcm5hbWUrcGFzc3dvcmQ='), -- username+password
334 -- 使用base64将字符串解码成原始字符串。但如果出现错误,将返回空字符串。
335 tryBase64Decode('dXNlcm5hbWUrcGFzc3dvcmQ=
');
336 -- 7.判断字符串是否已什么结尾或结束,返回1:true,0:flase
337 -- endsWith(s, suffix) 返回是否以指定的后缀结尾。如果字符串以指定的后缀结束,则返回1,否则返回0
338 -- startWith(s, prefix) 返回是否以指定的前缀开头。如果字符串以指定的前缀开头,则返回1,否则返回0。
339 SELECT
340 endsWith('string','g'),
341 startsWith('string', 'str'); -- 1 true
342 -- 8.删除左侧空白字符
343 -- trimLeft(s) 返回一个字符串,用于删除左侧的空白字符
344 -- trimRight(s) 返回一个字符串,用于删除右侧的空白字符
345 -- trimBoth(s) 返回一个字符串,用于删除左侧和右侧的空白字符
346 SELECT
347 trimLeft(' sdfdgs'), -- sdfdgs
348 trimRight('abcd '), -- abcd
349 trimBoth(' abcd '); -- abcd
351 -- 七、字符串搜索函数
352 --->>>>>> 字符串搜索函数
353 -- pasition(haystack, needle), 显示needle在haystack的第一个出现的位置。
354 SELECT
355 POSITION('2121stringstrstrstrstr','str') AS positionSearch, -- 5
356 POSITION('你好,hello,12323-你好,你,好sdfd*dg', '你,好'),-- 31
357 positionUTF8('n12你好','你好') AS positionUTF8,-- 4
358 positionCaseInsensitive('ABCDCDEFABCD','bc') AS positionCaseInsensitive, --2
359 locate('hellohellohellohello','ello'); -- 2
360 -- multiSearchAllPositions(haystack, [needle1, needle2, ..., needlen])
361 -- 注意:在所有multiSearch*函数中,由于实现规范,needles的数量应小于2^8。
362 -- 函数返回一个数组,其中包含所有匹配needlei的位置
363 SELECT
364 multiSearchAllPositions('goodnamegoodnamegoodhellohihihi', ['dn', 'good']) as multiSearch,-- [4,1]
365 multiSearchAllPositionsCaseInsensitive('nameSsdfagpSSDFDFetgfderef', ['SS','fa']) as multiCaseInsensitive,
366 multiSearchAllPositionsUTF8('nameSsdfazz轴功率gpSSDFDFetgfderef', ['Ss','fa', 'zz轴']) AS multiSearchUTF8,
367 multiSearchAllPositionsCaseInsensitiveUTF8('nameSsdfazz轴功率gpSSDFDFetgfderef', ['Ss','fa', 'zz轴']) AS multiCaseInsensitiveUTF8;
368 -- 检查字符串是否与pattern正则表达式匹配。pattern可以是一个任意的re2正则表达式。 re2正则表达式的语法比Perl正则表达式的语法存在更多限制。
369 -- match(haystack, pattern) 匹配到了则返回1,否则返回0
370 SELECT
371 match('1232434sadgaDDFSrefds', '[0-9a-zA-Z]'), -- 存在匹配的字符,返回1
372 match('1232321', '[a-z]'); -- 不存在匹配的字符,返回0
373 -- 与match相同,但如果所有正则表达式都不匹配,则返回0;如果任何模式匹配,则返回1。它使用hyperscan库。对于在字符串中搜索子字符串的模式,最好使用“multisearchany”,因为它更高效。
374 -- multiMatchAny(haystack, [pattern1, pattern2, ..., patternn])
375 -- 注意:任何haystack字符串的长度必须小于232字节,否则抛出异常。这种限制是因为hyperscan API而产生的。
376 -- 多个正则表达式对原始字符进行匹配,如若只有一个正则表达式匹配上了则返回1,否则返回0
377 SELECT
378 multiMatchAny('abcABC',['[0-9]','[a-zA-Z]']) AS multiMatchAnyOne, -- 1
379 multiMatchAny('123abcABC',['[0-9]','[a-zA-Z]']) AS multiMatchAnyTwo, --1
380 -- 与multiMatchAny相同,但返回与haystack匹配的任何内容的索引位置。
381 multiMatchAnyIndex('123abcABC', ['[0-9]','[a-zA-Z]']) as multiMatchAnyIndex; --2
382 -- 模糊匹配:like()函数,注意大写敏感。
383 -- % 表示任何字节数(包括零字符)
384 -- _ 表示任何一个字节
385 SELECT
386 'hello' LIKE '%h%' as LIKE_UP, -- 1
387 'hello' like 'he' AS like_low, -- 0
388 'hello' not like 'he' AS not_like, -- 1
389 'hello' like '%he%' AS like_litter, -- 1
390 like('adgadgadfa1232', '_12_') AS like_func,
391 like('sdfasdfasd', '[a-z]') AS like_func2, -- 0
392 notLike('1232423', '[a-zA-Z]') AS not_like_func; -- 1
393 -- 使用字符串截取字符串:extract(haystack, pattern)
394 -- 使用正则表达式截取字符串。如果‘haystack’与‘pattern’不匹配,则返回空字符串。如果正则表达式中不包含子模式,它将获取与整个正则表达式匹配的子串。否则,它将获取与第一个子模式匹配的子串。
395 SELECT
396 extractAll('hellogoodaimantIdeaIDEAfasd123232', '[0-9]'
), -- ['1','2','3','2','3','2']
397 extractAll('12323dSDFRE', '[A-Z]'),-- ['S','D','F','R','E']
398 extract('helloclickhouse', '[a-z]');-- h
399 -- ngramSearch(haystack, needle)
400 -- 基于4-gram计算haystack和needle之间的距离:计算两个4-gram集合之间的对称差异,并用它们的基数和对其进行归一化。
401 -- 返回0到1之间的任何浮点数 -- 越接近0则表示越多的字符串彼此相似。
402 -- 如果常量的needle或haystack超过32KB,函数将抛出异常。如果非常量的haystack或needle字符串超过32Kb,则距离始终为1。
403 SELECT
404 ngramDistance('hello123456789','123') AS ngramDistance,
405 ngramDistanceCaseInsensitive('hello123456789','123') AS ngramDistanceCaseInsensitive,
406 ngramDistanceUTF8('hello123456789','123') AS ngramDistanceUTF8,
407 ngramDistanceCaseInsensitiveUTF8('hello123456789','123') AS ngramDistanceCaseInsensitiveUTF8;
408 -- 注意:对于UTF-8,我们使用3-gram。所有这些都不是完全公平的n-gram距离。
409 -- 我们使用2字节哈希来散列n-gram,然后计算这些哈希表之间的(非)对称差异 - 可能会发生冲突。
410 -- 对于UTF-8不区分大小写的格式,我们不使用公平的tolower函数
411 -- 我们将每个Unicode字符字节的第5位(从零开始)和字节的第一位归零
412 -- 这适用于拉丁语,主要用于所有西里尔字母。
414 --八、字符串替换函数
415 --->>>>>> 字符串替换函数
416 -- 替换匹配到的字符串
417 -- replaceOne(haystack, pattern, replacement)
418 -- 用‘replacement’子串替换‘haystack’中与‘pattern’子串第一个匹配的匹配项(如果存在)。 ‘pattern’和‘replacement’必须是常量。
419 -- replaceAll(haystack, pattern, replacement), replace(haystack, pattern, replacement)
420 -- 用‘replacement’子串替换‘haystack’中出现的所有‘pattern’子串。
421 SELECT
422 replaceOne('hed1234544', '4', '*') AS replaceOne,-- hed123*544
423 replaceRegexpOne('hed1234544', '4', '*') AS replaceRegexpOne,-- hed123*544
424 replace('hed1234544', '4', '*') AS replace, -- hed123*5**
425 replaceAll('hed1234544', '4', '*') AS replaceAll;-- hed123*5**
427 -- 实例:2019-07-31 改变成 07/31/2019
428 SELECT
429 toDate(now()) AS now_date,
430 replaceRegexpOne(toString(now_date), '(\\d{4})-(\\d{2})-(\\d{2})', '\\2/\\3/\\1') AS format_date;
431 -- 示例:赋值字符串10次
432 SELECT replaceRegexpOne('Hello, World!', '.*', '\\0\\0\\0\\0\\0\\0\\0\\0\\0\\0') AS res;
433 -- replaceRegexpAll(haystack, pattern, replacement)
434 -- 与replaceRegexpOne相同,但会替换所有出现的匹配项。例如:
435 SELECT replaceRegexpAll('hello,world!', '.', '\\0\\0') as res; -- hheelllloo,,wwoorrlldd!!
436 SELECT replaceRegexpAll('hello o o, world.', ' ', '*') as res; -- hello*o*o,*world.
438 -- 函数:regexpQuoteMeta(s) 该函数用于在字符串中的某些预定义字符之前添加反斜杠。
439 -- 预定义字符:'0','\','|','(',')','^','$','。','[',']','?','* ','+','{',':',' - '。
440 -- 这个实现与re2 :: RE2 :: QuoteMeta略有不同。它以\0而不是\x00转义零字节,它只转义所需的字符
441 ---- 简言之,就是不处理转义字符,一般如果没有用的这个函数,都会有转义的情况出现。
442 SELECT regexpQuoteMeta('\\\\|[]{}+_-=@!~`&^*%$#'); -- \\\\\|\[\]\{}\+_\-=@!~`&\^\*%\$#
443
SELECT toString('\\\\'); -- \\
446 --九、条件函数
447 --->>>>>> 条件函数
448 -- 1. if(cond, then, else)函数:类似于三元操作符。
449 -- 中文字符使用双引号,英文字符可不使用引号也可使用当引号或双引号,根据具体情况而定。
450 -- 如果cond != 0则返回then,如果cond = 0则返回else。 cond必须是UInt8类型,then和else必须存在最低的共同类型。
451 -- 注意:then和else可以是NULL
452 SELECT
453 12 > 10 ? 'desc' : 'asc' AS "三元操作符",
454 if(12 > 10, 'desc' , 'asc') AS "if()函数",
455 if(12 > 10, NULL, NULL);
456 -- 2. multiIf(cond_1, then_1, cond_2, then_2...else)
457 -- 允许您在查询中更紧凑地编写CASE运算符。类似于java中的switch语法(可以接受2n+1个参数)
458 SELECT multiIf(1,'one',2,'two',3,'three','not this index');-- 关联case条件表达式
460 --十、数学函数
461 --->>>>>> 数学函数
462 SELECT
463 1 * e() AS E,
464 1 * pi() AS PI,
465 sqrt(25) AS sqrt_25, --接受一个数值类型的参数并返回它的平方根。
466 cbrt(27) AS cbrt_27, --接受一个数值类型的参数并返回它的立方根。
467 exp(10), --接受一个数值类型的参数并返回它的指数
468 exp10(10), --接受一个数值类型的参数并返回它的10的x次幂。
469 log(10) AS LOG,
470 log2(10) AS LOG2, --接受一个数值类型的参数并返回它的底2对数。
471 ln(e()) AS LOG10; --接受一个数值类型的参数并返回它的自然对数
472 -- 示例:三西格玛准则
473 SELECT erf(3 / sqrt(2)); -- 0.997
474 SELECT
475 sin(90), -- 返回x的三角正弦值。
476 cos(90), -- 返回x的三角余弦值。
477 tan(90), -- 返回x的三角正切值
478 acos(0), -- 返回x的反三角余弦值。
479 asin(1), -- 返回x的反三角正弦值。
480 atan(45); -- 返回x的反三角正切值。
481 -- pow(x, y), power(x, y) 接受x和y两个参数。返回x的y次方。
482 SELECT
483 pow(2, 3), -- 2的三次方
484 pow(3, 2); -- 3的平方
485 SELECT
486 intExp2(4), --2^4 接受一个数值类型的参数并返回它的2的x次幂(UInt64)。
487 intExp10(2);--10^2 接受一个数值类型的参数并返回它的10的x次幂(UInt64)。
489 -- 十一、取整函数
490 --->>>>>> 取整函数
491 -- 1.向下取整:floor(x[,N])
492 SELECT
493 floor(toFloat32(12.08098), 2), -- 12.08
494 floor(toFloat32(12.2323), 2), -- 12.23
495 floor(toFloat32(12.89788), -1), -- 10
496 floor(toFloat32(12.09590), 3), -- 12.095 (注意:如果按照正常的四舍五入,则应该是12.096,为什么呢?)
497 floor(toFloat32(12.0987), 3),-- 12.098
498 floor(10, 2); -- 10
499 -- 2.四舍五入:round(expression [, decimal_places])
500 -- 如果decimal_places=0,则取整数;
501 -- 如果>0,则将值舍入小数点右侧;
502 -- 如果<0,则将小数点左侧的值四舍五入。
503 SELECT
504 round(toFloat32(12.1234), 3),
505 round(toFloat32(12.0025), 3), -- 12.002(注意:为什么不是12.003呢?)
506 -- round函数只会最多保留三位有效数字
507 round(toFloat32(12.0025), 4), -- 12.002
508 round(toFloat32(12.0025002323), 100); -- 12.003
509 -- 示例:
510 SELECT
511 round(toFloat32(10 / 3)), -- 3
512 round(toFloat32(10 / 3), 2), -- 3.33
513 round(toFloat32(10.000/3), 3), -- 3.333
514 round(toFloat32(10.000/3), 6); -- 3.333
515 -- roundToExp2() 接受一个数字。如果数字小于1,则返回0。否则,它将数字向下舍入到最接近的(整个非负)2的x次幂。
516 SELECT
517 roundToExp2(12.0129), -- 8 = 2^3
518 roundToExp2(toFloat32(0.01)); -- 0.008
519 -- 3.向上取整:ceil(x[, N]) 或者 ceiling(x[, N])
520 SELECT
521 ceil(12.34343, 3), -- 12.344
522 ceil(toFloat64(12.34343), 3), -- 12.344
523 ceil(toFloat32(12.34343), 3), -- 12.344
524 ceil(12.0011, 3); -- 12.002
527 ---十二、数组函数
528 --->>>>>> 数组函数
529 -- 1.数组非空判断相关函数(真为1,假为0)
530 SELECT empty([]), empty([1,2,3]), notEmpty([1,2,3]), notEmpty([]);
531 -- 2.数组长度 length() 返回数组中的元素个数。 结果类型是UInt64。 该函数也适用于字符串。
532 SELECT
533 -- length(), -- 出现异常
534 -- length([true, false]), -- 异常
535 -- length([1,2,,4]), --出现异常!
536 length([]), -- 0
537 length(['a','b','c']), -- 3
538 length([1,2,3]); -- 3
539 -- 3.扩展判断非空的部分函数如下:不接受任何参数并返回适当类型的空数组
540 SELECT
541 emptyArrayUInt8(), -- UInt8的空数组
542 emptyArrayUInt16(),
543 emptyArrayUInt32(),
544 emptyArrayUInt64(),
545 emptyArrayDate(),
546 emptyArrayDateTime(),
547 emptyArrayInt8(),
548 emptyArrayInt16(),
549 emptyArrayInt32(),
550 emptyArrayInt64();
551 -- 接受一个空数组并返回一个仅包含一个默认值元素的数组。(以下是部分示例)
552 SELECT
553 emptyArrayToSingle(emptyArrayInt32()), -- 0
554 emptyArrayToSingle(emptyArrayUInt32()), -- 0
555 emptyArrayToSingle(emptyArrayDate()), -- 0002-11-30
556 emptyArrayToSingle(emptyArrayDateTime()); --0002-11-30 08:00:00
557 -- 4.生成一个含有N个元素的数组,元素从0开始增长,步长尾1.
558 -- range(N) 返回从0到N-1的数字数组。 以防万一,如果在数据块中创建总长度超过100,000,000个元素的数组,则抛出异常
559 SELECT
560 range(10), -- [0,1,2,3,4,5,6,7,8,9]
561 range(2), -- [0,1]
562 -- range(5.5), -- 出现异常,N为Int8的数据类型,正整数
563 -- range(-10), -- 出现异常,DB::Exception: Illegal type Int8 of argument of function range
564 range(1); -- 0
565 -- 5.新建一个数组的函数:array(x1,……) 类似于 直接[x1,……]
566 -- 注意:新建数组的每个元素的数据类型需保持一致性。
567 SELECT
568 array(1,2,2,3,4) AS "array()函数",
569 -- [1,'hello',3], -- 出现异常,DB::Exception: There is no supertype for types UInt8, String, UInt8 because some of them are String/FixedString and some of them are not (version 19.10.1.5 (official build))
570 [1,2,3,4] AS "[ ]";
571 -- 6.合并N个数组 arrayConcat(arrays) 合并参数中传递的所有数组。跟java的数组差不多的合并,不会自动去重,不会自动排序
572 SELECT
573 arrayConcat(array(1,2),array(2,3),array(4,5)), -- [1,2,2,3,4,5](第一种情况)
574 arrayConcat(array(1,1),array(2,2),array(3,3)), -- [1,1,2,2,3,3]
575 -- arrayConcat(array(1,2),['a','c'],array(3,3)), -- 出现异常,不能将不同类型的数组进行合并
576 arrayConcat(array(1,1),[2,3],array(4,5)); -- [1,1,2,3,4,5]
577 -- 7.从数组arr中获取索引为“n”的元素。
578 -- n必须是任何整数类型。 数组中的索引从一开始。 支持负索引。在这种情况下,它选择从末尾开始编号的相应元素。例如,arr [-1]是数组中的最后一项。
579 -- 如果索引超出数组的边界,则返回默认值(数字为0,字符串为空字符串等).
580 SELECT
581 arrayElement(array(10,20,3), 1), -- 10
582 arrayElement(array(1,20,3), 2), -- 20
583 arrayElement(array(1,2,30), 3), -- 30
584 arrayElement(array(10,20,3), 0), -- 0
585 arrayElement(array(10,20,3), -3), -- 10
586 arrayElement(array(10,20,3), -2), -- 20
587 arrayElement(array(10,20,3), -1);-- 3
588 -- 8.检查在数组中是否含有此元素。has(arr, elem) 包含此元素则返回1,否则返回0
589 -- has() 检查'arr'数组是否具有'elem'元素。 如果元素不在数组中,则返回0;如果在,则返回1。
590 -- hasAny(arr1, arr2) 返回1表示arr1和arr2存在交集。否则返回0.
591 --注意:特殊的定义:
592 -- ① “NULL”作为数组中的元素值进行处理。
593 -- ② 忽略两个数组中的元素值的顺序
594 -- hasAll(set, subset) 检查一个数组是否是另一个数组的子集。返回1,表示set包含subset中所有的元素
595 -- set – 具有一组元素的任何类型的数组。
596 -- subset – 任何类型的数组,其元素应该被测试为set的子集。
597 -- 注意:特殊的定义:
598 -- ① 空数组是任何数组的子集。
599 -- ② “NULL”作为数组中的元素值进行处理。
600 -- ③ 忽略两个数组中的元素值的顺序。
601 SELECT
602 has([1,2,3], 2), -- 1
603 has(array(1,2,3),2), -- 1
604 has([1,2,NULL], NULL), -- 1 (注意:null值的处理)
605 -- has([], 2), -- 出现异常,DB::Exception: Types of array and 2nd argument of function has must be identical up to nullability or numeric types or Enum and numeric type. Passed: Array(Nothing) and UInt8
606 has([1,2], 3); -- 0
607 SELECT
608 hasAll([], []), -- 1
609 hasAll([1,NULL,NULL], [NULL]), -- 1
610 hasAll([1,2,3], [1,2]), -- 1
611 hasAll([1,2,2,3], [2]), -- 1
612 hasAll(array(1,2,2,3), [2]), -- 1
613 hasAll([1,2,3], [4,5]); -- 0
614 -- 多重数组(如下的二维数组)。
615 SELECT hasAll([[1, 2], [3, 4]], [[1, 2], [3, 5]]); -- 0
616 SELECT
617 hasAny(array(1,2,3), array(1)), -- 1
618 hasAny(array(1,2,3), array(1,4,56,80)), -- 1
619 -- []与array()是一样的含义,本质上是一直的。只不过[]更加简便而已。
620 hasAny(array(), array()), -- 0
621 hasAny([],[]), -- 0
622 hasAny([1],[]), -- 0
623 -- 空数组跟null不是一样的对象
624 hasAny([1,NULL],[]), -- 0
625 hasAny([1,NULL],[NULL,2]); -- 1
628 -- 9.返回数组指定元素的索引
629 -- indexOf(arr, x) 返回数组中第一个‘x’元素的索引(从1开始),如果‘x’元素不存在在数组中,则返回0。
630 SELECT indexOf(['one','two','three'], 'one'); -- 1
631 SELECT indexOf([1, 2, 4], 4); -- 3
632 SELECT
633 indexOf(['one','two','three'], 'one'), -- 1
634 indexOf(['one',NULL,NULL], NULL),-- 1返回第一个找到的元素的索引位置
635 indexOf([1, 2, 4], 4); -- 3
636 -- 数组元素的以第一个和最后一个元素。
637 SELECT length([12,3,4,4,4]);
638 SELECT array(12,22,31)[1];
640 WITH
641 [23,43,565,2,32,34] AS arr
642 SELECT
643 arr[1], -- 去除数组中的第一个元素
644 arr[length(arr)]; -- 提取元素中的最后一个元素
646 -- 10.计算数组中包含指定元素的个数
647 -- countEqual(arr, x) 返回数组中等于x的元素的个数。相当于arrayCount(elem - > elem = x,arr)。
648 -- 注意:null值将作为单独的元素值处理。
649 SELECT
650 countEqual([1, 2, 2, 2, 3, 4], 2), -- 3
651 countEqual([1, 2, NULL, NULL], NULL); -- 2
653 -- 11.arrayEnumerate(arr) 返回 Array [1, 2, 3, ..., length (arr) ] 此功能通常与ARRAY JOIN一起使用。它允许在应用ARRAY JOIN后为每个数组计算一次。
654 SELECT arrayEnumerate([1,20,20,3]); -- [1,2,3,4]
655 SELECT arrayEnumerate(array(11,20,13)); -- [1,2,3]
656 SELECT arrayEnumerate(array(11,20,13,NULL)); -- [1,2,3,4] 注意:null也算是一个元素。
657 --arrayEnumerateUniq(arr) 返回与源数组大小相同的数组,其中每个元素表示与其下标对应的源数组元素在源数组中出现的次数
658 SELECT arrayEnumerateUniq([1,1,2,2]); -- [1,2]
660 -- 12.删除数组的元素
661 -- arrayPopBack(array) 删除数组array的最后一项
662 SELECT arrayPopBack(array(1,2,3,0)) AS res; -- [1,2,3]
663 -- arrayPopFront(array) 从数组中删除第一项
664 SELECT arrayPopFront(array(0,1,2,3)) AS res; -- [1,2,3]
666 -- 13.添加数组的元素 arrayPushFront(array, single_value) single_value是单个值
667 SELECT arrayPushBack([1,2,3], 0) AS res; -- [1,2,3,0]
668 SELECT arrayPushFront([1,2,3], 0) AS res; -- [0,1,2,3]
670 -- 14.更改数组的长度 arrayResize(arr, size[, extender])
671 -- 如果arr的长度 > size,则会对arr截取size的长度;
672 -- 如果arr的长度 < size,则其余位置用对应数据类型的默认值填充。
673 -- 注意:extender含义是扩展元素的值。如果没有指定extender,则默认按照对应的数据类型的默认值进行赋值。否则按照extender进行填充。
674 SELECT arrayResize([1,2,3], 5); -- [1,2,3,0,0]
675 SELECT arrayResize([1,2,3], 2); -- [1,2]
676 SELECT arrayResize([1,2,3], 3); -- [1,2,3]
677 --↓↓↓ RuntimeException: Parse exception: ByteFragment{[[[1,2],[3,4],[5,6],[],[]]], start=0, len=25}
678 SELECT arrayResize([array(1,2),array(3,4),array(5,6)], 5);
679 SELECT arrayResize([1,2,3], 5, 12); -- [1,2,3,12,12]
680 SELECT arrayResize(['one','two','three'], 5); -- ['one','two','three','','']
681 SELECT arrayResize(['one','two','three'], 5, 'default'); -- ['one','two','three','default','default']
683 -- 15.截取数组的部分元素,得到一个新的子数组
684 -- arraySlice(array, offset[, length])
685 -- 解释:
686 -- array: 数组,
687 -- offset – 数组的偏移。正值表示左侧的偏移量,负值表示右侧的缩进值。数组下标从1开始。
688 -- length - 子数组的长度。如果指定负值,则该函数返回[offset,array_length - length。如果省略该值,则该函数返回[offset,the_end_of_array]。
689 SELECT
690 arraySlice([1,2,3,4,5,6], 0, 3), -- 无返回值
691 arraySlice([1,2,NULL,5,6], 1, 3), -- [1,2,0]
692 arraySlice(['one','two',NULL], 1, 3), -- ['one','two','']
693 arraySlice([1,2,3,4,5,6], 1, 3); -- [1,2,3]
695 -- 16.数组排序:arraySort([func,] arr, ……)
696 -- 注意:如果在字符串数组中,''和NULL是需要特别对待的,''需要放在最前面,而NULL则是按顺序存放到最后的。
697 -- arraySort是高阶函数。您可以将lambda函数作为第一个参数传递给它。在这种情况下,排序顺序由lambda函数的调用结果决定。
698 SELECT
699 arraySort(['a','',NULL,'c','b']) AS hasNullempty1, --['','a','b','c',''] (第一个是'',最后一个''起始是NULL)
700 arraySort(array('ac','ab','bc','ad',NULL)) AS hasNull, -- ['ab','ac','ad','bc','']
701 arraySort(array('ac','','ab',NULL,'bc','ad',NULL)) AS hasNullempty2, -- ['','ab','ac','ad','bc','','']
702 arraySort([5,4,3,2,1]) AS numSorted,-- [1,2,3,4,5] (数字排序)
703 arraySort(['ca','bb','ac']) AS strSorted;-- ['ac','bb','ca'] (字符串排序)
704 SELECT
705 arraySort([NULL, 1, 3, NULL, 2]) AS sortedArr, -- [1,2,3,0,0]
706 arrayReverse(sortedArr) AS reverseSortdArr;-- [0,0,3,2,1]
707 -- 下面这种排序的实质,正数转成负数,再在数学上比较升序排序。
708 SELECT arraySort(x -> -x, [1,2,3]) as res; -- [3,2,1] 降序:(高阶函数用法)
709 SELECT arraySort((x) -> -x, [1,2,3]) as res; -- [3,2,1] 降序:(高阶函数用法)
710 SELECT arraySort(x -> x, [5,4,3,1,2,3]) as res; -- [1,2,3,3,4,5] 升序:(高阶函数用法)
711 SELECT arraySort((x) -> x, [5,4,3,1,2,3]) as res; -- [1,2,3,3,4,5] 升序:(高阶函数用法)
712 -- arraySort(lambda, arr1, arr2)
713 SELECT arraySort((x, y) -> y, ['hello', 'world'], [2, 1]) as res; -- ['world','hello']
714 SELECT arraySort((x, y) -> -y, [0, 1, 2], [1, 2, 3]) as res; -- [2,1,0]
715 -- 再次提醒:NULL, NaN, Inf的排序顺序:
716 -- 含义:
717 -- -Inf 是数组中的第一个。
718 -- NULL 是数组中的最后一个。
719 -- NaN 在NULL的前面。
720 -- Inf 在NaN的前面。
721 -- 出现异常:RuntimeException: Parse exception:
722 -- ByteFragment{[[-inf,-4,1,2,3,inf,nan,nan,NULL,NULL]], start=0, len=37}
723 SELECT arraySort([1, nan, 2, NULL, 3, nan, -4, NULL, inf, -inf]);
725 -- 17.数组翻转:arrayReverse([func,] arr, ……)
726 -- 如果是NULL的话在排序的过程中,根据数组的数据类型进行默认值填充。
727 SELECT
728 arrayReverse(array('a','b','c',NULL)) AS hasOneNull, -- ['','c','b','a']
729 arrayReverse(array('ac','ab','bc','ad',NULL)) AS hasNull, -- ['','ad','bc','ab','ac']
730 --网格视图: ['[NULL]','ad','bc','','ab','[NULL]','','ac'];文本视图 :['','ad','bc','','ab','','','ac']
731 arrayReverse(array('ac','',NULL,'ab','','bc','ad',NULL)) AS hasNullEmpty,
732 arrayReverse(array(NULL, 3, NULL, 2, 1)),-- [1,2,0,3,0]
733 arrayReverse([1,2,3,4]);-- [4,3,2,1]
735 -- 18.数组排序并翻转:arraySort([func,] arr, ...)
736 SELECT arrayReverseSort([1, 3, 3, 0]); -- [3,3,1,0]
737 SELECT arrayReverseSort(['hello', 'world', '!']); -- [
'world','hello','!']
738 --RuntimeException: Parse exception: ByteFragment{[[inf,3,2,1,-4,-inf,nan,nan,NULL,NULL]], start=0, len=37}
739 SELECT arrayReverseSort([1, nan, 2, NULL, 3, nan, -4, NULL, inf, -inf]) as res;-- [inf,3,2,1,-4,-inf,nan,nan,NULL,NULL]
740 -- 下面的执行顺序为:
741 -- 1.首先,根据lambda函数的调用结果对源数组([1, 2, 3])进行排序。 结果是[3, 2, 1]。
742 -- 2.反转上一步获得的数组。 所以,最终的结果是[1, 2, 3]。
743 SELECT arrayReverseSort((x) -> -x, [1, 2, 3]) as res; -- [1,2,3]
744 SELECT arrayReverseSort((x) -> x, [1, 2, 3]) as res; -- [1,2,3]
745 -- 下面的执行顺序为:
746 -- 1.首先,根据lambda函数的调用结果对源数组(['hello','world'])进行排序。 其中,在第二个数组([2,1])中定义了源数组中相应元素的排序键。 所以,排序结果['world','hello']。
747 -- 2.反转上一步骤中获得的排序数组。 所以,最终的结果是['hello','world']。
748 SELECT arrayReverseSort((x, y) -> y, ['hello', 'world'], [2, 1]) as res;-- ['hello','world']
749 SELECT arrayReverseSort((x, y) -> -y, ['hello', 'world'], [2, 1]) as res;-- ['world','hello']
750 SELECT arrayReverseSort((x, y) -> x, ['hello', 'world'], [2, 1]) as res;-- ['world','hello']
751 --出现异常:Illegal type String of argument
752 --SELECT arrayReverseSort((x, y) -> -x, ['hello', 'world'], [2, 1]) as res;
753 SELECT arrayReverseSort((x, y) -> x, ['hello', 'world'], [1, 2]) as res;-- ['world','hello']
755 -- 19.统计数组中不重复元素的个数。arrayUniq(arr,……)
756 -- ① 如果传递一个参数,则计算数组中不同元素的数量。
757 -- ② 如果传递了多个参数,则它计算多个数组中相应位置的不同元素元组的数量
758 SELECT
759 arrayUniq([1,2,3]), -- 3
760 arrayUniq([1,2,2,2,3]); -- 3
761 SELECT
762 arrayUniq([1,2,3],[2,3,4]),
763 arrayUniq([1,2,2],[1,3,3]);
765 -- 20.数组的特殊功能:arrayJoin(arr) 这是一个非常有用的函数。
766 -- 解释:此函数将数组作为参数,并将该行在结果集中复制数组元素个数
767 SELECT arrayJoin([1, 2, 3] AS src) AS dst, 'Hello', src;
768 -- 每个元素扩大两倍;
769 SELECT arrayJoin([1,2,3]) * 2;
770 SELECT arrayJoin([-1,-2,0,1,2]) * 2;
771 --出现异常: Illegal types Array(UInt8) and Array(UInt8) of arguments of function multiply
772 --SELECT multiply(array(1,2,3), 2);
773 SELECT multiply(arrayJoin([-1,-2,0,1,2]), 2);
774 -- 每个元素缩小两倍
775 SELECT arrayJoin([-4,-2,0,2,4]) / 2;
776 SELECT divide(arrayJoin([-4,-2,0,2,4]) , 2);
779 -- 21.arrayDifference(arr)
780 -- 返回一个数组,其中包含所有相邻元素对之间的差值
781 SELECT arrayDifference([1,2,3,4]);-- [0,1,1,1]
782 SELECT arrayDifference([1,3,10,50]);-- [0,2,7,40]
785 -- 22. arrayDistinct(arr)返回一个包含所有数组中不同元素的数组.
786 -- 类似于java的Set集合,对list集合进行去重。
787 SELECT arrayDistinct(array(1,2,3,4,4,4)); -- [1,2,3,4]
788 SELECT arrayDistinct([1,2,2,3,4,2,2,5,4,5]); -- [1,2,3,4,5]
789 SELECT arrayDistinct(array(0,1,NULL,3,4,4,4)); -- [0,1,3,4]
790 -- 数组去重统计元素个数
791 SELECT uniq(arrayJoin([1,2,3,6,3])); -- 4 表示数组去重后元素的个数
792 SELECT uniqArray([1,2,3,4,1,2,3,4]); -- 4 表示数组去重后元素的个数
793 -- 数组元素累计
794 SELECT sumArray([1,2,3,4,5]);-- 15
795 SELECT sum(arraySum([1,2,3,4,5])); -- 15
798 -- 23. arrayEnumerateDense(arr) 返回与源数组大小相同的数组,指示每个元素首次出现在源数组中的位置
799 SELECT
800 arrayEnumerateDense([10,20,20,10,30]) AS numArrEnumDense,-- [1,2,2,1,3]
801 -- [1,1,2,3,4,1,3,5,5]
802 arrayEnumerateDense([10,10,2,12,3,10,12,NULL,NULL]) as arrEnumDenseHasNull,
803 -- [1,2,1,1,2,3]
804 arrayEnumerateDense([10,20,10,10,20,30]) AS arrEnumDese2;
806 -- 24. arrayIntersect(arr,……) 返回所有数组元素的交集。
807 -- 如果arr的数目只有一个,则返回它本身;如果有多个数组,则返回所有数组中元素的交集。
808 SELECT
809 -- 注意:最后得到的数组元素的顺序。(有什么影响吗?)
810 arrayIntersect(['one','two'],['one','two','three']) as uniStrArr1, -- ['two','one']
811 arrayIntersect(['aaa','bbb'],['bbb','aaa','three']) as uniStrArr2, -- ['bbb','aaa']
812 arrayIntersect([1,2],[1,2,3]) as uniArr1, -- [1,2]
813 arrayIntersect([1,2],[1,2,3],[2,3,4],[2,3,4]) as uniArr2; -- 2
814 SELECT
815 arrayIntersect([1,2], [3,4]), -- []
816 arrayIntersect([1,2]);-- [1,2]
818 -- 25.arrayReduce(agg_func, arr1, ...)
819 -- agg_func 为聚合函数,传入到数组当中。
820 -- 将聚合函数应用于数组并返回其结果.如果聚合函数具有多个参数,则此函数可应用于相同大小的多个数组。
821 SELECT
822 arrayReduce('max', [1,2,3]) AS minNum,--最大值 3
823 arrayReduce('min', [1,2,3]) AS maxNum,--最小值 1
824 arrayReduce('sum', [1,2,3]) AS sumNum;--求和 6
826 -- 十三、 字符串查分合并函数
827 --->>>>>> 字符串拆分合并函数
828 -- 1.splitByChar(separator, s) 将字符串以‘separator’拆分成多个子串。
829 -- ‘separator’必须为仅包含一个字符的字符串常量。 返回拆分后的子串的数组。
830 -- 如果分隔符出现在字符串的开头或结尾,或者如果有多个连续的分隔符,则将在对应位置填充空的子串。
831 SELECT splitByChar(',', 'hello,world!'); -- [
'hello','world!']
832 --下面异常:Illegal separator for function splitByChar. Must be exactly one byte.
833 --SELECT splitByChar('or', 'hello,world!');
835 -- 2.splitByString(separator, s)
836 -- 与上面相同,但它使用多个字符的字符串作为分隔符。 该字符串必须为非空
837 SELECT splitByString('or','goodorniceorgreat'); -- ['good','nice','great']
839 -- 3.alphaTokens(s) 从范围a-z和A-Z中选择连续字节的子字符串。返回子字符串数组
840 SELECT alphaTokens('abca1abc'); -- ['abca','abc']
841 SELECT alphaTokens('abc1232abc2wer3rtty'); -- ['abc','abc','wer','rtty']
843 -- 4.数组元素合并函数:arrayStringConcat(arr[, sparator])
844 -- 使用separator将数组中列出的字符串拼接起来。
845 -- ‘separator’是一个可选参数:一个常量字符串,默认情况下设置为空字符串。 返回拼接后的字符串
846 SELECT arrayStringConcat([1,2,3], '-'); -- 出现异常,要求数组必须是字符串string类型的元素
847 SELECT arrayStringConcat(['one','two','three']); -- onetwothree
848 SELECT arrayStringConcat(['one','two','three'], '-'); -- one-two-three
849 SELECT arrayStringConcat(['one','two','three',''], '-');-- one-two-three- 注意:NULL不能存在arr中
852 --十四、位操作符
853 --->>>>>> 位操作符
854 --位操作函数适用于UInt8,UInt16,UInt32,UInt64,Int8,Int16,Int32,Int64,Float32或Float64中的任何类型。
855 --结果类型是一个整数,其位数等于其参数的最大位。
856 --如果至少有一个参数为有符数字,则结果为有符数字。如果参数是浮点数,则将其强制转换为Int64。
857 SELECT
858 bitAnd(1,0), -- 0
859 bitAnd(1,1), -- 1
860 bitAnd(1,2), -- 0
861 bitAnd(-1,0), -- 0
862 bitAnd(-1,-2), -- -2
863 bitAnd(-10,-1), -- -10
864 bitOr(1,2), -- 3
865 bitOr(1,0), -- 1
866 bitOr(2,0), -- 2
867 bitOr(0,2); -- 2
868 SELECT bitXor(1, 2), bitXor(20, 15), bitNot(2);-- 3 27 253
871 --十五、Hash函数:可以用于将元素不可逆的伪随机打乱。
872 -- 注意:伪随机!
873 SELECT
874 -- 计算字符串的MD5值。( 如果您不需要一定使用MD5,请使用‘sipHash64’函数。)
875 halfMD5('HELLO WORLD!'),
876 halfMD5(12);
877 SELECT
878 MD5('drew-zero,78967');
880 SELECT
881 -- 为任何类型的整数计算32位的哈希。 这是相对高效的非加密Hash函数
882 intHash32(1221232132132) AS intHash32,
883 -- 推荐:从任何类型的整数计算64位哈希码。 它的工作速度比intHash32函数快。
884 intHash64(1221232132132) AS intHash64,
885 -- 计算任意数量字符串的CityHash64或使用特定实现的Hash函数计算任意数量其他类型的Hash。
886 cityHash64('username') AS cityHash64,
887 -- 1.使用sha1或者sha224加密的话,只能用于字符串
888 -- 2.字符串 需使用单引号。
889 SHA1('1232131') AS sha1,
890 SHA224('1232131') AS sha224,
891 SHA256('DREW-ZERO') AS sha256;
893 -- URLHash(url[, N]) 一种快速的非加密哈希函数,用于规范化的从URL获得的字符串
894 -- 从一个字符串计算一个哈希,如果结尾存在尾随符号/,?或#则忽略。 URLHash(s,N)
895 -- 计算URL层次结构中字符串到N级别的哈希值,如果末尾存在尾随符号/,?或#则忽略。 URL的层级与URLHierarchy中的层级相同
896 -- 用处:此函数被用于Yandex.Metrica。
897 SELECT
898 URLHash('www.baidu.com'), -- 11390370829909720855
899 URLHash('www.baidu.com', 0), -- 11390370829909720855
900 --
901 URLHash('www.baidu.com', 1); -- 11160318154034397263
903 -- farmHash64(s) 计算字符串的FarmHash64。 接受一个String类型的参数。返回UInt64。
904 SELECT farmHash64('www.runoob.com'); -- 6668483584160323388
906 -- javaHash(s) 计算字符串的JavaHash。 接受一个String类型的参数。返回Int32。
907 SELECT javaHash('www.baidu.com'); -- 270263191
909 -- hiveHash(s) 计算字符串的HiveHash。 接受一个String类型的参数。返回Int32。 与JavaHash相同,但不会返回负数
910 SELECT hiveHash('www.baidu.com'); -- 270263191
913 --十六、随机函数
914 --->>>>>> 随机函数
915 -- 解释:随机函数使用非加密方式生成【伪随机】数字。
916 -- ① 所有随机函数都只接受一个参数或不接受任何参数。
917 -- ② 您可以向它传递任何类型的参数,但传递的参数将不会使用在任何随机数生成过程中。
918 -- ③ 此参数的唯一目的是防止公共子表达式消除,以便在相同的查询中使用相同的随机函数生成不同的随机数
919 -- rand() 函数:返回一个UInt32类型的随机数字,所有UInt32类型的数字被生成的概率均相等。
920 -- rand64() 函数:返回一个UInt64类型的随机数字,所有UInt64类型的数字被生成的概率均相等。
921 -- randConstant() 函数:返回一个UInt32类型的随机数字,该函数不同之处在于仅为每个数据块参数一个随机数。
922 SELECT
923 rand(), -- 1751687411
924 rand(10), -- 1124981728
925 rand64(),
926 rand64(10),
927 randConstant(),
928 randConstant();
931 -- 十七、编码函数:
932 -- hex(), unhex(), UUIDStringToNum(str), UUIDNumToString(str),bitmaskToList(num) ...
933 -- 1.hex函数编码
934 SELECT
935 -- 68656C6C6F20776F726C64212C68656C6C6F20636C69636B686F757365
936 hex('hello world!,hello clickhouse') AS hexStr,
937
hex(now()) AS hexDatetime, -- 5D414BA2
938 hex(toDate(now())) AS hexDate; --46BC
940 -- 2.接受包含36个字符的字符串,格式为“123e4567-e89b-12d3-a456-426655440000”,并将其转化为FixedString(16)返回
941 SELECT UUIDStringToNum('123e4567-e89b-12d3-a456-426655440000');
943 -- 3. 接受一个整数。返回一个UInt64类型数组,其中包含一组2的幂列表,其列表中的所有值相加等于这个整数。数组中的数字按升序排列。
944 -- bitmaskToArray(num)
945 SELECT bitmaskToArray(10); -- [2,8]
946 SELECT bitmaskToArray(100); -- [4,32,64]
948 -- 4.接受一个整数。返回一个字符串,其中包含一组2的幂列表,其列表中的所有值相加等于这个整数。列表使用逗号分割,按升序排列。
949 -- bitmaskToList(num)
950 SELECT bitmaskToList(10); -- 2,8
951 SELECT bitmaskToList(100); -- 4,32,64
952 SELECT bitmaskToList(0); -- '' 空字符串
955 --十八、UUID函数
956 --->>>>>> UUID函数
957 -- 1.generateUUIDv4() 返回 UUID类型的值。
958 SELECT generateUUIDv4() as randomUUID; -- 随机生成一个UUIDv4的字符串(b6940dfe-0dc9-4788-bac7-319d13235a2e)
959 SELECT replaceAll(toString(generateUUIDv4()), '-', '') AS replaceUUID; -- 9d1947ea4fcf450da5391feb6142cab6
961 -- 2.toUUID(s) 将string类型的值 转换成UUID类型的值
962 SELECT toUUID('61f0c404-5cb3-11e7-907b-a6006ad3dba0') AS uuid;
964 -- 3.接受一个String类型的值,其中包含36个字符且格式为xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx,
965 -- 将其转换为UUID的数值并以FixedString(16)将其返回。
966 SELECT
967 '612f3c40-5d3b-217e-707b-6a546a3d7b29' AS uuid, -- 612f3c40-5d3b-217e-707b-6a546a3d7b29
968 UUIDStringToNum(uuid) AS bytes; --a/<@];!~p{jTj={)
970 -- 4. UUIDNumToString() 接受一个FixedString(16)类型的值,返回其对应的String表现形式。
971 SELECT 'a/<@];!~p{jTj={)' AS bytes,
972 UUIDNumToString(toFixedString(bytes, 16)) AS uuid;
974 --- 二十、 URL函数:所有这些功能都不遵循RFC。它们被最大程度简化以提高性能。
975 --- 什么事RFC?
976 ---- Request For Comments(RFC),是一系列以编号排定的文件。文件收集了有关互联网相关信息,以及UNIX和互联网社区的软件文件。
977 -- 1. 截取函数:如果URL中没有要截取的内容则返回空字符串。
978 SELECT protocol('http://www.baidu.com');-- http
979 SELECT protocol('https://www.baidu.com');-- https
980 SELECT protocol('www.baidu.com');-- ''
981 -- 获取域名。
982 SELECT domain('http://www.baidu.com'); -- www.baidu.com
983 SELECT domain('https://www.google.com.cn'); -- www.google.com.cn
984 -- 返回域名并删除第一个‘www.’
985 SELECT domainWithoutWWW('http://www.baidu.com');-- baidu.com
986 SELECT domainWithoutWWW('www.baidu.com');-- ''
987 -- 返回顶级域名。例如:.ru
988 SELECT topLevelDomain('http://www.runoob.com.cn'); -- cn
989 SELECT topLevelDomain('https://www.huse.edn'); -- edu
990 -- 返回“第一个有效子域名”
991 -- 如果顶级域名为‘com’,‘net’,‘org’或者‘co’则第一个有效子域名为二级域名。否则则返回三级域名
992 SELECT firstSignificantSubdomain('https://news.yandex.com.tr/'); -- yandex
993 -- 返回包含顶级域名与第一个有效子域名之间的内容(参阅上面内容)
994 SELECT cutToFirstSignificantSubdomain('https://news.yandex.com.tr/'); -- yandex.com.tr
995 -- 返回URL路径
996 SELECT path('https://blog.csdn.net/u012111465/article/details/85250030');-- /u012111465/article/details/85250030
997 -- 与上面相同,但包括请求参数和fragment。
998 SELECT pathFull('https://clickhouse.yandex/#quick-start'); -- /#quick-start
999 -- 返回请求参数。例如:page=1&lr=213。请求参数不包含问号已经# 以及# 之后所有的内容。
1000 SELECT queryString('http://www.baidu.com/?page=1&lr=234'); -- page=1&lr=234 (根据?确定)
1001 SELECT queryString('http://www.baidu.com/page=1&lr=234'); -- ''
1002 -- 返回URL的fragment标识。fragment不包含#。
1003 SELECT fragment('https://clickhouse.yandex/#quick-start'); -- quick-start
1004 -- 返回请求参数和fragment标识。例如:page=1#29390。
1005 SELECT queryStringAndFragment('https://www.baidu.com/s?ie=utf-8&rsv_sug7=100#ei-ai'); -- ie=utf-8&rsv_sug7=100#ei-ai
1008 -- 2. 删除URL中的部分内容 (如果URL中不包含指定的部分,则URL不变。)
1009 SELECT cutWWW('www.baidu.com');-- www.baidu.com
1010 SELECT cutWWW('https://www.baidu.com');-- www.baidu.com
1011 SELECT cutWWW('https://www.baidu.com');-- www.baidu.com
1012 -- 删除请求参数
1013 SELECT cutQueryString('http://www.baidu.com/1?page=1'); -- http://www.baidu.com/1
1014 -- 删除fragment标识。#同样也会被删除。
1015 SELECT cutFragment('http://www.baidu.com/#quick-demo'); -- http://www.baidu.com/
1016 -- 删除请求参数以及fragment标识。问号以及#也会被删除。
1017 SELECT cutQueryStringAndFragment('http://www.baidu.com/1?page=23#we'); -- http://www.baidu.com/1
1018 -- cutURLParameter(URL, name) 删除URL中名称为‘name’的参数。下面例子中的参数是:&之后,resv,name
1019 SELECT cutURLParameter('http://www.baidu.com/1?page=1#erre&resv=23&name=user','resv');
1022 --二十一、IP函数
1026 --二十二、条件函数
1027 SELECT IF(12 > 10 , 12, 20);
1028 SELECT 12 > 10 ? 12 : 10;
1029 SELECT if(greater(12, 10), 12, 10);
1033 --二十三、操作符函数替换
1034 -- clickhouse自带的计算操作符函数(对接mybatis的时候不用将“<”之类的符号转换成 “age1 <![CDATA[ < ]] 2>”)
1035 -- 1.等于(注意函数名称的大小,严格区分大小写)
1036 SELECT
1037 equals('hello','hello'), -- 1
1038 equals('ab','ba'); -- 0
1039 -- 2.不等于
1040 SELECT
1041 notEquals('a','b'), -- 1
1042 notEquals('a','a'), -- 0
1043 notEquals(12, 12), -- 1
1044 notEquals(12, 1010); -- 0
1045 -- 3.大于( 如果前者大于后者,则返回1;否则返回0)
1046 SELECT
1047 greater(12, 10), -- 1
1048 greater(10, 12), -- 0
1049 greater(12, 12), -- 0
1050 greater('b','a'), -- 1
1051 greater('a','b'); -- 0
1052 -- 3.1 扩展:提取两者中最大的值
1053 SELECT greatest(12,11); -- 12
1054 -- 4.小于(如果前者小于后者,则返回1;否则返回0)
1055 SELECT less(12,23); -- 1
1056 SELECT less(120,23); -- 0
1057 -- 5.大于或等于
1058 SELECT greaterOrEquals(12,12); -- 1
1059 SELECT greaterOrEquals(120,12); -- 1
1060 -- 6.小于或等于
1061 SELECT lessOrEquals(12,12); -- 1
1062 SELECT lessOrEquals(12,129); -- 1
1063 -- ===== String操作
1064 -- *. a LIKE s
1065 SELECT like('a', 'abcd'); -- 0
1066 SELECT like('a', 'a'); -- 1