Hive之parse_url函数详解

Hive的parse_url函数使用

1
2
3
4
parse_url(url, partToExtract[, key]) - extracts a part from a URL

解析URL字符串
partToExtract的选项包含[HOST,PATH,QUERY,REF,PROTOCOL,FILE,AUTHORITY,USERINFO]

举例 :

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
select parse_url('http://hujiang.com/category/12258437290?query=test', 'PROTOCOL') from dual;
--http

select parse_url('http://hujiang.com/category/12258437290?query=test', 'HOST') from dual;
---hujiang.com​

select parse_url('http://hujiang.com/category/12258437290?query=test', 'REF') from dual;
---空​

select parse_url('http://hujiang.com/category/12258437290?query=test', 'PATH') from dual;
---/category/12258437290

select parse_url('http://hujiang.com/category/12258437290?query=test', 'QUERY') from dual;
---query=test

select parse_url('http://hujiang.com/category/12258437290?query=test', 'FILE') from dual;
---/category/12258437290?query=test

select parse_url('http://hujiang.com/category/12258437290?query=test', 'AUTHORITY') from dual;​
---hujiang.com​

select parse_url('http://hujiang.com/category/12258437290?query=test', 'USERINFO') from dual;​
---空