一、os模块
1、os.system(cmd)
在子终端运行系统命令,不能获取命令执行后的返回信息以及执行返回的状态
1 | import os |
2、os.popen(cmd)
不仅执行命令而且返回执行后的信息对象(常用于需要获取执行命令后的返回信息)
1 | import os |
INSERT ON DUPLICATE KEY UPDATE
如果您指定了ON DUPLICATE KEY UPDATE,并且插入行后会导致在一个UNIQUE索引或PRIMARY KEY中出现重复值,则执行旧行UPDATE
注意:
如:原有数据表中的索引:UNIQUE KEY
uk_admin_name(
admin_name) USING BTREE
UNIQUE KEY
uk_password(
password) USING BTREE
执行:
1 | insert into tab_admin(`admin_name`, `password`) value('admin', 'admin888') on duplicate key |
从上图可以看出:虽然admin,admin888和两行都匹配上了,但是只更新了一行数据,受影响的行: 2
至于为啥优先选择更新:admin_name这个唯一键? 原因:他会按照键的顺序来更新
Hive版本为 apache-hive-0.13.1
这几个分析函数通常用于OLAP中,不能累加,而且需要根据不同维度上钻和下钻的指标统计,比如,分小时、天、月的UV数。
数据准备:
1 | CREATE EXTERNAL TABLE lxw1234 ( |
Hive版本为 apache-hive-0.13.1
备注: 这几个函数不支持WINDOW子句。
数据准备:
1 | CREATE EXTERNAL TABLE lxw1234 ( |
Hive版本为 apache-hive-0.13.1
注意: 序列函数不支持WINDOW子句。(什么是WINDOW子句,点此查看前面的文章 )
数据准备:
1 | CREATE EXTERNAL TABLE lxw1234 ( |
Hive版本为 apache-hive-0.13.1
备注:序列函数不支持WINDOW子句
数据准备:
1 | CREATE EXTERNAL TABLE lxw1234 ( |
Hive版本为 apache-hive-0.13.1
SUM、AVG、MIN、MAX,用于实现分组内所有和连续累积的统计。
备注:在低版本hive中,sum不支持窗口,语法不保存,但是结果是不对的
数据准备
1 | CREATE EXTERNAL TABLE lxw1234 ( |