用EXCEPT对比两个表的数据用还是UNION

来源:互联网 发布:极速赛车全天计划数据 编辑:程序博客网 时间:2024/06/10 11:39

问题描述:

今天是新系统上线之后第一次跑数据,需要和老系统跑出来的表做对比。完全一样则项目运行ok,新系统在时间上减少了人工干预,提高了80个百分点。先用老系统跑一次数据,导入到一个备份表。再用新系统跑一次,数量和备份表里面的一样。心里坦荡了一点。再比较里面每一行数据是否一样的时候,先是用了如下方式:

SELECT

COUNT(0) 

FROM 

(

SELECT * FROM table_nm_bac

UNION

SELECT * FROM table_nm

)  A

表table_nm_bac和表table_nm里面的数据都是1万条,结果上述query出来的结果是9千条。


环境:SQL SERVER 2008


解决方法:

因为想到不可能union出来的结果比每个表数量少,所以立马用EXCEPT的如下方式:

SELECT

COLUMN_NM1,

COLUMN_NM2

...

FROM

table_nm

EXCEPT

SELECT

COLUMN_NM1,

COLUMN_NM2

...

FROM

table_nm_bac

GO


SELECT

COLUMN_NM1,

COLUMN_NM2

...

FROM

table_nm_bac

EXCEPT

SELECT

COLUMN_NM1,

COLUMN_NM2

...

FROM

table_nm

GO

这样两个query出来的结果都是空的。我就放心了。后来用下面的query再检查了一遍数据,结论出来了,是因为union把表里面自己的重复数据给除掉了:

SELECT COUNT(0) FROM(
SELECT DISTINCT * FROM table_nm) A

GO

SELECT
COUNT(0)
FROM
(
SELECT * FROM table_nm
UNION
SELECT * FROM table_nm
)

GO

DISTINCT后的数据和UNION自己后的数据是一样一样的。


结论:比对两个表数据是否一致还是用EXCEPT方式比较好, 因为两个做union会把自己表里面的重复数据也除掉。

0 0
原创粉丝点击