代码之家 › 专栏 › 技术社区 › Karl

SQL Server 2008使用ISNULL语句优化完全联接

isnull self-join outer-join optimization sql-server-2008

Karl · 技术社区 · 15 年前

大家好

我有这个表(简化示例):

    CREATE TABLE [dbo].[dataTable]
    (
    [ID] [int] IDENTITY(1,1) NOT NULL,
    [dteEffectiveDate] [date] NULL,
    [dtePrevious] [date] NULL,
    [dteNext] [date] NULL,
    [Age] [int] NULL,
    [Count] [int] NULL
    ) ON [PRIMARY]

    GO

以下是一些输入值:

INSERT INTO [YourDB].[dbo].[dataTable]
           ([dteEffectiveDate]
           ,[dtePrevious]
           ,[dteNext]
           ,[Age]
           ,[Count])
     VALUES
('2009-01-01',NULL,'2010-01-01',40,300),
('2010-01-01','2009-01-01', NULL,40,200),
('2009-01-01',NULL, '2010-01-01',20,100),
('2010-01-01','2009-01-01', NULL,20,50),
('2009-01-01',NULL,'2010-01-01',30,10)
GO

每个条目都有一个DTeeEffectiveDate字段。此外,每一个都有一个dteperious和dteNext,反映最近的上一个/下一个生效日期的日期。现在我需要的是一个查询,它将计算特定年龄段内连续期间计数字段的中间值。

注意,30岁只有一个条目,10。这是2009年1月1日。在2010/01/01没有条目,但是我们知道数据是在这一点上捕获的,所以事实上没有任何东西意味着30在这一天是0。因此查询应该产生5。

为了实现这一点,我在表本身上使用了一个完全联接,并使用ISNULL来选择值。这是我的密码:

SELECT

    ISNULL(T1.dteEffectiveDate,T2.dtePrevious) as [Start Date]
    ,ISNULL(T1.dteNext,T2.dteEffectiveDate)  as [End Date]
    ,ISNULL(T1.Age,T2.Age) as Age 
    ,ISNULL(T1.[Count],0) as [Count Start]
    ,ISNULL(T2.[Count],0)   as [Count End]
    ,(ISNULL(T1.[Count],0)+ISNULL(T2.[Count],0))/2 as [Mid Count]

    FROM
    [ExpDBClient].[dbo].[dataTable] as T1
    FULL JOIN [ExpDBClient].[dbo].[dataTable] as T2

    ON 
    T2.dteEffectiveDate = T1.dteNext
    AND T2.Age = T1.Age

    WHERE ISNULL(T1.dteEffectiveDate,T2.dtePrevious) is not null
    AND ISNULL(T1.dteNext,T2.dteEffectiveDate) is not null

GO

Start Date  End Date    Age Count Start Count End   Mid Lives
2009-01-01  2010-01-01  40  300         200         250
2009-01-01  2010-01-01  20  100         50          75
2009-01-01  2010-01-01  30  10          0           5

它工作得很好,但当我在实际数据(约700万条记录)上运行它时,执行起来要花很长时间。

有人有什么建议吗?

卡尔

1 回复 | 直到 15 年前

marc_s MisterSmith 15 年前

很难提出很多建议。

Age
dteEffectiveDate
dteNext

分别在每一列上创建一个非聚集索引,然后再次测量。只有几个数据行,没有可以衡量的改进—但是有数百万行,这可能会有所不同。

推荐文章

Mr. W · 如何生成一个重复的整数,如二进制中的1001001001,时间复杂度为O(n)?

1 年前

giantjenga · 优化整数向量到二进制向量的转换

1 年前

Costinean Sebastian · 如何优化使用for循环处理大型数组的MATLAB脚本的执行时间?"

1 年前

Daniel Lobo · 使用约束进行优化

1 年前

Imyaf · 在什么条件下,在组装时对“if”和“if-else”进行比较?

1 年前

Sergio · python中大量数字的乘法

1 年前

Kiran Raj R · 为什么尽管使用了useMemo和useCallback,我的React组件却意外地重新渲染?

1 年前

Sergey Dev · 临时表与表变量

1 年前

JoReyner · 单字符元素的空间差异:列表<字符>与列表<字符串>

1 年前

John · 减少C中的内存消耗++

2 年前