代码之家  ›  专栏  ›  技术社区  ›  Joh

数据挖掘实际上是如何工作的?

  •  0
  • Joh  · 技术社区  · 14 年前

    假设我想对超市的数据库进行一些数据挖掘。这实际上是什么意思?

    1)输出/结果是什么样的?

    2)产量是每天都不同还是随时间变化?

    3)在应用数据挖掘之前,我需要知道我想要什么,还是数据挖掘会自动提供我想要的一切?

    4 回复  |  直到 12 年前
        1
  •  1
  •   Andre Holzner    14 年前

    回答您的第一个问题:对于超市客户数据的案例,我可以想象以下问题:

    • 有多少种产品 X 通常在星期五卖?

      (帮助您确定 X 你应该有存货)

    • 哪些客户购买了产品 X 通常在上个月/年?

      当你介绍一个新的 X -类似产品:只将广告材料(有一定的成本)发送给那些客户。

    • 如果顾客购买产品 X (如啤酒)他/她购买产品的可能性有多大 Y (例如芯片)?

      对以下内容有用:确保 X Y 永远不要同时享受促销优惠( X Y 经常一起买。通过提供折扣让顾客进入商店 X 知道他们也会 Y 同时。要价很高 X -喜欢产品就在旁边 Y 更便宜的 X 在别的地方。

    • 哪些社区的客户最少?

      有助于找出哪些社区你可以通过广告来吸引更多的顾客。

    通常,通过“向数据提出某些问题”,人们会发现一些特性,并提出新的问题。

        2
  •  3
  •   SLaks    14 年前

    Data Mining 是可以应用于不同类型数据集的一般技术类别,就像编程是可以使用不同语言执行不同操作的一般技术类别一样。

    你的问题没有任何意义。

        3
  •  3
  •   Hiba Ali Saeed    12 年前

    A1:数据挖掘将为我们提供关于您查询超市数据库的准确报告。

    A2:当然,因为数据挖掘依赖于时间分析,在这种情况下,它取决于您想要实现的问题或目标。如果您的数据库很大,并且您以正确的方式构建了数据仓库,那么随着时间的推移,您将得到不同的输出。

    A3:是的,您应该确定需要挖掘的问题是什么,然后使用数据挖掘工具自动获取结果或指标。

        4
  •  0
  •   Phil    12 年前

    数据挖掘是一套技术。它指的是在数据中发现有趣和意外的模式。

    如果你想应用一些数据挖掘技术,你需要知道哪一种,你应该知道为什么。问题1、2和3的答案取决于您选择的技术。

    例如,如果我想查找超市中销售的商品之间的关联,可以使用关联规则挖掘。如果我想找到相似的客户群,我可能会使用聚类算法。等。

    数据挖掘中不只有一种技术。