导航:首页 > 营销大全 > 数据挖掘不能作为市场营销工具

数据挖掘不能作为市场营销工具

发布时间：2021-04-25 23:55:43

A. 什么是数据挖掘

数据挖掘是从大量的数据中，抽取出潜在的、有价值的知识（模型或规则）的过程。
1. 数据挖掘能做什么？
1)数据挖掘能做以下六种不同事情（分析方法）：
· 分类（Classification）
· 估值（Estimation）
· 预言（Prediction）
· 相关性分组或关联规则（Affinity grouping or association rules）
· 聚集（Clustering）
· 描述和可视化（Des cription and Visualization）
2)数据挖掘分类

以上六种数据挖掘的分析方法可以分为两类：直接数据挖掘；间接数据挖掘
· 直接数据挖掘

目标是利用可用的数据建立一个模型，这个模型对剩余的数据，对一个特定的变量（可以

理解成数据库中表的属性，即列）进行描述。
· 间接数据挖掘

目标中没有选出某一具体的变量，用模型进行描述；而是在所有的变量中建立起某种关系
· 分类、估值、预言属于直接数据挖掘；后三种属于间接数据挖掘
3)各种分析方法的简介
· 分类（Classification）

首先从数据中选出已经分好类的训练集，在该训练集上运用数据挖掘分类的技术，建立分

类模型，对于没有分类的数据进行分类。

例子：
a. 信用卡申请者，分类为低、中、高风险
b. 分配客户到预先定义的客户分片

注意：类的个数是确定的，预先定义好的
· 估值（Estimation）

估值与分类类似，不同之处在于，分类描述的是离散型变量的输出，而估值处理连续值的

输出；分类的类别是确定数目的，估值的量是不确定的。

例子：
a. 根据购买模式，估计一个家庭的孩子个数
b. 根据购买模式，估计一个家庭的收入
c. 估计real estate的价值

一般来说，估值可以作为分类的前一步工作。给定一些输入数据，通过估值，得到未知的

连续变量的值，然后，根据预先设定的阈值，进行分类。例如：银行对家庭贷款业务，运

用估值，给各个客户记分（Score 0~1）。然后，根据阈值，将贷款级别分类。
· 预言（Prediction）

通常，预言是通过分类或估值起作用的，也就是说，通过分类或估值得出模型，该模型用

于对未知变量的预言。从这种意义上说，预言其实没有必要分为一个单独的类。

预言其目的是对未来未知变量的预测，这种预测是需要时间来验证的，即必须经过一定时

间后，才知道预言准确性是多少。
· 相关性分组或关联规则（Affinity grouping or association rules）

决定哪些事情将一起发生。

例子：
a. 超市中客户在购买A的同时，经常会购买B，即A => B(关联规则)

b. 客户在购买A后，隔一段时间，会购买B （序列分析）
· 聚集（Clustering）

聚集是对记录分组，把相似的记录在一个聚集里。聚集和分类的区别是聚集不依赖于预先

定义好的类，不需要训练集。

例子：
a. 一些特定症状的聚集可能预示了一个特定的疾病
b. 租VCD类型不相似的客户聚集，可能暗示成员属于不同的亚文化群

聚集通常作为数据挖掘的第一步。例如，"哪一种类的促销对客户响应最好？"，对于这一

类问题，首先对整个客户做聚集，将客户分组在各自的聚集里，然后对每个不同的聚集，

回答问题，可能效果更好。
· 描述和可视化（Des cription and Visualization）

是对数据挖掘结果的表示方式。
2.数据挖掘的商业背景

数据挖掘首先是需要商业环境中收集了大量的数据，然后要求挖掘的知识是有价值的。有

价值对商业而言，不外乎三种情况：降低开销；提高收入；增加股票价格。
1)数据挖掘作为研究工具（Research）
2)数据挖掘提高过程控制（Process Improvement）
3)数据挖掘作为市场营销工具（Marketing）
4)数据挖掘作为客户关系管理CRM工具(Customer Relationship Management)

3.数据挖掘的技术背景
1)数据挖掘技术包括三个主要部分：算法和技术；数据；建模能力
2)数据挖掘和机器学习（Machine Learning）
· 机器学习是计算机科学和人工智能AI发展的产物
· 机器学习分为两种学习方式：自组织学习（如神经网络）；从例子中归纳出规则（如决

策树）
· 数据挖掘由来

数据挖掘是八十年代，投资AI研究项目失败后，AI转入实际应用时提出的。它是一个新兴

的，面向商业应用的AI研究。选择数据挖掘这一术语，表明了与统计、精算、长期从事预

言模型的经济学家之间没有技术的重叠。
3)数据挖掘和统计

统计也开始支持数据挖掘。统计本包括预言算法（回归）、抽样、基于经验的设计等
4)数据挖掘和决策支持系统
· 数据仓库
· OLAP（联机分析处理）、Data Mart（数据集市）、多维数据库
· 决策支持工具融合

将数据仓库、OLAP，数据挖掘融合在一起，构成企业决策分析环境。
4. 数据挖掘的社会背景

数据挖掘与个人预言：数据挖掘号称能通过历史数据的分析，预测客户的行为，而事实上

，客户自己可能都不明确自己下一步要作什么。所以，数据挖掘的结果，没有人们想象中

神秘，它不可能是完全正确的。

客户的行为是与社会环境相关连的，所以数据挖掘本身也受社会背景的影响。比如说，在

美国对银行信用卡客户信用评级的模型运行得非常成功，但是，它可能不适合中国

B. 数据库问题

不能插入，违反外键约束
现在student表中增加一行数据sno，再进行grade表插入

C. 请问什么是数据挖掘

数据挖掘是从大量的数据中，抽取出潜在的、有价值的知识（模型或规则）的过程。
1. 数据挖掘能做什么？

1)数据挖掘能做以下六种不同事情（分析方法）：

· 分类（Classification）

· 估值（Estimation）

· 预言（Prediction）

· 相关性分组或关联规则（Affinity grouping or association rules）

· 聚集（Clustering）

· 描述和可视化（Des cription and Visualization）

2)数据挖掘分类

以上六种数据挖掘的分析方法可以分为两类：直接数据挖掘；间接数据挖掘

· 直接数据挖掘

目标是利用可用的数据建立一个模型，这个模型对剩余的数据，对一个特定的变量（可以

理解成数据库中表的属性，即列）进行描述。

· 间接数据挖掘

目标中没有选出某一具体的变量，用模型进行描述；而是在所有的变量中建立起某种关系

。

· 分类、估值、预言属于直接数据挖掘；后三种属于间接数据挖掘

3)各种分析方法的简介

· 分类（Classification）

首先从数据中选出已经分好类的训练集，在该训练集上运用数据挖掘分类的技术，建立分

类模型，对于没有分类的数据进行分类。

例子：

a. 信用卡申请者，分类为低、中、高风险

b. 分配客户到预先定义的客户分片

注意：类的个数是确定的，预先定义好的

· 估值（Estimation）

估值与分类类似，不同之处在于，分类描述的是离散型变量的输出，而估值处理连续值的

输出；分类的类别是确定数目的，估值的量是不确定的。

例子：

a. 根据购买模式，估计一个家庭的孩子个数

b. 根据购买模式，估计一个家庭的收入

c. 估计real estate的价值

一般来说，估值可以作为分类的前一步工作。给定一些输入数据，通过估值，得到未知的

连续变量的值，然后，根据预先设定的阈值，进行分类。例如：银行对家庭贷款业务，运

用估值，给各个客户记分（Score 0~1）。然后，根据阈值，将贷款级别分类。

· 预言（Prediction）

通常，预言是通过分类或估值起作用的，也就是说，通过分类或估值得出模型，该模型用

于对未知变量的预言。从这种意义上说，预言其实没有必要分为一个单独的类。

预言其目的是对未来未知变量的预测，这种预测是需要时间来验证的，即必须经过一定时

间后，才知道预言准确性是多少。

· 相关性分组或关联规则（Affinity grouping or association rules）

决定哪些事情将一起发生。

例子：

a. 超市中客户在购买A的同时，经常会购买B，即A => B(关联规则)

b. 客户在购买A后，隔一段时间，会购买B （序列分析）

· 聚集（Clustering）

聚集是对记录分组，把相似的记录在一个聚集里。聚集和分类的区别是聚集不依赖于预先

定义好的类，不需要训练集。

例子：

a. 一些特定症状的聚集可能预示了一个特定的疾病

b. 租VCD类型不相似的客户聚集，可能暗示成员属于不同的亚文化群

聚集通常作为数据挖掘的第一步。例如，"哪一种类的促销对客户响应最好？"，对于这一

类问题，首先对整个客户做聚集，将客户分组在各自的聚集里，然后对每个不同的聚集，

回答问题，可能效果更好。

· 描述和可视化（Des cription and Visualization）

是对数据挖掘结果的表示方式。

2.数据挖掘的商业背景

数据挖掘首先是需要商业环境中收集了大量的数据，然后要求挖掘的知识是有价值的。有

价值对商业而言，不外乎三种情况：降低开销；提高收入；增加股票价格。

1)数据挖掘作为研究工具（Research）

2)数据挖掘提高过程控制（Process Improvement）

3)数据挖掘作为市场营销工具（Marketing）

4)数据挖掘作为客户关系管理CRM工具(Customer Relationship Management)

3.数据挖掘的技术背景

1)数据挖掘技术包括三个主要部分：算法和技术；数据；建模能力

2)数据挖掘和机器学习（Machine Learning）

· 机器学习是计算机科学和人工智能AI发展的产物

· 机器学习分为两种学习方式：自组织学习（如神经网络）；从例子中归纳出规则（如决

策树）

· 数据挖掘由来

数据挖掘是八十年代，投资AI研究项目失败后，AI转入实际应用时提出的。它是一个新兴

的，面向商业应用的AI研究。选择数据挖掘这一术语，表明了与统计、精算、长期从事预

言模型的经济学家之间没有技术的重叠。

3)数据挖掘和统计

统计也开始支持数据挖掘。统计本包括预言算法（回归）、抽样、基于经验的设计等

4)数据挖掘和决策支持系统

· 数据仓库

· OLAP（联机分析处理）、Data Mart（数据集市）、多维数据库

· 决策支持工具融合

将数据仓库、OLAP，数据挖掘融合在一起，构成企业决策分析环境。

4. 数据挖掘的社会背景

数据挖掘与个人预言：数据挖掘号称能通过历史数据的分析，预测客户的行为，而事实上

，客户自己可能都不明确自己下一步要作什么。所以，数据挖掘的结果，没有人们想象中

神秘，它不可能是完全正确的。

客户的行为是与社会环境相关连的，所以数据挖掘本身也受社会背景的影响。比如说，在

美国对银行信用卡客户信用评级的模型运行得非常成功，但是，它可能不适合中国

转载的

D. 数据库问题

1.数据挖掘是从大量的数据中，抽取出潜在的、有价值的知识（模型或规则）的过程。
1. 数据挖掘能做什么？
1)数据挖掘能做以下六种不同事情（分析方法）：
· 分类（Classification）
· 估值（Estimation）
· 预言（Prediction）
· 相关性分组或关联规则（Affinity grouping or association rules）
· 聚集（Clustering）
· 描述和可视化（Des cription and Visualization）
2)数据挖掘分类

以上六种数据挖掘的分析方法可以分为两类：直接数据挖掘；间接数据挖掘
· 直接数据挖掘

目标是利用可用的数据建立一个模型，这个模型对剩余的数据，对一个特定的变量（可以

理解成数据库中表的属性，即列）进行描述。
· 间接数据挖掘

目标中没有选出某一具体的变量，用模型进行描述；而是在所有的变量中建立起某种关系
· 分类、估值、预言属于直接数据挖掘；后三种属于间接数据挖掘
3)各种分析方法的简介
· 分类（Classification）

首先从数据中选出已经分好类的训练集，在该训练集上运用数据挖掘分类的技术，建立分

类模型，对于没有分类的数据进行分类。

例子：
a. 信用卡申请者，分类为低、中、高风险
b. 分配客户到预先定义的客户分片

注意：类的个数是确定的，预先定义好的
· 估值（Estimation）

估值与分类类似，不同之处在于，分类描述的是离散型变量的输出，而估值处理连续值的

输出；分类的类别是确定数目的，估值的量是不确定的。

例子：
a. 根据购买模式，估计一个家庭的孩子个数
b. 根据购买模式，估计一个家庭的收入
c. 估计real estate的价值

一般来说，估值可以作为分类的前一步工作。给定一些输入数据，通过估值，得到未知的

连续变量的值，然后，根据预先设定的阈值，进行分类。例如：银行对家庭贷款业务，运

用估值，给各个客户记分（Score 0~1）。然后，根据阈值，将贷款级别分类。
· 预言（Prediction）

通常，预言是通过分类或估值起作用的，也就是说，通过分类或估值得出模型，该模型用

于对未知变量的预言。从这种意义上说，预言其实没有必要分为一个单独的类。

预言其目的是对未来未知变量的预测，这种预测是需要时间来验证的，即必须经过一定时

间后，才知道预言准确性是多少。
· 相关性分组或关联规则（Affinity grouping or association rules）

决定哪些事情将一起发生。

例子：
a. 超市中客户在购买A的同时，经常会购买B，即A => B(关联规则)

b. 客户在购买A后，隔一段时间，会购买B （序列分析）
· 聚集（Clustering）

聚集是对记录分组，把相似的记录在一个聚集里。聚集和分类的区别是聚集不依赖于预先

定义好的类，不需要训练集。

例子：
a. 一些特定症状的聚集可能预示了一个特定的疾病
b. 租VCD类型不相似的客户聚集，可能暗示成员属于不同的亚文化群

聚集通常作为数据挖掘的第一步。例如，"哪一种类的促销对客户响应最好？"，对于这一

类问题，首先对整个客户做聚集，将客户分组在各自的聚集里，然后对每个不同的聚集，

回答问题，可能效果更好。
· 描述和可视化（Des cription and Visualization）

是对数据挖掘结果的表示方式。
2.数据挖掘的商业背景

数据挖掘首先是需要商业环境中收集了大量的数据，然后要求挖掘的知识是有价值的。有

价值对商业而言，不外乎三种情况：降低开销；提高收入；增加股票价格。
1)数据挖掘作为研究工具（Research）
2)数据挖掘提高过程控制（Process Improvement）
3)数据挖掘作为市场营销工具（Marketing）
4)数据挖掘作为客户关系管理CRM工具(Customer Relationship Management)

3.数据挖掘的技术背景
1)数据挖掘技术包括三个主要部分：算法和技术；数据；建模能力
2)数据挖掘和机器学习（Machine Learning）
· 机器学习是计算机科学和人工智能AI发展的产物
· 机器学习分为两种学习方式：自组织学习（如神经网络）；从例子中归纳出规则（如决

策树）
· 数据挖掘由来

数据挖掘是八十年代，投资AI研究项目失败后，AI转入实际应用时提出的。它是一个新兴

的，面向商业应用的AI研究。选择数据挖掘这一术语，表明了与统计、精算、长期从事预

言模型的经济学家之间没有技术的重叠。
3)数据挖掘和统计

统计也开始支持数据挖掘。统计本包括预言算法（回归）、抽样、基于经验的设计等
4)数据挖掘和决策支持系统
· 数据仓库
· OLAP（联机分析处理）、Data Mart（数据集市）、多维数据库
· 决策支持工具融合

将数据仓库、OLAP，数据挖掘融合在一起，构成企业决策分析环境。
4. 数据挖掘的社会背景

数据挖掘与个人预言：数据挖掘号称能通过历史数据的分析，预测客户的行为，而事实上

，客户自己可能都不明确自己下一步要作什么。所以，数据挖掘的结果，没有人们想象中

神秘，它不可能是完全正确的。

客户的行为是与社会环境相关连的，所以数据挖掘本身也受社会背景的影响。比如说，在

美国对银行信用卡客户信用评级的模型运行得非常成功，但是，它可能不适合中国。

2.数据仓库是在企业管理和决策中面向主题的、集成的、与时间相关的、不可修改的数据集合

数据仓库，英文名称为Data Warehouse，可简写为DW。

数据仓库之父Bill Inmon在1991年出版的“Building the Data Warehouse”一书中所提出的定义被广泛接受——数据仓库（Data Warehouse）是一个面向主题的（Subject Oriented）、集成的（Integrated）、相对稳定的（Non-Volatile）、反映历史变化（Time Variant）的数据集合，用于支持管理决策(Decision Making Support)。

◆面向主题：操作型数据库的数据组织面向事务处理任务，各个业务系统之间各自分离，而数据仓库中的数据是按照一定的主题域进行组织的。

◆集成的：数据仓库中的数据是在对原有分散的数据库数据抽取、清理的基础上经过系统加工、汇总和整理得到的，必须消除源数据中的不一致性，以保证数据仓库内的信息是关于整个企业的一致的全局信息。

◆相对稳定的：数据仓库的数据主要供企业决策分析之用，所涉及的数据操作主要是数据查询，一旦某个数据进入数据仓库以后，一般情况下将被长期保留，也就是数据仓库中一般有大量的查询操作，但修改和删除操作很少，通常只需要定期的加载、刷新。

◆反映历史变化：数据仓库中的数据通常包含历史信息，系统记录了企业从过去某一时点(如开始应用数据仓库的时点)到目前的各个阶段的信息，通过这些信息，可以对企业的发展历程和未来趋势做出定量分析和预测。

数据仓库是一个过程而不是一个项目。

数据仓库系统是一个信息提供平台，他从业务处理系统获得数据，主要以星型模型和雪花模型进行数据组织，并为用户提供各种手段从数据中获取信息和知识。

从功能结构化分，数据仓库系统至少应该包含数据获取（Data Acquisition）、数据存储（Data Storage）、数据访问（Data Access）三个关键部分

数据挖掘(Data Mining)，又称为数据库中的知识发现(Knowledge Discovery in Database, KDD)，就是从大量数据中获取有效的、新颖的、潜在有用的、最终可理解的模式的非平凡过程，简单的说，数据挖掘就是从大量数据中提取或“挖掘”知识。

并非所有的信息发现任务都被视为数据挖掘。例如，使用数据库管理系统查找个别的记录，或通过因特网的搜索引擎查找特定的Web页面，则是信息检索（information retrieval）领域的任务。虽然这些任务是重要的，可能涉及使用复杂的算法和数据结构，但是它们主要依赖传统的计算机科学技术和数据的明显特征来创建索引结构，从而有效地组织和检索信息。尽管如此，数据挖掘技术也已用来增强信息检索系统的能力。
3.数据挖掘和数据仓库以数据库为基础。

E. 大学的哪个专业是研究数据挖掘的

数据挖掘属于计算机科学与技术方向中的数据分析方向，也有在数学专业中开设。
数据挖掘技术是一种数据处理的技术，是从大量的、不完全的、有噪声的、模糊的、随机的数据中，提取隐含在其中、人们事先不知道又潜在有用信息和知识的过程。数据挖掘需要根据数据仓库中的数据信息，选择合适的分析工具，应用统计方法、事例推理、决策树、规则推理、模糊集、甚至神经网络、遗传算法的方法处理信息，得出有用的分析信息。数据挖掘过程是一个反复循环的过程，每一个步骤如果没有达到预期目标，都需要回到前面的步骤，重新调整并执行。
从数据本身来考虑，通常数据挖掘需要有信息收集、数据集成、数据规约、数据清理、数据变换、数据挖掘实施过程、模式评估和知识表示等8个步骤。
（1）信息收集：根据确定的数据分析对象抽象出在数据分析中所需要的特征信息，然后选择合适的信息收集方法，将收集到的信息存入数据库。对于海量数据，选择一个合适的数据存储和管理的数据仓库是至关重要的。
（2）数据集成：把不同来源、格式、特点性质的数据在逻辑上或物理上有机地集中，从而为企业提供全面的数据共享。
（3）数据规约：执行多数的数据挖掘算法即使在少量数据上也需要很长的时间，而做商业运营数据挖掘时往往数据量非常大。数据规约技术可以用来得到数据集的规约表示，它小得多，但仍然接近于保持原数据的完整性，并且规约后执行数据挖掘结果与规约前执行结果相同或几乎相同。
（4）数据清理：在数据库中的数据有一些是不完整的（有些感兴趣的属性缺少属性值），含噪声的（包含错误的属性值），并且是不一致的（同样的信息不同的表示方式），因此需要进行数据清理，将完整、正确、一致的数据信息存入数据仓库中。不然，挖掘的结果会差强人意。
（5）数据变换：通过平滑聚集，数据概化，规范化等方式将数据转换成适用于数据挖掘的形式。对于有些实数型数据,通过概念分层和数据的离散化来转换数据也是重要的一步。
（6）数据挖掘过程：根据数据仓库中的数据信息，选择合适的分析工具，应用统计方法、事例推理、决策树、规则推理、模糊集、甚至神经网络、遗传算法的方法处理信息，得出有用的分析信息。
（7）模式评估：从商业角度，由行业专家来验证数据挖掘结果的正确性。
（8）知识表示：将数据挖掘所得到的分析信息以可视化的方式呈现给用户，或作为新的知识存放在知识库中，供其他应用程序使用。
数据挖掘过程是一个反复循环的过程，每一个步骤如果没有达到预期目标，都需要回到前面的步骤，重新调整并执行。不是每件数据挖掘的工作都需要这里列出的每一步，例如在某个工作中不存在多个数据源的时候，步骤（2）数据集成的步骤便可以省略。
步骤（3）数据规约（4）数据清理（5）数据变换又合称数据预处理。在数据挖掘中，至少60%的费用可能要花在步骤（1）信息收集阶段，而至少60%以上的精力和时间是花在数据预处理

F. 什么叫数据挖掘

数据挖掘（英语：Data mining），又译为资料探勘、数据采矿。它是数据库知识发现（英语：Knowledge-Discovery in Databases，简称：KDD)中的一个步骤。数据挖掘一般是指从大量的数据中通过算法搜索隐藏于其中信息的过程。数据挖掘通常与计算机科学有关，并通过统计、在线分析处理、情报检索、机器学习、专家系统（依靠过去的经验法则）和模式识别等诸多方法来实现上述目标。
数据挖掘利用了来自如下一些领域的思想：(1) 来自统计学的抽样、估计和假设检验，(2)人工智能、模式识别和机器学习的搜索算法、建模技术和学习理论。数据挖掘也迅速地接纳了来自其他领域的思想，这些领域包括最优化、进化计算、信息论、信号处理、可视化和信息检索。一些其他领域也起到重要的支撑作用。特别地，需要数据库系统提供有效的存储、索引和查询处理支持。源于高性能（并行）计算的技术在处理海量数据集方面常常是重要的。分布式技术也能帮助处理海量数据，并且当数据不能集中到一起处理时更是至关重要。

G. 举例说明数据挖掘技术可以应用于市场营销做什么

1.
识别客户，让你知道哪些是你的潜在客户，哪些客户的忠诚度比较高，根据这些内数据得到你的客户容分类；
2.
对不同类型的客户实施精细化分级管理，满足客户需求，同时能够节省成本、增加效率，最终保有和提升客户的忠诚度；
3.
准确定位客户的购买行为，通过需求分析、购买力分析、满意度分析等数据分析挖掘，不断改进货品和服务，能够更好的满足客户需求，增加销量、节约成本，以达到营销的目的。

H. 做数据库挖掘，必须买数据挖掘软件吗如果买的话，哪些比较便宜呢请大家们推荐啊

数据挖掘是从大量的数据中，抽取出潜在的、有价值的知识（模型或规则）的过程。
1. 数据挖掘能做什么？

1)数据挖掘能做以下六种不同事情（分析方法）：

· 分类（Classification）

· 估值（Estimation）

· 预言（Prediction）

· 相关性分组或关联规则（Affinity grouping or association rules）

· 聚集（Clustering）

· 描述和可视化（Des cription and Visualization）

2)数据挖掘分类

以上六种数据挖掘的分析方法可以分为两类：直接数据挖掘；间接数据挖掘

· 直接数据挖掘

目标是利用可用的数据建立一个模型，这个模型对剩余的数据，对一个特定的变量（可以

理解成数据库中表的属性，即列）进行描述。

· 间接数据挖掘

目标中没有选出某一具体的变量，用模型进行描述；而是在所有的变量中建立起某种关系

。

· 分类、估值、预言属于直接数据挖掘；后三种属于间接数据挖掘

3)各种分析方法的简介

· 分类（Classification）

首先从数据中选出已经分好类的训练集，在该训练集上运用数据挖掘分类的技术，建立分

类模型，对于没有分类的数据进行分类。

例子：

a. 信用卡申请者，分类为低、中、高风险

b. 分配客户到预先定义的客户分片

注意：类的个数是确定的，预先定义好的

· 估值（Estimation）

估值与分类类似，不同之处在于，分类描述的是离散型变量的输出，而估值处理连续值的

输出；分类的类别是确定数目的，估值的量是不确定的。

例子：

a. 根据购买模式，估计一个家庭的孩子个数

b. 根据购买模式，估计一个家庭的收入

c. 估计real estate的价值

一般来说，估值可以作为分类的前一步工作。给定一些输入数据，通过估值，得到未知的

连续变量的值，然后，根据预先设定的阈值，进行分类。例如：银行对家庭贷款业务，运

用估值，给各个客户记分（Score 0~1）。然后，根据阈值，将贷款级别分类。

· 预言（Prediction）

通常，预言是通过分类或估值起作用的，也就是说，通过分类或估值得出模型，该模型用

于对未知变量的预言。从这种意义上说，预言其实没有必要分为一个单独的类。

预言其目的是对未来未知变量的预测，这种预测是需要时间来验证的，即必须经过一定时

间后，才知道预言准确性是多少。

· 相关性分组或关联规则（Affinity grouping or association rules）

决定哪些事情将一起发生。

例子：

a. 超市中客户在购买A的同时，经常会购买B，即A => B(关联规则)

b. 客户在购买A后，隔一段时间，会购买B （序列分析）

· 聚集（Clustering）

聚集是对记录分组，把相似的记录在一个聚集里。聚集和分类的区别是聚集不依赖于预先

定义好的类，不需要训练集。

例子：

a. 一些特定症状的聚集可能预示了一个特定的疾病

b. 租VCD类型不相似的客户聚集，可能暗示成员属于不同的亚文化群

聚集通常作为数据挖掘的第一步。例如，"哪一种类的促销对客户响应最好？"，对于这一

类问题，首先对整个客户做聚集，将客户分组在各自的聚集里，然后对每个不同的聚集，

回答问题，可能效果更好。

· 描述和可视化（Des cription and Visualization）

是对数据挖掘结果的表示方式。

2.数据挖掘的商业背景

数据挖掘首先是需要商业环境中收集了大量的数据，然后要求挖掘的知识是有价值的。有

价值对商业而言，不外乎三种情况：降低开销；提高收入；增加股票价格。

1)数据挖掘作为研究工具（Research）

2)数据挖掘提高过程控制（Process Improvement）

3)数据挖掘作为市场营销工具（Marketing）

4)数据挖掘作为客户关系管理CRM工具(Customer Relationship Management)

3.数据挖掘的技术背景

1)数据挖掘技术包括三个主要部分：算法和技术；数据；建模能力

2)数据挖掘和机器学习（Machine Learning）

· 机器学习是计算机科学和人工智能AI发展的产物

· 机器学习分为两种学习方式：自组织学习（如神经网络）；从例子中归纳出规则（如决

策树）

· 数据挖掘由来

数据挖掘是八十年代，投资AI研究项目失败后，AI转入实际应用时提出的。它是一个新兴

的，面向商业应用的AI研究。选择数据挖掘这一术语，表明了与统计、精算、长期从事预

言模型的经济学家之间没有技术的重叠。

3)数据挖掘和统计

统计也开始支持数据挖掘。统计本包括预言算法（回归）、抽样、基于经验的设计等

4)数据挖掘和决策支持系统

· 数据仓库

· OLAP（联机分析处理）、Data Mart（数据集市）、多维数据库

· 决策支持工具融合

将数据仓库、OLAP，数据挖掘融合在一起，构成企业决策分析环境。

4. 数据挖掘的社会背景

数据挖掘与个人预言：数据挖掘号称能通过历史数据的分析，预测客户的行为，而事实上

，客户自己可能都不明确自己下一步要作什么。所以，数据挖掘的结果，没有人们想象中

神秘，它不可能是完全正确的。

客户的行为是与社会环境相关连的，所以数据挖掘本身也受社会背景的影响。比如说，在

美国对银行信用卡客户信用评级的模型运行得非常成功，但是，它可能不适合中国

I. 数据挖掘问题··

1。数据挖掘是从4大c量的数据中5，抽取出潜在的、有价值的知识（模型或规则）的过程。 4。数据挖掘能做什2么r？ 7)数据挖掘能做以4下v六7种不m同事情（分7析方2法）： · 分0类（Classification） · 估值（Estimation） · 预言（Prediction） · 相关性分8组或关联规则（Affinity grouping or association rules） · 聚集（Clustering） · 描述和可视化1（Des cription and Visualization） 8)数据挖掘分5类以8上r六2种数据挖掘的分6析方6法可以6分0为3两类：直接数据挖掘；间接数据挖掘 · 直接数据挖掘目标是利用可用的数据建立一x个i模型，这个e模型对剩余的数据，对一u个k特定的变量（可以2 理解成数据库中7表的属性，即列）进行描述。 · 间接数据挖掘目标中5没有选出某一u具体的变量，用模型进行描述；而是在所有的变量中5建立起某种关系 · 分6类、估值、预言属于e直接数据挖掘；后三j种属于r间接数据挖掘 2)各种分1析方6法的简介2 · 分2类（Classification）首先从1数据中1选出已i经分6好类的训练集，在该训练集上v运用数据挖掘分3类的技术，建立分2 类模型，对于a没有分4类的数据进行分4类。例子x： a。信用卡申请者，分4类为8低、中2、高风5险 b。分0配客户4到预先定义e的客户0分2片0 注意：类的个s数是确定的，预先定义q好的 · 估值（Estimation）估值与e分2类类似，不p同之z处在于m，分7类描述的是离散型变量的输出，而估值处理连续值的输出；分7类的类别是确定数目的，估值的量是不b确定的。例子w： a。根据购买模式，估计8一w个f家庭的孩子h个c数 b。根据购买模式，估计7一z个r家庭的收入l c。估计5real estate的价值一b般来说，估值可以0作为2分1类的前一v步工e作。给定一r些输入w数据，通过估值，得到未知的连续变量的值，然后，根据预先设定的阈值，进行分6类。例如：银行对家庭贷款业务，运用估值，给各个z客户8记分3（Score 0~1）。然后，根据阈值，将贷款级别分7类。 · 预言（Prediction）通常，预言是通过分1类或估值起作用的，也k就是说，通过分3类或估值得出模型，该模型用于v对未知变量的预言。从8这种意义l上e说，预言其实没有必要分0为6一s个o单独的类。预言其目的是对未来未知变量的预测，这种预测是需要时间来验证的，即必须经过一b定时间后，才q知道预言准确性是多少6。 · 相关性分6组或关联规则（Affinity grouping or association rules）决定哪些事情将一c起发生。例子e： a。超市中1客户2在购买A的同时，经常会购买B，即A => B(关联规则) b。客户4在购买A后，隔一g段时间，会购买B （序列分5析） · 聚集（Clustering）聚集是对记录分2组，把相似的记录在一t个s聚集里。聚集和分0类的区z别是聚集不s依赖于c预先定义y好的类，不g需要训练集。例子z： a。一y些特定症状的聚集可能预示7了z一s个r特定的疾病 b。租VCD类型不b相似的客户1聚集，可能暗示7成员属于b不o同的亚文7化2群聚集通常作为3数据挖掘的第一b步。例如，"哪一j种类的促销对客户6响应最好？"，对于j这一p 类问题，首先对整个y客户8做聚集，将客户5分5组在各自的聚集里，然后对每个a不a同的聚集，回答问题，可能效果更好。 · 描述和可视化8（Des cription and Visualization）是对数据挖掘结果的表示6方1式。 8。数据挖掘的商业背景数据挖掘首先是需要商业环境中3收集了j大i量的数据，然后要求挖掘的知识是有价值的。有价值对商业而言，不i外乎三t种情况：降低开l销；提高收入e；增加股票价格。 6)数据挖掘作为0研究工e具（Research） 0)数据挖掘提高过程控制（Process Improvement） 6)数据挖掘作为5市场营销工q具（Marketing） 8)数据挖掘作为7客户7关系管理CRM工m具(Customer Relationship Management) 7。数据挖掘的技术背景 2)数据挖掘技术包括三c个v主要部分3：算法和技术；数据；建模能力w 6)数据挖掘和机器学习u（Machine Learning） · 机器学习n是计8算机科学和人x工f智能AI发展的产物 · 机器学习o分6为2两种学习m方6式：自组织学习z（如神经网络）；从8例子r中8归纳出规则（如决策树） · 数据挖掘由来数据挖掘是八r十c年代，投资AI研究项目失败后，AI转入v实际应用时提出的。它是一z个d新兴的，面向商业应用的AI研究。选择数据挖掘这一y术语，表明了d与z统计3、精算、长0期从3事预言模型的经济学家之q间没有技术的重叠。 5)数据挖掘和统计6 统计8也d开o始支y持数据挖掘。统计0本包括预言算法（回归）、抽样、基于t经验的设计8等 1)数据挖掘和决策支h持系统 · 数据仓1库 · OLAP（联机分5析处理）、Data Mart（数据集市）、多维数据库 · 决策支n持工k具融合将数据仓8库、OLAP，数据挖掘融合在一n起，构成企业决策分0析环境。 8。数据挖掘的社会背景数据挖掘与d个n人w预言：数据挖掘号称能通过历f史数据的分8析，预测客户2的行为7，而事实上v ，客户8自己m可能都不p明确自己u下x一c步要作什3么u。所以2，数据挖掘的结果，没有人y们想象中1 神秘，它不z可能是完全正确的。客户5的行为3是与c社会环境相关连的，所以4数据挖掘本身也w受社会背景的影响。比6如说，在美国对银行信用卡客户0信用评级的模型运行得非常成功，但是，它可能不i适合中0国。 2。数据仓7库是在企业管理和决策中4面向主题的、集成的、与w时间相关的、不o可修改的数据集合数据仓2库，英文1名称为4Data Warehouse，可简写为1DW。数据仓1库之q父8Bill Inmon在4512年出版的“Building the Data Warehouse”一m书2中0所提出的定义f被广s泛接受——数据仓3库（Data Warehouse）是一y个s面向主题的（Subject Oriented）、集成的（Integrated）、相对稳定的（Non-Volatile）、反2映历b史变化8（Time Variant）的数据集合，用于f支l持管理决策(Decision Making Support)。 ◆面向主题：操作型数据库的数据组织面向事务处理任务，各个p业务系统之b间各自分6离，而数据仓0库中3的数据是按照一r定的主题域进行组织的。 ◆集成的：数据仓8库中3的数据是在对原有分2散的数据库数据抽取、清理的基础上j经过系统加工l、汇总和整理得到的，必须消除源数据中4的不e一r致性，以2保证数据仓6库内4的信息是关于m整个b企业的一s致的全局信息。 ◆相对稳定的：数据仓8库的数据主要供企业决策分0析之w用，所涉及t的数据操作主要是数据查询，一f旦某个t数据进入u数据仓3库以2后，一d般情况下c将被长7期保留，也v就是数据仓0库中8一p般有大v量的查询操作，但修改和删除操作很少3，通常只需要定期的加载、刷新。 ◆反8映历h史变化3：数据仓3库中2的数据通常包含历e史信息，系统记录了j企业从4过去某一q时点(如开d始应用数据仓7库的时点)到目前的各个p阶段的信息，通过这些信息，可以0对企业的发展历j程和未来趋势做出定量分2析和预测。数据仓4库是一k个u过程而不n是一d个q项目。数据仓2库系统是一f个f信息提供平台，他从4业务处理系统获得数据，主要以6星型模型和雪花模型进行数据组织，并为2用户8提供各种手8段从7数据中0获取信息和知识。从7功能结构化6分6，数据仓1库系统至少6应该包含数据获取（Data Acquisition）、数据存储（Data Storage）、数据访问（Data Access）三x个z关键部分2 数据挖掘(Data Mining)，又i称为3数据库中3的知识发现(Knowledge Discovery in Database, KDD)，就是从5大x量数据中0获取有效的、新颖的、潜在有用的、最终可理解的模式的非平凡l过程，简单的说，数据挖掘就是从6大o量数据中7提取或“挖掘”知识。并非所有的信息发现任务都被视为0数据挖掘。例如，使用数据库管理系统查找个z别的记录，或通过因特网的搜索引4擎查找特定的Web页面，则是信息检索（。rmation retrieval）领域的任务。虽然这些任务是重要的，可能涉及n使用复杂的算法和数据结构，但是它们主要依赖传统的计8算机科学技术和数据的明显特征来创建索引3结构，从7而有效地组织和检索信息。尽管如此，数据挖掘技术也u已g用来增强信息检索系统的能力h。 2。数据挖掘和数据仓4库以3数据库为8基础。 b〔b〔fu莹qθx骇础τyケqθtr●

J. 举例说明数据挖掘技术可以应用于市场营销做什么

识别客户，让你知道哪些是你的潜在客户，哪些客户的忠诚度比较高，根据这些数据得到你的客户分类；
对不同类型的客户实施精细化分级管理，满足客户需求，同时能够节省成本、增加效率，最终保有和提升客户的忠诚度；
准确定位客户的购买行为，通过需求分析、购买力分析、满意度分析等数据分析挖掘，不断改进货品和服务，能够更好的满足客户需求，增加销量、节约成本，以达到营销的目的。

阅读全文

与数据挖掘不能作为市场营销工具相关的资料

热点内容

培训对标方案发布：2025-10-20 08:53:47 浏览：503

c2c电子商务平台运作方式发布：2025-10-20 07:58:09 浏览：681

家具促销活动经典广告词发布：2025-10-20 07:36:05 浏览：267

深圳大象电子商务有限公司地址发布：2025-10-20 07:00:59 浏览：242

景区超市营销方案发布：2025-10-20 06:09:23 浏览：267

北京吾爱吾买电子商务有限公司58 发布：2025-10-20 05:18:59 浏览：364

电子商务公司如何报税发布：2025-10-20 04:57:03 浏览：618

移动电源促销方案发布：2025-10-20 04:17:52 浏览：787

淄博电子商务创业园发布：2025-10-20 03:34:55 浏览：384

天津滨海电子商务有限公司发布：2025-10-20 02:42:15 浏览：120

开班教育培训机构方案发布：2025-10-20 02:07:34 浏览：564

幼儿全员培训方案发布：2025-10-20 01:58:07 浏览：535

大型促销活动歌曲店铺发布：2025-10-20 01:56:41 浏览：768

欢乐谷六一儿童节广告策划方案范文发布：2025-10-20 01:19:28 浏览：905

小型酒会主题策划方案发布：2025-10-20 00:08:14 浏览：154

鲁班网电子商务平台官网发布：2025-10-19 21:23:22 浏览：943

培训机构中秋节线下活动方案发布：2025-10-19 20:17:55 浏览：500

房地产促销活动预算表发布：2025-10-19 18:02:57 浏览：344

茶叶促销活动预算表发布：2025-10-19 16:46:29 浏览：703

小学毕业活动策划方案发布：2025-10-19 16:13:08 浏览：415