一、粗集理论及其在数据挖掘中的应用(论文文献综述)
蔡莉[1](2009)在《基于粗集求核和属性约简算法研究与应用》文中指出粗集理论是一种处理不精确、不一致、不完整信息的数据分析工具,不需要提供问题所需处理的数据集合之外的任何先验信息,可直接对数据进行分析和推理,从中发现隐含的知识,揭示潜在的规律。粗集理论已广泛地应用于机器学习、数据库知识发现、决策分析、模式识别、医疗诊断和专家系统等领域。在粗集理论中,约简与核是两个最重要的基本概念。约简是指在保持分类能力不变的前提下,删除冗余的属性。核是所有约简的交集,其核属性的计算往往是决策信息约简过程的出发点和关键。寻求快速的求核和属性约简算法是粗集理论研究的重要内容之一。本论文针对粗集求核和属性约简算法进行了研究,主要工作如下:首先,本文研究了求取决策表核属性的经典算法,分析了时间复杂度和空间复杂度,提出一种效率更高的计算核属性的算法,通过例子说明算法的具体过程并验证了算法的正确性。其次,本文研究了基于差别矩阵的属性约简算法及其局限性,提出了一种基于依赖度的决策表属性约简算法,该算法不需求核运算,节省了时间和空间,简化了求解过程。最后,本文分析了中医数据的特点,介绍基于粗集理论的中医数据预处理方法,并给出了一个中医诊断应用实例。
周序生,王志明[2](2009)在《粗糙集和神经网络方法在数据挖掘中的应用》文中研究表明提出了一种基于神经网络和粗集的数据挖掘新方法。首先利用粗集理论对原始数据进行一致性属性约简,然后使用神经网络对数据进行学习,并同时完成属性的不一致约简,最后再由粗集对神经网络中的知识进行规则抽取。该方法充分融合了粗集理论强大的属性约简、规则生成能力和神经网络优良的分类、容错能力。实验表明,该方法快速有效,生成规则简单准确,具有良好的鲁棒性。
汤效琴[3](2008)在《数据挖掘中的软计算方法及其应用》文中进行了进一步梳理文章对数据挖掘中软计算方法及应用作了一个综合性阐述。对模糊逻辑、遗传算法、神经网络、粗集等软计算方法,以及它们的混合算法的特点进行了分析,并对它们在数据挖掘中的应用进行了分类。
张静[4](2007)在《基于粗集理论的数据挖掘方法及应用研究》文中研究表明数据挖掘是从存放在信息库的大量数据中挖掘出有用知识的一种新技术。粗糙集理论作为一种处理不完全、不精确及不确定信息的有效方法,因其具有强大的数值分析能力,故在数据挖掘领域大有用武之地。目前基于粗糙集理论的数据挖掘技术已经成为人工智能领域中一个新的研究热点。论文对数据挖掘技术进行了深入的讨论,介绍了其相关概念,针对其普遍存在的海量高维数据、信息不完备数据、可理解性等问题,提出一种基于粗糙集的数据挖掘方法。首先,详细阐述了粗糙集的产生、发展及其在数据挖掘领域中的应用。其次,讨论了粗糙集的约简方法,利用粗糙集理论对数据样本进行约简,获取约简的规则集,使得规则数目大为减少,充分地提高了数据的处理能力。接着针对粗集只能处理离散化的属性,研究讨论了各种连续属性离散化方法。论文中对目前神经网络也进行了分析,并针对训练神经网络时由于样本数据中含有大量的、不完全的、有噪声的、模糊的、随机的数据,造成的网络结构复杂以及计算速度慢等问题,提出了一种基于粗糙集的构造神经网络的方法,即运用粗糙集方法对输入样本进行约简,确定神经网络隐含层神经元个数。利用基于粗集的数据挖掘技术构造的粗神经网络模型,具有计算简单、收敛速度快等特点。最后将该方法用于间歇式反应釜,通过粗神经网络建模,从而实现对间歇式反应釜的釜内温度的估计。仿真结果与实测数据比较表明,模型估计准确,误差小,与常规方法相比,网络的训练时间短。综上,基于粗糙集的数据挖掘技术是一种有效的数据处理方法,它可以为建模与控制等研究工作提供有用的信息。由于该方法具有较高的估计精度及较快的学习效率,所以更有利于实时应用。
白爱民[5](2006)在《基于客户集群和拓扑理论的CRM模型与算法研究》文中认为鉴于CRM技术的迅速发展以及它在实际中的广泛应用,CRM的理论和研究正在成为管理科学中的一个热点的研究课题。本文在研究了大量国内外相关文献的基础上,以CRM在某省级电信企业的理论与应用为研究背景,对CRM的发展及其相关理论、CRM模型的建立、内外部机制、关键算法以及CRM应用系统等题进行了较深入地探讨。1.针对CRM的客户集群理论,通过对集群→企业集群→客户集群三重概念的剖析,构建了适合于CRM的理论模型框架;对集群概念及其涵义进行了扩展和引申,建立了CRM体系结构。在对外部机制研究的基础上,对其内部核心机制的规律及运作模式进行了深入地探讨。2.采用拓扑理论方法,研究了CRM客户集群理论,构建了客户集群的数学模型,提出了企业集群、客户集群、信息集群的拓扑空间概念;并对该空间的内涵进行了深入地分析,阐述了客户集群的基、集族、子空间与映射等实体概念。3.提出了CRM客户集群核心机制的四种客户联系模式,根据客户联系的映射原理,将该理论模式与电信企业的营销实体应用进行了对应的映射分析。4.对CRM数据挖掘过程的关键环节——数据预处理存在问题和算法进行了研究。提出了一种基于密度的孤立点因子算法和一种基于粗集理论的属性类别差异数据归约算法。对CRM数据预处理与数据挖掘的孤立点异常检测方法,对采取粗集理论的预处理过程的数据约简与处理算法进行了分析和编程。5.结合省级电信企业在CRM系统应用项目的实施,对上述理论进行了实证研究,以验证理论的正确性,并给出其实际应用效果。该项研究和应用取得了显着的社会和经济效益,并具有应用和推广价值。
赵斌[6](2006)在《高亮度LED芯片制造工艺知识挖掘方法的研究及应用》文中研究指明知识发现是指从数据集中识别出有效的、新颖的、潜在有用的,以及最终可理解的模式的处理过程。粗集理论是一种处理模糊和不确定知识的数学工具。目前,基于粗集理论的知识挖掘方法已经成为知识挖掘的主要方法之一。 本文主要研究知识挖掘方法在高亮度LED(Light Emitting Diode,发光二极管)芯片制造过程中的具体应用。在综述国内外知识挖掘和粗集理论研究与应用的基础上,通过对高亮度LED芯片制造工艺过程的分析和研究,总结其中的知识并进行分类,提出了基于粗集理论的高亮度LED芯片制造工艺知识挖掘系统模型,研究了知识挖掘过程如何实现,并且开发了一个具有数据输入、信息查询和知识挖掘等功能的原型系统。论文的主要内容包括: 1) 首先分析论文的研究背景和国内外相关理论的研究现状,研究LED芯片制造工艺知识挖掘的意义。研究基于粗集理论知识挖掘的基本原理,讨论了连续属性的离散化、相对约简和相对核、属性的依赖度以及属性的重要度等知识挖掘所用到的概念和方法,并对基于粗集理论的属性约简进行了详细的分析。 2) 分析LED芯片的整个生产制造过程、各关键制造工序的基本原理和特性参数,确定哪些数据可以作为挖掘目标数据、要挖掘什么类型的知识、如何用挖掘的知识进行决策。 3) 研究知识挖掘系统模型在整个LED芯片制造过程的应用,知识挖掘过程是如何实现的。包括基于粗集的知识挖掘模型的建立、高效属性约简和值约简方法的具体应用、决策规则知识的获取和知识的表达等。 4) 在上述理论方法研究的基础上,研究开发了高亮度LED芯片制造工艺知识挖掘的原型系统。可以通过该系统输入各类制造工艺信息,对芯片制造信息进行综合查询,并对LED芯片制造过程进行知识挖掘。最后通过一个挖掘示例演示了系统的运行,验证本文研究理论的可行性和实用性。
王宏[7](2006)在《基于粗糙集数据挖掘技术的客户价值分析》文中提出当今的客户已经成为左右企业发展的一种决定性的力量。菲利普·科特勒指出以客户为中心的企业不仅需要建设产品,更重要的是建设客户。在现实的市场条件下任何企业要想成功,必须以客户需求为出发点,以满足市场或客户的需求为归宿,把客户对企业的信任和忠诚作为企业最重要的资产。国内外的理论和实践都已证明了忠诚的客户能为企业带来稳定而丰厚的利润,一个企业拥有了忠诚的客户群,就拥有了稳定的利润源和竞争优势,拥有了对市场的控制权。一个客户能保持忠诚越久,企业从他那里获得的利益越多。 企业在培养客户忠诚时必须首先明确不同客户对企业具有不同的价值,企业应向最可能盈利的客户推销产品。基于客户差别及企业能力的限制,任何一个企业都不可能为市场上的全体客户服务。为了能与无处不在的竞争者竞争,企业需要确定它能为之最有效服务的细分市场,把目标关注于为企业带来最大利润的客户,提高他们的忠诚度。为了获得客户的忠诚,企业必须为客户提供优异的价值,因为只有价值才能驱动客户忠诚,增进客户的重复购买行为并增加企业利润。 基于以上的思想,借鉴西方管理学研究的成果,本文针对客户价值分析的理论和方法展开讨论,在客户分类时采用基于粗糙集的数据挖掘技术。 企业常用的客户分类方法是基于经验方法和统计方法的简单划分,这些方法虽然曾得到广泛应用并取得良好效果,但却无法满足日益增长的数据量以及日益复杂的分析需求,而基于数据挖掘技术的分类方法,为进行更深入的客户细分提供了新的实现手段。 所谓数据挖掘也称为知识发现,是从大型数据库和数据中提供潜在价值的知识和规则的过程。数据挖掘技术有各种模式,如关联分析、分类和预测及聚类等。各种模式各有侧重,其中有一些已经研究得较为成熟,研究成果也较多,如挖掘关联规则、预测方法和分类模式中的一些其他方法。而分类模式中关于粗集的挖掘技术目前研究的人还不是很多,相应的研究成果也较少。因而基于粗集的数据挖掘技术有很大的研究价值。粗集理论是针对不确定性问题提出的,它的特点是不需要预先给定某些特征或属性的数量描述,而是直接从给定问题的描述集合出发,通过不可分辨关系和不可分辨类确定给定问题的近似域,从而找出该问题的内在规律。
王明春[8](2005)在《基于粗糙集的数据及文本挖掘方法研究》文中研究表明数据挖掘和文本挖掘是当前信息技术中的一个重要研究领域;将软计算方法之一的粗糙集理论应用于数据及文本挖掘方法研究,具有较大的理论意义和实用价值。本文研究了基于粗糙集的数据挖掘和文本挖掘方法,主要包括数据挖掘和文本挖掘中的属性约简问题、聚类问题;文本挖掘中的分类规则抽取问题;以及粗糙集同模糊集相结合的数据挖掘方法。所做主要工作内容包括:将粗集和遗传算法相结合成功应用于文本模糊聚类。在聚类过程中,将权重参数的设定也通过编码由遗传算法确定,从而使得权重参数的设定具有科学性和可操作性。给出了近似规则的定义,并对χ2值的意义进行了讨论。在此基础上提出了一种将特征选取和粗集方法相结合的文本分类规则抽取方法。该方法大大提高了文本规则抽取的效率,并使其更趋实用化。对相关文献中隶属函数的定义进行了改进,并且利用隶属函数的性质提出了一种从定量决策表转换为定性决策表的转换规则,利用此转换规则可以将原来的定量决策表转换为一个同样大小的定性决策表,这样大大减少了后面利用粗集理论进行规则抽取的计算量,而且提取的规则质量也有了很大提高。将模式聚合理论和潜在语义索引理论相结合,提出了一种文本降维新方法。它首先用PA理论对文本特征进行初步降维,在此基础上利用LSI方法对文本特征进一步降维,抽取隐藏在文本中的主要语义信息。提出了一种改进的基于粗集和Tabu搜索的属性约简算法。改进后的算法既具有较高的算法效率,又能以较大的概率得到最小属性约简。提出了基于知识简洁度的粗集聚类方法,它首先计算对象集合在每个属性下的划分;然后在对初始划分进行合并时,引进了不可分辨度的概念;在形成最终聚类结果时,引进了知识简洁度作为凝聚的终止条件。将基于次胜对手惩罚的竞争学习算法应用于文本聚类,这种方法既能自动确定聚类的数目,又具有较好的算法复杂度。
黄宋斌[9](2004)在《基于Rough集理论的知识发现及数据仓库的决策支持研究》文中提出本文首先分析了目前基于数据仓库的决策支持概况。在分别对数据仓库技术、联机分析处理(OLAP)技术及数据挖掘(DM)技术进行详细探讨之后,结合实际系统,构建了销售主题数据仓库,并运用OLAP技术对该实验数据仓库进行决策分析与研究。在此基础上根据实际需求,构建了Rough集决策表,并利用Rough集理论进行属性约简,数据归约等。 由于数据仓库的海量特性,为获得尽可能大的决策支持度,本文提出了一个改进的基于Rough集(粗糙集)理论的决策规则的最大覆盖算法,该算法在最佳数据归约的基础上,通过引入决策矩阵来对目标决策类进行分类。实验证明该算法能有效降低系统计算的复杂度,并得到较满意的决策规则。实验结果亦表明基于粗集理论的挖掘算法较其他传统算法无论在分类精度还是预测准确度上都具有明显的提高。 本文最后给出了一个通用的基于Rough集理论与数据仓库的决策支持系统模型。
崔华丽[10](2004)在《基于粗神经网络的数据挖掘方法及其应用》文中认为近年来,随着数据库技术的迅速发展以及数据库管理系统的广泛应用,企业的数据库或数据仓库中积累的数据越来越多。然而激增的数据背后隐藏着许多重要的信息,企业中的领导希望能够对其进行更高层次的分析,以便更好地利用这些数据,为企业以后的营销、发展提供正确的决策方案。但从众多的数据中鉴别并充分抽取有效强壮的特征目前还是一个没有完全解决的问题。 本论文首先介绍了数据挖掘理论及其在营销中的应用,并着重对数据挖掘的两种重要新方法粗糙集理论和神经网络以及它们的应用进行了概述。接着介绍了经典(Pawlak型)粗糙集模型的基本理论,它是建立在等价关系基础之上的,用上下近似集合来表示一个不精确的概念。由于等价关系条件较强,有一定的局限性,已经证明求所有约简和最小约简是NP-Hard问题。属性约简问题是粗糙集理论的核心问题之一,本文提出了一种基于GENRED的最大概率因子的改进属性约简算法,并将该算法应用在市场营销的客户购买分析方面。接下来分别介绍了变精度型粗糙集模型及其在企业经营现状分析方面的应用、概率粗糙集模型及其在产品分类方面应用和不完备信息系统粗糙集模型及其在产品销售方面的应用。针对目前在对企业的大型数据库或数据仓库进行数据挖掘时,输入信息不仅数据量大,而且存在噪声干扰,在数据挖掘中单纯的使用粗集方法会受噪声干扰而直接影响分类精度,单纯使用神经网络会因输入信息空间维数较大使网络结构复杂且训练时间长的问题,本论文最后将粗糙集理论与神经网络相结合,首先介绍了基于粗神经网络的数据挖掘方法在营销中的应用流程,接着介绍了基于粗神经网络数据挖掘的市场营销系统框架,最后将粗糙集理论与神经网络相结合应用于市场营销的产品销售预测领域,进行销售预测。
二、粗集理论及其在数据挖掘中的应用(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、粗集理论及其在数据挖掘中的应用(论文提纲范文)
(1)基于粗集求核和属性约简算法研究与应用(论文提纲范文)
摘要 |
ABSTRACT |
致谢 |
第一章 引言 |
1.1 数据挖掘概述 |
1.1.1 数据挖掘技术产生的背景 |
1.1.2 数据挖掘的定义及主要步骤 |
1.1.3 数据挖掘系统的分类 |
1.1.4 数据挖掘的方法 |
1.1.5 数据挖掘的应用 |
1.1.6 数据挖掘面临的问题 |
1.2 本文结构 |
1.3 本章小结 |
第二章 粗集理论 |
2.1 粗集理论概述 |
2.1.1 粗集理论研究概况 |
2.1.2 粗集理论的基本思想 |
2.1.3 粗集理论的特点 |
2.1.4 粗集知识发现系统 |
2.1.5 粗集理论的研究方向 |
2.2 粗集理论的基本概念 |
2.2.1 信息系统 |
2.2.2 不可分辨关系 |
2.2.3 等价类 |
2.2.4 集合的近似 |
2.2.5 属性约简与核 |
2.2.6 相对约简和相对核 |
2.3 本章小结 |
第三章 决策表系统核属性求解算法研究 |
3.1 决策表系统核属性经典算法概述 |
3.2 经典算法求取核属性的时间复杂度和空间复杂度 |
3.3 改进的求取核属性的算法 |
3.3.1 相关定义及性质 |
3.3.2 算法描述 |
3.3.3 算法正确性 |
3.3.4 算法复杂度分析 |
3.4 算法应用实例 |
3.5 本章小结 |
第四章 基于粗集的属性约简算法研究 |
4.1 属性约简的作用与算法研究 |
4.2 基于差别矩阵的属性约简算法及其局限性 |
4.2.1 算法基本思想 |
4.2.2 算法的局限性 |
4.2.3 改进的差别矩阵的属性约简算法 |
4.3 基于依赖度的决策表属性约简算法 |
4.3.1 属性的依赖性 |
4.3.2 算法实现 |
4.3.3 算法正确性 |
4.3.4 算法的实验结果及效率分析 |
4.4 算法应用实例 |
4.5 本章小结 |
第五章 粗集数据挖掘在中医领域的应用 |
5.1 中医学的优势及发展前景 |
5.2 中医临床数据的特点 |
5.3 目前应用于中医辅助诊断的数据挖掘方法 |
5.4 实验原始数据及数据预处理 |
5.4.1 基本数据预处理方法 |
5.4.2 实验原始数据来源 |
5.4.3 实验原始数据的预处理 |
5.5 建立决策表信息系统 |
5.6 属性约简及规则提取 |
5.7 根据规则进行诊断测试 |
5.8 本章小结 |
第六章 总结与展望 |
6.1 工作总结 |
6.2 研究展望 |
参考文献 |
攻读硕士学位期间发表的论文 |
(4)基于粗集理论的数据挖掘方法及应用研究(论文提纲范文)
摘要 |
Abstract |
1 绪论 |
1.1 研究背景与意义 |
1.2 国内外研究现状及存在的问题 |
1.3 本文的研究工作及内容安排 |
2 数据挖掘概述 |
2.1 数据挖掘的概念 |
2.2 数据挖掘的任务 |
2.3 数据挖掘的方法 |
2.4 数据挖掘的应用 |
3 粗集基本原理 |
3.1 粗糙集的基本概念 |
3.1.1 知识与不可分辨关系 |
3.1.2 粗集中的上近似、下近似与边界 |
3.2 知识的表达 |
3.2.1 知识表达系统 |
3.2.2 决策表 |
3.3 知识的化简 |
3.3.1 知识的依赖性 |
3.3.2 属性的重要性 |
3.3.3 知识的约简和核 |
3.3.4 知识的相对约简和相对核 |
3.4 粗糙度 |
3.5 粗集理论的特点 |
3.6 离散化 |
3.7 实例分析 |
4 基于粗神经网络的数据挖掘技术 |
4.1 BP神经网络 |
4.1.1 BP神经网络的结构 |
4.1.2 BP神经网络的优缺点 |
4.2 粗神经网络的生成 |
4.2.1 粗神经网络的算法介绍 |
4.2.2 粗神经网络的结构 |
4.3 小结 |
5 基于粗神经网络的数据挖掘技术在BSTR中的应用 |
5.1 间歇反应器的结构和特点 |
5.2 间歇反应特性分析 |
5.3 本实验室反应器介绍 |
5.4 粗神经网络在BSTR中的应用 |
结论 |
参考文献 |
攻读硕士学位期间发表学术论文情况 |
致谢 |
(5)基于客户集群和拓扑理论的CRM模型与算法研究(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 CRM 产生的背景 |
1.2 CRM 的内涵 |
1.3 CRM 的核心管理思想 |
1.4 存在问题 |
1.5 本文的主要研究路线及框架 |
1.6 本文的主要研究工作 |
1.7 本文创新点 |
第二章 国内外研究综述 |
2.1 引言 |
2.2 CRM 定义及理念研究 |
2.3 CRM 的主要功能 |
2.4 集群理论的发展与客户集群理论 |
2.5 应用于客户集群的CRM 分析技术 |
2.6 CRM 数据挖掘的预处理技术 |
2.7 CRM 发展前景 |
2.8 小结 |
第三章 客户集群理论及其基于拓扑的CRM 建模 |
3.1 引言` |
3.2 集群概念的引入及扩展 |
3.3 基于拓扑理论的企业集群分析 |
3.4 实例:电信数据集群的关系映射 |
3.5 小结 |
第四章 CRM 模型的营销实体映射分析 |
4.1 引言 |
4.2 现代差异化经营分析 |
4.3 基于客户集群的差异化服务映射分析 |
4.4 基于客户联系映射的电信企业CRM 模式分析 |
4.5 小结 |
第五章 CRM 数据预处理与异常检测方法 |
5.1 CRM 数据预处理 |
5.2 数据清理中的异常检测 |
5.3 孤立点的基本理论 |
5.4 局部孤立点因子的相关属性 |
5.5 基于局部异常因子(LOF)的孤立点检测算法 |
5.6 小结 |
第六章 基于粗集理论的 CRM 数据预处理 |
6.1 引言 |
6.2 粗糙集理论 |
6.3 连续属性离散化 |
6.4 属性约简 |
6.5 小结 |
第七章 实证研究 |
7.1 系统构建背景 |
7.2 CRM 系统的网络硬件平台 |
7.3 CRM 系统软件平台的功能 |
7.4 电信客户服务和管理系统 |
7.5 CRM 系统中的数据与数据结构 |
7.6 应用客户集群模型的示例 |
7.7 应用客户集群模型的CRM 评价 |
7.8 应用效果分析 |
7.9 小结 |
第八章 总结与展望 |
8.1 全文总结 |
8.2 研究前景展望 |
参考文献 |
攻读博士学位期间发表的论文和完成的科研项目 |
致谢 |
(6)高亮度LED芯片制造工艺知识挖掘方法的研究及应用(论文提纲范文)
摘要 |
Abstract |
目录 |
Content |
第一章 绪论 |
1.1 引言 |
1.2 研究高亮度LED芯片制造工艺知识挖掘的意义 |
1.3 知识挖掘研究及应用现状 |
1.3.1 基于数据库的知识发现及其研究现状 |
1.3.2 知识挖掘的应用 |
1.3.3 粗集理论的发展和研究概况 |
1.4 高亮LED芯片设计与制造过程概述 |
1.4.1 上游外延片制备 |
1.4.2 中游LED芯片制造 |
1.4.3 下游LED芯片的封装 |
1.5 本文主要研究内容 |
第二章 基于粗集理论的知识挖掘原理 |
2.1 知识发现与数据挖掘理论 |
2.1.1 知识发现的定义 |
2.1.2 知识的概念和分类 |
2.1.3 知识挖掘的功能 |
2.1.4 知识挖掘系统的分类 |
2.2 基于粗集理论知识挖掘方法的基本概念 |
2.2.1 前言 |
2.2.2 粗集理论概述 |
2.2.3 决策表与决策规则 |
2.2.4 属性值约简 |
2.2.5 基于粗集理论的知识挖掘一般过程 |
第三章 高亮度LED芯片制造过程分析与研究 |
3.1 前工部分 |
3.1.1 设计工艺过程 |
3.1.2 研磨 |
3.1.3 化学抛光与表面清洗 |
3.1.4 金属蒸镀 |
3.1.5 光刻 |
3.1.6 腐蚀工艺 |
3.1.7 合金 |
3.2 后工部分 |
3.2.1 半切和全切 |
3.2.2 芯片分检入库 |
3.3 知识总结 |
第四章 LED芯片制造过程中的知识挖掘 |
4.1 高亮度LED芯片制造过程中的知识 |
4.2 知识挖掘过程 |
4.2.1 知识挖掘步骤 |
4.2.2 制造工艺决策表的建立 |
4.2.3 属性值约简 |
4.2.4 获取决策知识 |
4.2.5 挖掘过程实例分析 |
4.3 基于粗集的知识挖掘系统模型 |
4.4 知识挖掘方法在LED芯片制造过程中的应用 |
4.5 知识的表达与应用 |
第五章 原型系统的开发与应用 |
5.1 引言 |
5.2 原型系统开发 |
5.2.1 系统开发模式 |
5.2.2 系统功能模块划分 |
5.3 系统应用示例 |
结论 |
1.论文总结 |
2.进一步的工作 |
参考文献 |
攻读学位期间发表的论文 |
独创性声明 |
致谢 |
(7)基于粗糙集数据挖掘技术的客户价值分析(论文提纲范文)
第1章 绪论 |
1.1 论文写作的背景 |
1.2 论文写作的目的和意义 |
1.3 国内外研究现状及发展趋势 |
1.3.1 客户价值理论研究现状 |
1.3.2 数据挖掘研究的现状和未来研究方向 |
1.3.3 基于粗糙集的数据挖掘的研究现状及发展趋势 |
1.4 论文的研究方法、总体结构和创新之处 |
1.4.1 论文的研究方法 |
1.4.2 论文的总体结构 |
1.4.3 论文的创新点 |
第2章 相关理论综述 |
2.1 客户价值研究综述 |
2.2 数据挖掘理论 |
2.2.1 基本概念 |
2.2.2 数据挖掘分类 |
2.2.3 数据挖掘技术 |
2.2.4 数据挖掘的过程 |
2.3 粗集理论 |
2.3.1 粗集的基本概念 |
2.3.2 基于粗集的知识表达系统 |
2.4 本章小结 |
第3章 客户价值分析 |
3.1 客户 |
3.1.1 客户的涵义 |
3.1.2 客户生命周期 |
3.2 客户价值 |
3.2.1 客户角度的价值 |
3.2.2 企业角度的价值 |
3.3 客户分类 |
3.3.1 客户分类的必要性 |
3.3.2 客户分类问题的特点 |
3.3.3 现有的客户分类方法 |
3.4 本章小结 |
第4章 决策表的约简 |
4.1 知识表达系统数据的一致性 |
4.2 一致决策表的约简 |
4.2.1 决策表的属性约简算法 |
4.2.2 值约简 |
4.3 不一致决策表的约简 |
4.3.1 考虑正域的变化 |
4.3.2 分成两个子表 |
4.4 本章小结 |
第5章 基于粗集的决策树的构建 |
5.1 决策树算法 |
5.1.1 决策树算法概述 |
5.1.2 决策树的生成 |
5.1.3 决策树生成举例 |
5.2 ID3算法 |
5.2.1 ID3算法的决策属性选择方法 |
5.2.2 ID3算法示例 |
5.2.3 决策树的剪枝 |
5.2.4 ID3算法的不足 |
5.3 ID3算法的改进——CAAI算法 |
5.3.1 CAAI算法 |
5.3.2 可信度和支持度 |
5.3.3 CAAI算法举例 |
5.3.4 CAAI算法与ID3算法的关系 |
5.4 本章小结 |
第6章 基于粗集数据挖掘技术的客户分类 |
6.1 基于粗糙集的RFM分析 |
6.1.1 数据准备 |
6.1.2 基于粗糙集的RFM规则获取 |
6.1.3 RFM分析的优缺点 |
6.2 基于粗糙集数据挖掘的客户价值评价 |
6.2.1 客户价值评价的指标体系 |
6.2.2 基于粗集的决策树技术的客户价值评价规则的获取 |
6.3 客户关系战略选择 |
第7章 提升客户价值增强企业竞争优势 |
7.1 忠诚客户的价值 |
7.2 CRM价值链 |
7.2.1 CRM价值链的基本环节 |
7.2.2 CRM价值链的支持条件 |
7.3 客户让渡价值与企业竞争优势 |
7.4 差异化战略的实施 |
7.4.1 竞争优势与差异化战略 |
7.4.2 差异化战略的内容 |
7.4.3 差异化战略的风险 |
7.5 本章小结 |
结论 |
参考文献 |
攻读博士学位期间发表的论文和取得的科研成果 |
致谢 |
个人简历 |
(8)基于粗糙集的数据及文本挖掘方法研究(论文提纲范文)
第一章 绪论 |
1.1 选题的研究背景和意义 |
1.2 数据挖掘与文本挖掘概述 |
1.2.1 数据挖掘概述 |
1.2.2 文本挖掘概述 |
1.3 数据挖掘文本挖掘的主要技术 |
1.3.1 分类技术 |
1.3.2 聚类技术 |
1.4 基于粗糙集理论的数据及文本挖掘进展及评述 |
1.4.1 粗糙集理论概述 |
1.4.2 粗糙集中的属性约简问题 |
1.4.3 粗糙集在数据挖掘中的应用 |
1.4.4 粗糙集同其他方法相结合用于数据挖掘 |
1.4.5 基于粗糙集的数据挖掘系统[109] |
1.5 本文的主要工作和创新点 |
第二章 数据挖掘及文本挖掘中的属性约简方法研究 |
2.1 引言 |
2.2 基于TABU搜索的属性约简算法 |
2.2.1 Tabu搜索算法 |
2.2.2 基于Tabu搜索的属性约简算法及其缺点 |
2.3 基于算法改进的属性约简方法 |
2.3.1 算法的原理和步骤 |
2.3.2 算法具体实现技术 |
2.4 仿真实验研究 |
2.4.1 实验1 |
2.4.2 实验2 |
2.5 模式聚合理论简介 |
2.5.1 CHI概率统计 |
2.5.2 模式聚合 |
2.6 基于模式聚合和潜在语义索引的文本降维新方法 |
2.7 仿真实验研究 |
2.7.1 实验一 |
2.7.2 实验二 |
2.8 结论 |
第三章 基于粗集和遗传算法相结合的文本模糊聚类方法 |
3.1 引言 |
3.2 粗糙集的几个性质 |
3.3 粗集和遗传算法相结合的文本聚类方法 |
3.3.1 文本的表示 |
3.3.2 评价函数 |
3.3.3 遗传编码 |
3.3.4 遗传算子的设计 |
3.3.5 运算终止条件 |
3.4 仿真实验研究 |
3.4.1 测试结果 |
3.4.2 对于权重的讨论 |
3.5 本章小结 |
第四章 一种基于χ值特征选取的粗糙集文本分类规则抽取方法 |
4.1 引言 |
4.2 基本原理 |
4.2.1 文本分类近似规则 |
4.2.2 χ~2 值的讨论 |
4.2.3 方法主要步骤 |
4.3 基于χ值特征选取和粗糙集的文本分类规则抽取方法 |
4.3.1 主算法 |
4.3.2 属性约简子算法 |
4.3.3 规则抽取子算法 |
4.4 仿真实验研究 |
4.4.1 实验一 |
4.4.2 实验二 |
4.5 本章小结 |
第五章 基于粗集和模糊集理论相结合的决策规则抽取方法 |
5.1 引言 |
5.2 定量数据的模糊表示 |
5.3 改进算法 |
5.3.1 隶属函数定义的改进 |
5.3.2 定量决策表到定性决策表的转换 |
5.4 仿真实验研究 |
5.5 本章小结 |
第六章 基于RPCL的文本聚类方法 |
6.1 引言 |
6.2 RPCL聚类算法 |
6.3 RPCL文本聚类的步骤 |
6.4 仿真实验研究 |
6.4.1 实验方案 |
6.4.2 实验过程 |
6.4.3 结果分析 |
6.5 本章小结 |
第七章 基于知识简洁度的粗集聚类方法 |
7.1 引言 |
7.2 基于知识简洁度的聚类算法 |
7.2.1 算法中的基本概念 |
7.2.2 基于知识简洁度的聚类算法 |
7.3 仿真实验研究 |
7.4 结论 |
第八章 总结与展望 |
参考文献 |
攻读博士期间发表的论文及参加的科研项目 |
致谢 |
(9)基于Rough集理论的知识发现及数据仓库的决策支持研究(论文提纲范文)
第一章 绪论 |
1.1 论文的选题背景及意义 |
1.2 国内外研究现状 |
1.3 本文的内容和结构安排 |
第二章 数据仓库系统的研究和应用 |
2.1 数据仓库技术的提出 |
2.2 数据仓库的定义 |
2.3 数据仓库的功能 |
2.4 数据仓库中的数据组织 |
2.5 数据仓库系统 |
2.6 数据仓库设计 |
2.7 实际系统中的销售数据仓库的体系结构 |
2.8 数据仓库目前的发展状况 |
2.9 本章小结 |
第三章 OLAP的研究及应用 |
3.1 基本概念 |
3.2 OLAP的多维数据结构 |
3.3 OLAP的实现方法 |
3.4 多维数据集的构建 |
3.5 OLAP的发展方向 |
3.6 本章小结 |
第四章 Rough集理论及其在决策支持上的应用研究 |
4.1 数据挖掘(DM)与知识发现(KDD) |
4.2 Rough集理论的特点 |
4.3 基于Rough集理论的知识发现过程 |
4.4 Rough集理论相关知识 |
4.5 决策规则的最大覆盖方法 |
4.6 改进的决策规则的最大覆盖方法 |
4.7 本章小结 |
第五章 实验及数据分析 |
5.1 决策需求分析 |
5.2 决策表构造 |
5.3 决策知识获取 |
5.4 实验结果及评价 |
5.5 RS方法与其他算法的比较分析 |
5.6 基于Rough集理论及数据仓库的决策支持系统模型 |
5.7 本章小结 |
第六章 总结 |
6.1 工作小结 |
6.2 进一步的工作 |
参考文献 |
致谢 |
(10)基于粗神经网络的数据挖掘方法及其应用(论文提纲范文)
1 绪论 |
1.1 论文研究的目的和意义 |
1.2 国内外研究现状及发展动态 |
1.3 论文的主要研究内容 |
2 市场营销与数据挖掘概述 |
2.1 数据挖掘在营销中的应用 |
2.2 粗糙集理论及其应用 |
2.3 神经网络及其应用 |
3 粗糙集模型及其在营销领域的应用 |
3.1 PAWLAK粗糙集模型及其在客户购买分析方面的应用 |
3.1.1 Pawlak粗糙集模型 |
3.1.2 改进的属性约简算法 |
3.1.3 算法正确性 |
3.1.4 算法复杂性 |
3.1.5 Pawlak粗糙集模型在客户购买分析方面的应用 |
3.2 变精度粗糙集模型及其在企业经营现状分析方面的应用 |
3.2.1 变精度粗糙集模型 |
3.2.2 变精度粗糙集模型在企业经营现状分析方面的应用 |
3.3 概率粗糙集模型及其在产品分类方面应用 |
3.3.1 概率粗糙集模型 |
3.3.2 概率粗糙集模型在产品分类方面应用 |
3.4 不完备信息系统的粗糙集模型及其在产品销售方面的应用 |
3.4.1 不完备信息系统的粗糙集模型 |
3.4.2 不完备信息系统的粗糙集在产品销售方面的应用 |
3.5 ROUGH SETS理论的存在问题 |
4 粗神经网络在市场营销产品销售领域中的应用 |
4.1 基于粗神经网络数据挖掘的市场营销系统 |
4.2 粗神经网络系统在产品销售预测领域中的应用 |
5 总结与展望 |
参考文献 |
致谢 |
作者简介及硕士期间发表的学术论文 |
四、粗集理论及其在数据挖掘中的应用(论文参考文献)
- [1]基于粗集求核和属性约简算法研究与应用[D]. 蔡莉. 合肥工业大学, 2009(11)
- [2]粗糙集和神经网络方法在数据挖掘中的应用[J]. 周序生,王志明. 计算机工程与应用, 2009(07)
- [3]数据挖掘中的软计算方法及其应用[J]. 汤效琴. 计算机系统应用, 2008(03)
- [4]基于粗集理论的数据挖掘方法及应用研究[D]. 张静. 大连理工大学, 2007(06)
- [5]基于客户集群和拓扑理论的CRM模型与算法研究[D]. 白爱民. 天津大学, 2006(05)
- [6]高亮度LED芯片制造工艺知识挖掘方法的研究及应用[D]. 赵斌. 广东工业大学, 2006(09)
- [7]基于粗糙集数据挖掘技术的客户价值分析[D]. 王宏. 哈尔滨工程大学, 2006(12)
- [8]基于粗糙集的数据及文本挖掘方法研究[D]. 王明春. 天津大学, 2005(07)
- [9]基于Rough集理论的知识发现及数据仓库的决策支持研究[D]. 黄宋斌. 广西大学, 2004(04)
- [10]基于粗神经网络的数据挖掘方法及其应用[D]. 崔华丽. 西安建筑科技大学, 2004(03)