简介:简介由于拼写错误、意外的缩略语和其他不规则问题,实际的数据是“有问题”的。因此,在数据仓储项目中,很大一部分的时间和金钱都花费在了数据提取、数据转换和数据加载(ETL,Extraction、Transformation、Loading)阶段。在ETL阶段,新数据被清理、标准化,并使其与现有数据一致。在MicrosoftSQLServer2005中可用的模糊查找和模糊分组转换,有助于使ETL过程在遇到若干种在交际数据中观测到的常见错误时更易复原。它们解决一般的匹配和分组问题,而无需特定于域的规则和脚本的专家集合。通过为您的域自定义模糊查找和模糊分组,您可以利用BusinessIntelligenceDevelopmentStudio内的通用数据清理算法,并避免创建复杂的自定义规则和代码。
简介:头脑风暴法是现在流行的在一些管理书籍中描述的各种技术之一。那些写书的人描述了头脑风暴法的大量细节和各种各样的程序、方法,由此也挣了不少钱。这种方法总是被人用到,以至于很多人都对这个方法感到厌倦了。这真是对这个方法的误解,因为它最基本的概念是很有道理的,而且这个方法也的确很有效。这个方法的基本思路非常简单:召集一组人,让他们不加评价和批评地提出尽可能多的想法,随后才对它们进行评估。通过告诉人们无论说出什么想法都不会受批评,刻意地鼓励他们提出各种疯狂的念头。越是鼓励创造性地思考,就会提出越来越多的想法。随后,把这些想法都汇集起来,并且从头脑风暴会议的混乱中提取出一些比较合理的意识。