1.3.4 高级数据和信息系统与高级应用
日期:2007年6月10日 作者: 查看:[大字体 中字体 小字体]-
1.3.4 高级数据和信息系统与高级应用
关系数据库系统广泛地用于各种行业应用。随着数据库技术的发展,各种高级数据和信息系统已经出现并在开发中,以适应新的数据库应用的需要。
新的数据库应用包括处理空间数据(如地图)、工程设计数据(如建筑设计、系统部件或集成电路)、超文本和多媒体数据(包括文本、图像、视频和音频数据)、时间相关的数据(如历史记录或股票交易数据)、流数据(如视频监控和探测器数据,其中数据像流一样流进和流出)以及万维网(通过因特网提供巨大的、广泛分布的可用信息储存库)。这些应用需要有效的数据结构和可伸缩的方法来处理复杂的对象结构,变长记录,半结构化或非结构化的
数据、文本、空间和时间数据、多媒体数据, 以及具有复杂结构和动态变化的数据库模式。为满足这些需求,开发了高级数据库系统和面向特殊应用的数据库系统。这些包括对象-关系数据库系统、时间和时间序列数据库系统、空间和时间空间数据库系统、文本和多媒体数据库系统、异构和遗产数据库系统、数据流管理系统和基于Web的全球信息系统。
虽然这样的数据库或信息储存库需要复杂的机制,以便有效地存储、检索和更新大量复杂的数据,但是它们也为数据挖掘提供了肥沃的土壤,提出了挑战性的研究和实现问题。本节,我们将介绍上面列举的每种高级数据库系统。
1. 对象-关系数据库
对象-关系数据库基于对象-关系数据模型构造。这种模型通过提供处理复杂对象的丰富数据类型和对象定位,扩充关系模型。因为大部分复杂的数据库应用需要处理复杂的对象和结构,对象-关系数据库在业界和应用中日趋流行。
从概念上讲,对象-关系数据库模型继承了面向对象数据库的基本概念。其中,用一般术语,把每个实体看作一个对象。对于AllElectronics例子,对象可以是个别的雇员、顾客或商品。涉及一个对象的数据和代码封装在一个单元中。每个对象关联:• 一个变量集,描述对象。这对应于实体-联系和关系模型的属性。
• 一个消息集,对象可以使用它们与其他对象或与数据库系统的其他部分通信。
• 一个方法集,其中每个方法存放实现一个消息的代码。每收到一个消息,方法就返回一个响应值。例如,消息get_photo(employee)的方法将检索并返回给定雇员对象的照片。共享公共特性集的对象可以归入一个对象类。每个对象都是其对象类的实例。对象类可以组成类/子类层次结构,使每个类代表该类对象共有特性。例如,类employee可以包含变量name, address和birthdate。假设类sales_person是类employee的子类。一个sales_person对象将继承属于其超类employee的所有变量。此外,它还具有作为一个销售员特有的所有变量(如commission)。这种类继承性有利于信息共享。
对于对象-关系系统中的数据挖掘,需要开发新的技术,处理复杂的对象结构、复杂的数据类型、类和子类层次结构、特性继承以及方法和过程。
2. 时间数据库、序列数据库和时间序列数据库
时间数据库(temporal database)通常存放包含时间相关属性的关系数据。这些属性可能涉及若干时间标签,每个都具有不同的语义。序列数据库(sequence database)存放具有或不具有具体时间概念的有序事件的序列。例子包括顾客购物序列、Web点击流和生物学序列。时间序列数据库(time-series database)存放定时(如每小时、每天、每周)重复测量得到的值或事件的序列。例子包括股票交易、库存控制和自然现象(如气温和风力)观测收集的数据。
可以使用数据挖掘技术发现数据库中对象演变特征或对象变化趋势。这些信息对于决策和规划是有用的。例如,银行数据的挖掘可能有助于根据顾客的流量安排银行出纳员。可以挖掘股票交易数据,发现可能帮助你制订投资策略的趋势。(例如,何时是购买AllElectronics的股票的最佳时机?)通常,这种分析需要定义时间的多粒度。例如,时间可以按财政年、学年或日历年分解。年可以进一步分解成季度或月。
3. 空间数据库和时间空间数据库
空间数据库(Spatial database)包含涉及空间的信息。例子包括地理(地图)数据库、超大规模集成电路(VLSI)或计算机辅助设计数据库以及医疗和卫星图像数据库。空间数据可能用光栅格式(raster format)表示,由n维位图或像素图构成。例如,一个2维卫星图像可以用光栅数据表示,每个像素存放一个给定区域的降水量。地图也可以用向量格式表示,其中路、桥、建筑物和湖泊可以用诸如点、线、多边形和这些形状形成的划分和网络等基本几何
结构的组合或叠加表示。地理数据库有大量应用,包括从森林和生态规划,到提供关于电话和电气电缆、管道和水道系统位置在内的公共信息服务。此外,地理数据库还常常用于车辆疏导和调度系统。例如,一个用于出租车的系统可以存储一个城市的地图,提供关于单行线、交通拥挤时从区域A到区域B的建议路径、饭店和医院的位置以及每个司机的当前位置等信息。
你可能会问:“对于空间数据库可以进行何种数据挖掘?”数据挖掘可以发现描述坐落在特定类型地点(如公园)附近的房屋特征。其他模式可能描述不同海拔高度的山区气候,或根据城市离主要高速公路的距离描述大城市贫困率的变化趋势。可以考察空间对象集之间的联系,发现空间自相关或关联的对象子集。通过空间聚类分析可以发现簇和离群点。此外,还可以进行空间分类,根据空间对象的相关特征集构造预测模型。进一步,可以构造“空间
数据立方体”,将数据组织到多维结构和层次结构中,可以对其进行OLAP操作(如下钻和上卷)。存放随时间变化的空间对象的空间数据库称作时间空间数据库(spatiotemporal database),从这种数据库可以挖掘有趣的信息。例如,我们可以将移动对象的趋势分组,识别移动怪异的车辆;或者根据疾病随时间的地理分布,区别生物恐怖攻击与正常的流感爆发。
4. 文本数据库和多媒体数据库
- [1] [2] [3] 下一页
-
- 1.3.4 高级数据和信息系统与高级应用 相关文章:
- ·1.3.4 高级数据和信息系统与高级应用
- 1.3.4 高级数据和信息系统与高级应用 相关软件
- 特别声明:本站除部分特别声明禁止转载的专稿外的其他文章可以自由转载,但请务必注明出处和原始作
- 者.文章版权归文章原始作者所有.对于被本站转载文章的个人和网站,我们表示深深的谢意。如果本站转
- 载的文章有版权问题请联系编辑人员,我们尽快予以更正. 转载请注明来源:http://www.hackhome.com
上一篇:1.5 所有模式都是有趣的吗
下一篇:1.2 什么是数据挖掘
精品推荐
热点TOP10
- ·UML业务建模实例分析
- ·GIF文件格式
- ·代码静态分析工具PC-LINT安装配置
- ·游戏外挂设计技术探讨
- ·开发WDM型的USB设备驱动程序
- ·设计模式探索系列之Bridge模式
- ·逆向思维 《魔兽世界》封包分析
- ·LZW压缩算法简介
- ·Solaris 10 安装及SVC管理及X及Vmware及其它可能遇到的一些问题
- ·1.2 什么是数据挖掘
- ·Spring让LOB数据操作变得简单易行
- ·编写QQ外挂插件的原理和方法
- ·使用BHO定制你的IE浏览器
- ·利用API在Windows下创建进程和线程
- ·在内存中修改数据的网游外挂
- ·程序语言效率比较
- ·正则表达式从入门到精通
- ·网络监听技术概览
- ·游戏开发新手入门之跟踪窗口和使用GDI
- ·原始套接字透析之实现Ping
