《算法与数据结构考研试题精析》笔记(11) - 文件

选择好的散列函数和冲突处理是散列文件的关键。

磁带上只能存储顺序文件

ISAM文件适合于磁盘

B+树应用在VSAM文件系统中。

ISAM文件和VSAM文件属于索引顺序文件


倒排文件

  • 倒排文件是对次关键字建立索引;
  • 倒排文件包含有若干个倒排表;
  • 内容一个关键字值和该属性的全部记录地址
  • 维护困难;
  • 目的是为了多关键字查找;
  • 与多重表文件的次关键字索引结构是不同的。

【错误说法】Hash表与Hash文件的唯一区别是Hash文件引入了“桶”的概念。

【错误说法】对处理大量数据的外存介质而言,索引顺序存取方法是一种方便的文件组织方法。


文件由记录组成;记录由数据项组成。

文件可按其记录的类型不同分成两类,即操作系统文件数据库文件

从用户的观点看,文件的逻辑结构通常可分为两类:一类是如dBASE中数据库文件那样的文件组织结构,成为数据库文件;另一种是诸如用各种文字处理软件编辑成的文本文件,称为文本文件。从文件在存储器的存放方式来看,文件的物理结构往往可以分为三类,即顺序组织随机组织链组织。B+树适用于组织随机组织的索引结构…(关于B+树)

索引顺序文件即可以顺序存取,也可以随机存取

建立索引文件的目的是提高查找速度

倒排文件的主要优点在于检索速度快

检索是为了在文件中寻找满足一定条件的记录而设置的操作。检索可以按关键字检索,也可以按记录号检索;按记录号检索又可以有顺序检索直接检索

散列检索技术的关键是构造散列函数解决冲突的方法

VSAM系统是由索引集顺序集数据集构成的。

VSAM文件的优点:动态地分配和释放存储空间,不需要文件进行重组,并能较快地对插入的记录进行查找。