`
aspnetwinform
  • 浏览: 84565 次
  • 性别: Icon_minigender_2
  • 来自: 武汉
社区版块
存档分类
最新评论

散列表(三):冲突处理的方法之开地址法(线性探测再散列的实现)

阅读更多

二、开地址法

基本思想:当关键码key的哈希地址H0 = hash(key)出现冲突时,以H0为基础,产生另一个哈希地址H1 ,如果H1仍然冲突,再以H0

基础,产生另一个哈希地址H2 ,…,直到找出一个不冲突的哈希地址Hi ,将相应元素存入其中。这种方法有一个通用的再散列函

数形式:


其中H0 为hash(key) ,m为表长,di称为增量序列。增量序列的取值方式不同,相应的再散列方式也不同。主要有以下四种:

线性探测再散列

二次探测再散列

伪随机探测再散列

双散列法


(一)、线性探测再散列


假设给出一组表项,它们的关键码为 Burke, Ekers, Broad, Blum, Attlee, Alton, Hecht, Ederly。采用的散列函数是:取其第一个字母在

字母表中的位置。


hash (x) = ord (x) - ord (‘A’)

这样,可得

hash (Burke) = 1hash (Ekers) = 4

hash (Broad) = 1hash (Blum) = 1

hash (Attlee) = 0hash (Hecht) = 7

hash (Alton) = 0hash (Ederly) = 4

又设散列表为HT[26],m = 26。采用线性探查法处理溢出,则上述关键码在散列表中散列位置如图所示。红色括号内的数字表示找

到空桶时的探测次数。比如轮到放置Blum 的时候,探测位置1,被占据,接着向下探测位置2还是不行,最后放置在位置3,总的探

次数是3。



堆积现象

散列地址不同的结点争夺同一个后继散列地址的现象称为堆积(Clustering),比如ALton 本来位置是0,直到探测了6次才找到合适位

置5。这将造成不是同义词的结点也处在同一个探测序列中,从而增加了探测序列长度,即增加了查找时间。若散列函数不好、或装

填因子a 过大,都会使堆积现象加剧。


下面给出具体的实现代码,大体跟前面讲过的链地址法差异不大,只是利用的结构不同,如下:


status 保存状态,有EMPTY, DELETED, ACTIVE,删除的时候只是逻辑删除,即将状态置为DELETED,当插入新的key 时,只要不

是ACTIVE 的位置都是可以放入,如果是DELETED位置,需要将原来元素先释放free掉,再插入。


common.h:

C++ Code
<nobr>1<br> 2<br> 3<br> 4<br> 5<br> 6<br> 7<br> 8<br> 9<br> 10<br> 11<br> 12<br> 13<br> 14<br> 15<br> 16<br> 17<br> 18<br> 19<br></nobr>
#ifndef_COMMON_H_
#define_COMMON_H_

#include<unistd.h>
#include<sys/types.h>
#include<stdlib.h>
#include<stdio.h>
#include<string.h>


#defineERR_EXIT(m)\
do\
{\
perror(m);\
exit(EXIT_FAILURE);\
}\
while(0)

#endif


hash.h:

C++ Code
<nobr>1<br> 2<br> 3<br> 4<br> 5<br> 6<br> 7<br> 8<br> 9<br> 10<br> 11<br> 12<br> 13<br> 14<br> 15<br></nobr>
#ifndef_HASH_H_
#define_HASH_H_

typedefstructhashhash_t;
typedefunsignedint(*hashfunc_t)(unsignedint,void*);

hash_t*hash_alloc(unsignedintbuckets,hashfunc_thash_func);
voidhash_free(hash_t*hash);
void*hash_lookup_entry(hash_t*hash,void*key,unsignedintkey_size);
voidhash_add_entry(hash_t*hash,void*key,unsignedintkey_size,
void*value,unsignedintvalue_size);
voidhash_free_entry(hash_t*hash,void*key,unsignedintkey_size);


#endif/*_HASH_H_*/


hash.c:

C++ Code
<nobr>1<br> 2<br> 3<br> 4<br> 5<br> 6<br> 7<br> 8<br> 9<br> 10<br> 11<br> 12<br> 13<br> 14<br> 15<br> 16<br> 17<br> 18<br> 19<br> 20<br> 21<br> 22<br> 23<br> 24<br> 25<br> 26<br> 27<br> 28<br> 29<br> 30<br> 31<br> 32<br> 33<br> 34<br> 35<br> 36<br> 37<br> 38<br> 39<br> 40<br> 41<br> 42<br> 43<br> 44<br> 45<br> 46<br> 47<br> 48<br> 49<br> 50<br> 51<br> 52<br> 53<br> 54<br> 55<br> 56<br> 57<br> 58<br> 59<br> 60<br> 61<br> 62<br> 63<br> 64<br> 65<br> 66<br> 67<br> 68<br> 69<br> 70<br> 71<br> 72<br> 73<br> 74<br> 75<br> 76<br> 77<br> 78<br> 79<br> 80<br> 81<br> 82<br> 83<br> 84<br> 85<br> 86<br> 87<br> 88<br> 89<br> 90<br> 91<br> 92<br> 93<br> 94<br> 95<br> 96<br> 97<br> 98<br> 99<br> 100<br> 101<br> 102<br> 103<br> 104<br> 105<br> 106<br> 107<br> 108<br> 109<br> 110<br> 111<br> 112<br> 113<br> 114<br> 115<br> 116<br> 117<br> 118<br> 119<br> 120<br> 121<br> 122<br> 123<br> 124<br> 125<br> 126<br> 127<br> 128<br> 129<br> 130<br> 131<br> 132<br> 133<br> 134<br> 135<br> 136<br> 137<br> 138<br> 139<br> 140<br> 141<br> 142<br> 143<br> 144<br> 145<br> 146<br> 147<br> 148<br> 149<br> 150<br> 151<br> 152<br> 153<br> 154<br> 155<br> 156<br> 157<br></nobr>
#include"hash.h"
#include"common.h"
#include<assert.h>


typedefenumentry_status
{
EMPTY,
ACTIVE,
DELETED
}entry_status_t;

typedefstructhash_node
{
enumentry_statusstatus;
void*key;
void*value;
}hash_node_t;


structhash
{
unsignedintbuckets;
hashfunc_thash_func;
hash_node_t*nodes;
};

unsignedinthash_get_bucket(hash_t*hash,void*key);
hash_node_t*hash_get_node_by_key(hash_t*hash,void*key,unsignedintkey_size);


hash_t*hash_alloc(unsignedintbuckets,hashfunc_thash_func)
{
hash_t*hash=(hash_t*)malloc(sizeof(hash_t));
//assert(hash!=NULL);
hash->buckets=buckets;
hash->hash_func=hash_func;
intsize=buckets*sizeof(hash_node_t);
hash->nodes=(hash_node_t*)malloc(size);
memset(hash->nodes,0,size);
printf("Thehashtablehasallocate.\n");
returnhash;
}

voidhash_free(hash_t*hash)
{
unsignedintbuckets=hash->buckets;
inti;
for(i=0;i<buckets;i++)
{
if(hash->nodes[i].status!=EMPTY)
{
free(hash->nodes[i].key);
free(hash->nodes[i].value);
}
}

free(hash->nodes);

printf("Thehashtablehasfree.\n");
}

void*hash_lookup_entry(hash_t*hash,void*key,unsignedintkey_size)
{
hash_node_t*node=hash_get_node_by_key(hash,key,key_size);
if(node==NULL)
{
returnNULL;
}

returnnode->value;
}

voidhash_add_entry(hash_t*hash,void*key,unsignedintkey_size,
void*value,unsignedintvalue_size)
{
if(hash_lookup_entry(hash,key,key_size))
{
fprintf(stderr,"duplicatehashkey\n");
return;
}

unsignedintbucket=hash_get_bucket(hash,key);
unsignedinti=bucket;
//找到的位置已经有人存活,向下探测
while(hash->nodes[i].status==ACTIVE)
{
i=(i+1)%hash->buckets;
if(i==bucket)
{
//没找到,并且表满
return;
}
}

hash->nodes[i].status=ACTIVE;
if(hash->nodes[i].key)//释放原来被逻辑删除的项的内存
{
free(hash->nodes[i].key);
}
hash->nodes[i].key=malloc(key_size);
memcpy(hash->nodes[i].key,key,key_size);
if(hash->nodes[i].value)//释放原来被逻辑删除的项的内存
{
free(hash->nodes[i].value);
}
hash->nodes[i].value=malloc(value_size);
memcpy(hash->nodes[i].value,value,value_size);

}

voidhash_free_entry(hash_t*hash,void*key,unsignedintkey_size)
{
hash_node_t*node=hash_get_node_by_key(hash,key,key_size);
if(node==NULL)
return;

//逻辑删除,置标志位
node->status=DELETED;
}

unsignedinthash_get_bucket(hash_t*hash,void*key)
{
//返回哈希地址
unsignedintbucket=hash->hash_func(hash->buckets,key);
if(bucket>=hash->buckets)
{
fprintf(stderr,"badbucketlookup\n");
exit(EXIT_FAILURE);
}

returnbucket;
}

hash_node_t*hash_get_node_by_key(hash_t*hash,void*key,unsignedintkey_size)
{
unsignedintbucket=hash_get_bucket(hash,key);
unsignedinti=bucket;
while(hash->nodes[i].status!=EMPTY&&memcmp(key,hash->nodes[i].key,key_size)!=0)
{
i=(i+1)%hash->buckets;
if(i==bucket)//探测了一圈
{
//没找到,并且表满
returnNULL;
}
}
//比对正确,还得确认是否还存活
if(hash->nodes[i].status==ACTIVE)
{
return&(hash->nodes[i]);
}

//如果运行到这里,说明i为空位或已被删除

returnNULL;
}

main.c:

C++ Code
<nobr>1<br> 2<br> 3<br> 4<br> 5<br> 6<br> 7<br> 8<br> 9<br> 10<br> 11<br> 12<br> 13<br> 14<br> 15<br> 16<br> 17<br> 18<br> 19<br> 20<br> 21<br> 22<br> 23<br> 24<br> 25<br> 26<br> 27<br> 28<br> 29<br> 30<br> 31<br> 32<br> 33<br> 34<br> 35<br> 36<br> 37<br> 38<br> 39<br> 40<br> 41<br> 42<br> 43<br> 44<br> 45<br> 46<br> 47<br> 48<br> 49<br> 50<br> 51<br> 52<br> 53<br> 54<br> 55<br> 56<br> 57<br> 58<br> 59<br> 60<br> 61<br> 62<br> 63<br> 64<br> 65<br> 66<br> 67<br> 68<br> 69<br> 70<br> 71<br> 72<br> 73<br> 74<br> 75<br> 76<br> 77<br> 78<br> 79<br> 80<br> 81<br> 82<br> 83<br> 84<br> 85<br></nobr>
#include"hash.h"
#include"common.h"

typedefstructstu
{
charsno[5];
charname[32];
intage;
}stu_t;

typedefstructstu2
{
intsno;
charname[32];
intage;
}stu2_t;


unsignedinthash_str(unsignedintbuckets,void*key)
{
char*sno=(char*)key;
unsignedintindex=0;

while(*sno)
{
index=*sno+4*index;
sno++;
}

returnindex%buckets;
}

unsignedinthash_int(unsignedintbuckets,void*key)
{
int*sno=(int*)key;
return(*sno)%buckets;
}

intmain(void)
{

stu2_tstu_arr[]=
{
{1234,"AAAA",20},
{4568,"BBBB",23},
{6729,"AAAA",19}
};

hash_t*hash=hash_alloc(256,hash_int);

intsize=sizeof(stu_arr)/sizeof(stu_arr[0]);
inti;
for(i=0;i<size;i++)
{
hash_add_entry(hash,&(stu_arr[i].sno),sizeof(stu_arr[i].sno),
&stu_arr[i],sizeof(stu_arr[i]));
}

intsno=4568;
stu2_t*s=(stu2_t*)hash_lookup_entry(hash,&sno,sizeof(sno));
if(s)
{
printf("%d%s%d\n",s->sno,s->name,s->age);
}
else
{
printf("notfound\n");
}

sno=1234;
hash_free_entry(hash,&sno,sizeof(sno));
s=(stu2_t*)hash_lookup_entry(hash,&sno,sizeof(sno));
if(s)
{
printf("%d%s%d\n",s->sno,s->name,s->age);
}
else
{
printf("notfound\n");
}

hash_free(hash);

return0;
}

simba@ubuntu:~/Documents/code/struct_algorithm/search/hash_table/linear_probing$ ./main
The hash table has allocate.
4568 BBBB 23
not found
The hash table has free.


链地址法示例还有一点不同,就是key 使用的是int 类型,所以必须再实现一个hash_int 哈希函数,根据key 产生哈希地址。


分享到:
评论

相关推荐

    散列表 (哈希表,线性探测再散列)

    散列表,也称为哈希表。根据设定的哈希函数H(key)和处理冲突的方法将一组... 处理冲突的方法:1)开放定址法(线性探测再散列,二次探测再散列,伪随机探测再散列) 2)再哈希法 3)链地址法 4)建立一 公共溢出区

    选取哈西函数h(k)=k%11,用线性探测在散列方法处理冲突。是

    选取哈西函数h(k)=k%11,用线性探测在散列方法处理冲突。是在0-10的散列地址中,对关键序列(22,41,53,46,30,01,67)构造哈希表并求等概率情 况下查找成功与不成功过的平均查找长度

    线性探测法和拉链法处理散列表冲突

    对于给定的一组整数和散列函数,分别采用线性探测法和拉链法处理冲突构造散列表,并在这两种方法构建的散列表中查找整数K,比较两种方法的时间和空间性能。

    实验六 查找的有关操作.cpp

    1. 随机产生一组关键字,已知散列函数为H(key)=key%p(p为自定的常数),冲突处理方法为线性探测法实现散列表的建立(利用插入算法实现); 2.编写从散列表中查找一个元素的算法。

    Hash表存储数据,用再散列来解决地址冲突问题,计算平均查找长度,还可以通过Key值查找对应的value

    散列表(Hash table,也叫哈希表),是根据关键码值(Key value)而直接进行访问的数据结构。也就是说,它通过把关键码值映射到表中一个位置来访问记录,以加快查找的速度。

    散列表---算法数据结构

    散列表散列表散列表散列表散列表散列表散列表散列表散列表散列表

    散列表的建立和查找.zip

    假设关键字为整型数据,散列函数用除留余数法,采用开放定址法的线性探测法处理冲突。 1.从键盘输入关键字个数n及关键字数据; 2.根据输入的关键字个数及平均查找长度要求,设计散列函数和计算表长; 3.构造散列表;...

    哈希函数的应用(数据结构课程设计)

    1.给定一关键字序列,用除留余数法构造hash函数,用线性探测再散列解决冲突构造hash表; 2.给定一个关键字进行查找,返回其位序(如不存在返回0值);

    处理散列冲突的方法

    一旦发生了冲突,就去寻找下一个空的散列地址,只要散列表足够大,空的散列地址总能找到,并将记录存入。 发生冲突,另寻他处 我们把这种解决冲突的方法称为线性探测法。 我们在解决冲突的时候,还会碰到比如说一个...

    哈希表的设计与实现.zip

    造,用线性探测再散列法或链地址法处理冲突) 4)查找并显示给定电话号码的记录;(显示比较次数) 5)查找并显示给定用户姓名的记录;(显示比较次数) 6)输出相应的哈希表,计算平均查找长度; 7)设计一个菜单,上述...

    人名查询哈希表设计(链地址法)

    哈希函数用除留余数法构造,用线性探测再散列法或链地址法处理冲突。 测试数据 取读者周围较熟悉的30个人名。 选作内容 (1) 从教科书上介绍的集中哈希函数构造方法中选出适用者并设计几个不同的哈希函数,比较...

    哈希表设计

    针对某个集体中人名设计一个哈希表,使得平均查找长度不超过R,并完成相应的建表和查表程序。假设人名为中国人姓名的汉语拼音形式。...哈希函数用除留余数法构造,用线性探测再散列法或链地址法处理冲突。

    哈希表的查找、删除等相关算法

    哈希表中线性探查法解决冲突,查找,删除、插入关键字等操作

    实现顺序查找、折半查找和散列表的查找功能

    这个程序包含三种查找算法的实现: ...散列表: 使用数组实现哈希表,利用散列函数和线性探测法解决冲突。 用户可以选择在生成的随机数中查找目标值,程序会根据用户选择的算法来执行相应的查找操作。

    哈希(散列)查找1

    1、散列函数的设计 2、冲突的处理 1、直接地址法 2、除留余数法 3、数字分析法 4、平方取中法 1、线性探测法 3、随机探测法 2、二次探测法 4、拉链法:

    sanliebiao.rar_visual c_散列

    散列表```用线性探测解决冲突```````

    Delphi算法与数据结构 源码(上)

    7.2利用线性探测方法实现冲突解决 7.3其他开放定址机制 7.4利用链式方法解决冲突 7.5利用桶式方法解决冲突 7.6磁盘上的散列表 7.7小结 第8章二叉树 8.1创建一个二叉树 8.2叉树的插入和删除 8.3二叉树的遍历...

    Delphi算法与数据结构 源码(下)

    7.2利用线性探测方法实现冲突解决 7.3其他开放定址机制 7.4利用链式方法解决冲突 7.5利用桶式方法解决冲突 7.6磁盘上的散列表 7.7小结 第8章二叉树 8.1创建一个二叉树 8.2叉树的插入和删除 8.3二叉树的遍历...

    数据结构(C++)有关练习题

    首先用C++实现单链表编程,再基于编写好的单链表类,实现堆栈类的定义和实现。 c. 链表类和堆栈类都要包含必要的成员函数(按照教材要求)。 2、 已知a[n]为整数数组,试写出实现下列运算的递归代码(C或C++...

    数据结构题

    6,线性探测法处理冲突,构造该散列表。 关键字序列: 14,7,11,4,49,54,写出直接插入排序,起泡排序,简单选择排序(快速排序)每趟结果。 初始序列:{14,7,11,4,49,54} 第一趟{4,7,11},14,{49,54} ...

Global site tag (gtag.js) - Google Analytics