简单的哈希表实现
这是一个简单的哈希表的实现,用c
语言做的。
原理
先说一下原理。
先是有一个bucket
数组,也就是所谓的桶。
哈希表的特点就是数据
与其在表中的位置存在相关性
,也就是有关系的,通过数据应该可以计算出其位置。
这个哈希表是用于存储一些键值对(key -- value
)关系的数据,其key
也就是其在表中的索引,value
是附带的数据。
通过散列算法,将字符串的key
映射到某个桶中,这个算法是确定的,也就是说一个key
必然对应一个bucket
。
然后是碰撞问题,也就是说多个key
对应一个索引值。举个例子:有三个key
:key1
,key3
,key5
通过散列算法keyToIndex
得到的索引值都为2
,也就是这三个key
产生了碰撞,对于碰撞的处理,采取的是用链表连接起来,而没有进行再散列。
这是包含的头文件
#include <stdio.h>
#include <stdlib.h>
#include <string.h> #define BUCKETCOUNT 16
哈希表和节点数据结构的定义
struct hashEntry
{
const char* key;
char* value;
struct hashEntry* next;
}; typedef struct hashEntry entry; struct hashTable
{
entry bucket[BUCKETCOUNT]; //先默认定义16个桶
}; typedef struct hashTable table;
初始化和释放哈希表
//初始化哈希表
void initHashTable(table* t)
{
int i;
if (t == NULL)return; for (i = ; i < BUCKETCOUNT; ++i) {
t->bucket[i].key = NULL;
t->bucket[i].value = NULL;
t->bucket[i].next = NULL;
}
} //释放哈希表
void freeHashTable(table* t)
{
int i;
entry* e,*ep;
if (t == NULL)return;
for (i = ; i<BUCKETCOUNT; ++i) {
e = &(t->bucket[i]);
while (e->next != NULL) {
ep = e->next;
e->next = ep->next;
free(ep->key);
free(ep->value);
free(ep);
}
}
}
哈希散列算法
//哈希散列方法函数
int keyToIndex(const char* key)
{
int index , len , i;
if (key == NULL)return -; len = strlen(key);
index = (int)key[];
for (i = ; i<len; ++i) {
index *= + (int)key[i];
}
index >>= ;
index &= (BUCKETCOUNT - );
return index;
}
辅助函数strDup
这是比较多余的做法,因为C标准库中string.h
中有一系列这样的函数。
//在堆上分配足以保存str的内存
//并拷贝str内容到新分配位置
char* strDup(const char* str)
{
int len;
char* ret;
if (str == NULL)return NULL; len = strlen(str);
ret = (char*)malloc(len + );
if (ret != NULL) {
memcpy(ret , str , len);
ret[len] = '\0';
}
return ret;
}
string.h
中的相关函数
#include <string.h> char *strdup(const char *s); char *strndup(const char *s, size_t n);
char *strdupa(const char *s);
char *strndupa(const char *s, size_t n);
哈希表的插入和修改
这个了插入和修改是一个方法,如果key
在哈希表中已经存在,那么就是修改value
,否则就是插入一个节点。
//向哈希表中插入数据
int insertEntry(table* t , const char* key , const char* value)
{
int index , vlen1 , vlen2;
entry* e , *ep; if (t == NULL || key == NULL || value == NULL) {
return -;
} index = keyToIndex(key);
if (t->bucket[index].key == NULL) {
t->bucket[index].key = strDup(key);
t->bucket[index].value = strDup(value);
}
else {
e = ep = &(t->bucket[index]);
while (e != NULL) { //先从已有的找
if (strcmp(e->key , key) == ) {
//找到key所在,替换值
vlen1 = strlen(value);
vlen2 = strlen(e->value);
if (vlen1 > vlen2) {
free(e->value);
e->value = (char*)malloc(vlen1 + );
}
memcpy(e->value , value , vlen1 + );
return index; //插入完成了
}
ep = e;
e = e->next;
} // end while(e... //没有在当前桶中找到
//创建条目加入
e = (entry*)malloc(sizeof (entry));
e->key = strDup(key);
e->value = strDup(value);
e->next = NULL;
ep->next = e;
}
return index;
}
哈希表中查找
因为这个哈希表中保存的是键值对
,所以这个方法是从哈希表中查找key
对应的value
的。要注意,这里返回的是value
的地址,不应该对其指向的数据进行修改,否则可能会有意外发生。
//在哈希表中查找key对应的value
//找到了返回value的地址,没找到返回NULL
const char* findValueByKey(const table* t , const char* key)
{
int index;
const entry* e;
if (t == NULL || key == NULL) {
return NULL;
}
index = keyToIndex(key);
e = &(t->bucket[index]);
if (e->key == NULL) return NULL;//这个桶还没有元素
while (e != NULL) {
if ( == strcmp(key , e->key)) {
return e->value; //找到了,返回值
}
e = e->next;
}
return NULL;
}
哈希表元素的移除
这个函数用于将哈希表中key
对应的节点移除,如果其不存在,那就返回NULL
。如果存在,就返回这个节点的地址。注意,这里并没有释放节点,如果不需要了,应该手动释放它。
//在哈希表中查找key对应的entry
//找到了返回entry,并将其从哈希表中移除
//没找到返回NULL
entry* removeEntry(table* t , char* key)
{
int index;
entry* e,*ep; //查找的时候,把ep作为返回值
if (t == NULL || key == NULL) {
return NULL;
}
index = keyToIndex(key);
e = &(t->bucket[index]);
while (e != NULL) {
if ( == strcmp(key , e->key)) {
//如果是桶的第一个
if (e == &(t->bucket[index])) {
//如果这个桶有两个或以上元素
//交换第一个和第二个,然后移除第二个
ep = e->next;
if (ep != NULL) {
entry tmp = *e; //做浅拷贝交换
*e = *ep;//相当于链表的头节点已经移除
*ep = tmp; //这就是移除下来的链表头节点
ep->next = NULL;
}
else {//这个桶只有第一个元素
ep = (entry*)malloc(sizeof(entry));
*ep = *e;
e->key = e->value = NULL;
e->next = NULL;
}
}
else {
//如果不是桶的第一个元素
//找到它的前一个(这是前面设计不佳导致的多余操作)
ep = &(t->bucket[index]);
while (ep->next != e)ep = ep->next;
//将e从中拿出来
ep->next = e->next;
e->next = NULL;
ep = e;
}
return ep;
}// end if(strcmp...
e = e->next;
}
return NULL;
}
哈希表打印
这个函数用于打印哈希表的内容的。
void printTable(table* t)
{
int i;
entry* e;
if (t == NULL)return;
for (i = ; i<BUCKETCOUNT; ++i) {
printf("\nbucket[%d]:\n" , i);
e = &(t->bucket[i]);
while (e->key != NULL) {
printf("\t%s\t=\t%s\n" , e->key , e->value);
if (e->next == NULL)break;
e = e->next;
}
}
}
测试一下
用于测试的数据来自于本机相关信息。
int main()
{
table t;
initHashTable(&t); insertEntry(&t , "电脑型号" , "华硕 X550JK 笔记本电脑");
insertEntry(&t , "操作系统" , "Windows 8.1 64位 (DirectX 11)");
insertEntry(&t , "处理器" , "英特尔 Core i7 - 4710HQ @ 2.50GHz 四核");
insertEntry(&t , "主板" , "华硕 X550JK(英特尔 Haswell)");
insertEntry(&t , "内存" , "4 GB(Hynix / Hyundai)");
insertEntry(&t , "主硬盘" , "日立 HGST HTS541010A9E680(1 TB / 5400 转 / 分)");
insertEntry(&t , "显卡" , "NVIDIA GeForce GTX 850M (2 GB / 华硕)");
insertEntry(&t , "显示器" , "奇美 CMN15C4(15.3 英寸)");
insertEntry(&t , "光驱" , "松下 DVD - RAM UJ8E2 S DVD刻录机");
insertEntry(&t , "声卡" , "Conexant SmartAudio HD @ 英特尔 Lynx Point 高保真音频");
insertEntry(&t , "网卡" , "瑞昱 RTL8168 / 8111 / 8112 Gigabit Ethernet Controller / 华硕");
insertEntry(&t , "主板型号" , "华硕 X550JK");
insertEntry(&t , "芯片组" , "英特尔 Haswell");
insertEntry(&t , "BIOS" , "X550JK.301");
insertEntry(&t , "制造日期" , "06 / 26 / 2014");
insertEntry(&t , "主人" , "就是我");
insertEntry(&t , "价格" , "六十张红色*");
insertEntry(&t , "主硬盘" , "换了个120G的固态"); entry* e = removeEntry(&t , "主板型号");
if (e != NULL) {
puts("找到后要释放");
free(e->key);
free(e->value);
free(e);
e = NULL;
} printTable(&t); const char* keys[] = { "显示器" , "主人","没有" , "处理器" };
for (int i = ; i < ; ++i) {
const char* value = findValueByKey(&t , keys[i]);
if (value != NULL) {
printf("find %s\t=\t%s\n" ,keys[i], value);
}
else {
printf("not found %s\n",keys[i]);
}
} freeHashTable(&t);
getchar();
return ;
}