分布式文件系统的设计问题 100分!!!!!

时间:2022-11-26 19:03:40
有100亿个url,每个url 包括site 跟path两部分。site就是比如 www.google.com  path就是http://www.google.com/s?wd=%D7%D6%B7%FB%B4%A 后面那部分,同时若干服务器分别位于不同地区。
要求设计一个系统,能实现url的添加、删除、更新,并能查看url的内容。
请大牛们拿分那!!!!!

5 个解决方案

#1


http://topic.csdn.net/u/20091013/21/f5f7a56f-9d0b-426d-ba0e-6045e44aaba9.html

基本上是同一个问题

每一个site根据hash值,存为一个文件,文件中包含所有path,以及path的Hash

#2


我觉得字典要合适些

#3


引用 1 楼 litaoye 的回复:
http://topic.csdn.net/u/20091013/21/f5f7a56f-9d0b-426d-ba0e-6045e44aaba9.html

 基本上是同一个问题

 每一个site根据hash值,存为一个文件,文件中包含所有path,以及path的Hash


能讲讲为什么用hash吗?

#4


引用 3 楼 crazylibai 的回复:
引用 1 楼 litaoye 的回复:
http://topic.csdn.net/u/20091013/21/f5f7a56f-9d0b-426d-ba0e-6045e44aaba9.html

基本上是同一个问题

每一个site根据hash值,存为一个文件,文件中包含所有path,以及path的Hash


能讲讲为什么用hash吗?

hash可以用来快速定位,hash算法设计得好的话,可以直接根据hash值定位到文件,然后根据pash的hash值定位这个path在文件中的位置,避免一个个去比较

#5


引用 3 楼 crazylibai 的回复:
引用 1 楼 litaoye 的回复:
 http://topic.csdn.net/u/20091013/21/f5f7a56f-9d0b-426d-ba0e-6045e44aaba9.html

  基本上是同一个问题

  每一个site根据hash值,存为一个文件,文件中包含所有path,以及path的Hash


 能讲讲为什么用hash吗?


hash查找速度快,可以快速定位

#1


http://topic.csdn.net/u/20091013/21/f5f7a56f-9d0b-426d-ba0e-6045e44aaba9.html

基本上是同一个问题

每一个site根据hash值,存为一个文件,文件中包含所有path,以及path的Hash

#2


我觉得字典要合适些

#3


引用 1 楼 litaoye 的回复:
http://topic.csdn.net/u/20091013/21/f5f7a56f-9d0b-426d-ba0e-6045e44aaba9.html

 基本上是同一个问题

 每一个site根据hash值,存为一个文件,文件中包含所有path,以及path的Hash


能讲讲为什么用hash吗?

#4


引用 3 楼 crazylibai 的回复:
引用 1 楼 litaoye 的回复:
http://topic.csdn.net/u/20091013/21/f5f7a56f-9d0b-426d-ba0e-6045e44aaba9.html

基本上是同一个问题

每一个site根据hash值,存为一个文件,文件中包含所有path,以及path的Hash


能讲讲为什么用hash吗?

hash可以用来快速定位,hash算法设计得好的话,可以直接根据hash值定位到文件,然后根据pash的hash值定位这个path在文件中的位置,避免一个个去比较

#5


引用 3 楼 crazylibai 的回复:
引用 1 楼 litaoye 的回复:
 http://topic.csdn.net/u/20091013/21/f5f7a56f-9d0b-426d-ba0e-6045e44aaba9.html

  基本上是同一个问题

  每一个site根据hash值,存为一个文件,文件中包含所有path,以及path的Hash


 能讲讲为什么用hash吗?


hash查找速度快,可以快速定位