语义网 (Semantic Web)和 web 3.0

时间:2023-03-09 23:58:18
语义网 (Semantic Web)和 web 3.0

语义网=有意义的网络。

“如果说 HTML 和 WEB 将整个在线文档变成了一本巨大的,那么 RDF, schema, 和 inference languages 将会使世界上所有的数据变成一个巨大的数据库。”

--- Tim Berners-Lee, Weaving the Web, 1999

=================

作者:顾轶灵
链接:https://www.zhihu.com/question/19965749/answer/13499141
来源:知乎
著作权归作者所有,转载请联系作者获得授权。
简单说下我的看法。
传统的 Web:以内容为核心,网站负责提供各种内容 (新闻、小说、视频等等) 吸引用户,用户主要是找到自己感兴趣的内容后较被动地接受信息。

“Web 2.0”:之所以加引号,因为毕竟没有所谓的 “Web 2.0 标准”。在广泛的共识中,Web 2.0 以用户为核心,用户自己共享内容 (User-generated content,比如发表微博、博客文章、podcast、上传视频、图片到 Youtube、Flickr 等等),Web 服务商提供各类 Web 应用来承载用户的内容、组织他们之间的交互。相比传统 Web,Web 2.0 的各种服务更专注于用户,提供更好的交互体验,同时各种服务商提供不同的开放 API,使得一些个性化 Web 应用的实现成为可能。

“Web 3.0”:应该说 Web 3.0 这个说法究竟指什么还没能得到广泛的共识,大家对其定义有很多不同的理解。
其中,较多人把语义网 (Semantic Web, http://www.w3.org/2001/sw/) 看作 Web 3.0。这是 WWW 之父 Tim Berners-Lee 提出的,对当前的 Web 内容组织方式可以算是一种颠覆:目前互联网上的信息绝大多数都是以 HTML 格式承载的,是将各个网站背后数据库中隐藏着的结构化信息编码为浏览器能够渲染的 HTML 代码 (在这过程中浏览器并不知道网页内容的真正含义,只知道如何渲染),最终渲染为人类可读的信息。这就有一个非常大的局限:真正在互联网上能够被共享的信息绝大多数都是半结构化的 HTML 内容,因为这些信息是海量的,要把它们整合利用必须通过自动化的手段,但机器又难以理解 HTML 中实际给人类阅读的内容。所以现在各种自然语言处理、人工智能的方法被广泛应用于互联网内容的处理,力图让机器能够还原各种数据之间的关系,更智能地加以组织利用 (这里说的不是小说等自然语言文本,而主要是一些原本结构化的信息,在转换为 HTML 的过程中丢失了原来的语义。例如电子商务网站上某个照相机的各项参数,机器很难准确识别一个网页中哪些部分是用来描述这个相机的,而哪些又是广告或是描述其他产品的)。
而语义网的概念是从另一个方向来解决这个问题:不用机器来做基于人工智能的识别,而是在提供内容的时候,就用明确的、机器可读、有标准语义可依的方式来将所提供内容的语义描述清楚,建立完善的机制来描述互联网上的各种资源。在资源的标准化描述之上,建立标准的语义推理以及信任体系,为各种智能代理 (intelligent agent) 提供可靠的信息、标准化的交互模式,从而改变人们访问 Web 的方式 (比如比 Siri 更为强大且智能得多的应用,记得有个例子是当你牙疼要看牙医,智能代理会自动检查你的日程安排、寻找合适的有空的牙医、与诊所的代理进行自动登记,为你安排出行)。

目前已经有几项技术成为了语义网的推荐标准 (http://www.w3.org/standards/semanticweb/ ),其中在 Unicode、URI、XML 等基础设施层之上已经成为标准的有:
  • RDF/RDFS,资源描述框架及基于此的一套词汇集
  • OWL,Web 本体语言,用来在 RDF 之上提供基于本体的词汇集
  • SPARQL,用于查询 RDF 文档

在这些层次之上,还有推理、信任等层还没有确定的标准。
语义网能否最终发展成为其愿景所描述的状态,还很难说。因为从目前来看,各种开放 API 已经可以组织成甚为丰富的 Web 应用,而像语义网愿景中描述的可以自己搜寻识别可用服务进行组合完成用户需求的超级智能代理,显得有些遥遥无期。此外,语义网的标准的推动也有很大难度,率先“拥抱”这些标准短期内并不会给互联网公司带来多大的好处,且语义网的未来又被很多人看衰,最终结局会不会惨淡收场也尚未可知。批评语义网的观念太过理想化、认为其完全不可能成为现实的人大有人在。

回到 Web 3.0,语义网只是其中一种说法,也有人把语义网称为 “Web 4.0”。其它观点个人不太了解,也就留待其他人补充吧。

至于盈利模式,可以说目前互联网上的主要盈利模式还是广告。Web 不管是几点零,之前的模式也不是说就被取代了。比如说现在我们有那么多 Web 2.0 网站,但是提供内容服务的网站同样可以很红火,人们照样上新浪看新闻、上优酷看电视剧。只要用户能看得见的地方,都可以通过广告来获得利润。此外还有电子商务,不管 Web 几点零,通过交易总是可以获取利润的,只是交易的交互模式可能发生改变。另外一个途径是提供收费服务 (比如提供云计算服务、提供网游等娱乐服务),这和电商类似,只是交易的内容不是实体。

=========================

什么是对于Web 3.0[1]

  对于Web 3.0的概念更是众说纷纭,如把Web 3.0等同于基于浏览器的虚拟网络操作系统Web OS,或等同于智能语义网,或等同于Web服务;有的提出Web 3.0是XML Web Services,属于开放式OPenAPI(应用程序编程接口);Google则把云计算看做是Web 3.0,(Google CEO Eric Schmidt在韩国首尔数码论坛(Seoul Digital Forum)上,定义Web 3.0的概念):“Web 3.0是指集合众多应用在一起,并带有以下特点:应用相对少,数据成云状分布,应用可以运行于任何设备上(电脑或者手机都可以),应用速度很快且可以高度个性化设置,呈病毒化几何数量级的分发(通过社会网络电子邮件等)。

Web 3.0的特点

  1.Web 3.0的API(应用程序编程接口)是全球范围的,也就是XMLWebServices;

  2.Web 3.0的速度达到10G,所有的应用都不用担心速度;

  3.Web 3.0是一个技术框架或操作系统。

Web 3.0的核心内涵

  为了说明Web 3.0,我们需要回顾Web历史上的重要浪潮。它们不是严格按时间定义的,而是交叉重叠在一起的。

  1.Web l.0:任何人可以交易。1.O是关于来自一些主要的公司,如:eBayAmazon和Google等。我们一直认为它们仅仅是网站,但它们实际上是一些功能丰富、容易上手、扩展性强的应用程序,这些特性以前很少被普通消费者看到过。Web 1.0在今天依旧具有很大的推动力,并且将持续很长时间。

  2.Web 2.0:任何人可以参与。Web 2.0特点是用户产生内容、合作化、社区化。代表性的事物就是:BlogWiki等。任何人可以参与到内容的创建中。在You Tube上上传一个视频,在Flickr上上传参加聚会的照片。所有这些都不需要专门的技术,仅仅需要连接上互联网。参与改变了我们对于内容的理解:内容不是固定在发布者那里,它是活动在任何地方的。

  3.Web 3.0:任何人可以创新。Web 3.0通过改变传统软件行业的技术和经济基础来改变现有的一切。新的Web 3.0强调的是任何人,在任何地点都可以创新。代码编写、协作、调试、测试、部署、运行都在云计算上完成。对于企业来说,Web 3.0意味着SaaS程序可以比传统的c—s软件更快、更高效的开发、部署、升级。对于开发者来说,Web 3.0意味着他们需要创建一个理想的应用程序,所需要的仅仅是一个想法,一个浏览器。因为世界上的每一个开发人员都可以访问强大的云计算,Web 3.0是全球经济的推动力。

  从上述来看,我们认为:Web 3.0跟Web 2.0一样,仍然不是技术的创新,而是思想的创新,是本体技术以及知识组织观念在网络空间中的延伸和深入发展。Web 3.0的最大价值不是提供信息,而是提供基于不同需求的过滤器,每一种过滤器都是基于一个具体需求。如果说Web 2.0解决了个性解放的问题,那么Web 3.0就是解决信息社会机制的问题,也就是最优化信息聚合的问题。所以,Web 3.0的核心内涵就是信息的高度整合和高度的智能化服务。

Web 3.0的结构[2]

  Web 3.0的布局可以划分为四个不同层面:API服务、聚合服务、应用程序服务以及被服务的客户

  应用程序接口(API)服务。API服务是使Web 2.0运行的主服务器,并且将成为Web 3.0的引擎。下面是一些例子:谷歌的搜索和AdWords API;Areazon.com的附属API;大量的RSS源;众多的功能服务,比如包含在StrikeIron网络服务市场(strikeiron.com)(Wainewright 2005)里的那些。这个基础层最突出的特征之一就是它是商品层。随着Web 3.0逐渐成熟,将会产生一个近乎完美的市场,它将从最高容量的服务中挤出所有利润

  聚合服务。这些服务是一种中介,通过将原始API服务以一种有用的途径捆绑在一起,来解决一部分定位上的困难。各种各样的RSS聚合器和新兴的网络服务市场,如Strikelron服务都是很典型的例子。

  应用程序服务。最多、最持久的利润应该出现在这一层。这些服务将不同于现有的企业应用程序种类,如CRMERP,而是作为一种新型的复合应用程序,将多种服务的基础功能集中起来,帮助用户以一种灵活、直观的方式达到目的。一个有望增长的领域的例-g-.是语音商务(voice commerce(v-commerce)),它涵盖了语音识别的应用,该应用的目的在于使声控服务,包括互联网浏览和电子邮件提取成为可能。

  被服务的客户。在Web 3.0界面的设计中,客户端逻辑发挥了重要的作用,但是用户更希望掌握和控制Web 3.0的一些后台的操作知识。

  从数十亿份形成网络的文件和将其整合在一起的链接中,计算机科学家和越来越多的新公司企图找到开发人类智力的新途径。它们的目的是在现存的网络系统之上增加一层含义,它将使现存网络不像一份目录而更像一个向导——甚至为人工智能系统提供了基础。为了完成这种程度的人工智能,即机器能够思考而不是仅仅听从指挥,研究者已经投入了半个多世纪的精力,但仍未成功。Web 3.0的一个主要技术是语义网络。

Web 3.0的特征分析

  作为Web 2.0的替代物,Web 3.0仍然是建立在Web 2.0的基础之上,并且实现了更加“智能化的人与人和人与机器的交流”功能的互联网模式。笔者从信息媒体网络化角度出发,归纳总结了Web 3.0四个方面的主要特征。

  1.微内容(widget)的*整合与有效聚合

  Web 3.0将应用Mash—up技术对用户生成的内容信息进行整合,使得内容信息的特征性更加明显,便于检索。将精确地阐明信息内容特征的标签进行整合,提高信息描述的精确度,从而便于互联网用户的搜索与整理。同时,对于UGC(用户原创内容)的筛选性过滤也将成为Web 3.0不同于Web 2.0的主要特征之一。互联网用户的发布权限需经过长期的认证,对其发布的信息做不同可信度的分离,可信度高的信息将会被推到互联网信息检索的首项,同时提供信息的互联网用户的可信度也会得到相应的提高。

  最后聚合技术的应用将在Web 3.0模式下发挥更大的作用,TAG/RSS基础聚合设施,渐进式语义网的发展也将为Web 3.0构建完备的内容聚合与应用聚合平台。将传统意义的聚合技术和挖掘技术相结合,创造出更加个性化、搜索反应迅速、准确的“Web挖掘个性化搜索引擎”。

  2.适合多种终端平台,实现信息服务的普适性

  Web 3.0的网络模式将实现不同终端的兼容,从PC互联网到WAP手机、PDA、机顶盒、专用终端,不只应用在互联网这一单一终端上。

  现有的Web 2.0只能通过PC终端应用在互联网这一单一的平台上。现在层出不穷的新的移动终端的开发与应用都需要新的技术层面和理念层面的支持。而Web 3.0将打破这一僵局,使得各种终端的用户群体都可以享受到在互联网上冲浪的便捷。

  3.良好的人性化用户体验以及基础性的个性化配置

  Web 3.0同样以人为本,将用户的偏好作为设计的主要考虑因素。Web 3.0在对于UGC筛选性过滤的基础上同时引入偏好信息处理与个性化引擎技术,对用户的行为特征进行分析,既寻找可信度高的UGC发布源,同时对互联网用户的搜索习惯进行整理、挖掘,得出最佳的设计方案,帮助互联网用户快速、准确地搜索到自己想要的感兴趣的信息内容,避免了大量信息带来的搜索疲劳。

  个性化搜索引擎以有效的用户偏好信息处理为基础,对用户进行的各种操作以及用户提出的各种要求为依据,来分析用户的偏好。通过偏好系统得出的结论再归类到一起,在某一内容主题(如体育方面)形成一种内容搜索的聚合、推送,达到更好地满足用户搜索、浏览的需要。将这一技术引入到图书馆信息服务中来,将会给传统图书馆服务带来巨大的影响。个性化引擎的建立是以读者偏好系统为基础,偏好系统的建立要全面而且与内容聚合相联系。有了对读者一定的偏好分析,才能建立起完善的个性化引擎。

   4.有效和有序的数字新技术

  Web 3.0将建立可信的SNS(社会网络服务系统),可管理VoIP(Voice over Internet Protocol)与IM(即时通讯、实时传讯),可控的Blog/Vlog/Wiki,实现数字通信与信息处理、网络与计算、媒体内容与业务智能、传播与管理、艺术与人文的有序有效结合和融会贯通。

  Web 2.0模式下的网络社交平台,只是简单地将人与人通过互联网这一平台连接起来。通过互联网注册在SNS的平台上结交朋友这一途径,并不能确保注册信息的可靠性和有效性,并不是每一次交际圈的扩展都会带来相应的利益需求,这一过程进行下去的结果将会导致本身信息的外泄和零乱、不可靠信息的泛滥,这些都颠覆了人们想利用互联网来扩展人际交往的初衷。这一问题在Web 3.0模式下,将通过对用户的真实信息的核查与认证这一方式来解决。高可信度的信息发布源为以后交际圈的扩展提供了可靠的保障。与此同时,人们在交际的过程中,也可以更迅速地找到自己需要的人才,并且可以完全信任这些可信度高的用户提供的信息,利用这些进一步扩展对自己的有利的交际圈。

  Web 3.0模式下可管理的VoIP与IM,同样为互联网用户的使用提供了方便快捷的服务方式。可信度越高、信用度越好的用户发布的信息将会被自动置顶,既提高了信息源发布者的可信度,同时使得这些有用、真实的信息更快地出现在用户的面前,发挥信息的最大效力,提高了信息的使用率,降低了信息查找的时间损耗。

  Web 3.0模式下可控的Blog/Vlog/Wiki,同样也是为了提高消息的利用率与查找信息的便捷度而生的。这些原本在Web 2.0模式下允许用户随意发布的Blog/Vlog/Wiki会使得网络上堆积大量杂乱无章的信息,为用户的搜索带来极大的不便。由此,Web 3.0提出了“可控”这一概念,使得信息的发布与使用连接起来,如果想搜索高可信度的信息,可以点击可信度高的用户撰写的Blog/Vlog/Wiki,实现可信内容与用户访问的对接。提供了可靠的保障。与此同时,人们在交际的过程中,也可以更迅速地找到自己需要的人才,并且可以完全信任这些可信度高的用户提供的信息,利用这些进一步扩展对自己的有利的交际圈。

  Web 3.0模式下可管理的VoIP与IM,同样为互联网用户的使用提供了方便快捷的服务方式。可信度越高、信用度越好的用户发布的信息将会被自动置顶,既提高了信息源发布者的可信度,同时使得这些有用、真实的信息更快地出现在用户的面前,发挥信息的最大效力,提高了信息的使用率,降低了信息查找的时间损耗。

  Web 3.0模式下可控的Blog/Vlog/Wiki,同样也是为了提高消息的利用率与查找信息的便捷度而生的。这些原本在Web 2.0模式下允许用户随意发布的Blog/Vlog/Wiki会使得网络上堆积大量杂乱无章的信息,为用户的搜索带来极大的不便。由此,Web 3.0提出了“可控”这一概念,使得信息的发布与使用连接起来,如果想搜索高可信度的信息,可以点击可信度高的用户撰写的Blog/Vlog/Wiki,实现可信内容与用户访问的对接。

Web 3.0和语义网络[2]

  在Web 3.0中有可能增加语义网络。The Economist指出,语义网络浏览器将很快投入使用,在这个浏览器上,人们可以进行发布数据、画图等活动。“朋友的朋友”网络就是一个范例,在该网络中,网络社区中的个体以他们与朋友之间的链接的形式来提供自己的信息。语义网络有助于可视化如此复杂的网络并组织它们以加深对社区结构的理解。

  语义网络(Semantic web)是网络的进化延伸。在语义网络中,网络内容不仅可以用人类语言来表达,也可以以一种可以被智能计算机软件代理理解、翻译和使用,使得它们查找、分享和整合信息更加容易的形式来表达。这项技术起源于万维网联盟主席蒂姆·伯纳斯一李对互联网的看法,即互联网是数据、信息和知识交换的共用媒介。语义网络的核心包括一种哲学、一系列设计理念、相互协作的工作团体以及各种可用技术。

  Borland将语义网络看作即将使用的Web 3.0的核心工具。Borland认为Web 3.0的新工具(其中一些工具已经在帮助开发人员将复杂应用程序结合起来)将改进和自动化数据库搜索,帮助人们选择度假胜地,更有效地对复杂的财务数据进行分类。

基于Web 3.0的个人网络中心平台框架

  Web 3.0公用信息平台记录公用的信息类型,把Web 2.0时期对信息的引用和转载,变成对信息ID的引用和转载信息的记录,这样就实现了跨网站、平台流动,并且分布在各个地方的资源网站和个人中心平台信息是交互的,而个人信息平台上的信息是处于动态变化之中的(见图2)。

  1.信息整合与交换

  中心内的信息可以直接和其他网站的信息进行交互,能通过第三方信息平台同时对多家网站信息进行整合使用。通过内置的方法可让小工具和远程服务或者站点进行数据交换,这意味着在同一个页面上可以同时享用多个站点的服务(包括邮件、股票信息、在线翻译、天气、游戏、资讯等)。

  2.用户在中心上拥有自己的数据,并能在不同的网站使用

  迈向Web 3.0的第一步是“数据网络”这一概念的体现,结构化数据集以可重复利用、可远程查询的格式公布于网络上,比如XMLRDF和微格式。最近SPARQL的发展为网络上以RDF方式配发的数据库提供了一套标准化的查询语言和应用程序接口。数据网络让数据契合和应用程序互用性更上新台阶,使数据像网页一样容易访问和链接。在数据网络时代,重点主要是如何以RDF的方式提供结构化的数据。全语义网时期会拓宽语义范围,这样结构化,半结构化甚至零散的数据内容(比如传统的网页、文档等)都能以RDF和OWL语义格式的形式普遍存在。可以这样说,“我的其他电脑是一个数据中心”。

  3.完全基于Web,用浏览器即可实现复杂的系统程序才具有的功能

  Web 3.0有两个特性:一是数据和应用可以全部存储在网络服务端,不再需要在计算机上运行;二是在任何一台电脑或终端上打开浏览器,就能进入属于自己的世界。

  “未来是数据跟着你走,你买了一台新的机器,不用担心把数据拷过来或装新的应用软件,一个浏览器一切的环境、内容、信息全部在你面前了。当然这不止是在PC上,未来用手机、电视或其他的也可以接触这样的信息。未来你在任何时候、任何设备可以看到你所有的信息、做你所有的应用,都经过一个浏览器。”

参考文献

  1. 高路著.超越谷歌 全球网脑新商机.中国经济出版社,2010.02.
  2. 2.02.1 特伯恩等著.电子商务导论 第2版.中国人民大学出版社,2011.06.

=========================

什么是语义网?

semantic(语义的)这个词指有意思的或与之相关的

语义网是一种使用可以被计算机理解的方式描述事物的网络。

  • 甲壳虫乐队是来自利物浦的著名乐队。
  • 约翰.列农是甲壳虫乐队的成员之一。
  • 唱片 "Hey Jude" 是由甲壳虫乐队录制的。

象这样的句子可以被人类理解。但是如何能够被计算机理解呢?

陈述是由语法规则构建的。一门语言的语法定义了构建该语言的陈述所需的规则。

这就是语义网的本质所在 - 以计算机应用程序可以理解的方式描述事物。

语义网和网页之间的链接没有关系

语义网描述的是事物之间的关系(比方说 A 是 B 的一部分,而 Y 是 Z 的成员)以及事物的属性(例如尺寸、重量、使用期限和价格等等)。

资源描述框架

RDF(资源描述框架,Resource Description Framework)是一种用于描述网络上的信息和资源的的标记语言。

将信息至于 RDF 文件之中,这样的话,这些信息就有可能被计算机程序("web spiders")从网络中搜索、发现、摄取、筛选、分析和处理。

语义网使用 RDF 来描述网络资源。

如果您希望学习更多关于 RDF 的知识,请阅读我们的《RDF 教程

如何使用语义网?

假如有关音乐、汽车、入场券(或者任何别的东西)的信息被存储于 RDF 文件,智能网络应用程序就会将信息从不同的源中进行摄取,并将其整合,然后以一个有意义的方式将信息提交给用户们。

类似如下内容的信息:

  • 不同经销商的汽车价格
  • 药品信息
  • 航班时刻表
  • 工业备件
  • 书籍信息(价格、页数、编辑、年份)
  • 某人是谁
  • 事件的日期
  • 软件更新

语义网技术容易被理解吗?

语义网不是快速发展的技术。

其学习曲线是原因之一。RDF 是由那些拥有逻辑学和人工智能方面的学院背景的人们发展起来的。对于一般的开发人员的来说,它并不是特别容易被理解。

RSS 是一种用于构建语义网应用的快速发展的语言。如果您希望了解更多 RSS 的知识,请阅读我们的《RSS 教程》。

在下面的教程中,我们将专注于 RDF 的使用,以发现语义网的潜力所在。

请单击下一章,您可以看到一个简单的语义网应用实例。

=======================================================

语义网。一个简单的应用实例。

购买和出售二手车

假设某个语义网系统用于通过因特网管理二手车的销售和购买。

该系统可能包括两个主要的应用程序: 一个针对希望购买汽车的人群 一个针对希望出售汽车的人群

让我们把这两个应用程序称为 IBA (I Buy Application) 和 ISA (I Sell Application)。

IBA - I Buy Application

希望购买汽车的人群使用的 IBA 应用程序类似这样:

I Buy Application (IBA)

在真实世界的应用程序中,您可能在第一次使用该程序时被要求标示自己的身份。您的 ID 将存储在一个 RDF 文件中。您的 ID 会把您标示为一个带有名字、地址、电子邮件以及 ID 号的人。

当您提交查询时,应用程序会返回一个待售汽车的列表,这个列表会按照年份、价格、位置和可用性进行排序。通过在 web 对 RDF 文件的搜索,此信息会不断地从 web spider 返回。

ISA - I Sell Application

希望出售汽车的人群使用的 ISA 应用程序类似这样:

I Sell Application (ISA)

当您提交表单时,应用程序会向您请求更多的信息,并把您的 ID 和信息存储在一个 RDF 文件中,以供 web 使用。

RDF 文件包含的信息类似:

  • 您的 ID: 姓名、地址、电子邮件、ID 号。
  • 您的出售条目: 类型、型号、图片、价格、描述。

幕后

在幕后,这个 "ISA" 应用程序会创建一个带有许多 RDF 指针的 RDF 文件。

它会创建一个指向带有关于 person 信息的文件的指针,一个指向带有关于 Volvo 和 Volvo 型号信息的文件的指针,一个指向带有关于 Volvo 经销商和出售者信息的文件的指针,等等。

RDF 指针是一种指向有关某事物的信息的指针(实际上是 URL),类似知识数据库。

有关于此的优点在于您不必对您本人或汽车的型号进行描述。这个 RDF 应用程序会为您对信息进行整理。

语义网将如何工作?

混乱?标准?我们需要什么?我们在期待什么?

由微软,由 Google,还是由 W3C 发展标准?

RDF 是关于数据的数据 - 即元数据。RDF 文件经常会描述其它的 RDF 文件。将来有可能把所有的 RDF 文件连接起来构建一个语义网吗?

没有人知道,但是总有人去尝试。

语义网会依靠自己发展起来吗?

我们不认为语义网会依靠自己发展起来。它需要第三方的协助才能成为现实。

不太可能的是,您仅仅在因特网上发布 RDF 文件,就能够出售您的汽车。

必须通过很多力量的参与,才能够发展类似上面的 "ISA" 和 "IBA" 应用程序。一方为所有的项目构建搜索引擎数据库,另一方则为其开发标准。

可能是 eBay,或 Microsoft,或 Google,也可能是别的公司。但是总会有人去做。

不久,我们就会看到基于 RDF 的市场。而有一天,您将能够使用标准化的 RDF 文件在 Web 上收集有关几乎所有事物的信息。

它可能免费。也可能你不得不为信息,或至少为出售您的信息来付费。

在因特网上发布信息将比过去更加容易。也许 RSS 语言(参阅我们的 RSS 教程)会成为很多问题的解决途径。

请阅读我们的下一节 - 有关语义网这个话题的更多内容。

===================================================

这里列出了一些有关语义网的话题。

语义网代理

语义网不是可供搜索的免费文本。如希望搜索或访问语义网,我们需要软件的协助。

要使用语义网,我们就需要 “语义网代理” 或 “语义网络服务”。这些“代理”或“服务”会帮助我们在语义网上找到正在寻找的东西。

编者注:“语义网代理”:"Semantic Web Agents",“语义网络服务”:"Semantic Web Services"。

在语义网上,我们可能会搜索这些信息:

  • 最便宜的机票
  • 适合我的汽车的装饰
  • 书籍、电影或音乐
  • 天气预报
  • 时间表和日程
  • 股票价格和汇率

在未来,要想在 Web 上找到任何信息,使用您的“语义网代理”就可以了。

语义网安全

我能信赖语义网上的一个卖家吗?我能信任语义网上的一个买家吗?

要解决上述问题,我需要访问更多 RDF 文件:

  • 信用卡信息
  • 银行信息
  • 语义网记录
  • 社会安全信息
Source Person ID Person Name Status
Citybank 11223344 John Smith trustworthy
VISA 11223344 John Smith trustworthy
Recorded 11223344 John Smith unknown
US Social Security 11223344 John Smith born 10-10-1962

通过使用类似的这些 RDF 文件,我的“语义网”代理就能够确定能够我们是否能信任我正在打交道的这个人。

(能够通过 eBay 和 Amazon 之类的因特网交易公司来提供记录信息)

支付

要运营语义网,就必须开发支付手段。

易用的因特网“储蓄存款”可能成为此问题的解决方案。

“储蓄存款帐户”是一种只能接受存款的帐户。它可以为因特网上的所有提供便利,只要得到您的 ID(或者您的电子邮件地址,很类似 PayPal),任何人都可以把钱存入您的帐户。

通过使用这种支付手段,每个人都可以在因特网上公布他们的银行帐户,并在不需要中间人的情况下出售他们的汽车。

因特网银行业务的未来会是什么样子呢?

OWL - 您的网络词典

情景

  1. 您需要卖一本书
  2. 您打开 OWL 代理
  3. 您在种类中输入 “Book”
  4. 在新窗口中填写关于书的信息
  5. 您填写印在书上的 ISBN 号码
  6. 您选择“二手”,以及 "condition as new",并单击返回
  7. 您的 OWL 代理会自动填写其余的部分
  8. 作者、年份、页数... 现在所有的信息都完整了
  9. 您的 OWL 代理已经搜集好您需要出售的书籍的所有信息
  10. 最后,您点击拍卖按钮。

您可以在我们的 RDF 教程中学习更多的内容。

您的拍卖代理

  1. 您的拍卖代理打开了。
  2. 您填好了最低价格,然后点击“提交”。
  3. 这样,您的书籍就可以在因特网上进行拍卖了。

=================================

Introduction to the Semantic Web

Introduction

The Semantic Web, Web 3.0, the Linked Data Web, the Web of Data…whatever you call it, the Semantic Web represents the next major evolution in connecting information. It enables data to be linked from a source to any other source and to be understood by computers so that they can perform increasingly sophisticated tasks on our behalf.

This lesson will introduce the Semantic Web, putting it in the context of both the evolution of the World Wide Web as we know it today as well as data management in general, particularly in large corporations.

Objectives

After completing this lesson, you will know:

  • How Semantic Web technology fits in to the past, present, and future evolution of the Internet.
  • How Semantic Web technology differs from existing data-sharing technologies, such as relational databases and the current state of the World Wide Web.
  • The three primary international standards that help define the Semantic Web.

Context

The World Wide Web was invented by Sir Tim Berners-Lee in 1989, a surprisingly short time ago. The key technology of the original web—from an end user's point of view, anyway—was the hyperlink. A user could click on a link and immediately (well, back then, almost immediately) go to the document identified in that link.

The following 6-minute video places that invention in the context of both what had come before—including libraries and low-level computer networks—and what came afterwards—including Web 2.0 phenomena such as Facebook and Twitter.

语义网 (Semantic Web)和 web 3.0

In summary, the great advantage of Web 1.0 was that it abstracted away the physical storage and networking layers involved in information exchange between two machines. This breakthrough enabled documents to appear to be directly connected to one another. Click a link and you're there—even if that link goes to a different document on a different machine on another network on another continent!

In the same way that Web 1.0 abstracted away the network and physical layers, the Semantic Web abstracts away the document and application layers involved in the exchange of information. The Semantic Web connects facts, so that rather than linking to a specific document or application, you can instead refer to a specific piece of information contained in that document or application. If that information is ever updated, you can automatically take advantage of the update.

This may appear at first to be a very subtle advantage, but it is one that will be illustrated in detail in the various lessons here at Semantic University.

Today's Lesson

How is the "Semantic Web" Different?

The word semantic itself implies meaning or understanding. As such, the fundamental difference between Semantic Web technologies and other technologies related to data (such as relational databases or the World Wide Web itself) is that the Semantic Web is concerned with the meaning and not the structure of data.

Note: Other semantic technologies include Natural Language Processing (NLP) and Semantic Search. We will compare these technologies in separate lessons.

This fundamental difference engenders a completely different outlook on how storing, querying, and displaying information might be approached.  Some applications, such as those that refer to a large amount of data from many different sources, benefit enormously from this feature.  Others, such as the storage of high volumes of highly structured transactional data, do not.

Understanding when it is a good idea and when it is not a good idea to apply Semantic Web technologies is one of the primary objectives of the Semantic University. These topics will be addressed in much more detail in future lessons.

What Standards Apply to the Semantic Web?

From a technical point of view, the Semantic Web consists primarily of three technical standards:

  • RDF (Resource Description Framework): The data modeling language for the Semantic Web. All Semantic Web information is stored and represented in the RDF.
  • SPARQL (SPARQL Protocol and RDF Query Language): The query language of the Semantic Web. It is specifically designed to query data across various systems.
  • OWL (Web Ontology Language) The schema language, or knowledge representation (KR) language, of the Semantic Web. OWL enables you to define concepts composably so that these concepts can be reused as much and as often as possible. Composability means that each concept is carefully defined so that it can be selected and assembled in various combinations with other concepts as needed for many different applications and purposes.

Though there are other standards sometimes referenced by Semantic Web literature, these are the foundational three.

One way to differentiate a Semantic Web application vs. any other application is the usage of those three technologies.  However, the Semantic Web has been called many things, such as Web 3.0 or the Linked Data Web. Some of these names carry great significance, even with regard to the technology stack, so we'll cover this topic in a separate lesson.

Conclusion

Semantic Web technologies as a whole have made tremendous strides in the last decade. Some highlights include:

  • The Open Linked Data movement has grown massively every single year and contains far more information than any single resource anywhere on the Web.
  • Massive organizations—such as Merck, Johnson & Johnson, Chevron, Staples, GE, the US Department of Defense, NASA, and others—now rely on Semantic Web technologies to run critical daily operations.
  • The Semantic Web standards—RDF, SPARQL, OWL, and others—were merely drafts in 2001, but they have now been formalized and ratified.

Truly, an entire industry has been born in the past ten years, complete with multiple trade shows on several continents, a growing user community, and active standards bodies.

That said, significant room for growth still can be found.

  • In spite of recent huge strides on the part of Schema.org, Facebook's Open Graph, and others, the vision of an entire Web of interoperable data has still not yet been realized.
  • In spite of significant early corporate adoption by a select few frontrunners, most companies have not yet started using (or are even unaware of the existence of) Semantic Web technologies.
  • The learning curve for using Semantic Web technologies is steep because few educational resources currently exist for users new to the concepts, and still fewer resources can be found that discuss when and how to apply the technologies to real world scenarios.