近日,Neo Technology发布了Neo4j 2.0 GA版,带有一个全新的图浏览器、结点标签、一个可选的模式以及改进的Cypher。
Neo4j 2.0最值得关注的改进就是全新的浏览器UI,用户可以通过图或是表格形式来查看和编辑数据。下面是一个示例电影数据库的截图,展示了一个演员与他所参演的一些影片(灰色)以及与其他演员之间(红色)的关系:
结点现在可以拥有标签了,可以通过标签将结点标记为属于某个组。一个结点可以有多个标签。
Neo4j 2.0还增加了对模式的支持,不过这是可选的,看起来有点向关系型数据库回归的意味。增加模式主要是为了包含一些元信息,从而改进查询的执行。
Cypher查询语言也得到了改进,这主要是通过OPTIONAL MATCH与MERGE子句、字面结点模式以及返回字面map与collection的能力而实现的。
我们有幸采访到了Spring Integration的领导与Neo Technology的开发者Michael Hunger,从而了解Neo4j 2.0的兼容性问题、模式的使用以及未来的路线图。
InfoQ:Neo4j 2.0与之前的版本存在哪些兼容性问题?
MH:Neo4j 2.0有着突破性的变化,增强了数据模型,增加了标签的概念以及可选的模式信息。
此外,查询语言Cypher从1.9开始经历了相当大的革新,对于嵌入式API来说,读事务也成为必须的了,此外,该版本还删除了很多之前被标记为不建议使用的内容。
具体请参考:
http://www.neo4j.org/release-notes#2.0.0
http://docs.neo4j.org/chunked/2.0.0/deployment-upgrading.html#deployment-upgrading-two-zero
InfoQ:新引入的模式是如何加快查询速度的?
MH:可选的模式信息(标签)支持索引和唯一约束,他们会自动用在查询中,将过滤条件转换为索引查找。此外,将标签作为查询的一部分还会让数据库在查找非索引信息时只扫描整个数据库的子集。第三,标签信息是内联在结点记录中的,因此测试现有结点的标签信息是非常简单的,并不需要进一步查找属性或是关系。
InfoQ:如果数据库发生变化了该怎么办?还需要手工更新模式么?
HM:当数据发生变化时,索引与约束信息会与数据保持同步。
比如说,要是增加新的标签,那么你就需要提供新的索引/约束定义。不过通过新标签增强的现有数据则会自动被索引。
InfoQ:Neo4j未来的路线图是怎样的?
MH:
- 持续改进用户体验
- 性能(读、写、查询语言)
- 增加了对结点、关系的(人为)限制
- 更好的导入/导出功能
- BI/集成
- 操作上的改进
- 一些大数据/图计算
- 化的安装体验
- 改进的远程/驱动