在5G、物联网、人工智能等技术的推动下,企业数据呈现爆发式增长,数据间的关联复杂度也随之剧增。在处理这些杂关联数据时,传统关系型数据库运算效率较低,难以进一步挖掘海量关系数据背后的价值。

为了更好地利用数据间的连接,企业需要一种将实体间的关系进行存储、灵活拓展数据模型的数据库技术,这时图数据库出现了。

什么是图数据库?

图是基于事物关联关系的模型表达,通过将实体与关系点边化的方式将知识结构化地保存,因此具有天然的可解释性,从而备受学术界和工业界的推崇。

图数据是指采用图结构存储的数据。

图数据库以图论为理论基础,使用图模型,将关联数据的实体作为顶点存储,关系作为边存储,解决了数据复杂关联带来的严重随机访问问题。在分类上,图数据库可归类为NoSQL(,非关系型数据库)数据库。

当前,通信、互联网、电子商务、社交网络和物联网等领域中积累了大量的图数据,其规模巨大并且不断增长:的社交网络在2011年已超过8亿顶点;而腾讯QQ社交网络目前在10亿个顶点的规模;在电信行业中,广州市仅一个月内由电话呼叫方和被呼叫方组成的图就超过4.5千万个顶点、1.5亿条边;而数据包含海量的网页,2012年公布的数据集已经达到10亿个顶点、425亿条边,仅是存储边的列表文件就超过400GB。

连通分量强连通分量_连通分量定义_强连通分量

图数据库的作用

随着企业数字化转型的深入,社交、物联网、金融、电商等领域快速发展,因此产生和收集的数据量呈现指数级的增长,传统的关系型数据库在处理复杂关系的数据方面遇到瓶颈,其对数据的管理和使用不能完全满足市场需求。企业对于数据库的需求已经从一般的数据管理演变为从复杂的数据关系中最大化提取数据价值。

而图数据库采用了高性能、分布式的图算法,通过扩展的图算法语法,用户可调用图算法语法从过获得方便使用的图算法功能。图数据库的使用场景主要是实时查询,用户通过图查询语言在图上做遍历、过滤和统计等操作,一般为局部查询,以满足实时的需求。

强连通分量_连通分量定义_连通分量强连通分量

GDATA技术架构

连通分量定义_连通分量强连通分量_强连通分量

GDATA的技术架构整体上采用分层架构的模式,从上往下依次是:接口层、计算层、存储层。

(1)接口层:接口层对外提供服务,有如下几种方式:

查询语言接口:提供除该图数据库原有查询语言之外例如、等主流图查询语言接口。

(2)计算层:提供对操作的处理和计算,包括语法解析、查询引擎、优化器、事务管理、任务调度和图算法实现等。其中,图算法可能是由图数据库本身提供,也可能是提供接口与图处理引擎对接。

(3)存储层:图数据库有原生和非原生存储两种存储方式,图存储引擎提供了图数据结构、索引逻辑上的管理。

多种图分析算法,便于挖掘业务价值

GDATA提供了多种图分析算法,能根据具体的业务需求进行组合和应用,帮助用户挖掘图数据中的业务价值。

社区发现算法

标签传播、监听标签传播、加权标签传播、鲁汶算法、弱连通分量算法、强连通分量算法、算法、莱顿算法

图挖掘算法

图的数据挖掘,用来发现数据的模式。通过分析图数据,发现有趣、意外、有用的模式是非常必要的,可以用来帮助理解数据或做出决策。常见直径估计算法、三角形计数算法、最大独立集算法、K核算法、K阶团计数算法、K阶析架计数算法

路径查询算法

宽度优先搜索、单源最短路、多源最短路、全对最短路、查找环、随机游走算法重要性分析算法

网页排名算法、个性化网页排名算法、加权网页排名算法、信任指数算法、Sybil指数算法、介度中心度算法、紧密度中心度算法、超链接主题搜索

关联性分析算法

公共邻域算法、度数关联度算法、系数算法、集聚系数算法

中心性算法

用于计算节点的重要性,可以帮助用户找到关键节点,从而优化业务流程或者发现核心用户。

软江图灵GDATA优势

1.高性能

GDATA相较于关系型数据库和其它非关系型数据库,在处理深度关联数据时,具有绝对的性能提升。

2.灵活性

GDATA提供了极其灵活的数据模型,可以根据业务变化实时对数据模型进行修改,数据库的设计者无需计划数据库未来用例的详细信息。

3.敏捷性

GDATA的数据建模非常直观,而且支持测试驱动开发模式,每次构建时可进行功能测试和性能测试,符合当今最流行的敏捷开发需求,极大地提高了生产和交付效率。

4.兼容性

GDATA具有较高兼容性,具体包括:1)面向主流硬件的支持能力;2)面向新型硬件的支持能力;3)访问接口的支持能力。

5.安全性

GDATA拥有完善的安全机制防止数据泄露、误操作等状况:

1)支持面向数据的权限管理,例如:从多个级别例如图/标签/ 对象(分别对应关系型数据库中的库/表/行)等管理用户的访问权限;

2)支持面向访问方式(用户名/IP/端口等)的权限管理,提供黑名单/白名单等功能;

3)提供日志的管理和分析,辅助管理员定位问题;

4)支持数据的加密,减少数据泄露带来的风险。

———END———
限 时 特 惠: 本站每日持续更新海量各大内部创业教程,永久会员只需109元,全站资源免费下载 点击查看详情
站 长 微 信: nanadh666

声明:1、本内容转载于网络,版权归原作者所有!2、本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。3、本内容若侵犯到你的版权利益,请联系我们,会尽快给予删除处理!