随着移动互联网的发展,万物互联带来数据爆发式地增长,这些数据恰好可以作为分析实体间关系的有效原料。以往的智能分析专注在每一个个体上,在移动互联网时代,这种个体之间的关系也必然成为我们需要深入分析的重要部分。 在实际应用场景中,只要有关系分析的需求,知识图谱就“有可能”派的上用场。
知识图谱将通过发掘实体之间的关联,将半结构化、非结构化的数据整合,帮助我们理解数据、解释现象、知识推理,从而发掘深层关系、实现智慧搜索与智能交互。
文思海辉·金融基于知识图谱技术,分别在语义搜索、智能问答、视觉理解、数据分析等方面做过深度的探索。基于知识图谱,机器获取到的不再是无关联的信息,而是可以把这些信息映射到各种各样的实体、概念,从而建立机器自己的认知世界。在知识图谱的探索过程中,我们将逐步解决数据结构、数据质量以及核心算法的问题。
知识图谱的实现
其中,我们主要探索的核心图谱包括:
- l引文分析:基于论文之间的引用与被引用关系开展分析,并可以进一步延伸,分析与论文相关的作者、机构、期刊等多种对象。
- l词频分析:利用能代表文献核心内容的主题词在某领域中出现的频次高低来确定该领域研究热点和发展动向。
- l共词分析:统计文件中共同出现的关键词对,进而分析这些词对所代表的学科和主题的结构变化。
- l多元统计分析:对若干可能相关的随机变量的观测值的分析。
- l社会网络分析:社会学研究方法,通过分析网络中的关系探讨网络的结构及属性特征
- l多重共现分析:对于多个不同类型的信息(字段),借助它们之间的共同出现考察关联关系。
新数据和新算法为规模化知识图谱构建提供了新的技术基础和发展条件,使得知识图谱构建的来源、方法和技术手段都发生极大的变化。知识图谱作为知识的一种形式,尤其在金融领域中,数据可视化、风险评估、反欺诈、风险预测、用户洞察等各类业务场景上,知识图谱作为底层基础性技术的支撑作用越来越显著。基于知识图谱技术,文思海辉·金融分别在客户的关系网络、担保网络等得到非常好的应用,也为商业银行提供了较强的决策支持。
随着应用场景和技术生态的变化,整个知识图谱的应用也面临着全新的挑战。
从技术角度来讲,通过一系列的实践证明,简单的优于强大的,太过复杂的比如 OWL 最终用不起来,反而比较简单的像 RDF以及最近比较火的 JSON-LD 用得越来越多,后续文思海辉·金融会在更多的项目中不断完善。
从应用的角度来讲,知识图谱的应用趋势越来越从通用领域走向行业领域。
未来,文思海辉·金融将在智能风控、反欺诈、智能营销、智能催收、智能投顾等方面做更深入的知识探究。