凯峰数据王凯:大数据AI正在催生第三代金融终端

凯峰数据王凯:大数据AI正在催生第三代金融终端
2017年07月11日 18:46 三板慧

王凯

凯峰数据 董事长 & CEO,14年技术研发与管理经验,擅长网络攻防与信息安全。曾就职于胡杨网络(新三板挂牌)、天天艾米(连续三周AppStore免费排行第一)、Defportal (香港) 等公司担任CTO、技术VP与CEO职位;在华为、金山网络(猎豹移动)担任技术总监负责云计算安全、移动安全;在联想研究院担任高级研究员、 主设计师研究系统安全和可信计算技术。

2017年7月5日下午,由三板慧主办、大成律所赞助的沙龙《Fintech遇上股权投资》在上海中心大厦成功举办。

三板慧CEO&董事长王凯就《AI-股权投资》进一步表达了自己的观点,指出AI技术推动金融终端走向第三代——而这也是三板慧正在尝试的事,而要做第三代金融终端就意味彻底推翻了原有的技术架构、后台与存储方式,因此与wind、Chioce等代表第二代金融终端的产品有着根本区别

以下为王凯先生的发言文字稿。

部分会议嘉宾合影(从左到右):东方证券资本投资有限公司MD 唐洁、学者&评论人 布娜新、海通证券新三板业务资本市场部负责人 李洁、凯峰数据董事长&CEO王凯、大成律所合伙人 邓炜

01

非常感谢大家在炎热的天气到场,一起聚在大成非常漂亮的办公室里分享、探讨AI(人工智能)与股权投资。

先做个简单的自我介绍,我本人是技术人士出来创业,从事技术将近15年,一直在做黑客、攻防这方面的工作。实际上在做攻防的时候,即便是日常遇到的病毒、木马软件,其背后都有大量的样本要去做分析,而有了云计算和大数据之后,我们可以对海量互联网样本进行全量分析:什么病毒、木马将产生变种?我们可以利用大数据进行回归,第一时间发现它的规律,预测出一些病毒和木马可能产生的变种,以此实现在不依赖病毒库的特征下提前发现潜在威胁。

这样的技术应用到广告领域,属于精准营销。PC互联网时代,是人找广告,通过搜索去寻找广告;而在移动互联网时代,是广告找人,它精准地识别了每个人的兴趣、偏好,投放对应的广告。这背后的技术是大数据辅之以自动推荐的算法,是人工智能(AI)的雏形表现。

在美国,google很早就在布局AI,搜索引擎上已经发生了改变:在早些时候,搜索引擎可以把乔布斯相关的名字搜索出来,而现在可以把和乔布斯相关的关系也搜出来,包括他的妻子、同事等等,这其实是搜索引擎向AI能演进的一个方向。

前段时间炒得非常火热的AphalGo,已经连续战胜很多围棋界的高手,非常瞩目,在这里我们可以大胆预测未来:下个互联网的10年,是“互联网+”至“AI+”的发展,各行各业都会倡导AI+。我们现在就可以看到BAT都争抢布局人工智能,中国腾讯、百度都成立了人工智能实验室。

02

AI是Fintech的一个分支,聚焦在金融这一领域,AI为这个产业提供了核心的技术驱动力,可以让这个产业真正产生一次化学反应。在量化投资方面,AI已经有大量的应用。在美国,高盛、摩根这样的投资银行已经率先应用了很多这方面的技术。

我们是一家大数据公司,也是一家人工智能公司——在这里,需要申明一点,即为什么我们要把大数据和人工智能划在一起?AI离不开大数据,大数据可以帮助人工智能从海量样本中深度学习,从而提升人工智能的能力,因此两者是不可分割的。

现在,我们正在尝试大数据这一块的应用,尤其是金融终端这一领域里打造未来的金融终端——三板慧,这是我们凯峰数据的核心产品,其核心技术是自然语言处理、图像识别和数据挖掘,最终这些技术将指向一张知识图谱,而这个知识图谱是整个三板慧技术架构的核心。

知识图谱是AI重要技术,其概念最早由谷歌提出。谷歌为什么能搜索出乔布斯相关的关联信息?也全部基于一张知识图谱。

在数据的收集和处理端,AI是被大量应用的,但这个阶段大家看不见摸不着,完全是在后台自动化工作的。举个例子,新三板每天产生2000个公告,公告里面的pdf文件是一个非结构化的信息,针对这样一个海量数据,传统是人工去处理2000多个公告,去解读它每个的含义,以及2000多个公告之间的关联,后者仅依赖于人是有难度的。而在自动化处理的过程中,对于关键信息的提取、建立和链接,然后对这些关系信息进行存储,已经发生了重大改变。

在后台数据库方面,我们也进行了大量的数据改造,而这恰恰是传统金融终端做不到的事情,因为整个技术架构、后台、数据存储完全不同:以前关系式的数据库是一张二维表存储,数据的关联也就是通过表和表之间不同的进行关联,而现在的知识图谱,是一个网状的结构,它不是一个二维表的简单的二维关系,是一个非常复杂的网状关系。

图形数据库就是为了解决这种网状关系应之而生的一种存储技术。如图所示,每个圆圈是一个实体、一个对象。类比下现在的实例,可能是一个人,也可能是一个企业,也可能是一个事件或者一个资本;每个边都代表了它不同的关系。通过这样的知识图谱,我们可以查找出任何的一个节点和另一个节点之间的关系,以及其背后众多节点之间是什么关系,应用到咱们的资本市场,是将“人–企业-事件-资本”这四大对象进行链接,从而发现企业和企业的关系、企业与人的关系、人与人之间的关系。

在此之上,我们还做了一个垂直的智能搜索引擎,只要是在金融、投资领域,大家可以用非常贴近自然的方式来查找你想要的数据,比如说最近所说的三类股东问题,我们就直接搜索“新三板有三类股东问题的企业”,存在相关问题的企业就会被检索出来。

03

AI还有一个典型应用,就是概念标签。很多朋友可能听说过这个词语,很多互联网产品也提供标签,但互联网产品的标签是人打上去的,通过大量、海量的用户使用,形成了标签体系。

新三板里面也有行业概念股,是股转公司的官方定义,但这个比较宽泛,如果靠人为新三板1万1千多家企业打上细致的标签是不现实的,而AI就是要对它的具体业务进行语义分析来识别它究竟是做什么事情的。

在这里,我要强调语义分析,而非传统的关键词匹配。

关键词匹配可能有大量错误。因为一个企业可能有个客户是医药制造的行业龙头,这个时候关键词匹配可能命中医药制造,但实际上可能不是它做这个事,而是他的客户在做这个事情,所以这个时候我们需要语义分析去了解它到底在干什么事情。

基于此,就可以对企业的商业模式展开深度分析,发现其潜在的竞争对手和同行,比用行业去分析潜在竞争对手和同行更为精准。

 

另一个应用是多维度分析预测,在三板慧SaaS的“慧分析”模块中三板慧色谱还对三板整个企业做了更进一步的做层次划分。我们知道,股转分了两层,基础层和创新层,而且主要是以财务指标为方式分层,但其实对于一个创新企业或者成长中的企业,仅仅用财务指标去衡量的话,是不合理的。

在三板慧色谱中,既有定量分析,又有定性分析。比如是否处于高新企业、行业属性、企业规模等,这些就属于定性……在这样的基础上,三板慧精选了一批企业,将它们归为“精选层”。

在精选层之上,我们还推出了IPO预测。IPO预测除了包括一些硬性的指标之外,还通过分析IPO之前的信号,以预测其潜在的IPO企业。

再往上去企业家数就比较少了,IPO监控只包括了真正公布过上市辅导的企业。在这里,我们全览、监控、并第一时间将信息推送给关注我们的用户,同时对后续的阶段也进行持续跟踪。

 

04

纵观金融终端发展史,第一代其实是小纸条、DOS机,满足了信息获取的原始需求;第二代是信息化时代的金融终端,产生了像Wind、Choice等本土化传统金融终端,通过人工录入加上技术辅助,将传统纸面上的信息变成电子化的信息,大大提升了查询的效率。

但随着互联网与移动互联网进一步发展,数据产生的速度越来越快,从以前的几TB到现在的PB,到未来甚至可能是ZB为衡量单位产生,如何快速获取数据、从杂乱的数据中分析出有价值的数据,成了整个信息产业面临的新问题。大数据技术及AI不断完善、发展,使得第三代金融终端呼之欲出——三板慧要做的就是第三代金融终端,是一个“慧”分析的金融终端,这里我想强调的是不是能不能的“会”,而是智“慧”的“慧”。

相对第二代金融终端,第三代金融终端就好比“单兵作战系统”,如图所示,下面这两张图很好地类比了两者间的区别:

 

传统单兵作战装备包括了侦查、武器和防护,比如头盔(夜视仪、传感仪)、M4冲锋枪、防弹衣等等,这里仍然存在着一些问题:

侦查系统方面,支持个体单独作战,但由于无法纵览整个战争全局,决策效率较低,也就是没有一整个有效体系。

武器方面,精度比较低,攻击范围有限,批量审查、无法定制,这有点像我们今天传统的金融终端,其实是批量生产、无法定制的。

防御方面,环境适应能力比较差,不灵活。

 

而一个综合的“单兵作战系统”,包括了战场情报分析系统、武器系统、防御系统,能做到既是战场的一个点,又可以在全局中起到至关重要的作用。

以三板慧为例,其战场情报分析系统类比到产品中的功能,就好比是IPO监控、交易异动、指数、全市场下单信息监控等等,可以帮助用户进行快速决策支持。

在武器系统,我们可以让投资人、企业及时发现市场的机会,对应的功能就是“慧分析”功能,包括精选层、IPO预测、企业对比及概念标签等等。这里特别要说下我们的“企业调查报告”,可以一键生成企业调查报告,可以帮助我们做尽职调查,可以提升效率。

在防御系统方面,主要是防范风险,对应提供的功能是司法、诉讼信息,还有对整个企业的新闻、全市场新闻全网汇聚,感情色彩分析,这也是人工智能的一个应用,可以对一个事件进行定性,定性背后有其算法作为支撑。还有财务状况预警,对异常进行预测,一个企业的财务是否有异常,完全可以让AI替代进行。

AI的最终目的是要使用计算机代替人类实现认知、识别、分析、决策的功能,本质是对人的思维与意识关于信息获得的模拟。不过坦率说,现在AI还处于有监督地学习中,真正能够做到无监督学习的,就是机器可以实现自我学习、自我成长、自我提高,那种时候才是真正达到人类水平。

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部