利用“大数据”和“人工智能”技术来进行股票投资并不少见,但深挖技术背后的投资理念,发现最为关键的不是技术,而是使用技术的人。
乔布斯用一堆手机零件创造出了苹果手机,雷军用一堆手机零件组装出了小米,二者使用的技术没有本质区别,区别在操盘者的见地。
股票投资并不是一个简单的事情,每一个在股市里浸染过的人都知道这一点,这个行业不仅需要专业的技术分析能力,还要有对信息综合分析、整理以及正确解读的能力。
多数时候后者更为重要,因为到目前为止,从技术分析层面,人们仍然无法解释驱动股票价格忽上忽下背后的原因,更多时候专家们更愿意将它比作“布朗运动”,微小粒子无规律的撞击运动。
然而从消息面的角度,对股价的波动却总是能找到“合理”的动因,人们会不厌其烦挖掘出“布朗运动”背后每一个“微小粒子”运动的原因,以期能总结出规律。显然这是一个浩瀚的工程,数据的分析量异常大,尽管如此,仍有人不惧挑战。
拥有计算机博士学位,在华尔街沉浸多年的金融科技“老炮儿”于洪钧就是其中之一,他带领着一群来自充满干劲的金融和互联网人,要利用“大数据+人工智能”技术来完成对“毫无规律”的股价波动的解读。
目前于洪钧创立的搜股科技已经获得千万元级别Pre-A轮融资。于洪钧告诉《经理人》,他要用这个来解决散户所面临的信息不对称和专业能力不足的问题,让他们免于被“荷枪实弹”的机构和庄家血洗。
淘金大数据
近年来,在中国的许多行业,谈及创新、谈及利用新技术,无不牵扯到一个概念—大数据。
制造业用大数据来分析销售和进行生产;
交通部门用大数据来进行交通管理;
卫生部门用大数据来防治疾病;
金融公司利用大数据来进行投资和放贷。
似乎一切都在和大数据发生关系,但是当我们在谈论大数据时,大数据其实是一个很大、很复杂的概念,包括数据的采集、清洗、挖掘、储存、计算、显化等。抛开“大数据”这个热词,其实各行各业都在做与数据有关的事情,只不过数据要做到一定的规模才能称为“大”数据。
大数据技术除了要求数据的规模,更要求对数据的清洗和挖掘。其实在中国,拥有最多数据的并不是私人部门,而是政府部门和国有企业,如教育部门、社会保障部门、公安部门、电信运营商等,但是目前这些公共部门尚未找到对大数据清洗、挖掘的合适方法。私人部门对于大数据卓有成效的运营案例也十分稀少,其中最主要的原因就在于对数据的清洗、挖掘方面一直不能有效展开,简单来说就是找不到数据之间的关系。
全球零售业巨头沃尔玛曾有一段被“大数据”分析界传为佳话的成功案例。
沃尔玛在对消费者购物行为分析时发现,男性顾客在购买婴儿尿片时,常常会顺便搭配几瓶啤酒来犒劳自己,于是尝试推出了将啤酒和尿布摆在一起的促销手段,没想到这个举措居然使尿布和啤酒的销量都大幅增加了。按照传统的商品分类、消费品分类,啤酒和尿布之间完全没有任何联系,这个案例不仅反应了大数据的神奇效果,更反映了找到数据之间关系的难度。
于洪钧告诉《经理人》,数据就像河里的沙子,大家都可以看到,但并不是每个人都能做到“沙里淘金”。
于洪钧是美国名校毕业,拥有计算机科学专业博士学位,精通数据挖掘。同时,他曾在全球知名银行摩根大通总部工作6年并担任要职,随后转战全世界最大的独立另类资产管理机构之一黑石华尔街总部工作,有17年中国A股市场实战经验,10年美国股票市场实战经验。从这些经历不难看出,游走于科技的投资之间的于洪钧,是当之无愧的金融科技“老炮儿”。
正是得益于自己的丰富阅历,于洪钧对从大数据这个沙堆里淘金,充满信心。他深谙投资之道,明白数据背后蕴藏的内在逻辑。目前搜股科技拥有4000台服务器,监测61.2万个网站,包括1428个中文媒体和6000个支干媒体,数据及时性确保在60秒以内,这在目前的炒股软件中抓取信息能力最强,是市面上多数软件的3倍。强大的基础设施保证了搜股科技能够抓取到足够多的数据量,来进行更为精确的分析。
在搜股科技开发出来的“股票卫士”APP中,有一个新闻在全网影响力指数的栏目。这个栏目通过对一条新闻信息的全网追踪,来分析它在网民心目中的影响力。
在网络时代刚刚到来的时候,人们忧虑于虚假信息对社会造成的冲击,甚至为了保护未成年人,我们用简单粗暴的不让他们上网的方式来解决这个复杂的问题。尽管现在这个问题随着社会的发展、人们知识的积累而慢慢弱化,但并不是已经完全消失。虚假、失实、乌龙的消息仍然见诸于各种网站、贴吧、论坛。基于抓取网络数据的搜股科技,又如何辨别信息的真实性、可靠性呢?
于洪钧认为,信息一旦发出,不论真假都会在人们的心里产生一定的影响,对于搜股来说,重要的不是信息的真假,而是这个信息产生了什么样的反映,可能会导致什么结果。从《经理人》对“股票卫士”APP的使用情况来看,多数新闻的影响力都在10%以内,依据此来进行推荐的股票仍涨跌互现。于洪钧表示,目前仍无法确切分辨信息的全网影响力指数与股价之间的关系。
例如,有些信息的全网影响力超过10%,反而消息被过度解读,不利于股价。对于数据关系的解密注定是一个长期的过程,需要大量的实践才能发现其中微妙的联系,目前“股票卫士”仍处在内测阶段。随着数据的积累,算法的跌进,距离谜底将越来越近。
人工智能
大数据解决了散户面临的信息不对称的问题,人工智能则将在大数据的基础之上解决散户专业能力不足的问题。
今年3月,韩国棋手李世石对阵人工智能机器人AlphaGo,以1:4的成绩败下阵来,让绝大部分围观人士都傻了眼,出乎预料的不是败了,而是败得太快。在围棋这一极具人类思维特性的领域,机器人竟能赶超得这么快,人类竟会输得那么惨。从人工智能的角度而言,AlphaGo代表了人工智能发展到了一个新的水平。
作为计算机博士,于洪钧对人工智能一直有所关注。
人工智能可以说是建立在大数据之上,因为只有数据库足够大,人工智能才可以充分学习,才可能最接近人类的思考方式。
目前谷歌的AlphaGo是一个开源项目,搜股科技也将利用这一技术,来进行自己的人工智能应用开发。需要说明的是,尽管AlphaGo人工智能技术是一个开源的技术,但是并不意味着什么人都利用这个技术轻易的能做出一个很好的人工智能产品。“技术只是手段,怎么使用更为关键。”于洪钧表示。
一款手机拆开来,99%的技术都是大家共同可得到,但是有些手机做成了苹果,有些手机做成了小米。在大数据和人工智能的实际运用中,有机的应用技术就类似于做手机,零件可能都大同小异,但是对于整体设计理念的不同,将使得产品出现极大的差异。