金融信息如何分类?
市场中存在着大量以各种形式存在的信息,有些与金融市场有关,而更多的是与金融市场无关的信息,或者说是噪声。金融信息是一个泛泛的概念,从广义上说,一切与金融、经济相关的消息、知识及资料均认为是金融信息,更广泛的还包括金融信息化,如炒股软件、计量软件等金融信息处理工具。本书特指的金融信息是具有可度量、可处理、可存储性质,以便于建立金融模型或者进行金融数据处理的信息。这既包括文本信息如财经新闻报道,也包括数据信息如可直接应用于金融建模的宏观数据。
下面我们将具体分析金融信息大数据的具体内容以及如何进行分类和运用。金融信息可以按照形式、内容、来源等来分类。
一、按形式分类
根据信息的表现形式进行分类,可以把金融信息分为数字形式的金融信息、文本形式的金融信息和图形形式的金融信息。
(1)数字形式的金融信息是指各种以数字形式公布的经济指标或者可以通过直接计算得来的数据信息,如常见的宏观经济指标:CPI、PPI、失业率、GDP增长率等。数字形式的金融信息可直接应用于数量分析、模型构造、策略构建,是一种结构化标准化的信息。投资者可以通过横向比较和纵向比较,分析信息内涵,指导投资决策。
(2)文本形式的金融信息是指以文字形式公布的金融信息。主要包括财经新闻、公司公吿、分析师观点、财经博客等。这些信息的特点往往是定性地描述了一件事情的发生及市场参与者的观点,投资者无法直接将这类信息进行比较或者定量分析,只能依据个人经验加以判断。在数量化信息解读同质化的情况下,对这类信息的解析和反应往往决定了投资者的投资能力。
(3)图形形式的金融信息是指以图形形式发布的新闻资讯。主要包括交易所指数走势、价格走势曲线图、饼形、柱状图等。这些信息的特点往往是定量地展示了收益、风险、数量、规模等的发展趋势以及横向比较数据。
二、按内容分类
(一)宏观经济信息
宏观经济不仅是指国民经济的总体活动,也是指整个国民经济或国民经济总体及其经济活动和运行状态,如总供给与总需求;国民经济的总值及其增长速度;国民经济中的主要比例关系;物价的总水平;劳动就业的总水平与失业率;货币发行的总规模与增长速度;进出口贸易的总规模及其变动等。
宏观经济信息主要包括宏观经济指标和宏观经济政策两大方面。宏观经济指标是体现经济情况的一种方式,主要指标从内容上分类包括国民经济指标、通货膨胀与紧缩、投资指标、消费、金融、财政指标、CPI、M1、M2、进出口总额、GDP等和宏观经济相联系的指标。从时效方面分类包括滞后指标、同步指标和领先指标。宏观经济指标对于宏观经济政策起着重要的分析和参考作用。宏观经济政策是指政府有意识、有计划地运用一定的政策工具,调节控制宏观经济运行,以达到一定的政策目标。从西方国家第二次世界大战后的实践经验来看,国家宏观调控的政策目标,一般包括充分就业、经济增长、物价稳定和国际收支平衡等。主要政策包括收入政策、指数化政策、就业政策、经济增长政策、区域发展政策、扶持政策。
(二)行业信息
行业一般是指其按生产同类产品或具有相同工艺过程或提供同类劳动服务划分的经济活动类别,如饮食行业、服装行业、机械行业等。根据上市公司主营业务来划分,投资者通常把上市公司分为以下行业:科技行业、房地产行业、家电行业、电子信息行业、化工行业、能源行业、汽车行业、金融行业、农林牧副渔业、酿酒食品饮料行业、医药行业、冶金行业、纺织行业、机械行业、纸业包装行业、建材行业、商业行业、综合类等。
在证券市场中板块轮动与行业轮动对投资者策略决策的影响都不容小觑,股票市场的板块效应是我国证券市场的特殊现象,在我国证券市场发展的各个阶段都产生过重要的影响。板块分类与行业分类标准不一。板块分类可按地域划分,也可以上市公司的经营业绩为纽带划分。板块也可以根据行业分类进行划分,有高科技板块、金融板块、房地产板块、酿酒板块、建材板块等。
行业与板块分析在股票投资中的作用非常关键和重要。一方面,行业分析可为股票投资者提供更为详尽的行业投资背景。对各行业的一般特征、经营状况和发展前景有进一步的了解,这样才能更好地进行投资决策。另一方面,行业分析可协助股票投资者确定行业投资重点。国家在不同时间的经济政策与对不同地区的政策导向会对不同的行业和地区产生不同的影响,属于这些行业和位于这些地区的企业会受益匪浅。行业与板块分析可协助股票投资者选择投资企业及持股时间。通过对行业所处生命周期和影响行业发展的因素进行分析,投资者可了解行业的发展潜力和欲投资企业的优势所在,这对其最终确定所投资企业及确定持股时间有重要作用。
(三)公司基本面信息
公司信息包括公司基础信息、公司财务信息和公司交易信息。公司基础信息主要包括公司性质、股东结构、所属行业等;公司财务信息包括财务报表中财务指标、会计指标;公司交易信息主要指公司股票价格、成交量、换手率、波动率等。具体来讲,基本面信息分析包括公司每股收益、每股净资产、实际市盈率、分析师市盈率等财务指标;公司概况、股本结构、公司公告、持股情况、经营分析、高管及机构持股分析等。
(四)技术面信息
技术面信息是指反映股价变化的技术指标、走势形态以及K线组合等。技术面分析指对日换手率、流通市值、异动买入和异动卖出金额等指标的判断预测和分析。技术分析有三个前提假设:市场行为包容一切信息、价格变化有一定的趋势或规律、历史会重演。
技术分析的主要步骤和方法包括发现趋势、支撑和阻力、线条和通道、平均线。找到主导趋势将帮助您统观市场全局导向,并且能赋予您更加敏锐的洞察力。一旦发现整体趋势,就能在希望交易的时间跨度中选择走势。支撑和阻力水准是图表中经受持续向上或向下压力的点。当这些点显示出再现的趋势时,它们即被识别为支撑和阻力。通道被定义为与相应向下趋势线平行的向上趋势线。两条线可表示价格向上、向下或者水平的走廊。支持趋势线连接点的通道的常见属性应位于其反向线条的两连接点之间。如果您相信技术分析中“趋势是您的朋友”的信条,那么移动平均线将使您获益匪浅。移动平均线显示了在特定周期内某一特定时间的平均价格。它们被称作“移动”,因为它们依照同一时间度量,且反映了最新平均线。
(五)行为偏差信息
无论是初涉市场的个人投资者还是精明老练的经纪人或是资深的金融分析师,证券投资者都试图以理性的方式判断市场并进行投资决策,但作为普通人而非理性人他们的判断与决策过程会不由自主地受到认知过程、情绪过程、意志过程等心理因素的影响以致陷入认知陷阱,导致金融市场中较为普遍的行为偏差。
行为偏差包括过度自信、信息反应偏差、损失厌恶与后悔厌恶、心理账户、锚定效应、典型启示、羊群效应。另外,投资者的行为偏差还有赌博与投机(Gambling and Speculation)、心理分隔(Mental Compartment)、遗憾与认知不协调(Re-gretand Cognitive Dissonance)、脱节效应(Disjunction Effect)、歧义想象(Magical Thinking)、注意力反常(Attention Anomalies)、可得性启发(Availability Heuristic)、历史无关性(Irrelevance of History)、文化与社会传染(Culture and Social Contagion)等。
行为偏差分析主要包括分析师预测一致性、反映程度等指标。
(六)高频数据信息
高频数据是时间间隔低于I日的证券交易数据,如股票价格、外汇价格以及成交量等。免费数据都以“日”为单位,如股票开盘价、收盘价、最高价、最低价、成交量等。股票每个时间点都有一个价格,每隔30分钟的股票价格数据就是高频数据。高频交易基于高频数据的统计分析,高频因子分析目前市场使用最为广泛的是资金流向指标。
(七)金融衍生信息
金融衍生产品是以货币、债券、股票等传统金融产品为基础,以杠杆性的信用交易为特征的金融产品,它依赖于基础资产(UnderLyings)价值变动。金融衍生产品的特点主要体现在零和博弈、跨期性、联动性、不确定性、高杠杆性、契约性、交易对象的虚拟性等。金融衍生产品的作用有规避风险、价格发现,它是对冲资产风险的好方法。
金融衍生信息是指金融衍生品市场、产品、相关行业的资讯。金融衍生信息的分析方法主要包括对可转债、公司债收益以及可转债转股溢价率等指标的研究和应用。
此外,金融信息还包括突发事件(复合因子的实质是优秀投资家的投资逻辑,不应该算作金融信息)。事件分析包括定向、非定向增发实际发行总股数、定向、非定向增发实际募集总金额、解禁股数占总股本比例、董监高前三名薪酬总额等和公司事件变动相关的指标研究与应用。
三、按来源分类
政府机构会定期公布一些数据信息,如国家统计局公布的宏观经济信息、交易所公布的交易信息等。这类信息的特点是以特定的时间和特定的格式发布,具有标准化、数据化等特点。
公司公告信息主要是上市公司为履行信息披露义务而公开发布的信息。包括公司的年报、半年报等定期发布的财务报表信息,也包括遇到特定事项而发布的公告。这类信息往往很具体,涉及面可能就是一个公司,并且一般具有标准化特点,分析和应用格式化。但对公司特定事项的临时公告一般具备事件性质,往往会对该公司的股票价格和交易量有一定的影响,具体分为预期中的信息和预期外的信息。
机构和媒体信息是指来自一些特定的行业协会、金融机构发布的研究报告或者是市场调研、新闻媒体发布的相关公司的新闻舆情等信息。这类信息有的是第一手信息,有的是转载的或者经加工的信息,并且信息覆盖面广、繁杂、形式多样且质量不一。
这些数据如何应用到量化投资中去呢,常见的方式是加工成因子的形式,通过对股票或股票池因子分析,寻找股票的Alpha来源。目前,已经出现了有一些比较成熟的机构直接提供加工好的因子,国外的有BARRA,JPmorgan,国内的有深圳国泰安教育技术有限公司。以深圳国泰安教育技术有限公司提供的量化因子仓库为例,表2-1展示了常见的量化因子。
表2-1量化因子分类及相关说明
近年来,大数据越来越受到社会各界人士的关注。2013年7月,麦肯锡研究报告显示:到2020年“大数据”将对美国的经济产生巨大影响。研究报告把美国经济划为17个板块,大数据对零售、生产、医疗和政府四个板块的经济发展具有重大影响,到2020年这四个板块预计每年能给美国提供6100亿美元的GDP增长量。如图2-2所示。
图2-2大数据潜在价值与数据采集难易度
也有一些公司开始用大数据进行基本面研究。如RSMetrics,用沃尔玛停车场的卫星图像来做基本面分析来看顾客多不多,并用这个数据来预测沃尔玛下一个季度收益的好坏。如一些机构用卡车GPS数据看公司货流的运输情况,用海轮的航运数据来做基本面方面的研究等。大数据不仅能应用在零售、生产、医疗等领域;同时,大数据也渐渐体现出其在金融投资领域巨大的潜在价值。