量化投资:数据提取方法
目前,主流的数据提取方法主要分为终端提取方法和API提取方法两种。
一、终端提取方法
终端包括有网页终端和软件终端,其提取方法是利用终端界面上的行业分类和字段筛选等提取相关数据,并最终导出为Excel、DBF或TXT等格式文件。
我国提供终端的主流金融数据库主要有CSMAR数据库、Wind数据库、恒生聚源数据库、锐思数据库、中国统计局数据库、巨潮数据库和巨灵数据库等。
国际上提供终端的主流金融数据库主要有彭博数据库、路透社数据库、CEIC数据库、Th。ms。nFinancial。neBaker数据库和CapitalIQ数据库。
二、API提取方法
API(ApplicationProgrammingInterface)也称应用程序编程接口,目的是提供应用程序与开发人员基于某软件或硬件的以访问一组例程的能力,而又无须访问源码,或理解内部工作机制的细节。利用API接口连接数据库服务器并提取相关需求数据,能极大地提高程序化效率,因此API接口对于量化投资者而言异常重要。
目前,API提取方法主要是利用Matlab、C++、.Net、C。M和Excel等软件连接数据库服务器,并通过相关函数字段提取数据库数据。