项目简介专威廉希尔栏简介
威廉希尔官方网站大家好!我是Chinas Prices Project的项目创始人和负责人,厦门大学王亚南经济研究院(WISE)大二本科生,主修经济学威廉希尔,辅修统计学,编程爱好者。我们是一个致力于大数据经济学的本科生课题组,课题组导师为WISE的茅家铭老师威廉希尔,课题组成员主要来自厦门大学王亚南经济研究院、厦门大学经济学院和厦门大学计算机系。项目已经获得厦门大学经济学拔尖计划资助。
我们的课题是《基于爬虫数据的中国线上价格指数的编制》。我们主要的思路是参考MIT的Billion Prices Project的工作,follow Cavallo(2010)关于Scraped Data的讨论、Cavallo(2011)关于阿根廷CPI的讨论和Cavallo(2016)关于线上线下价格水平变动一致性的讨论,基于网页爬虫、数据库、数据挖掘技术,以天猫、京东等电商平台作为主要数据来源,参考中国官方CPI编制标准,编制中国高频线上价格指数,一方面更快速地提供价格水平信息,另一方面也检验阿里公布的iSPI指数的可靠性。
目前我们项目基于中国官方CPI的分类标准作为搜索关键词,每天采集并储存天猫和京东的实时价格数据。项目每天采集的关键词有1000余个,数据点有500w左右。天猫数据已经积累了两个月威廉希尔,京东数据已经积累了一个月。此外,我们正在从第三方历史价格提供网站获取历史价格数据以最大可能地补充我们的数据库。线下超市的线上店也即将成为我们关注的重点之一。
开设这个专栏的主要目的是分享我们的进度和成果,给课题组成员一些外部压力,接受来自各个角度的批评以不断提高我们的产出质量,和学界的朋友们分享我们积累的学术工具和科研经验,也向公众介绍我们的研究并传递我们对于学术思维的浅显理解。
由于项目成员都在考试周中,考试周结束之后我们会开始更新专栏。欢迎大家关注和批评!
扫一扫关注微信公众帐号