综合性数据资源

1 网站类

1.2 天池数据集

网站链接:https://tianchi.aliyun.com/dataset

天池数据集是阿里集团对外开放的科研数据平台,由阿里巴巴集团业务团队和外部研究机构联合提供,覆盖了电商、娱乐、物流、医疗健康、交通、工业、自然科学、能源等十多个行业,涵盖了数据挖掘、机器学习、计算机视觉、自然语言处理、决策智能等经典的人工智能技术领域。

1.3 科学数据银行

网站链接:https://www.scidb.cn/

科学数据银行(Science Data Bank, ScienceDB)是一个开放可信的通用型科学数据存储与发布平台,旨在服务全球开放科学数据共享事业,由中国科学院计算机网络信息中心建设维护。

ScienceDB面向全球科研工作者、科研团队、学术期刊及出版商、科研机构及高校等利益相关者,提供科学数据存储、长期保存、出版、共享和获取等服务。平台提供多种数据共享方式与多样的数据许可协议,充分尊重和保障数据所有人权益。

ScienceDB致力于出版数据符合主流数据标准或惯例的科学数据,旨在促进科学数据的可发现性、可访问性、互操作性和可重用性(FAIR principle),并推动数据共享文化氛围在科研共同体中的培育及良性发展。

  • 7,085,114 公开数据集
  • 840,094,745 平台访问量
  • 371,159 +GB 数据体量
  • 23,179,534 文件下载量

2 政府公开数据

2.1 国内综合性公开数据

国家数据中心:具备详实的月度、季度、年度数据以及普查、地区、部门、国际数据。提供多种文件输出、制表、绘图、指标解释、表格转置、可视化图表、数据地理信息系统等多种功能

中国统计信息网:国家统计局的官方网站,汇集了海量的全国各级政府各年度的国民经济和社会发展统计信息,比如统计年鉴、阶段发展数据、统计分析、经济新闻、主要统计指标排行等

中国人民银行调查统计司:涵盖历年的重要金融经济数据,比如社会融资规模、货币统计概览、金融业机构资产负债统计、金融机构信贷收支统计、金融市场统计、企业商品价格(CGPI)指数

2.2 地方性政府公开数据

(以下数据统计口径截止日期为2023-01-05)

北京市公共数据开放平台:涉及115个单位、15964个数据集、581397个数据项、12954个数据接口、71.86亿条数据、71254帧图像数据/点云数据

上海市公共数据开放平台:现已开放50个数据部门,131个数据开放机构,5,345个数据集(其中2,233个数据接口),65个数据应用,43,800个数据项,2,007,091,541条数据

广州市政府数据统一开放平台:经济发展 (71) 机构团体 (228) 公共安全 (26) 农业农村 (26) 财税金融 (23) 劳动人事 (62) 信用服务 (73) 社会发展 (23) 城市建设 (36) 道路交通 (35) 教育科技 (178 民生服务 (179) 企业服务 (33) 卫生健康 (111) 资源环境 (77) 文体娱乐 (122)

深圳市政府数据开放平台:涉及50个市级部门/区、3358个开放目录、30457个数据项、12.21亿数据、数据接口3317个

除北上广深外,包括重庆、成都、武汉、南京、杭州、济南等等,很多省级城市、二线城市也有相关的数据开发平台,此处不再赘述

2.3 卫健委相关数据

各地方卫健委,主要包含人口与卫生相关信息的统计年鉴和统计提要。其中个人感觉数据公开比较全面的有上海市卫健委南京市卫健委深圳市卫健委天津市卫健委沈阳市卫健委(本次调研后发现,大部分省级卫健委很难统计到全面的数据,而较发达的市级卫健委则能公开较为全面且可用的统计数据)

北京市卫生健康大数据与政策研究中心:出生、死亡、死因、传染病、孕产妇相关;医疗服务量及服务效率、卫生人员、卫生机构数、机构床数、

2.4 裁判文书

中国裁判文书网本地搜索:需要磁盘空间 320G 以上

往年同期文章