分类目录归档:数据资源

知识图数据资源

中文综合

中文开放知识图谱

网站链接: http://www.openkg.cn/

数据分类概述: 常识 (27)、医疗 (23)、新冠专题 (15)、生活 (11)、娱乐 (11)、地理 (10)、城市 (9)、社交 (8)、出行 (6)、金融 (5)、科教 (5)、商业 (4)、OpenKG 评测 (4)、气象 (3)、其他 (3)、物联网 (2)、schemata (2)

英文综合

FreeBase

FreeBase 是一个由社区贡献内

Read more

财经类数据资源

AKShare 开源财经数据接口库

AKShare 是基于 Python 的财经数据接口库,目的是实现对股票、期货、期权、基金、外汇、债券、指数、加密货币等金融产品的基本面数据、实时和历史行情数据、衍生数据从数据采集、数据清洗到数据落地的一套工具,主要用于学术研究目的。

AKShare 的特点是获取的是相对权威的财经数据网站公布的原始数据,通过利用原始数据进行各数据源之间的交叉验证,进而再加工,从而得出科学的结论。

项目地址 7.5 k ⭐

TuShare 金融数据获取与分析

TuShare

Read more

医药类数据资源

MIMIC 重症数据库

MIMIC 是一个重症医学数据库,全称是 Medical Information Mart for Intensive Care

以最新版 MIMIC-IV 为例(截止于 20211116),此数据主要来自两个住院数据库系统:定制的医院电子病历系统 (EHR)和 ICU 自身的临床信息系统

MIMIC-IV 创建过程(

Read more

NLP 类数据资源

综合型资源(推荐)- funNLP

NLP民工的乐园: 几乎最全的中文NLP资源库

 类ChatGPT的模型评测对比 <br> 类ChatGPT的资料 <br> 类ChatGPT的开源框架 <br> LLM的训练_推理_低资源_高效训练 <br> 提示工程 <br&g

Read more

综合性数据资源

1 网站类

1.2 天池数据集

网站链接:https://tianchi.aliyun.com/dataset

天池数据集是阿里集团对外开放的科研数据平台,由阿里巴巴集团业务团队和外部研究机构联合提供,覆盖了电商、娱乐、物流、医疗健康、交通、工业、自然科学、能源等十多个行业,涵盖了数据挖掘、机器学习、计算机视觉、自然语言处理、决策智能等经典的人工智能技术领域。

1.3 科学数据银行

网站链接:https:/

Read more