kk Blog —— 通用基础


date [-d @int|str] [+%s|"+%F %T"]
netstat -ltunp
sar -n DEV 1

MIMIC III v1.4 数据简介

https://blog.csdn.net/weixin_59734569/article/details/131074344

MIMIC-III 临床数据集V1.4简介

数据库介绍

MIMIC-III(重症监护医学信息市场)是一个大型的单中心数据库,其中包含与大型三级护理医院重症监护病房收治的患者有关的信息

数据包括生命体征,药物,实验室测量值,医嘱,手术代码,诊断代码,影像报告,住院时间,生存数据等

MIMIC-III包含与2001年至2012年之间进入重症监护病房的成年患者(16岁或以上)的53,423例不同的医院入院相关的数据以及2001年至2008年之间收治的7870名新生儿的数据

数据集中一共包括26个数据表,除了字典表(D_开头)以外,表之间通过患者编号(SUBJECT_ID)、病案号(HADM_ID)、和ICU编号(ICUSTAY_ID)连接

按照数据格式,患者数据可以被划分为结构化数据(实验室测量、生命体征等)和非结构化数据(医嘱信息等)

一个患者对应一个subject_id,但是可能多次入院,有多个hadm_id,一次入院可能有多次进入ICU,即一个hadm_id可能对应多个icustay_id

通常采用一个hadm_id对应的第一个icustay_id开展相关的研究

字典表用于某个项的查询,举例如下:

比如查询某个患者的白细胞的数据(在LABEVENTS表中),首先需要找到患者对应的三个ID,然后在实验室检查编码(d_labitems)中找到白细胞的item_id,然后再去LABEVENTS表中查找

官方数据说明

MIMIC-III 是一个包含 26 个表的关系数据库。表由通常带有后缀'ID'的标识符链接。例如,SUBJECT_ID 指的是唯一的患者,HADM_ID 指的是唯一的医院入院,ICUSTAY_ID 指的是唯一的重症监护病房入院。

记录、实验室测试和体液平衡等图表事件存储在一系列'events'表中。例如,OUTPUTEVENTS 表包含与给定患者的输出相关的所有测量值,而 LABEVENTS 表包含患者的实验室测试结果。

D_为前缀的表是字典表,并提供标识符的定义。例如,CHARTEVENTS 的每一行都与一个 ITEMID 相关联,它表示测量的概念,但它不包含测量的实际名称。通过在 ITEMID 上连接 CHARTEVENTS 和 D_ITEMS,可以识别给定 ITEMID 所代表的概念。

开发 MIMIC 数据模型涉及平衡解释的简单性和与基本事实的接近程度。因此,该模型反映了基础数据源,根据用户反馈对 MIMIC 数据库的迭代进行了修改。在进行转换时已注意避免对基础数据做出假设,因此 MIMIC-III 密切代表原始医院数据。

从广义上讲,有五个表格用于定义和跟踪患者住院时间:

ADMISSIONS;(入院)

PATIENTS; (患者)

ICUSTAYS;(ICU)

SERVICES; (服务)

TRANSFERS. (转移)

另外五个表是对照各自定义交叉引用代码的字典:

D_CPT;

D_ICD_DIAGNOSES;

D_ICD_PROCEDURES;

D_ITEMS;

D_LABITEMS.

其余表包含与患者护理相关的数据,例如生理测量、护理人员观察和账单信息。

在某些情况下,可以合并表——例如,D_ICD_PROCEDURES 和 CPTEVENTS 表都包含与程序相关的详细信息并且可以合并——但我们的方法是为了清楚起见保持表独立,因为数据源明显不同。我们建议研究人员开发适当的数据库视图和转换,而不是在 MIMIC 数据模型中组合表格。

全部26张表的详细信息

患者人口学信息以及院内周转信息(6张)

表名简介特征/属性行列数文件大小
ADMISSIONS患者入院情况行号、患者编号、病案号、入院时间、出院时间、死亡时间、入院类型、入院地点、出院目的地、保险类型、语种、宗教信仰、婚姻状况、种族、急诊留观登记时间、急诊留观出观时间、初步诊断、院内死亡标记、是否有charievents记录58,976*1912.5MB
CALLOUT患者ICU出科时的即时信息行号、患者编号、病案号、提交出科申请的科室代码、目标科室代码、出科申请结果、患者需接受的治疗服务、出科且期、出科时是否感染了MRSA等34,499*246.34MB
ICUSTAYSICU入住信息行号、患者编号、病案号、ICU病案号、数据源、患者入住监护室24小时内的首个和最终监护室类别、入住首个和末次监护室代码、入科出科时间、住院时长61,532*126.36MB
PATIENTS患者信息行号、患者编号、性别、出生日期、死亡日期、院内登记死亡日期、社保局登记死亡日期、死亡标记种类46,520*82.63MB
SERVICES患者需要接受的医疗服务行号、患者编号、病案号、服务种类更改时间、前次服务种类、当前服务73,343*63.48MB
TRANSFERS患者周转信息行号、患者编号、病案号、ICU病案号、数据源、周转项目、前次和当前所在监护室类型、前次和当前所在科室代码、入科出科时间、住院时长261,897*1325.1MB

患者在监护室住院期间采集的各类信息(8张)

表名简介特征/属性行列数文件大小
CAREGIVERS护理人员信息行号、护理人员标志符、头衔缩穿、类别7,567*4203KB
CHARTEVENTS患者观察记录数据行号、患者编号、病案号、ICU病案号、项目标志符、记录时间、存储时间、护理人员标志符、项目值等330,712,483*1535.5GB
DATETIMEEVENTS患者操作时间信息行号、患者编号、病案号、ICU病案号、项目标志符、记录时间、存储时间、护理人员标志符、项目对应时间4,485,937*14526MB
INPUTEVENTS_CV使用CareVue监护系统记录的入量信息行号、患者编号、病案号、ICU病案号、记录时间、项目标志符、前次纪录至今总入量、护理人员标志符、给药速率、给药途径、给药部位药品组合标志符、药品组合总量17,527,935*222.46GB
INPUTEVENTS_MViMDSoftMetavision系统入量数据行号、患者编号、病案号、ICU病案号、出入量活动开始结束时间、项目标志符、总入量、入量单位、药品组合标志符、药品一级分类名、药品类型、液体总量、出科后是否续药、输液状态等3,618,991*31975MB
NOTEEVENTS治疗记录行号、患者编号、病案号、记录时间、记录类别、护理人员标志符、医嘱具体内容2,083,180*114.01GB
OUTPUTEVENTS患者出量信息行号、患者编号、病案号、ICU病案号、记录时间,项目标志符、液体出量、护理人员标志符、输液是否中断、新液体准备状态4,349,218*13396MB
PROCEDUREEVENTS_MVMetavision系统的操作信息行号、患者编号、病案号、ICU病案号、操作或手术开始结束时间、项目标志符、项目值、数据上传时间、护理人员标志符、药品组合标志符、药品一级分类名、药品类型、医嘱状态258,066*2548.8MB

医院记录系统采集的各类信息(7张)

表名简介特征/属性行列数文件大小
CPTEVENTS患者操作记录行号、患者编码、病案号、记录时间、操作编码、部门573,146*1258.2MB
DIAGNOSES_ICD患者诊断ICD-9编码行号、患者编号、病案号、ICD9编码651,047*519.1MB
DRGCODES患者诊断类别组行号、患者编号、病案号、诊断类别、诊断编码125,557*810.5MB
LABEVENTS患者化验项目行号、患者编号、病案号、项目标志符、记录时间、项目值27,854,055*91.85GB
MICROBIOLOGYEVENTS病人标本微生物病原体检测结界行号、患者编号、病案号、记录时间、化验项目标志符、化验类型、化验微生物、是否隔离631,726*1672.5MB
PRESCRIPTIONS病人用药记录行号、患者编号、病案号、ICU病案号、用药开始结束时间、药物类型、药物名称、剂量,用药途径、处方药代码、药物gsn4,156,450*19770MB
PROCEDURES_ICD病人手术记录ICD-9编码行号、患者编号、病案号、ICD9编码240,095*56.8MB

字典信息(5张)

表名简介特征/属性行列数文件大小
D_CPT操作记录代码索引细分成多个category,包括每个子部分的代号及范围134*913.8KB
D_ICD_DIAGNOSES诊断代码索引行号、ICD9编码、缩写、全称14,567*41.39MB
D_ICD_PROCEDURES手术操作代码索引行号、ICD9编码、缩写、全称3,882*4311KB
D_ITEMS记录项目代码索引行号、项目标志符、项目标签、数据来源12,487*10954KB
D_LABITEMS化验项目代码索引行号、项目标志符、项目标签、化验类型753*643.1KB

全部26张表总结

1、ADMISSIONS患者入院情况,包括每个患者的入院代码、患者标识码、人口统计学资料等

2、CALLOUT患者准备从ICU出科时的即时信息,包括具体ICU科室、病床号、出科日期等

3、CAREGIVERS监护提供人员,是医生、护士还是社工等

4、CHARTEVENTS患者的呼吸机设定、神志状态,患者入院期间的大多数信息都在这个大表里

5、CPTEVENTS患者操作记录

6、D_CPTCPT操作记录代码索引

7、D_ICD_DIAGNOSESICD-9诊断代码索引

8、D_ICD_PROCEDURESICD-9手术操作代码索引

9、D_ITEMS记录项目代码索引,如代码211就是用来表示心率的

10、D_LABITEMS化验项目代码索引,如50820表示血气化验里的pH

11、DATETIMEEVENTS各项操作日期信息

12、DIAGNOSES_ICD患者诊断ICD-9码

13、DRGCODES患者诊断类别组

14、ICUSTAYSICU出入科时间

15、INPUTEVENTS_CV使用CareVue监护系统记录的入量信息

16、INPUTEVENTS_MV使用Metavision监护系统记录的入量信息

17、OUTPUTEVENTS患者出量信息

18、LABEVENTS患者化验项目结果

19、MICROBIOLOGYEVENTS患者标本微生物病原体检测结果

20、NOTEEVENTS病程及出院录记录信息

21、PATIENTS患者出生及死亡信息

22、PRESCRIPTIONS患者用药记录

23、PROCEDUREEVENTS_MV患者手术记录

24、PROCEDURES ICD患者手术记录ICD-9码

25、SERVICES患者在院期间接受专科服务信息

26、TRANSFERS患者在院期间所有床位信息


https://cloud.tencent.com/developer/article/1913701

文章目录

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
1. 概述
2. 字典信息辅助表
    D_CPT(目前使用医疗服务术语表)
    D_ICD_DIAGNOSES (ICD病情确诊词典表)
    D_ICD_PROCEDURES (ICD医疗过程词典表)
    D_ITEMS(ICU化验词典表)
    D_LABITEMS(门诊化验词典表)
3. 病人基本信息及转移信息表
    PATIENTS(病人登记表)
    ADMISSIONS(住院表)
    CALLOUT(出院表)
    ICUSTAYS(ICU记录表)
    TRANSFERS(病房转移表)
    SERVICES(服务表)
4. 病人医院门诊治疗的相关信息表
    CPTEVENTS(当前使用医疗服务记录表)
    DIAGNOSES_ICD(诊断信息表)
    DRGCODES(诊断相关组编码表)
    LABEVENTS(门诊检查记录表)
    MICROBIOLOGYEVENTS(微生物检测记录表)
    PRESCRIPTIONS(处方信息表)
5. 病人在ICU里的治疗相关信息表
    CAREGIVERS(医务人员信息表)
    CHARTEVRNTS(化验记录表)
    DATETIMEEVENTS (日期型事件表)
    INPUTEVENTS(注射事件表(CV))
    INPUTEVENTS_MV (注射事件表(MV))
    NOTEEVENTS (文本记录事件表)
    OUTPUTEVENTS (排泄记录表)
    PROCEDUREEVENTS_MV (医疗过程事件表)
    PROCEDURES_ICD(ICD手术记录表)

参考文章

1. 概述

多参数智能监测数据库(MIMIC-III)是一个免费开放的、公共资源的重症监护室研究数据库。该数据库于2006年由美国麻省理工学院计算生理学实验室以及贝斯以色列迪康医学中心(BIDMC)和飞利浦医疗共同发布,吸引了越来越多的学术界和工业界的研究人员采用该医疗数据库从事医疗研究。

MIMIC数据集包括MIMIC-II数据集和MIMIC-III数据集,MIMIC-II数据集的数据是2001—2008年间贝斯以色列迪康医学中心(BIDMC)重症监护室中病人的医疗数据,MIM-IC-III数据集的数据是2001年6月—2012年10月重症监护室病人数据。数据集MIMIC数据库从发布到现在,随着更多数据变得可用,数据导入和提取方法的改进,以及数据库维护人员一直根据社区提供的数据库内容的反馈定期更新数据集,因此MIMIC数据集有多个版本,目前最新的版本是2016年9月发布的MIMIC-IIIV1.4。

MIMIC数据库中包含了多种类型ICU(外科监护室、内科监护室、创伤外科监护室、新生儿监护室、心脏病监护室、心外恢复监护室)。MIMIC-Ⅲ数据集主要包括波形数据集(病人的生命体征趋势图)和临床数据集,按照记录内容的不同,共包含以下21个数据表:住院表、出院表、当前使用医疗服务记录表(CPT)、日期型事件表、医务人员表、监测情况表、ICD病情确诊表、诊断相关组编码表(DRG)、ICU记录表、注射记录表(CV)、注射记录表(MV)、排泄记录表、化验记录表、微生物检测记录表、文本报告记录表、病人登记表、处方信息表、过程事件表(MV)、ICD手术记录表、服务表、病房转移表。同时,数据集中还包含了5个辅助表用来辅助查找:目前使用医疗服务术语表、ICD病情确诊词典表、ICD医疗过程词典表、ICU化验词典表、门诊化验词典表。在对26个数据表的内容充分了解后,按照各个表的内容相关程度可分为四类,分别是病人基本信息及转移信息表、病人医院门诊的治疗相关信息表、病人在ICU里的治疗相关信息表和辅助信息表。下面分别介绍数据表的主要内容和利用该数据表进行的相关研究。

2. 字典信息辅助表

字典信息数据,共包含5个数据表。抽取患者的数据比如说生命体征,心率等,实验室指标(如白细胞红细胞等)等, 需要在相应的字典中找到相应的item,即项目标识符,再对应查找某一个患者对应指标下的数据。

D_CPT(目前使用医疗服务术语表)

Name

Postgres data type

说明

ROW_ID

INT

行号

CATEGORY

SMALLINT

CPT code 类别号

SECTIONRANGE

VARCHAR(100)

给定的代码范围

SECTIONHEADER

VARCHAR(50)

给定的代码说明

SUBSECTIONRANGE

VARCHAR(100)

对给定子部分的代码范围

SUBSECTIONHEADER

VARCHAR(300)

对给定子部分的描述

CODESUFFIX

VARCHAR(5)

当CPT_CD包含非数字字符时,CPT_SUFFIX列包含文本后缀

MINCODEINSUBSECTION

INT

SUBSECTIONRANGE 的最小值

MAXCODEINSUBSECTION

INT

SUBSECTIONRANGE 的最大值

D_ICD_DIAGNOSES (ICD病情确诊词典表)

Name

Postgres data type

说明

ROW_ID

INT

-

ICD9_CODE

VARCHAR(10)

ICD-9 编码

SHORT_TITLE

VARCHAR(50)

缩写(对给定代码的简单描述)

LONG_TITLE

VARCHAR(300)

全称

D_ICD_PROCEDURES (ICD医疗过程词典表)

Name

Postgres data type

说明

ROW_ID

INT

-

ICD9_CODE

VARCHAR(10)

ICD-9 编码

SHORT_TITLE

VARCHAR(50)

缩写

LONG_TITLE

VARCHAR(300)

全称

D_ITEMS(ICU化验词典表)

Name

Postgres data type

说明

ROW_ID

INT

-

ITEMID

INT

项目标识符

LABEL

VARCHAR(200)

项目标签

ABBREVIATION

VARCHAR(100)

标签缩写

DBSOURCE

VARCHAR(20)

数据来源

LINKSTO

VARCHAR(50)

对应的数据表

CATEGORY

VARCHAR(100)

项目种类

UNITNAME

VARCHAR(100)

项目测量单位

PARAM_TYPE

VARCHAR(30)

记录数据的类型 a date, a number, a text field

CONCEPTID

INT

未知,数据表中该列全为空

D_LABITEMS(门诊化验词典表)

Name

Postgres data type

说明

ROW_ID

INT

-

ITEMID

INT

实验室检测项目的ITEMID

LABEL

VARCHAR(100)

项目标签

FLUID

VARCHAR(100)

测量的物质 ‘blood’ ‘urine’

CATEGORY

VARCHAR(100)

测量的种类

LOINC_CODE

VARCHAR(100)

LOINC_CODE包含与给定ITEMID关联的LOINC代码。 LOINC是一种本体,最初指定了实验室测量,但后来扩展到涵盖了广泛的临床相关概念。 LOINC公开提供一个表,其中包含有关每个LOINC代码的大量详细信息。 该表可在线免费获取,也可由数据库的监护人提供

3. 病人基本信息及转移信息表

PATIENTS(病人登记表)

Name

Postgres data type

说明

ROW_ID

INT

-

SUBJECT_ID

INT

患者编号

GENDER

VARCHAR(5)

性别

DOB

TIMESTAMP(0)

出生日期

DOD

TIMESTAMP(0)

死亡日期

DOD_HOSP

TIMESTAMP(0)

院内登记死亡日期

DOD_SSN

TIMESTAMP(0)

社保局登记死亡日期

EXPIRE_FLAG

VARCHAR(5)

死亡标记

ADMISSIONS(住院表)

Name Postgres data type

说明

ROW_ID INT

行号

SUBJECT_ID INT

患者编号

HADM_ID INT

病案号

ADMITTIME TIMESTAMP(0)

入院时间

DISCHTIME TIMESTAMP(0)

出院时间

DEATHTIME TIMESTAMP(0)

死亡时间

ADMISSION_TYPE VARCHAR(50)

入院类型

ADMISSION_LOCATION VARCHAR(50)

入院地点

DISCHARGE_LOCATION VARCHAR(50)

出院地点

INSURANCE VARCHAR(255)

保险类型

LANGUAGE VARCHAR(10)

语种

RELIGION VARCHAR(50)

宗教信仰

MARITAL_STATUS VARCHAR(50)

婚姻状况

ETHNICITY VARCHAR(200)

种族

EDREGTIME TIMESTAMP(0)

急诊留观登记时间

EDOUTTIME TIMESTAMP(0)

急诊留观出观时间

DIAGNOSIS VARCHAR(300)

初步诊断

HOSPITAL_EXPIRE_FLAG TINYINT

院内死亡标记

HAS_CHARTEVENTS_DATA TINYINT

是否有chartevents记录

CALLOUT(出院表)

Name Postgres data type

说明

ROW_ID INT

行号

SUBJECT_ID INT

患者编号

HADM_ID INT

病案号

SUBMIT_WARDID INT

提交申请的科室代码

SUBMIT_CAREUNIT VARCHAR(15)

提交申请的科室所属的ICU cost类型

CURR_WARDID INT

患者所属科室

CURR_CAREUNIT VARCHAR(15)

患者所属的ICU cost类型

CALLOUT_WARDID INT

申请转移的地方 0 代表 Home / 1 代表转移到可用的的病房

CALLOUT_SERVICE VARCHAR(10)

患者需接受的治疗服务

REQUEST_TELE SMALLINT

预防患者已经感染的疾病

REQUEST_RESP SMALLINT

预防患者已经感染的疾病

REQUEST_CDIFF SMALLINT

预防患者已经感染的疾病

REQUEST_MRSA SMALLINT

预防患者已经感染的疾病

REQUEST_VRE SMALLINT

预防患者已经感染的疾病

CALLOUT_STATUS VARCHAR(20)

申请的状态

CALLOUT_OUTCOME VARCHAR(20)

‘Discharged’ or ‘Cancelled’

DISCHARGE_WARDID INT

实际转移的地方 0 代表 Home / 1 代表转移到可用的的病房

ACKNOWLEDGE_STATUS VARCHAR(20)

申请的反馈结果状态 ‘Acknowledged’, ‘Revised’, ‘Unacknowledged’ or ‘Reactivated’

CREATETIME TIMESTAMP(0)

申请创建时间

UPDATETIME TIMESTAMP(0)

更新时间

ACKNOWLEDGETIME TIMESTAMP(0)

反馈时间

OUTCOMETIME TIMESTAMP(0)

callout完成时间

FIRSTRESERVATIONTIME TIMESTAMP(0)

首次病房保留时间

CURRENTRESERVATIONTIME TIMESTAMP(0)

当前病房保留时间

ICUSTAYS(ICU记录表)

Name

Postgres data type

说明

ROW_ID

INT

-

SUBJECT_ID

INT

指定患者的标识符

HADM_ID

INT

对于患者而言HADM_ID是唯一的

ICUSTAY_ID

INT

ICU病案号(对于患者住院而言ICUSTAY_ID是唯一的)

DBSOURCE

VARCHAR(20)

来源数据库 ‘carevue’ ‘metavision’ 在某些地方处理上有所不同

FIRST_CAREUNIT

VARCHAR(20)

患者入住监护室24小时内的首个ICU监护室种类

LAST_CAREUNIT

VARCHAR(20)

患者入住监护室24小时内的最终ICU监护室种类

FIRST_WARDID

SMALLINT

监护室编号

LAST_WARDID

SMALLINT

监护室编号

INTIME

TIMESTAMP(0)

入科时间

OUTTIME

TIMESTAMP(0)

出科时间

LOS

DOUBLE

入住时长 可能包括单个或多个ICU单位

TRANSFERS(病房转移表)

Name

Postgres data type

说明

ROW_ID

INT

-

SUBJECT_ID

INT

-

HADM_ID

INT

-

ICUSTAY_ID

INT

-

DBSOURCE

VARCHAR(20)

数据来源 ‘carevue’ ‘metavision’

EVENTTYPE

VARCHAR(20)

转移的类型 ‘admit’ ‘transfer’ ‘discharge’

PREV_CAREUNIT

VARCHAR(20)

前次所在监护室

CURR_CAREUNIT

VARCHAR(20)

当前所在监护室

PREV_WARDID

SMALLINT

前次所在科室代码

CURR_WARDID

SMALLINT

当前所在科室代码

INTIME

TIMESTAMP(0)

入科时间

OUTTIME

TIMESTAMP(0)

出科时间

LOS

INT

住院时长

SERVICES(服务表)

ROW_ID

INT

-

SUBJECT_ID

INT

-

HADM_ID

INT

-

TRANSFERTIME

TIMESTAMP(0)

服务种类更改时间

PREV_SERVICE

VARCHAR(20)

前次服务种类

CURR_SERVICE

VARCHAR(20)

当前服务种类

服务的名称缩写及其详细说明:

Service

Description

CMED

Cardiac Medical - for non-surgical cardiac related admissions

CSURG

Cardiac Surgery - for surgical cardiac admissions

DENT

Dental - for dental/jaw related admissions

ENT

Ear, nose, and throat - conditions primarily affecting these areas

GU

Genitourinary - reproductive organs/urinary system

GYN

Gynecological - female reproductive systems and breasts

MED

Medical - general service for internal medicine

NB

Newborn - infants born at the hospital

NBB

Newborn baby - infants born at the hospital

NMED

Neurologic Medical - non-surgical, relating to the brain

NSURG

Neurologic Surgical - surgical, relating to the brain

OBS

Obstetrics - conerned with childbirth and the care of women giving birth

ORTHO

Orthopaedic - surgical, relating to the musculoskeletal system

OMED

Orthopaedic medicine - non-surgical, relating to musculoskeletal system

PSURG

Plastic - restortation/reconstruction of the human body (including cosmetic or aesthetic)

PSYCH

Psychiatric - mental disorders relating to mood, behaviour, cognition, or perceptions

SURG

Surgical - general surgical service not classified elsewhere

TRAUM

Trauma - injury or damage caused by physical harm from an external source

TSURG

Thoracic Surgical - surgery on the thorax, located between the neck and the abdomen

VSURG

Vascular Surgical - surgery relating to the circulatory system

4. 病人医院门诊治疗的相关信息表

CPTEVENTS(当前使用医疗服务记录表)

Name

Postgres data type

说明

ROW_ID

INT

行号

SUBJECT_ID

INT

患者编号

HADM_ID

INT

病案号

COSTCENTER

VARCHAR(10)

操作部门

CHARTDATE

TIMESTAMP(0)

操作时间

CPT_CD

VARCHAR(10)

操作的原始编码code

CPT_NUMBER

INT

CPT_CD 的数字信息

CPT_SUFFIX

VARCHAR(5)

CPT_CD 的文本后缀

TICKET_ID_SEQ

INT

CPT_CD 的顺序

SECTIONHEADER

VARCHAR(50)

CPT_CD 的种类

SUBSECTIONHEADER

VARCHAR(300)

CPT_CD 的种类

DESCRIPTION

VARCHAR(200)

CPT_CD 的详细信息

DIAGNOSES_ICD(诊断信息表)

Name

PostgreSQL data type

Modifiers

说明

ROW_ID

INT

not null

-

SUBJECT_ID

INT

not null

-

HADM_ID

INT

not null

-

SEQ_NUM

INT

ICD诊断顺序

ICD9_CODE

VARCHAR(10)

实际编码IDC-9

DRGCODES(诊断相关组编码表)

Name

PostgreSQL data type

说明

ROW_ID

INT

-

SUBJECT_ID

INT

-

HADM_ID

INT

-

DRG_TYPE

VARCHAR(20)

诊断类别

DRG_CODE

VARCHAR(20)

诊断编码

DESCRIPTION

VARCHAR(300)

详细描述

DRG_SEVERITY

SMALLINT

严重程度

DRG_MORTALITY

SMALLINT

死亡率

LABEVENTS(门诊检查记录表)

Name

Postgres data type

说明

ROW_ID

INT

-

SUBJECT_ID

INT

-

HADM_ID

INT

-

ITEMID

INT

项目标识符

CHARTTIME

TIMESTAMP(0)

测量时间

VALUE

VARCHAR(200)

测量项目

VALUENUM

DOUBLE PRECISION

测量数值数据

VALUEUOM

VARCHAR(20)

测量单位

FLAG

VARCHAR(20)

测量值是否异常

MICROBIOLOGYEVENTS(微生物检测记录表)

Name

Postgres data type

说明

ROW_ID

INT

-

SUBJECT_ID

INT

-

HADM_ID

INT

-

CHARTDATE

TIMESTAMP(0)

记录日期

CHARTTIME

TIMESTAMP(0)

记录时间

SPEC_ITEMID

INT

化验项目标识符

SPEC_TYPE_DESC

VARCHAR(100)

化验类型 血液 尿液 痰

ORG_ITEMID

INT

生成的有机物标识符

ORG_NAME

VARCHAR(100)

有机物名称

ISOLATE_NUM

SMALLINT

分离菌落数目

AB_ITEMID

INT

抗生素敏感性测试标识符

AB_NAME

VARCHAR(30)

抗生素名称

DILUTION_TEXT

VARCHAR(10)

测试抗生素敏感性

DILUTION_COMPARISON

VARCHAR(20)

-

DILUTION_VALUE

DOUBLE PRECISION

测试抗生素敏感性时的稀释值

INTERPRETATION

VARCHAR(5)

解释抗生素的敏感性和试验结果 “S”是敏感的,“R”是抗性的,“I”是中间的,“P”是待定的

PRESCRIPTIONS(处方信息表)

Name

Postgres data type

说明

ROW_ID

INT

-

SUBJECT_ID

INT

-

HADM_ID

INT

-

ICUSTAY_ID

INT

-

STARTDATE

TIMESTAMP(0)

用药开始时间

ENDDATE

TIMESTAMP(0)

用药结束时间

DRUG_TYPE

VARCHAR(100)

药物类型

DRUG

VARCHAR(100)

药物名称

DRUG_NAME_POE

VARCHAR(100)

药物说明

DRUG_NAME_GENERIC

VARCHAR(100)

药物说明

FORMULARY_DRUG_CD

VARCHAR(120)

处方药代码

GSN

VARCHAR(200)

通用序列号

NDC

VARCHAR(120)

国家药品编码

PROD_STRENGTH

VARCHAR(120)

-

DOSE_VAL_RX

VARCHAR(120)

-

DOSE_UNIT_RX

VARCHAR(120)

-

FORM_VAL_DISP

VARCHAR(120)

-

FORM_UNIT_DISP

VARCHAR(120)

-

ROUTE

VARCHAR(120)

-

PROD_STRENGTH

DOSE_VAL_RX, DOSE_UNIT_RX

FORM_VAL_DISP, FORM_UNIT_DISP

ROUTE

The route prescribed for the drug.

为该药开出的途径

5. 病人在ICU里的治疗相关信息表

CAREGIVERS(医务人员信息表)

Name Postgres data type

说明

ROW_ID INT

行号

CGID INT

护理人员标志符

LABEL VARCHAR(15)

护理人员的头衔 RN, MD, PharmD

DESCRIPTION VARCHAR(30)

护理人员的结构化数据信息 17 unique values

CHARTEVRNTS(化验记录表)

Name

Postgres data type

In CareVue

In Metavision

说明

ROW_ID

INT

Y

Y

行号

SUBJECT_ID

NUMBER(7,0)

Y

Y

患者编号

HADM_ID

NUMBER(7,0)

Y

Y

病案号

ICUSTAY_ID

NUMBER(7,0)

Y

Y

ICU病案号

ITEMID

NUMBER(7,0)

Y

Y

项目标识符

CHARTTIME

DATE

Y

Y

记录时间

STORETIME

DATE

Y

Y

存储时间

CGID

NUMBER(7,0)

Y

Y

护理人员标识符

VALUE

VARCHAR2(200 BYTE)

Y

Y

项目测量的值

VALUENUM

NUMBER

Y

Y

项目测量的数字信息

VALUEUOM

VARCHAR2(20 BYTE)

Y

Y

项目测量的值对应的单位

WARNING

NUMBER(1,0)

Y

测量过程发生的警告 / Metavision specific columns

ERROR

NUMBER(1,0)

Y

测量过程发生的错误 / Metavision specific columns

RESULTSTATUS

VARCHAR2(20 BYTE)

Y

测量类型 ‘Manual’ or ‘Automatic’ / CareVue specific columns

STOPPED

VARCHAR2(20 BYTE)

Y

测量是否停止

DATETIMEEVENTS (日期型事件表)

Name

Postgres data type

说明

ROW_ID

INT

行号

SUBJECT_ID

INT

患者编号

HADM_ID

INT

病案号

ICUSTAY_ID

INT

ICU病案号

ITEMID

INT

项目标识符

CHARTTIME

TIMESTAMP(0)

记录时间

STORETIME

TIMESTAMP(0)

存储时间

CGID

INT

护理人员标识符

VALUE

TIMESTAMP(0)

项目测量的值

VALUEUOM

VARCHAR(50)

项目测量的值对应的单位

WARNING

SMALLINT

测量过程发生的警告 / Metavision specific columns

ERROR

SMALLINT

测量过程发生的错误 / Metavision specific columns

RESULTSTATUS

VARCHAR(50)

测量类型 ‘Manual’ or ‘Automatic’ / CareVue specific columns

STOPPED

VARCHAR(50)

测量是否停止

INPUTEVENTS(注射事件表(CV))

Name

Postgres data type

说明

ROW_ID

INT

-

SUBJECT_ID

INT

-

HADM_ID

INT

-

ICUSTAY_ID

INT

-

CHARTTIME

TIMESTAMP(0)

记录时间

ITEMID

INT

项目标识符

AMOUNT

DOUBLE PRECISION

总入量

AMOUNTUOM

VARCHAR(30)

入量单位

RATE

DOUBLE PRECISION

给药速率

RATEUOM

VARCHAR(30)

速率单位

STORETIME

TIMESTAMP(0)

存储时间

CGID

BIGINT

护理人员编码

ORDERID

BIGINT

同一次输入的多个药物进行链接

LINKORDERID

BIGINT

同一次的单个药物不同改变进行链接

STOPPED

VARCHAR(30)

输入是否暂停

NEWBOTTLE

INT

新配制的溶液

ORIGINALAMOUNT

DOUBLE PRECISION

-

ORIGINALAMOUNTUOM

VARCHAR(30)

-

ORIGINALROUTE

VARCHAR(30)

-

ORIGINALRATE

DOUBLE PRECISION

-

ORIGINALRATEUOM

VARCHAR(30)

-

ORIGINALSITE

VARCHAR(30)

-

ORIGINALAMOUNT, ORIGINALAMOUNTUOM, ORIGINALROUTE, ORIGINALRATE, ORIGINALRATEUOM , ORIGINALSITE

这些列提供有关药物首次输入信息系统时所使用的解决方案的信息

INPUTEVENTS_MV (注射事件表(MV))

Name

Postgres data type

说明

ROW_ID

INT

-

SUBJECT_ID

INT

-

HADM_ID

INT

-

ICUSTAY_ID

INT

-

STARTTIME

TIMESTAMP(0)

入量开始时间

ENDTIME

TIMESTAMP(0)

入量结束时间

ITEMID

INT

项目标识符

AMOUNT

DOUBLE PRECISION

总入量

AMOUNTUOM

VARCHAR(30)

入量单位

RATE

DOUBLE PRECISION

给药速率

RATEUOM

VARCHAR(30)

速率单位

STORETIME

TIMESTAMP(0)

存储时间

CGID

BIGINT

护理人员编号

ORDERID

BIGINT

同上

LINKORDERID

BIGINT

同上

ORDERCATEGORYNAME

VARCHAR(100)

-

SECONDARYORDERCATEGORYNAME

VARCHAR(100)

-

ORDERCOMPONENTTYPEDESCRIPTION

VARCHAR(200)

-

ORDERCATEGORYDESCRIPTION

VARCHAR(50)

-

PATIENTWEIGHT

DOUBLE PRECISION

患者体重 (kg)

TOTALAMOUNT

DOUBLE PRECISION

溶液液体总量

TOTALAMOUNTUOM

VARCHAR(50)

溶液液体总量单位

ISOPENBAG

SMALLINT

-

CONTINUEINNEXTDEPT

SMALLINT

转移是否继续入量

CANCELREASON

SMALLINT

取消原因

STATUSDESCRIPTION

VARCHAR(30)

项目最终状态 changed paused finishedrunning stopped rewritten flushed

COMMENTS_STATUS

VARCHAR(30)

-

COMMENTS_TITLE

VARCHAR(100)

-

COMMENTS_DATE

TIMESTAMP(0)

-

ORIGINALAMOUNT

DOUBLE PRECISION

-

ORIGINALRATE

DOUBLE PRECISION

-

COMMENTS_STATUS, COMMENTS_TITLE, COMMENTS_DATE

指定是编辑还是取消订单,如果是,则指定取消或编辑该订单的护理员的日期和职位。

ORIGINALAMOUNT

通常将药物混合在溶液中,并从同一袋子连续输送。此栏代表处袋子中所含药物的数量STARTTIME。对于第一次注入一个新袋子,ORIGINALAMOUNT= TOTALAMOUNT。以后,如果速率改变了,那么袋子中的药物量就会减少(因为有些药物已经施予患者了)。结果,ORIGINALAMOUNT<TOTALAMOUNTORIGINALAMOUNT将是该处袋子中剩余药物的数量STARTTIME

ORIGINALRATE

这是护理人员输入的费率。请注意,这可能RATE由于各种原因而有所不同:ORIGINALRATE是原始计划费率,而RATE列将是实际交付的费率。例如,如果一个袋子快要用完了,而护理人员决定将剩余的液体推入,则RATE> ORIGINALRATE。但是,这两列通常是相同的,但由于四舍五入误差,在临床上的差别很小。

NOTEEVENTS (文本记录事件表)

Name

Postgres data type

说明

ROW_ID

INT

-

SUBJECT_ID

INT

-

HADM_ID

INT

-

CHARTDATE

TIMESTAMP(0)

记录note的日期

CHARTTIME

TIMESTAMP(0)

记录note的日期和时间

STORETIME

TIMESTAMP(0)

记录note保存到系统的日期和时间

CATEGORY

VARCHAR(50)

记录类型 ‘Discharge’ :出院

DESCRIPTION

VARCHAR(300)

记录类别 ‘Summary’ :总结

CGID

INT

护理人员标识符

ISERROR

CHAR(1)

‘1’ 代表该记录被标记为错误

TEXT

TEXT

医嘱内容

OUTPUTEVENTS (排泄记录表)

Name

Postgres data type

说明

ROW_ID

INT

-

SUBJECT_ID

INT

-

HADM_ID

INT

-

ICUSTAY_ID

INT

-

CHARTTIME

TIMESTAMP(0)

时间

ITEMID

INT

项目标识符

VALUE

DOUBLE PRECISION

出量值

VALUEUOM

VARCHAR(30)

出量值的单位

STORETIME

TIMESTAMP(0)

存储时间

CGID

BIGINT

护理人员标识符

STOPPED

VARCHAR(30)

是否中断

NEWBOTTLE

INT

是否有准备新溶液

ISERROR

SMALLINT

是否被标记为错误

PROCEDUREEVENTS_MV (医疗过程事件表)

Name

Postgres data type

说明

ROW_ID

INT NOT NULL

-

SUBJECT_ID

INT NOT NULL

-

HADM_ID

INT NOT NULL

-

ICUSTAY_ID

INT

-

STARTTIME

TIMESTAMP(0)

-

ENDTIME

TIMESTAMP(0)

-

ITEMID

INT

-

VALUE

DOUBLE PRECISION

-

VALUEUOM

VARCHAR(30)

-

LOCATION

VARCHAR(30)

-

LOCATIONCATEGORY

VARCHAR(30)

-

STORETIME

TIMESTAMP(0)

-

CGID

INT

-

ORDERID

INT

-

LINKORDERID

INT

-

ORDERCATEGORYNAME

VARCHAR(100)

药物一级分类名称

SECONDARYORDERCATEGORYNAME

VARCHAR(100)

药物二级分类名称

ORDERCATEGORYDESCRIPTION

VARCHAR(50)

药物分类描述

ISOPENBAG

SMALLINT

-

CONTINUEINNEXTDEPT

SMALLINT

-

CANCELREASON

SMALLINT

取消原因

STATUSDESCRIPTION

VARCHAR(30)

状态描述

COMMENTS_EDITEDBY

VARCHAR(30)

COMMENTS_CANCELEDBY

VARCHAR(30)

COMMENTS_DATE

TIMESTAMP(0)

PROCEDURES_ICD(ICD手术记录表)

Name

PostgreSQL data type

Modifiers

说明

ROW_ID

INT

not null

-

SUBJECT_ID

INT

not null

-

HADM_ID

INT

not null

-

SEQ_NUM

INT

操作顺序

ICD9_CODE

VARCHAR(10)

ICD-9 编码

MIMIC III v1.4 数据入库

MIMIC III v1.4

https://blog.csdn.net/mysssqqqlll/article/details/126123093

文件解压后大小为43.3GB

drop数据库mimic

1
DROP DATABASE IF EXISTS mimic;

创建数据库mimic

1
CREATE DATABASE mimic OWNER postgres;

连接上数据库mimic

1
\c mimic;

输入一个新模式mimiciii到当前数据库中

1
CREATE SCHEMA mimiciii;

添加新模式mimiciii到search_path

1
set search_path to mimiciii;

执行mimiciii建表语句,创建所有数据表

1
2
3
4
5
6
7
8
9
10
11
12
13
14
\i /var/www/mimic/mimic/mimic/postgres_create_tables.sql

# 无效??
# set mimic_data_dir /var/www/mimic/mimic/mimic/mimicd/data/;

\cd /var/www/mimic/mimic/mimic/mimicd/data/;

\i /var/www/mimic/mimic/mimic/postgres_load_data.sql

\i /var/www/mimic/mimic/mimic/postgres_add_indexes.sql

\i /var/www/mimic/mimic/mimic/postgres_checks.sql

## 查询为26行行记录,并且row_count_check全部为PASSED,代表安装成功

CentOS安装PostgreSQL

https://blog.csdn.net/u012190388/article/details/128025382

https://www.yisu.com/ask/99033014.html

Centos下安装postgreSQL

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
# 安装PostgreSQL
sudo yum install postgresql-server

# 初始化数据库
sudo postgresql-setup initdb

# 启动PostgreSQL服务
sudo systemctl start postgresql
sudo systemctl enable postgresql

# 设置数据库密码: 设置数据库用户postgres的密码:
sudo -u postgres psql -c "ALTER USER postgres WITH PASSWORD 'your_password';"

# 重启PostgreSQL服务
sudo systemctl restart postgresql

常用操作命令

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
# 切换到postgres用户
su postgres

# 切换SQL模式
psql

# 修改密码
alter user postgres with password 'postgres123';

# 创建test用户
create user test with password 'test';

# 授权
grant all privileges on database mydb to test;

# 退出
\q
1
2
3
4
5
6
7
8
9
10
11
# 创建数据库mydb
create database mydb;

# 查看所有数据库
\l

# 切换到mydb数据库
\c mydb

# 删除
drop database mydb ;
1
2
3
4
5
# 查看所有表
\d

# 查看表结构
\d tb

数据库备份与还原

实际工作中会对数据库进行备份和还原,备份主要有三种格式

.bak 即压缩的二进制

.sql 即明文存储

.tar 即tarball压缩格式

数据库备份分单数据库备份,使用 pg_dump 命令;所有数据库备份,使用 pg_dumpall 命令。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
# 切换到postgres用户
su postgres

# 单数据库备份-导出到当前目录
pg_dump mydb > mydb.bak

# 所有数据库备份,
pg_dumpall > backup.bak

# 整个数据库备份到指定位置
pg_dump -f /tmp/mydb.bak mydb

# 备份postgres数据库中business_order表
pg_dump -U postgres -f /tmp/mydb.sql -t business_order postgres

# 数据库恢复-直接恢复,注意先新增空数据库
psql -f /tmp/mydb.bak mydb

# 数据库恢复
pg_restore -U postgres -d business_order /temp/mydb.bak

切换模式(schema)

要在 PostgreSQL 中切换模式(schema),您可以使用 SET search_path 命令。模式是 PostgreSQL 数据库中用于组织和分隔对象的命名空间。

以下是如何在 psql 命令行客户端中切换模式的步骤:

  1. 打开 psql 客户端并连接到您的数据库。

  2. 使用以下命令查看当前搜索路径(search path):

1
SHOW search_path;

这将显示当前搜索路径,即数据库在查找对象时搜索的模式列表。

  1. 如果要切换到不同的模式,可以使用 SET search_path 命令。例如,要切换到名为 new_schema 的模式,可以执行:
1
SET search_path TO new_schema;

如果要切换到多个模式,可以将它们以逗号分隔列出。例如:

1
SET search_path TO schema1, schema2, schema3;
  1. 确认您已经成功切换到新的模式。可以再次使用 SHOW search_path; 命令验证。

通过这些步骤,您可以在 PostgreSQL 中轻松切换模式。

  1. 查看 schema
1
2
3
4
5
# 查看所有 schema
select schema_name from information_schema.schemata;

# 查看当前数据库中的 schema
\dn