Chia, a large annotated corpus of clinical trial eligibility criteria-Reference-Cited by-同舟云学术

Chia, a large annotated corpus of clinical trial eligibility criteria

Published:2020-08-27 Issue:1 Volume:7 Page:
ISSN:2052-4463
Container-title:Scientific Data
language:en
Short-container-title:Sci Data

Author:

Kury Fabrício,Butler Alex,Yuan Chi,Fu Li-heng,Sun Yingcheng,Liu Hao,Sim Ida^ORCID,Carini Simona,Weng Chunhua

Abstract

AbstractWe present Chia, a novel, large annotated corpus of patient eligibility criteria extracted from 1,000 interventional, Phase IV clinical trials registered in ClinicalTrials.gov. This dataset includes 12,409 annotated eligibility criteria, represented by 41,487 distinctive entities of 15 entity types and 25,017 relationships of 12 relationship types. Each criterion is represented as a directed acyclic graph, which can be easily transformed into Boolean logic to form a database query. Chia can serve as a shared benchmark to develop and test future machine learning, rule-based, or hybrid methods for information extraction from free-text clinical trial eligibility criteria.

Publisher

Springer Science and Business Media LLC

Subject

Library and Information Sciences,Statistics, Probability and Uncertainty,Computer Science Applications,Education,Information Systems,Statistics and Probability

Link

https://www.nature.com/articles/s41597-020-00620-0.pdf

Reference37 articles.

1. Weng, C. Optimizing Clinical Research Participant Selection with Informatics. Trends in pharmacological sciences 36, 706–709, https://doi.org/10.1016/j.tips.2015.08.007 (2015).

2. Banda, J. M., Seneviratne, M., Hernandez-Boussard, T. & Shah, N. H. Advances in Electronic Phenotyping: From Rule-Based Definitions to Machine Learning Models. Annual review of biomedical data science 1, 53–68, https://doi.org/10.1146/annurev-biodatasci-080917-013315 (2018).

3. Sen, A. et al. Correlating eligibility criteria generalizability and adverse events using Big Data for patients and clinical trials. Ann N Y Acad Sci 1387, 34–43, https://doi.org/10.1111/nyas.13195 (2017).

4. Murthy, V. H., Krumholz, H. M. & Gross, C. P. Participation in cancer clinical trials: race-, sex-, and age-based disparities. Jama 291, 2720–2726, https://doi.org/10.1001/jama.291.22.2720 (2004).

5. Chondrogiannis, E. et al. A novel semantic representation for eligibility criteria in clinical trials. Journal of biomedical informatics 69, 10–23, https://doi.org/10.1016/j.jbi.2017.03.013 (2017).

Cited by 24 articles. 订阅此论文施引文献订阅此论文施引文献，注册后可以免费订阅5篇论文的施引文献，订阅后可以查看论文全部施引文献

1. Machine learning and natural language processing in clinical trial eligibility criteria parsing: a scoping review;Drug Discovery Today;2024-10

2. From Web to RheumaLpack: Creating a Linguistic Corpus for Exploitation and Knowledge Discovery in Rheumatology;Computers in Biology and Medicine;2024-09

3. Pre-trained language models in medicine: A survey;Artificial Intelligence in Medicine;2024-08

4. Optimizing Clinical Trial Eligibility Design Using Natural Language Processing Models and Real-World Data: Algorithm Development and Validation;JMIR AI;2024-07-29

5. From Web to RheumaLpack: Creating a Linguistic Corpus for Exploitation and Knowledge Discovery in Rheumatology;2024-04-27