Ukrainian
Albanian
Arabic
Armenian
Azerbaijani
Belarusian
Bengali
Bosnian
Catalan
Czech
Danish
Deutsch
Dutch
English
Estonian
Finnish
Français
Greek
Haitian Creole
Hebrew
Hindi
Hungarian
Icelandic
Indonesian
Irish
Italian
Japanese
Korean
Latvian
Lithuanian
Macedonian
Mongolian
Norwegian
Persian
Polish
Portuguese
Romanian
Russian
Serbian
Slovak
Slovenian
Spanish
Swahili
Swedish
Turkish
Ukrainian
Vietnamese
Български
中文(简体)
中文(繁體)
Journal of Biomedical Informatics 2017-May

Towards generalizable entity-centric clinical coreference resolution.

Тільки зареєстровані користувачі можуть перекладати статті
Увійти Зареєструватися
Посилання зберігається в буфері обміну
Timothy Miller
Dmitriy Dligach
Steven Bethard
Chen Lin
Guergana Savova

Ключові слова

Анотація

This work investigates the problem of clinical coreference resolution in a model that explicitly tracks entities, and aims to measure the performance of that model in both traditional in-domain train/test splits and cross-domain experiments that measure the generalizability of learned models.

The two methods we compare are a baseline mention-pair coreference system that operates over pairs of mentions with best-first conflict resolution and a mention-synchronous system that incrementally builds coreference chains. We develop new features that incorporate distributional semantics, discourse features, and entity attributes. We use two new coreference datasets with similar annotation guidelines - the THYME colon cancer dataset and the DeepPhe breast cancer dataset.

The mention-synchronous system performs similarly on in-domain data but performs much better on new data. Part of speech tag features prove superior in feature generalizability experiments over other word representations. Our methods show generalization improvement but there is still a performance gap when testing in new domains.

Generalizability of clinical NLP systems is important and under-studied, so future work should attempt to perform cross-domain and cross-institution evaluations and explicitly develop features and training regimens that favor generalizability. A performance-optimized version of the mention-synchronous system will be included in the open source Apache cTAKES software.

Приєднуйтесь до нашої
сторінки у Facebook

Найповніша база даних про лікарські трави, підкріплена наукою

  • Працює 55 мовами
  • Лікування травами за підтримки науки
  • Розпізнавання трав за зображенням
  • Інтерактивна GPS-карта - позначайте трави на місці (скоро)
  • Читайте наукові публікації, пов’язані з вашим пошуком
  • Шукайте лікарські трави за їх впливом
  • Організуйте свої інтереси та будьте в курсі новинних досліджень, клінічних випробувань та патентів

Введіть симптом або хворобу та прочитайте про трави, які можуть допомогти, наберіть траву та ознайомтесь із захворюваннями та симптомами, проти яких вона застосовується.
* Вся інформація базується на опублікованих наукових дослідженнях

Google Play badgeApp Store badge