Die Healthcare Natural Language API ist Teil der Cloud Healthcare API, die Natural Language-Modelle verwendet, um medizinische Informationen aus medizinischem Text zu extrahieren.
In diesem konzeptionellen Leitfaden werden die Grundlagen der Verwendung der Healthcare Natural Language API erläutert. Dazu gehören:
- Die Anfragentypen, die Sie an die Healthcare Natural Language API senden können
- Wie Sie Anfragen an die Healthcare Natural Language API erstellen
- Wie Sie Antworten der Healthcare Natural Language API verwenden
Übersicht
Die Healthcare Natural Language API extrahiert medizinische Informationen aus medizinischen Texten. Dazu gehören:
- Medizinische Konzepte wie Medikamente, Verfahren und Erkrankungen
- Funktionale Merkmale wie Zeitbeziehungen, Subjekte und Sicherheitsprüfungen
- Zusammenhänge wie Nebenwirkungen und Dosierung von Medikamenten
Zwischen der Healthcare Natural Language API und AutoML Entity Extraction for Healthcare wählen
Die Healthcare Natural Language API bietet vortrainierte Natural Language-Modelle, um medizinische Konzepte und Zusammenhänge aus medizinischen Texten zu extrahieren. Die Healthcare Natural Language API ordnet Text verschiedenen vordefinierten medizinischen Wissenskategorien zu.
Mit AutoML Entity Extraction for Healthcare können Sie ein benutzerdefiniertes Modell zur Entitätsextraktion erstellen, das mit Ihren eigenen annotierten medizinischen Texten und Ihren eigenen Kategorien trainiert wurde. Weitere Informationen finden Sie in der AutoML Entity Extraction for Healthcare-Dokumentation.
Verfügbare Standorte
Die Healthcare Natural Language API ist in den folgenden Ländern verfügbar:
Standortname | Standortbeschreibung |
---|---|
asia-south1 |
Mumbai, Indien |
australia-southeast1 |
Sydney, Australien |
europe-west2 |
London, Großbritannien |
europe-west4 |
Niederlande |
northamerica-northeast1 |
Montreal, Kanada |
us-central1 |
Iowa, USA |
Merkmale der Healthcare Natural Language API
Die Healthcare Natural Language API untersucht medizinische Texte auf medizinische Konzepte und Beziehungen. Sie führen eine Entitätsanalyse mit der Methode analyzeEntities
durch.
Anfragen für die Entitätsanalyse
Die Healthcare Natural Language API ist eine REST API und besteht aus JSON-Anfragen und -Antworten. In den folgenden Abschnitten wird beschrieben, wie Sie verschiedene medizinische Informationen aus einem bestimmten medizinischen Text extrahieren:
- Entitäten, Beziehungen und Kontextattribute extrahieren
- Lizenzierte Wortlisten einschließen
- Ausgabe als FHIR R4-Bundle extrahieren
Die Anfrage für die Entitätsanalyse enthält die folgenden Felder:
documentContent
: Die Daten für die Anfrage, die aus medizinischen Texten bestehen. Die maximale Größe des medizinischen Textes beträgt 20.000 Unicode-Zeichen.licensedVocabularies[]
: Optional. Das Vokabular SNOMED CT Nur für Nutzer in den USA verfügbar.alternativeOutputFormat
: Optional. Das FHIR-Bundle-Format.
Antwortfelder der Entitätsanalyse
Die Entitätsanalyse gibt eine Reihe von erkannten Erwähnungen von medizinischem Wissen, medizinischen Konzepten und Zusammenhängen zwischen Erwähnungen von medizinischem Wissen zurück, darunter:
entityMentions
: Vorkommen von medizinischen Wissensentitäten im medizinischen Quelltext. Jede Entitätserwähnung hat die folgenden Felder:mentionId
: Eine eindeutige Kennung für eine Entität, die in der Antwort erwähnt wird.type
: die medizinische Wissenskategorie der Entitätserwähnung.text
: besteht aus dem FeldtextContent
und beschreibt den Auszug aus dem medizinischen Text, der die Entitätserwähnung enthält, undoffset
, den Standort der Entitätserwähnung im medizinischen Quelltext.temporalAssessment
gibt an, wie sich die verknüpfte Entität auf die Entitätserwähnung bezieht, entwederCURRENT
,CLINICAL_HISTORY
,FAMILY_HISTORY
,UPCOMING
oderOTHER
.certaintyAssessment
: Negation oder Qualifikation des medizinischen Konzepts, entwederLIKELY
,SOMEWHAT_LIKELY
,UNCERTAIN
,SOMEWHAT_UNLIKELY
,UNLIKELY
oderCONDITIONAL
.subject
gibt das Thema an, auf das sich das medizinische Konzept bezieht, entwederPATIENT
,FAMILY_MEMBER
oderOTHER
.linkedEntities
: Eine Liste medizinischer Konzepte, die mit dieser Entitätserwähnung in Beziehung stehen könnten. Verknüpfte Entitäten geben dieentityId
an, die ein medizinisches Konzept mit einer Entität inentities
verknüpft.
entities
: beschreibt die medizinischen Konzepte der verknüpften Entitätsfelder. Jede Entität wird mithilfe der folgenden Felder beschrieben:entityId
: Eine eindeutige Kennung aus dem FeldlinkedEntities
.preferredTerm
: Der bevorzugte Begriff für das medizinische Konzept.vocabularyCodes
: die Darstellung des medizinischen Konzepts in unterstützten medizinischen Vokabularen.
relationships
: definiert gerichtete Beziehungen zwischen Entitätserwähnungen. Im Beispiel ist das Subjekt der Beziehung „Insulin regimen human“ und das Objekt der Beziehung ist „5 units“.confidence
: gibt die Zuverlässigkeit des Modells in der Beziehung als Zahl zwischen 0 und 1 an.
Neben den aufgeführten Feldern kann die Antwort auch das Feld additionalInfo
enthalten, das eine zusätzliche Beschreibung des Typs der Entitätserwähnung enthält.
Weitere Informationen finden Sie unter Zusätzliche Informationen.
Unterstützte Sprachen
Die Healthcare Natural Language API unterstützt ausschließlich das Extrahieren von Gesundheitsdaten aus englischem Text.
Unterstütztes medizinisches Vokabular
Die Healthcare Natural Language API unterstützt das folgende medizinische Vokabular:
- Foundational Model of Anatomy
- Gene Ontology
- HUGO Gene Nomenclature Committee
- Human Phenotype Ontology
- ICD-10 Procedure Coding System
- ICD-10-CM
- ICD-9-CM
- LOINC
- MeSH
- MedlinePlus-Gesundheitsthemen
- Metathesaurus Names
- NCBI Taxonomy
- NCI Thesaurus
- National Drug File
- Online Mendelian Inheritance in Man
- RXNORM
- SNOMED CT (nur für Nutzer in den USA verfügbar)
Unterstützte medizinische Wissenskategorien
Die Healthcare Natural Language API weist dem Feld entityMentions.type
eine medizinische Wissenskategorie zu.
Im Folgenden finden Sie eine Liste der unterstützten medizinischen Wissenskategorien. Die Typen von Entitätserwähnungen, die zu den Gruppen „Onkologie“, „Soziale Determinanten der Gesundheit“ und „Geschützte Gesundheitsdaten“ gehören, sind nur in der Vorabversion verfügbar:
Gruppe | Medizinische Wissenskategorie | Beschreibung |
---|---|---|
Allgemein | ANATOMICAL_STRUCTURE
|
Ein komplexer Teil des menschlichen Körpers, z. B. Zellen, Organe und Systeme. |
BODY_FUNCTION
|
Eine vom menschlichen Körper ausgeführte Funktion. | |
BF_RESULT
|
Das Ergebnis einer Körperfunktion. | |
BODY_MEASUREMENT
|
Eine normale Messung des menschlichen Körpers, z. B. von Vitalzeichen, die ohne komplexe Tests oder Verfahren mit einfachen Instrumenten wie einem Thermometer oder Stethoskop durchgeführt wird. | |
BM_RESULT
|
Das Ergebnis einer Körpermessung. | |
BM_UNIT
|
Die Maßeinheit für eine Körpermessung. | |
BM_VALUE
|
Der Wert einer Körpermessung. | |
LABORATORY_DATA
|
Die Ergebnisse eines Tests einer Körperprobe. | |
LAB_RESULT
|
Eine qualitative Beschreibung von Labordaten, z. B. „erhöht“, „niedrig“, „positiv“ oder „negativ“. | |
LAB_VALUE
|
Der Wert einer Instanz der Labordaten. | |
LAB_UNIT
|
Die Maßeinheit für den Laborwert. | |
MEDICAL_DEVICE
|
Ein physisches oder virtuelles Instrument. | |
MEDICINE
|
Ein Medikament oder eine andere Zubereitung zur Behandlung oder Vorbeugung einer Krankheit. | |
MED_DOSE
|
Eine Dosis eines Medikaments. | |
MED_DURATION
|
Die Zeitspanne, in der ein Medikament verabreicht wird. | |
MED_FORM
|
Die physikalischen Eigenschaften eines bestimmten Arzneimittels. | |
MED_FREQUENCY
|
Die Häufigkeit, mit der ein Medikament eingenommen wird. | |
MED_ROUTE
|
Ein Ort im Körper, an dem ein Medikament verabreicht wird. | |
MED_STATUS
|
Der Status eines vorhandenen Medikaments, z. B. „Fortfahren“, „Starten“, „Neustarten“, „Beenden“, „Wechseln“, „Erhöhen“ und „Reduzieren“. | |
MED_STRENGTH
|
Die Menge des Wirkstoffs in einer Dosis eines Medikaments. | |
MED_UNIT
|
Die Maßeinheit für den Wirkstoff in einem Medikament. | |
MED_TOTALDOSE
|
Die Menge der Medikamente, die auf einmal eingenommen werden soll. | |
PROBLEM
|
Eine Erkrankung, darunter Befunde und Krankheiten. | |
PROCEDURE
|
Diagnose- oder Behandlungsmethoden | |
PROCEDURE_RESULT
|
Die Ergebnisse eines Verfahrens. | |
PROC_METHOD
|
Die Methode, mit der ein Verfahren durchgeführt wird. | |
SEVERITY
|
Schweregrad der Erkrankung | |
SUBSTANCE_ABUSE
|
Eine Beschreibung des Missbrauchs einer psychoaktiven Substanz. | |
Onkologie (Vorabversion) | CLINICAL_STATUS
|
Der Status eines Krebsfalls, z. B. „aktiv“, „wiederkehrend“, „rückfällig“ und „behoben“. |
DATE
|
Eine Datumsanmerkung, z. B. das Datum der Diagnose, das Datum des Eingriffs oder das Datum einer Strahlentherapie. Es werden alle Elemente eines Datums extrahiert, möglicherweise jedoch nicht das Jahr. | |
DIMENSIONS
|
Die Maße eines Tumors, einer Masse oder eines abnormalen Wachstums. | |
GENE_STUDIED
|
Die untersuchten Gene, die direkt oder indirekt zur Tumorbildung führen, z. B. BRCA1, p53 und ALK. | |
HISTOLOGICAL_GRADE
|
Ein Klassifizierungssystem zur Einstufung des Erscheinungsbildes einer Krebszelle. | |
LAB_SPECIMEN
|
Biologisches Material, das für Tests oder Proben aus dem Körper entnommen wird. | |
RADIATION_DOSAGE
|
Die Strahlungsdosis, die ein Patient erhält. | |
ONSET
|
Eine Datumsanmerkung, die das Datum angibt, an dem ein Patient zum ersten Mal Krebssymptome bemerkt hat. | |
VARIATION_CODE
|
Ein Code, der der spezifischen genomischen Variante zugewiesen wird, die in einem wichtigen Codierungssystem wie ClinVar und HGVS erkannt wird. | |
Soziale Determinanten von Gesundheit (SDoH) (Vorabversion) | AGE
|
Eine Alterskennzeichnung. Dazu gehören auch Begriffe, die das Alter beschreiben, z. B. „sieht jünger aus als angegeben“, „im mittleren Alter“, „78 Jahre alt“ oder „Teenager“.
Hinweis: Gemäß HIPAA wird das Alter einer Person nur dann als PHI eingestuft, wenn sie älter als 90 Jahre ist. Weitere Informationen finden Sie unter Zusammenfassung der HIPAA-Datenschutzregeln. |
FAMILY
|
Formulierungen, die die Familienstruktur oder Verwandten des Patienten beschreiben, z. B. „verheiratet, zwei Kinder“, „Bruder“, „Frau“, „unterstützende Eltern“ oder „geschieden“. | |
LIVING_SITUATION
|
Formulierungen, die die Wohnsituation des Patienten beschreiben, z. B. „mit Mitbewohnern“, „hat eine rund um die Uhr verfügbare Pflegekraft“ oder „ist vor Kurzem umgezogen“. | |
SOCIAL_IDENTITY
|
Formulierungen, die die soziale Identität des Patienten oder der Familie beschreiben, einschließlich ethnischer Zugehörigkeit, sexueller Orientierung, Religion, Nationalität, gesprochener oder nicht gesprochener Sprachen oder Herkunftslandes. | |
PHYSICAL_APPEARANCE
|
Formulierungen, die die auffälligste oder offensichtlichste körperliche Eigenschaft des Patienten oder der Familie beschreiben, z. B. „Narbe auf der rechten Wange“, „Down-Syndrom“, „fettleibig“ oder „linkes Bein amputiert“. | |
OCCUPATION
|
Wortgruppen, die den Beruf und den Beschäftigungsstatus des Patienten oder der Familie beschreiben, z. B. „Rentnerin“, „20 Jahre als Schweißer gearbeitet“ oder „Letztes Jahr arbeitslos geworden“. | |
Geschützte Gesundheitsdaten (Protected Health Information, PHI) (Vorabversion) | PERSON_NAME
|
Eine generische Namens-ID für eine Person. Enthält Titel wie „Dr.“ „Frau“ oder „Dr.“ |
ORGANIZATION_NAME
|
Eine Kennung für eine medizinische Organisation, die PHI erhebt, z. B. eine Klinik, ein Pflegeheim oder ein Krankenhaus. | |
GENERIC_ID
|
Eine generische ID, die Krankenakten, Patienten, Ärzte und Krankenhäuser identifiziert, z. B. die Sozialversicherungsnummer des Patienten oder die Nummer eines Anbieters. | |
LOCATION
|
Ein geografischer Ort, der Namen und Zahlen für Gebäude, Straßen, Städte, Bundesländer oder Postleitzahlen enthalten kann. | |
PHONE_NUMBER
|
Eine Zahl, die eine Telefonnummer, Faxnummer oder Pagernummer angibt. | |
EMAIL_ADDRESS
|
Eine E-Mail-Adresse. | |
URL
|
Die Adresse einer Website. | |
ZIPCODE
|
Eine Postleitzahl. |
Unterstützte funktionale Funktionskategorien
Die Healthcare Natural Language API kann funktionale Funktionen oder Attribute einer Entität aus Kontext ableiten. In der Anweisung "Kusumas Mutter hat Diabetes" hat die Bedingung "Diabetes" beispielsweise die funktionale Funktion subject
FAMILY_MEMBER
.
Temporäre Beziehungen
Temporäre Beziehungen, die im Feld temporalAssessment
zurückgegeben werden, beschreiben, wie diese erwähnte Entität zum Subjekt temporär in Beziehung steht.
Die Healthcare Natural Language API unterstützt die folgenden temporären Beziehungen:
CURRENT
CLINICAL_HISTORY
FAMILY_HISTORY
UPCOMING
OTHER
Betreffzeilen
Betreffzeilen, die im Feld subject
zurückgegeben werden, beschreiben die Person, auf die sich die Entität bezieht.
Die Healthcare Natural Language API unterstützt die folgenden Subjekte:
PATIENT
FAMILY_MEMBER
OTHER
Wahrscheinlichkeitsbewertungen
Wahrscheinlichkeitsbewertungen, die im Feld certaintyAssessment
zurückgegeben werden, beschreiben die Vertrauenswürdigkeit des Erstellers der Originalnotiz. Wenn die Originalnotiz beispielsweise "Der Patienten hat Halsschmerzen" enthält, gibt die Bewertung einen LIKELY
-Wert zurück, der angibt, dass der Notizenersteller es für wahrscheinlich hält, dass der Patient Halsschmerzen hatte. Wenn die Originalnotiz "Der Patienten hat keine Halsschmerzen" enthält, gibt die Bewertung einen UNLIKELY
-Wert zurück, der angibt, dass der Notizenersteller es für unwahrscheinlich hält, dass der Patient Halsschmerzen hatte.
Wahrscheinlichkeitsbewertungen können folgende Werte sein:
LIKELY
SOMEWHAT_LIKELY
UNCERTAIN
SOMEWHAT_UNLIKELY
UNLIKELY
CONDITIONAL
Weitere Informationen
Das Feld additionalInfo
enthält zusätzliche Details zu einer Entitätserwähnung. Das Feld additionalInfo
für eine DATE
-Entitätserwähnung kann beispielsweise Details zum Datumstyp enthalten, der in eine der folgenden Kategorien fällt:
ADMISSION_DATE
CONSULTATION_DATE
DISCHARGE_DATE
SERVICE_DATE
VISIT_DATE
DIAGNOSIS_DATE
MED_STARTED_DATE
MED_ENDED_DATE
NOTE_DATE
PROCEDURE_DATE
RADIATION_STARTED_DATE
RADIATION_ENDED_DATE
STAGE_DATE
Unterstützte Beziehungen zwischen Entitätserwähnungen
Die Healthcare Natural Language API kann Beziehungen zwischen Entitätserwähnungen basierend auf dem umgebenden medizinischen Text ableiten. In der Antwort wird das Subjekt der Beziehung durch subjectId
und das Objekt der Beziehung durch objectId
angegeben.
Die Healthcare Natural Language API unterstützt die folgenden Beziehungen zwischen Entitätserwähnungen:
Betreff | Object |
---|---|
ANATOMICAL_STRUCTURE |
MEDICAL_DEVICE |
BODY_FUNCTION |
BF_RESULT |
BODY_MEASUREMENT |
BM_RESULT |
BODY_MEASUREMENT |
BM_UNIT |
BODY_MEASUREMENT |
BM_VALUE |
LABORATORY_DATA |
LAB_RESULT |
LABORATORY_DATA |
LAB_UNIT |
LABORATORY_DATA |
LAB_VALUE |
MEDICINE |
MED_DOSE |
MEDICINE |
MED_DURATION |
MEDICINE |
MED_FORM |
MEDICINE |
MED_FREQUENCY |
MEDICINE |
MED_ROUTE |
MEDICINE |
MED_STATUS |
MEDICINE |
MED_STRENGTH |
MEDICINE |
MED_TOTALDOSE |
MEDICINE |
MED_UNIT |
PROBLEM |
ANATOMICAL_STRUCTURE |
PROBLEM |
MEDICINE |
PROBLEM |
PROCEDURE |
PROBLEM |
SEVERITY |
PROCEDURE |
ANATOMICAL_STRUCTURE |
PROCEDURE |
PROC_METHOD |
PROCEDURE |
PROCEDURE_RESULT |
SUBSTANCE_ABUSE |
SEVERITY |
Healthcare Natural Language API-Ausgabe als FHIR-Bundle
Wenn Sie die analyzeEntities
-Methode anfordern und das Feld alternativeOutputFormat
auf FHIR_BUNDLE
festgelegt ist, enthält die Antwort die folgenden JSON-Objekte:
- Entitätserwähnungen, Entitäten und Beziehungen
- Ein FHIR R4-Bundle, das als String dargestellt wird und alle Entitäten, Entitätserwähnungen und Beziehungen im JSON-Format enthält
Um das FHIR R4-Bundle zu erstellen, werden die Entitätserwähnungen, Entitäten und Beziehungen von der Healthcare Natural Language API FHIR-Ressourcen und ihren Elementen zugeordnet. In der folgenden Tabelle sind einige dieser Zuordnungen aufgeführt.
Entitätserwähnungen in der Healthcare Natural Language API | Medizinische Wissenskategorie | FHIR-R4-Ressourcen und -Elemente |
---|---|---|
PROBLEM |
Condition |
|
PROBLEM |
Condition.category |
|
PROBLEM |
Condition.status |
|
PROBLEM |
ANATOMICAL_STRUCTURE |
Condition.bodySite |
PROBLEM |
ANATOMICAL_STRUCTURE |
Condition.evidence |
PROBLEM |
SEVERITY |
Condition.severity |
PROCEDURE |
Procedure |
|
PROCEDURE |
Procedure.status |
|
PROCEDURE |
Procedure.code |
|
PROCEDURE |
ANATOMICAL_STRUCTURE |
Procedure.bodySite |
PROCEDURE |
MEDICAL_DEVICE |
Procedure.usedCode |
PROCEDURE |
PROBLEM |
Procedure.reasonReference |
MEDICINE |
MedicationStatement |
|
MEDICINE |
MedicationStatement.status |
|
MEDICINE |
MedicationStatement.medication |
|
MEDICINE |
PROBLEM |
MedicationStatement.reasonReference |
MEDICINE |
MED_DOSE |
MedicationStatement.dosage.doseAndRate.doseQuantity |
MEDICINE |
MED_FREQUENCY |
MedicationStatement.dosage.text |
MEDICINE |
MED_ROUTE |
MedicationStatement.dosage.route |
MEDICINE |
MED_STRENGTH |
MedicationStatement.dosage.doseAndRate.doseQuantity |
MEDICINE |
MED_UNIT |
MedicationStatement.dosage.doseAndRate.doseQuantity |
Informationen zum Extrahieren von Entitäten aus Text als FHIR R4-Bundle finden Sie unter Ausgabe als FHIR R4-Bundle extrahieren.