Skip to main content

Label your data

In your project, there are five documents, four of the documents have a green dot to indicate the documents have been analyzed and labeled. The fifth document needs to be analyzed and labeled.

Video introduction to labeling forms with Form Recognizer

Watch this YouTube to understand how to label an English language version of a form. Open the video on Youtube to watch in full screen.

Label the new patient registration form

The following steps will show you how to label your data.

  1. Select the document named sample.pdf.

  2. Select Run layout the document will analyze and then open the document for labeling.

  3. Select the ISO language code for the document. You'll find this field in the top right-hand corner of the document, then from the list of labels, select iso.

  4. Now repeat this labeling process for all the fields in the document. See the tables below for the list of form fields and their associated labels for:

note

You can filter the list of labels by typing the label name in the list of labels dropdown. For example, if you type family in the list of labels, the family_name label will be displayed.

English Labels

This image is the english registration form

  1. Select the Family name field on the analyzed document, then from the list of labels, select family_name.

  2. Repeat this process for the remaining fields in the document. It's important to correctly label all the fields in the document as they will be used to train the model.

    Document elementLabel name
    Document language isoiso
    Family namefamily_name
    Given namesgiven_names
    Date of birthdate_of_birth
    Street addressaddress_street
    Cityaddress_city
    Stateaddress_state
    Codeaddress_code
    Emailemail
    Phonephone
    Prefer Email checkboxprefer_email
    Prefer Phone checkboxprefer_phone
    Prefer Text checkboxprefer_text
    My gender identitygender_identity
    My pronounsmy_pronouns
    Emergency contact nameemergency_name
    Emergency contact relationshipemergency_relationship
    Emergency contact emailemergency_email
    Emergency contact phoneemergency_phone
    Allergy row 1allergy_1
    Allergy row 2allergy_2
    Allergy row 3allergy_3
    Reaction row 1reaction_1
    Reaction row 2reaction_2
    Reaction row 3reaction_3
    datedate

You now have all the documents in your dataset labeled. If you look at the storage account, you'll find a .labels.json and .ocr.json files that correspond to each document in your training dataset and a new fields.json file. This training dataset will be submitted to train the model.

Etiquetas Españolas

This image is the spanish registration form

  1. Seleccione el campo Nombre Completo en el documento analizado, luego de la lista de etiquetas, seleccione nombre_completo.

  2. Repita este proceso para los campos restantes del documento. Es muy importante etiquetar correctamente todos los campos del documento, ya que se utilizarán para entrenar el modelo.

    Elemento de documentoNombre de etiqueta
    Idioma del documento isoiso
    Nombrefamily_name
    Apellidogiven_names
    Fecha de nacimientodate_of_birth
    Direcciónaddress_street
    Ciudadaddress_city
    Estadoaddress_state
    Códigoaddress_code
    Correo electrónicoemail
    Teléfonophone
    Método de contacto preferido: Correo electrónicoprefer_email
    Método de contacto preferido: teléfonoprefer_phone
    Método de contacto preferido: Mensaje de textoprefer_text
    Mi identidad de género esgender_identity
    Mis pronombres sonmy_pronouns
    Contacto de emergencia: Nombreemergency_name
    Contacto de emergencia: Grado de parentescoemergency_relationship
    Contacto de emergencia: Correo electrónicoemergency_email
    Contacto de emergencia: Teléfonoemergency_phone
    Alergia fila 1allergy_1
    Alergia fila 2allergy_2
    Alergia fila 3allergy_3
    Fila de reacción 1reaction_1
    Fila de reacción 2reaction_2
    Fila de reacción 3reaction_3
    Fechadate

Ahora tiene todos los documentos en su conjunto de datos etiquetados. Si observa la cuenta de almacenamiento, encontrará archivos .labels.json y .ocr.json que corresponden a cada documento en su conjunto de datos de entrenamiento y un nuevo archivo fields.json. Este conjunto de datos de entrenamiento se enviará para entrenar el modelo.

Etiquetas Portuguêsas

This image is the portuguese registration form

  1. Selecione o campo Nome Completo no documento analisado e, na lista de rótulos, selecione nome_completo.

  2. Repita este processo para os demais campos do documento. É importante rotular corretamente todos os campos no documento, pois eles serão usados para treinar o modelo.

    Elemento do documentoNome do rótulo
    Idioma do documento isoiso
    Nomefamily_name
    Sobrenomegiven_names
    Data de nascimentodate_of_birth
    Endereçoaddress_street
    Cidadeaddress_city
    Estadaaddress_state
    Códigoaddress_code
    E-mailemail
    TelefonePhone
    E-mail de preferência checkboxprefer_email
    Telefone de preferência checkboxprefer_phone
    Texto de preferência checkboxprefer_text
    Me identifico como (gênero)gender_identity
    Meus pronomes são:my_pronouns
    Contato de emergência: Nomeemergency_name
    Contato de emergência: Grau de Parentescoemergency_relationship
    Contato de emergência: E-mailemergency_email
    Contato de emergência: Telefoneemergency_phone
    Alergia linha 1allergy_1
    Alergia linha 2allergy_2
    Alergia linha 3allergy_3
    Linha de reação 1reaction_1
    Linha de reação 2reaction_2
    Linha de reação 3reaction_3
    DataDate

Agora você tem todos os documentos em seu conjunto de dados rotulados. Se você observar a conta de armazenamento, encontrará arquivos .labels.json e .ocr.json que correspondem a cada documento em seu conjunto de dados de treinamento e um novo arquivo fields.json. Este conjunto de dados de treinamento será enviado para treinar o modelo