Scalatura del lessico

Base imprescindibile per una corretta analisi (sintattica e semantica) è il riconoscimento delle singole parole in un testo.
Si identificano quattro fasi:

  1. Riduzione a token : distinzione tra parola e punteggiatura
  2. Analisi morfologica : distinzione in una parola di eventuali prefissi, suffissi e radici.
  3. ® flessionale: individua variazioni alla parola affinché possa stare in un contesto (sing./plur. , m/f)

    ® derivazionale : deriva una nuova parola da una parola di categoria diversa (bello, bellezza)

    ® composizionale : unione di due parole in una
     

  4. Ricerca nel dizionario : si ricerca una parola nel dizionario da cui posso estrarre la/le definizione/i per costruire l'interpretazione semantica. Serve inoltre per identificare le categorie dei simboli terminali di un'analisi sintattica.
  5. Recupero da errore : si intraprende quando una parola non viene trovata nel dizionario.
® tento di indovinare la classe sintattica di una parola con una analisi morfologica

® se la prima lettera è maiuscola allora probabilmente sono di fronte ad un nome proprio

® altri schemi fissi sono riservati a date, codici fiscali ….

® posso avviare programmi di correzione ortografica per ricondurmi a parole esistenti nel dizionario

Un dizionario completo e accurato è quindi fondamentale per una accurata analisi.
Torna a Analisi semantica