PS LENGUAJE
TEMA 6 (CAP 9)/1
TEMA 6 (CAP 9)
COMPRENSIÓN DEL HABLA
PERCEPCIÓN DEL HABLA: como identificamos y percibimos los sonidos del lenguaje DISTINCIÓN
RECONOCIMIENTO DE LAS PALABRAS: proceso de nivel superior consistente en reconocer las palabras que conforman los sonidos RECONOCIMIENTO DEL HABLA
¿Por qué es tan difícil la percepción del habla?
Representaciones para acceder al lexicón (diccionario mental)
- Código preléxico: representación del sonido utilizada antes de la identificación de la palabra - Código posléxico: información que solo está disponible tras el léxico ► Tarea importante para la comprensión del habla → especificar la naturaleza del código preléxico
Percepción de la palabra hablada Diferencias Percepción de la palabra escrita
Se presenta únicamente de forma muy breve Solo tiene una oportunidad de reconocerla No segmentación fácil de palabra a sonido La palabra escrita está ahí durante todo el tiempo que uno quiera para analizarla Se puede volver atrás y comprobar una palabra presentada visualmente tantas veces como se quiera Segmentación fácil palabras en letras
Proceso automático: cuando se oye hablar no se puede obligar a no comprender Se produce sin esfuerzo (la mayor parte del tiempo) Es rápido Reconocimiento del habla
Comprender: 20 fonemas por segundo a veces más Identificar palabra en contexto: desde 200 ms. después del comienzo
► Ventaja en el reconocimiento del habla en contexto y con sonidos que no son habla
Los sonidos del habla parecen tener ventaja sobre los sonidos que no son habla cuando se oyen con sonido circundante - Cuanto + palabras hay para elegir en un conjunto predeterminado mayor tenía que ser la señal sobre el ruido para que la identificaran bien - Con ruido de fondo, las palabras en un contexto significativo se reconocen mejor que las palabras fuera de contexto
PS LENGUAJE
TEMA 6 (CAP 9)/2
Se produce debido a que los detalles de la realización de un fonema varían en función del contexto de sus fonemas circundantes - adoptan parte de las propiedades acústicas de sus vecinos → Asimilación - al producir un sonido, el aparato vocal se acaba de mover a la posición necesaria para hacer otro sonido y se está preparando para Se producen cambiar de posición. Ventajas para el habla: se puede producir + deprisa de lo que se produciría si hubiera que articular cada fonema de forma clara y x separado efectos de Ventajas para el que escucha: Se puede repartir la información sobre la identidad de los segmentos fonéticos entre varios segmentos acúst coarticulación
Invarianza Acústica
No resulta fácil separar los sonidos del habla, puesto que se producen juntos Restricción de la Preferimos segmentar el habla de forma que cada palabra posible segmento corresponda a una posible palabra
Segmentación
Estrategias
¿Cómo segmentamos el habla?
Variabilidad acústica
Propiedades acústicas de los fonemas no son fijas (varían con el contexto e incluso en función del ritmo del habla) → Identificación de los fonemas tarea compleja MILLER y Relación Compleja entre la señal acústica fija y los sonidos que transmite la señal Complejida Problema de la invarianza el mismo fonema puede tener un sonido distinto en función del contexto en que se produce JUSCZYK d debida a Problema de la segmentación: Los sonidos se producen conjuntamente y no se pueden separar fácilmente (1989)
Estrategia de segmentación métrica
Percepción Categórica
Segmentación en personas bilingües
Cualquier segmentación que dé lugar a una palabra imposible (como consonantes separadas) será rechazada
Exposición a determinado idioma - Silabas fuertes: van acentuadas y nunca se acortan a sonidos de vocales neutras sin acentuar - Sílabas débiles: no están acentuadas y suelen acortarse a sonidos de vocales neutras sin acentuar Segmentación en función de la acentuación: Los oyentes segmentan el habla identificando las sílabas acentuadas (inglés) Segmentación en función de las sílabas: se basa en detectar las sílabas (francés: sílabas muy claras y poco ambiguas) Estrategia determinada por el idioma dominante → como si la estrategia quedara prefijada a una edad temprana → todas las personas bilingües son monolingües desde el punto de vista de la segmentación (son capaces de descartar procesos de segmentación ineficaces y utilizan otros procesos analíticos más generales)
Se perciben las cosas que se encuentran a lo largo de un continuo como pertenecientes a una categoría distintiva u otra LIBERMAN et al. (1957) Utilizaron sintetizador crear un continuo de sílabas artificiales que diferían en su lugar de articulación de palabras Colocaban estas sílabas en 3 categorías bastante distintas, /b/, /d/ y /g/. tiempo que tarda la vibración de las cuerdas vocales cuando se Consonantes sonoras ( /b/ y /d/), el retardo es 0 Tiempo de comienzo de cierra el tracto vocal, Consonantes sordas (como /p/ y /t/) es de 60 ms Los pares con 1 consonante sonora y otra sorda sólo difieren en esta característica la voz (VOT) Aunque se pueden crear sonidos con características intermedias entre ellas, como un VOT de 30 ms, la percepción sigue siendo categórica Técnica de la adaptación selectiva Categoría
donde se “cansa” a los receptores de características supuestamente responsables de la percepción categórica para cambiar la percepción hacia el extremo opuesto del continuo - A ritmos rápidos: un intervalo corto puede ser considerado como un intervalo No están fijas → Son sensibles a Sistema perceptivo es relativamente largo si el habla que lo rodea es suficientemente rápida Bebes también sensibles al ritmo del habla → son capaces de interpretar la duración relativa factores contextuales como el ritmo capaz de adaptarse
PS LENGUAJE
TEMA 6 (CAP 9)/3 del habla
¿Cuál es el carácter del código preléxico?
MASSARO
de los componentes del habla en función del ritmo
La aparente mala discriminación entre categorías no deriva de un temprano procesamiento perceptivo, sino que surge de un sesgo de los participantes a afirmar que los elementos de la misma categoría son idénticos.
SAVIN y BEVER (1970)
¿Tenemos que identificar los fonemas antes que las palabras?
FOSS y SWINNEY (1973)
procesamiento del habla utiliza
Tª del Código Dual (FOSS y BLANK, 1980)
tarea de monitorizació n de de fonemas
-
-
→ la identificación de los fonemas es posterior a la de las sílabas
No tenía por qué ser así: el hecho de que en la consciencia apareciera la sílaba (unidad superior) antes que el fonema no quería decir que su procesamiento fuera también anterior.
Código preléxico o fonético: se computa directamente a partir del análisis perceptivo de la información acústica de entrada. Código posléxico o fonémico: se deriva de la información que emana de las unidades de nivel superior como las palabras.
tiempos de monitorización del fonema ante los fonemas objetivo en palabras reales e inexistentes eran =
→los participantes deberían estar respondiendo utilizando el código preléxico o fonético, puesto que las palabras inexistentes no pueden tener códigos fonológicos La “frecuencia” de la palabra objetivo no influía en los tiempos de monitorización del fonema
la manipulación del contexto semántico de - con el código preléxico: cuando se facilita la tarea de una palabra hace que las personas monitorización del fonema - con el código posléxico: cuando la tarea es más difícil respondan ► por lo general, las personas contestan en una tarea de monitorización del fonema a partir del código preléxico, Y sólo en circunstancias excepcionales utilizan el código posléxico. Los resultados sugieren que los fonemas forman parte del código preléxico.
(apretar un botón al oír determinado sonido)
MARSLEN-WILSON y WARREN (1994)
Responder en cuanto oyeran determinada unidad: fonema o sílaba Rrespondían más lentamente a los fonemas que a las sílabas
Se accede directamente a las representaciones léxicas a partir de información en la señal de sonido. La información de coarticulación de las vocales se utiliza enseguida para identificar la consonante siguiente y, por tanto, para identificar la palabra.
¿Debemos procesar los fonemas antes de reconocer una palabra?
-
Aunque es posible que se computen los fonemas durante el reconocimiento de la palabra, no tenemos que culminar la identificación del fonema antes de que se pueda empezar a reconocer la palabra. Parece que somos menos conscientes de los fonemas que de los otros elementos fonológicos constituyentes del habla, como las sílabas.
PS LENGUAJE
TEMA 6 (CAP 9)/4
¿El reconocimiento del habla es un proceso puramente de abajo arriba o de arriba abajo?
2 representaciones distintas de los fonemas
Sistema inconsciente: actúa en el reconocimiento y la producción del habla. Sistema consciente: desarrollado en el contexto del desarrollo de la alfabetización (escritura y lectura)
Abajo arriba: de los sonidos a la interpretación Arriba abajo: el conocimiento y las estructuras previas influyen en la mera percepción de los sonidos Si se demuestra: la palabra en la que se produce un sonido (o el significado ►se podrá afirmar: la percepción es un proceso interactivo: de toda una frase) puede influir sobre el reconocimiento de dicho sonido → el conocimiento sobre las palabras está influyendo sobre la se habrá demostrado la influencia arriba abajo. percepción de sus sonidos constituyentes
►Los distintos tipos de contextos podrían tener un efecto en cada uno de los niveles de procesamiento fonológico y los efectos podrían ser distintos en cada nivel la percepción categórica de los sonidos que varían Ejemplo: /p/ y /b/ con VOT entre 0 y 60 ms, →los sonidos entre medias serán asignados a una u otra categoría, cuya a lo largo de un continuo delimitación dependerá del contexto del contexto de las palabras. GANONG (1980)
Evidencias
¿Cuál es el papel del contexto en la identificación de los sonidos?
MORAIS y KOLLINSKY (1994)
CONNINE y CLIFTON
Varió un fonema ambiguo a lo largo de un continuo pertinente e insertó estas variaciones delante de un contexto proporcionado por el final de una palabra. usando esta misma técnica
Método de análisis: “detección de la señal”
Resultado: Los participantes están dispuestos a poner un sonido en una categoría en la que no la pondrían normalmente si el resultado crea una palabra Conclusión: el contexto afectaba al “punto de cambio perceptivo” → cambio de identificación léxica, (el contexto de una palabra influye en nuestra clasificación de los sonidos)
El conocimiento léxico (información sobre las palabras), está disponible para la percepción categórica de elementos ambiguos. ►se logran otras ventajas del procesamiento de EE ambiguos cuando se invoca el conocimiento léxico, pero no en los extremos del continuo donde la información perceptiva, por sí sola, basta para tomar una decisión
El cambio de identificación léxica en una tarea de percepción La TDS proporciona un medio para describir la identificación de estímulos categórica es auténticamente perceptivo. “imperfectamente discriminables” El contexto léxico no es sensible a las manipulaciones (fundamentalmente el grado en el que se recompensan las RR correctas y se castigan las incorrectas) que se sabe que influyen sobre los procesos pos perceptivos el contexto de la frase Tiene un efecto análogo al del efecto pos perceptivo evidente de la cuantía de la recompensa monetaria, donde determinadas RR dan lugar a mayores recompensas► tiene efectos pos perceptivos.
Conclusión psicolingüística clásica: prueba de la participación del contexto en la identificación del sonido (a 1ª vista) Presentaron frases donde se - no pudieron detectar que faltaba un sonido de la frase (Parecían restaurar el sonido /s/.) - informados de que faltaba un sonido: seguían diciendo que los percibían todos y tampoco podían localizar correctamente había cortado un fragmento de dónde estaba la tos en la frase. 0,12 segundos (donde falta la se encuentra este efecto en omisiones más largas /s/), y se había metido una tos ►en su procesamiento de habla, están usando, más allá de los fonemas individuales, información semántica y sintáctica. (= efecto tos, pitido o El efecto desaparecía si en vez de toses, pitos o zumbidos, se introducía un silencio → detectado fácilmente. zumbido).
TEMA 6 (CAP 9)/5 Propusieron 4 frases: a 1 de las palabras se le omitía un fonema (siempre en la misma), el final de la frase cambiaba en todas las oraciones (sólo la palabra final).
Resultados: introdujeron sonidos diferentes dependiendo del contexto → la información semántica y sintáctica influía en la percepción
WARREN et al (1970)
Efecto de la restauración del fonema
PS LENGUAJE
¿El contexto afectaba al procesamiento perceptivo o al pos perceptivo (de carácter superior)? Conclusión
► evidencia: en ciertas circunstancias, la restauración de fonemas es un auténtico efecto perceptivo SAMUEL (1996)
añadir ruido al segmento, en vez de sustituirlo
El contexto léxico: da lugar a una auténtica restauración del fonema y que el efecto era preléxico. El contexto de la frase no afecta al reconocimiento del fonema y sólo afecta al procesamiento posléxico. ►sólo la información sobre determinadas palabras afecta a la identificación de las palabras; la información sobre el significado de la frase afecta a una fase de procesamiento superior
El contexto arriba abajo tiene, en el mejor de los casos, un papel limitado en la identificación de los sonidos. Hay poca evidencia de que el contexto de la frase afecte al procesamiento del habla.
.
1) Fase de o inicial
El reconocimiento de la palabra hablada empieza cuando cierta representación de la entrada sensorial hace un o inicial con el léxico (lexicón). La “representación de o” activa las entradas léxicas almacenadas. - Puede ser “todo o nada” (como en el modelo original de cohortes), - puede haber niveles de activación relativa que dependen de ciertas características como la frecuencia La activación - puede que la activación sea proporcional a la bondad actual del ajuste con los datos sensoriales (como en el modelo de TRACE o en el más actualizado de cohortes)
2) Fase de selección léxica: la activación sigue acumulándose hasta que se elige una entrada léxica. El reconocimiento de la palabra es el punto final de esta fase.
3) Fase de
el punto de reconocimiento suele producirse antes de que se haya oído la palabra completa - Caso más sencillo: el punto de reconocimiento se corresponde con su punto de singularidad (La secuencia inicial de la palabra es común a esa palabra y a ninguna otra).
3 fases de la identificación (FRAUENFELDER y TYLER, 1987)
EL CURSO TEMPORAL DEL RECONOCIMIENTO DE LA PALABRA HABLADA
PS LENGUAJE
TEMA 6 (CAP 9)/6 reconocimiento de la palabra
-
Con frecuencia se retrasará el reconocimiento hasta después del punto de singularidad: podríamos reconocer la palabra (en contextos muy sesgados)
Punto de aislamiento (punto de 1 palabra en el que una proporción de oyentes identifica la palabra, aunque es posible que haya dudas sobre esta decisión). Punto de reconocimiento: se sigue monitorizando la entrada sensorial hasta que se alcanza cierto nivel de confianza
léxico: Punto en que se encuentra disponible toda la información sobre una palabra (fonológica, semántica, sintáctica y pragmática) tras su reconocimiento Proceso de integración: marca el inicio del proceso de comprensión propiamente dicho donde se integran las propiedades semánticas y sintácticas de la palabra
La frecuencia tiene un efecto mucho más temprano en el reconocimiento de la palabra hablada ¿Cuándo afecta la frecuencia al reconocimiento de la palabra hablada?
DAHAN et al.
Analizaron los movimientos oculares de personas cuando miraban imágenes en una pantalla ►La frecuencia de las palabras es importante desde las primeras etapas de procesamiento y estos efectos persisten durante cierto tiempo.
PS LENGUAJE
Es toda la información que no se encuentra en la señal sensorial inmediata. Incluye información disponible de Postura autónoma
2 posturas
-
la entrada sensorial previa (el contexto anterior) de fuentes de conocimiento superiores (información semántica, sintáctica y pragmática)
El contexto no puede tener un efecto previo al reconocimiento de la palabra, sólo puede contribuir a la evaluación e integración del resultado del procesamiento léxico, no a su generación. Se permite el flujo lateral de información (si dentro del lexicón, pero no del lexicón a los procesos inferiores como la identificación del fonema.)
Postura interaccionista
2 tipos de contexto (FRAUENFELDER y TYLER)
EFECTOS DEL CONTEXTO EN EL RECONOCIMIENTO DE PALABRAS
Contexto
TEMA 6 (CAP 9)/7
Permite que los distintos tipos de información interactúen entre sí. Se puede producir una retroalimentación de los niveles posteriores de procesamiento a los anteriores (la información sobre el significado de la frase o del contexto pragmático podría influir en la percepción)
Información proveniente del mismo nivel de procesamiento en el que se está procesando actualmente. Ejemplo: facilitación del procesamiento que surge del contexto intraléxico (como relación asociativa entre dos palabras, doctor- enfermera). Contexto no estructural
Explicaciones -
en términos de relaciones dentro de un único nivel de procesamiento→ no tiene por qué incumplir el principio de autonomía en cuanto a la divulgación de la actividad dentro del lexicón. considerar que la facilitación se debe a potentes conexiones entre cosas similares en el mismo nivel..
Teóricos de la autonomía: este es el único tipo de contexto que afecta a los procesos antes del reconocimiento Afecta a la combinación de palabras en unidades de un nivel superior, e implica un mayor nivel de información Es un procesamiento arriba abajo
Contexto estructural
Tipos de contexto basados en el significado
Semántico
Gran evidencia de que este contexto afecta al procesamiento de la palabra. Se responde más rápidamente a las palabras que son adecuadas al contexto que a las que no lo son, Pero no está claro si se pueden distinguir efectos del contexto estructural semántico y el contexto no estructural, o en qué fases se producen
Interpretativo
Implica más información de nivel superior, como la información pragmática, la información del discurso y el conocimiento del mundo. Cierta evidencia de que el contexto no lingüístico puede afectar al reconocimiento de palabras. Estudios movimientos oculares: el contexto visual puede facilitar el reconocimiento de la palabra hablada.
PS LENGUAJE
TEMA 6 (CAP 9)/8
MODELOS DE RECONOCIMIENTO DEL HABLA Para acceder al lexicón → traducir el resultado de los nervios auditivos a un formato adecuado (de la que se ocupa la percepción del habla) - Se almacenan palabras objetivo como patrones (descripciones exactas del sonido o la palabra que se está buscando), - se produce la identificación cuando se encuentra una correspondencia Problema en el habla hay demasiada variación como para que esta posibilidad sea verosímil (excepto en los campos más restringidos) → El número de patrones que habría que almacenar sería muy elevado ► En general los modelos de patrones no se consideran posibles en psicolingüística.
Correspondencias entre patrones (1º modelos)
Reconocemos el habla mediante referencia a las acciones necesarias para producir un sonido → cuando oímos hablar, producimos o sintetizamos una sucesión de sonidos del habla hasta que encontramos una correspondencia con lo que oímos no genera aleatoriamente candidatos que comparar con la entrada: - crea la mejor conjetura inicial restringida por las pistas acústicas de la entrada - después intenta minimizar las diferencias entre esta conjetura inicial y la entrada
Sintetizador:
Ventajas
PRIMEROS MODELOS
1. utiliza nuestra capacidad de producir el habla también para el reconocimiento de la misma 2. asume fácilmente las diferencias entre distintos hablantes, porque los oyentes están generando sus propias palabras candidatas 3. es fácil demostrar cómo podrían tener efecto las restricciones de todos los niveles; el sintetizador sólo genera palabras posibles. No generará secuencias de palabras imposibles.
Análisis por síntesis Tª del motor (variante del modelo de Análisis por síntesis)
sintetizador del habla
-
- Modeliza el aparato articulatorio y los movimientos motores de la persona que habla - Computa cuáles habrían sido los movimientos necesarios para producir los sonidos que se han escuchado → la forma en que se hacen los sonidos proporciona una descripción perfecta de los mismos
Especificación de los movimientos motores: debe ser bastante abstracta
-
las personas mudas pueden comprender el habla perfectamente podemos comprender cosas que se han dicho que no podemos producir nosotros mismos (como el habla de un tartamudo o un acento extranjero).
PS LENGUAJE
TEMA 6 (CAP 9)/9 Problemas de modelos de análisis por síntesis
a) No hay una forma evidente de traducir la hipótesis articulatoria, generada por el sistema de producción, al mismo formato que el habla oída para poder valorar la correspondencia potencial. b) Somos buenos reconociendo palabras claramente articuladas que son improbables en su contexto →sugiere que el reconocimiento del habla es un proceso impulsado fundamentalmente por los datos. ► Esta teoría está inespecificada y tiene poco poder predictivo
Idea central
Cuando oímos hablar, generamos una cohorte de posibles elementos que podrían ser la palabra que oímos Se van eliminando elementos de este conjunto hasta que sólo queda 1, que es el elemento que se acepta como la palabra que se está intentando reconocer
2 versiones del modelo
3 fases del procesamiento
Mod. original – Mod. logogen (MORTON)
Modelo revisado
(MARSLEN-WILAON y WELSH, 1987)
MODELO DE COHORTES
:
la primera; que permitía una mayor interacción La revisada; en la que el procesamiento es más autónomo y el sistema de reconocimiento estaba más capacitado para recuperarse si los principios de las palabras estaban degradados Fase de : Se usa la representación perceptiva para activar elementos léxicos y generar un conjunto de candidatos (cohorte). El principio de la palabra es muy importante para genera la cohorte Preléxicas Fase de selección: se elige un elemento dentro del conjunto. Se selecciona un elemento de la cohorte sólo. Fase de integración: se utilizan las propiedades semánticas y sintácticas de la palabra elegida, por ejemplo, al integrar la Posléxica palabra en una representación completa de toda la frase. Se basa en un directo, paralelo e interactivo (como en el modelo de los logogenes) - Al presentarse el principio de una palabra, se constituye una “cohorte de inicios las palabras de la cohorte buscan activamente ser eliminadas de palabras” con las palabras candidatas - se van eliminando activamente estas palabras con todos los medios posibles (los logogenes acumulan pasivamente evidencia positiva) ► A medida que se van oyendo fragmentos adicionales de la palabra se van eliminando candidatos. Punto de singularidad” Actividad de procesamiento más intensa: Se produce en torno a este punto (punto en el que se puede distinguir de forma singular una palabra de todas las palabras similares). No tiene que coincidir con “el punto de reconocimiento
Contexto sólo afecta a la fase de Tiene una prioridad de “abajo arriba” → no se puede usar el contexto para restringir cuáles son los elementos que conforman la cohorte inicial (no se puede utilizar el contexto para eliminar candidatos en una etapa temprana) integración la eliminación de palabras de la cohorte deja de ser un proceso de todo o nada (sirve para explicar que aunque no se haya entendido bien el comienzo de la palabra se puedan superar esas distorsiones) grado de solapamiento es elevado aunque el principio de las palabras sea muy importante para generar la cohorte. a medida que las palabras de la cohorte no se ven favorecidas por información positiva, van decayendo hasta quedar de nuevo en estado de reposo. El contexto de la frase no puede invalidar la hipótesis de la percepción y sólo tiene un efecto tardío cuando una candidata está empezando a emerger como probable ganadora. La frecuencia de una palabra afecta al nivel de activación de las candidatas en las primeras etapas del léxico. El tipo de ganancia de la activación es
PS LENGUAJE
TEMA 6 (CAP 9)/10 mayor para las palabras de mayor frecuencia. Hay efectos de frecuencia relativa dentro de la cohorte inicial, de forma que pertenecer a la cohorte no es una cuestión de todo o nada sino que los elementos varían a lo largo de un continuo de activación. directo de las entradas léxicas en función de un análisis acústico de la señal del habla entrante.
SOMBREADO
Pruebas experimentales del modelo de cohortes
Analizar cómo interactúan la sintaxis y la semántica en el reconocimiento de palabras Tarea Escuchar un discurso continuado y repetirlo lo antes posible (con un retardo de 250ms). Los discursos tienen errores deliberados (sonidos distorsionados, se pronuncian mal las palabras) Resultados “Restauraciones de la fluidez”: repiten el discurso como debería haber sido, sin los errores de pronunciación (50%) Cuanto más distorsionado está un sonido, más probable es que se obtenga una repetición exacta. a) Magnitud de la discrepancia entre la palabra objetivo y la palabra errónea. Esta discrepancia se medía en función de una serie de características distintivas alteradas en el error (“trachedy” en vez de “tragedy”) b) Restricción léxica; reflejaba el número de candidatos disponibles en distintas posiciones de una palabra manipulando la posición de la sílaba en la que se localizaba el error (primera o tercera sílaba) c) Contexto; la palabra objetivo era continuación probable o improbable del inicio de la frase, podía ser de restricción o de restricción baja
3 variables de interés
Conclusiones /Resultados
ESCUCHA DE PRONUNCIACIONE S ERRONEAS Tarea
Restauraciones más fluidas: con distorsiones leves, de la última sílaba y cuando era predecible por el contexto (restricción alta) Reproducciones más exactas con una mayor distorsión: cuando la palabra estaba poco restringida por el contexto, si la restricción es adecuada, se restaura la fluidez mejor, aunque las desviaciones sean muy grandes. Interpretación: demostración de que la percepción inmediata es el producto tanto de la entrada perceptiva de abajo arriba como de las restricciones contextuales de arriba abajo. ►El análisis sintáctico y semántico empieza muy poco después de haber empezado a escuchar la frase, no se aplazan hasta haberla escuchado entera Tarea: Escuchar un discurso donde hay un sonido distorsionado (cambio de “bota” por “pota”) y detectar esos cambios. Los participantes son más sensibles a - Los fragmentos que se corresponden con el comienzo de una palabra son una prima casi Resultados los cambios al principio de las palabras tan eficaz como la palabra misma - los fragmentos de la rima producen muy poca imprimación
Presentación paulatina de cantidades crecientes de una palabra - se pueden identificar los “puntos de aislamiento”: tiempo medio que pasa desde el comienzo de una palabra hasta que los oyentes son capaces de identificar cuál es, pero con cierto grado de duda.
PS LENGUAJE
TEMA 6 (CAP 9)/11
- la importancia del contexto adecuado - las palabras candidatas se generan de forma que son compatibles con la representación perceptiva hasta cierto punto, pero no con el contexto ►El contexto de la frase no parece tener un efecto temprano. No influye en la generación de palabras candidatas, pero sí puede eliminarlas Técnica que permite medir los efectos del contexto en distintos momentos de reconocimiento de una palabra Tarea escuchan un discurso en unos auriculares al tiempo que miran a la vez a una pantalla para realizar una tarea de decisión léxica ante las palabras que se le presentan visualmente Demostró: el contexto puede ayudar a elegir las palabras candidatas semánticamente adecuadas antes de alcanzar el punto de reconocimiento Imprimación no tiene efecto al principio de la palabra (incluso cuando favorece enérgicamente una palabra, también con competidoras poco multimodal verosímiles). Una vez que se ha pasado el punto de aislamiento sí influye, su efecto es fomentar el nivel de activación de la palabra respecto al de Contexto sus competidoras. ► El contexto acelera la integración ZWITSERLOOD
ACTIVACIÓN PAULATINA
Demuestra
VAN PETTEN et al
Sugieren: la integración semántica puede empezar cuando el sistema sólo tiene información incompleta sobre la identidad de la palabra Potenciales evocados: todas las palabras crean un pico máximo de activación a los 400 ms de haber empezado el E (N400) N400: mayor en amplitud cuando la palabra está en un contexto incongruente. (encontró N400 diferenciales a palabras semánticamente adecuadas e inadecuadas antes del punto de aislamiento de la palabra)
Modelo muy interactivo del reconocimiento de la palabra hablada Derivado del Modelo de activación interactiva de las letras y de identificación visual de las palabras de McClelland Procesamiento arriba abajo (el contexto) en el reconocimiento de las palabras
-
Contexto léxico: puede ayudar directamente al procesamiento perceptivoacústico La información por encima del nivel de la palabra (semántico, sintáctico y pragmático), puede ayudar al reconocimiento de la misma.
Compuesto de muchas unidades simples de procesamiento conectadas entre sí. Unidades de Entrada provistas de energía o “activadas” que se propaga por las conexiones 3 niveles (características fonológicas) Procesamiento temprano y sofisticado de la señal acústica. Características que analiza la red: precisión, grado de difusión y vocales implicadas. de Unidades de fonemas: quedan activadas las unidades de los fonemas que se han registrado o que se conforman con los análisis del nivel anterior. procesamiento Unidades de palabras: de los datos del nivel anterior y su combinación surge la palabra identificada ► surge energía que se propaga por la red excitando e inhibiendo de manera tal que al final sólo queda una unidad de salida, la palabra que ha reconocido la red. Las unidades en distintos excitadoras Todas las conexiones entre los niveles son de doble sentido: la información fluye entre ellas en ambos sentidos. Esto niveles (mutuamente permite tanto el procesamiento abajo arriba como el arriba abajo inhibidoras → Una vez que una unidad se ha activado, tiende a inhibir a sus compañeras de nivel. consistentes) dentro de cada nivel → competencia entre unidades del mismo nivel tienen conexiones Tiempo Lo tiene en cuenta el modelo Las unidades se representan de manera independiente en cada porción de tiempo. simulándolo como porciones discretas El modelo se ejecuta en forma de simulaciones informáticas y se comparan las series de simulaciones con lo que ocurre en el procesamiento del habla en humanos Funcionamiento
Modelo conexionista
MODELO TRACE
Característic a
Percepción categórica
Se produce a consecuencia de una inhibición dentro del mismo nivel entre las unidades de fonema. A medida que una activación proporcionada por una entrada antigua va circulando por el tiempo, la inhibición mutua entre las unidades de fonemas da lugar a que se clasifique la entrada como en un extremo u otro del continuo
PS LENGUAJE
TEMA 6 (CAP 9)/12
Ventajas
problemas
Los sonidos al inicio de las palabras desempeñan un papel importante La entrada se va desvelando a lo largo del tiempo, de forma que los sonidos del principio de la palabra contribuyen mucho más a las estimaciones de los nodos de la palabra que los sonidos del final de la misma. -
Trata muy bien los efectos del contexto en la percepción del habla. Puede operar con cierta variación acústica Explica fenómenos como el efecto de la restauración del fonema ,los efectos de la coarticulación y los efectos del contexto léxico Es bueno para encontrar las limitaciones de las palabras Opera bien con entradas con ruido, que se aproximan más al lenguaje natural.
El tratamiento del tiempo como porciones discretas es inverosímil
se basa en la idea de que el contexto afecta de arriba abajo al proceso de evidencia experimental en contra del efecto: los efectos del contexto sólo aparecen ante estímulos degradados desde el punto de vista de la percepción reconocimiento (controvertido).. No ofrece un buen rendimiento para detectar errores de pronunciación. Frauenfelder y otros no encontraron ninguna prueba de una inhibición de arriba abajo en los fonemas en una tarea que implicaba la monitorización de fonemas inesperados al final de una palabra en comparación con palabras inexistentes de control. ►TRACE es bueno para explicar los efectos del contexto, pero es débil en el grado en que sus predicciones no están respaldadas fehacientemente por los datos
Redes recurrentes
Modelo de GASKELl y MARSLEN-WILSON
OTROS MODELOS CONEXIONISTAS
Evaluación del modelo
Efectos de la posición
Utilizan “conexiones recurrente” de la capa oculta a un contexto para almacenar información sobre estados previos de la red. Permite :codificar información explicación mucho más verosímil de carácter basado en el tiempo del procesamiento del habla que un modelo sobre el tiempo TRACE (usa unidades basadas en tiempos fijos →problemas a la hora de asimilar variaciones del ritmo del habla)
Ampliación el modelo de cohortes para modelizar el proceso que hace correspondencias entre la información léxica y la fonológica Diferencias otros carácter distribuido de las representaciones léxicas se distribuye la información sobre una palabra cualquiera entre un gran (≠ TRACE: usa representación local), modelos nº de unidades de procesamiento la información de bajo nivel (características fonéticas), recibe directamente una correspondencia en forma léxica conexionistas No hay niveles adicionales de procesamiento fonológico implicados (aunque hay una capa de unidades ocultas que media entre las entradas de características y las capas de salida semántica y fonológica). Curso temporal del léxico
Simulación de facetas importantes del procesamiento del habla
Demuestra que es posible que se activen múltiples candidatos en paralelo. La palabra objetivo sólo se diferencia de sus competidoras cerca de su punto de singularidad. Simulación con éxito los datos experimentales Muestra muy poca tolerancia Consecuencia de la forma realista en que se presentan las entradas (con palabras incorporadas en un flujo de habla) y (como los humanos) del entrenamiento de la red en un gran nº de formas fonológicas similares. Estas características obligan a la red a ser intolerante sobre la clasificación de los elementos de entrada. La competencia entre elementos similares es una parte esencial del procesamiento → La activación simultánea de más de una palabra candidata crea conflicto la cantidad de competencia Las palabras candidatas activadas por un sonido parcial sonarán necesariamente similares, por lo que serán coherentes entre las palabras depende La imprimación semántica: no puede hacerlo → genera múltiples elementos candidatos no relacionados entre sí, por lo de la coherencia del que son incoherentes conjunto competitivo ►Los efectos de la competencia y los efectos del tamaño de la cohorte serían mayores en la imprimación
PS LENGUAJE
TEMA 6 (CAP 9)/13 semántica que en la imprimación por repetición.
Arquitectura híbrida
Redes recurrentes
Modelo SHORTLIST (NORRIS)
Modelo MERGE. (NORRIS, McQUEEN y CUTLER)
-
una red recurrente proporciona los elementos de entrada de una red de activación interactiva Modelo totalmente abajo arriba ( parte de un vocabulario de decenas de miles de palabras) → el reconocimiento de palabras es una carrera abajo arriba entre palabras similares Se crea una “red de competencia al vuelo”
Desde la salida de una red de reconocimiento en la que las palabras candidatas detectadas en el flujo de entrada pueden competir entre sí. Sólo hay unas pocas palabras recientemente activas para ser utilizadas en la lista (shortlist=lista reducida). El principal inconveniente de este modelo es la viabilidad de crear una nueva red competitiva en cada momento.
Modelo completamente dependiente de los datos (abajo arriba) la activación fluye del nivel preléxico al lexicón y los nodos de decisión del fonema. No hay retroalimentación entre los nodos léxicos y los preléxicos. Modelo de competencia-activación Sin embargo, la información léxica puede influir sobre los nodos de decisión de los fonemas ►MERGE es en realidad un modelo que explica las tareas de decisión del fonema, pero no un modelo de reconocimiento del habla en general.
o Inicial
Comparación de los modelos del reconocimient o de la palabra hablada
Pueden identificar palabras habladas en su punto de singularidad Pueden asimilar variaciones en el ritmo del habla. No se pueden recuperar si identifican incorrectamente partes de una palabra. No se pueden deshacer las decisiones (≠ TRACE)
►Determinado por la cantidad de habla necesaria para computar la representación de o KLATT (1989): el o de puede iniciar transcurridos los primeros 10 ms Modelos que utilizan sílabas para localizar posibles comienzos de palabras: necesitan más tiempo para poder acceder al lexicón Modelo de cohortes
Forma de o (representaciones con el lexicón)
Modelo TRACE
Principio de la palabra (primeros 150 ms.) para hacer el primer o Desventaja: es difícil recuperarse de un error (haber oído mal) Mod.cohortes revisado: Permite una activación paulatina de las palabras candidatas en vez de una activación de todo o nada
No hay o único para cada palabra: cada fonema identificado (palabra completa) contribuye al conjunto de entradas léxicas activas Problema: estos conjuntos pueden ser muy grandes, puede ser caro en cuanto a la computación
Modelos Conexionistas
Difieren de TRACE: utilizan más la información abajo-arriba Demuestran cómo es probable que se desarrollen los modelos de reconocimiento del habla Modelo SHORTLIST (combina las ventajas de redes recurrentes y TRACE): problema: no está claro cómo se pueden crear rápidamente “al vuelo”, redes de activación interactiva
PS LENGUAJE
TEMA 6 (CAP 9)/14
Lesiones cerebrales: Dificultades en el reconocimiento del habla puede afectar a
-
a los códigos
-
Preléxico léxico
1ª etapas del procesamiento acusticofonético de las características (como tiempo de comienzo de la voz) Etapas posteriores que implican la identificación de sonidos en función de estas características
NEUROPSICOLOGÍA DEL RECONOCIMIENTO DE LA PALABRA HABLADA
Dificultades para construir código preléxico:
Dificultades con el léxico
Evidencias
Vocales y consonantes procesadas por sistemas distintos
2 pacientes con afasia con dificultades selectivas para producir vocales y las consonantes - Puede leer, hablar y escribir - No pueden comprender el habla a pesar de oír con total normalidad Pacientes con sordera de - No pueden repetir el habla palabra pura - Comprensión auditiva extremadamente pobre →Podemos producir palabras sin ser necesariamente capaces de comprenderlas Pacientes con sordera del significado de la palabra Mismos síntomas que sordera de palabra pura pero Tienen intactas las capacidades de repetición
Paciente EDE
Procesamiento acusticofonémioco intacto (capacidad de construir código preléxico) Buen rendimiento en pruebas de discriminación de fonemas Muchos errores al decidir si una serie de sonidos constituían una palabra o no Buen rendimiento en tareas de comprensión del lenguaje rutinario (interpretado como déficit de M)