Categorización radial
Lingüística ComputacionalTeoría que propone que las categorías tienen miembros centrales (prototipos) y periféricos, sin límites rígidos.
18 términos que empiezan por "C"
Teoría que propone que las categorías tienen miembros centrales (prototipos) y periféricos, sin límites rígidos.
Métrica para evaluar reconocimiento de voz que calcula errores a nivel de caracteres. Más robusto que WER para idiomas morfológicamente ricos o aglutinantes.
Técnica de prompting que hace que el modelo muestre su razonamiento paso a paso antes de dar una respuesta final.
Proceso de agrupar palabras en frases o constituyentes sintácticos (sintagmas nominales, verbales, etc.).
Contrastive Language-Image Pre-training. Modelo de OpenAI que conecta imágenes y texto en un espacio de embeddings compartido.
Corriente lingüística que ve el lenguaje como parte integral de la cognición general, estructurado por la experiencia corporal.
Métrica de evaluación de traducción automática basada en embeddings contextuales, entrenada con juicios humanos. Correlaciona mejor con evaluación humana que BLEU o ROUGE.
Conocimiento lingüístico abstracto e idealizado que un hablante tiene de su lengua. Opuesto a actuación.
Principio según el cual el significado de una expresión compleja depende del significado de sus partes y sus reglas de combinación.
Método de alineación desarrollado por Anthropic que entrena modelos usando principios éticos explícitos. El modelo critica y revisa sus respuestas según reglas constitucionales.
Tarea de asignar una categoría o etiqueta a un texto. Incluye análisis de sentimiento, detección de spam, etc.
Análisis sintáctico que descompone oraciones en constituyentes jerárquicos (SN, SV, etc.) formando un árbol.
Palabra o grupo de palabras que funciona como una unidad dentro de una oración (ej: sintagma nominal).
Número máximo de tokens que un modelo puede procesar de una vez. Los LLMs modernos tienen ventanas de 8K a 128K+ tokens.
Técnica de aprendizaje que acerca representaciones de ejemplos similares y aleja las de ejemplos diferentes.
Tarea de identificar todas las menciones en un texto que se refieren a la misma entidad del mundo real.
Colección de textos utilizada para entrenar o evaluar modelos de lenguaje. Puede estar etiquetado o no.
Función de pérdida estándar para clasificación que mide la diferencia entre distribuciones predicha y real.