[NLP][Regresión logistica] Función sigmoide

La función sigmoide, también conocida como función logística, es una función matemática que tiene una característica forma de “S”. Se utiliza comúnmente en la regresión logística y las redes neuronales para introducir la no linealidad en el modelo y para convertir valores numéricos en probabilidades.

La función sigmoide se define como:

f (x) =1 / 1 + e^-x

Donde:

$x$ es la entrada a la función.
$e$ es la base del logaritmo natural.

La función sigmoide tiene varias propiedades interesantes:

Rango: La salida de la función sigmoide está en el rango (0, 1), lo que la hace útil para convertir valores arbitrarios en probabilidades.
Derivada: La derivada de la función sigmoide puede ser expresada en términos de la propia función sigmoide: $f^{'} (x) = f (x) * (1 - f (x))$ . Esta propiedad es útil durante el entrenamiento de las redes neuronales, ya que simplifica el cálculo del gradiente.
No linealidad: La función sigmoide es no lineal, lo que significa que puede capturar patrones más complejos en los datos.
Suavidad: La función sigmoide es suave y diferenciable en todas partes, lo que la hace adecuada para métodos de optimización como el descenso del gradiente.

Comentarios

Entradas populares de este blog

[Validación Cruzada] [Machine Learning] [Evaluación de Modelos] [Ciencia de Datos] [R Programming] [Resampling] Validación Cruzada: Concepto y Técnicas Principales

Validación Cruzada: Concepto y Técnicas Principales Validación Cruzada: Concepto y Técnicas Principales La validación cruzada es un conjunto de técnicas utilizadas para evaluar la capacidad de generalización de un modelo de machine learning. Su objetivo principal es determinar cómo de bien puede el modelo desempeñarse con datos no vistos, proporcionando una evaluación más robusta y fiable en comparación con dividir los datos en un simple conjunto de entrenamiento y prueba. Principales Técnicas de Validación Cruzada 1. K-Fold Cross Validation (Validación Cruzada K-Fold) El conjunto de datos se divide en $k$ particiones o "pliegues" de igual tamaño. El modelo se entrena $k$ veces: en cada iteración, un pliegue diferente se utiliza como conjunto de prueba y los $k-1$ pliegues restantes como conjunto de entrenamiento. La métrica final (por ejemplo, precisión, F1, etc.) se c...

AI:LLM:GREP: Regular expressions using "grep"

The regular expression [ˆa-zA-Z], which we used to avoid embedded instances of "the", implies that there must be some single (although non-alphabetic) character before the the. We can avoid this by specifying that before the the we require either the beginning-of-line or a non-alphabetic character, and the same at the end of the line: grep -E "(^|[^a-zA-Z])[tT]he([^a-zA-Z]|^)" wizard_of_oz The process we just went through was based on fixing two kinds of errors: false false positives positives, strings that we incorrectly matched like other or there, and false negafalse negatives tives, strings that we incorrectly missed, like The. Addressing these two kinds of errors comes up again and again in implementing speech and language processing systems. Reducing the overall error rate for an application thus involves two antagonistic efforts: • Increasing precision (minimizing false positives) • Increasing recall (minimizing false negatives) Some aliases for common...

Encontré 42 GB de modelos de IA fosilizados en mi PC: una puesta al día honesta sobre IA local, conceptos y entornos Python en 2026

Hace tiempo que no tocaba nada de IA en mi PC, y al echar un ojo descubrí varios programas que no recordaba para qué eran y, sobre todo, modelos de hace año y medio acumulando polvo en el disco. Lo que empezó como una limpieza acabó siendo una puesta al día completa: Ollama, conceptos fundamentales, mapa del ecosistema, comparativas, y un setup de Python desde cero. Lo dejo aquí ordenado por si a alguien le sirve. 1. El punto de partida: 42 GB de modelos zombi Lo primero que encontré fue Ollama corriendo en segundo plano (ese icono pequeño en la barra de tareas que llevaba meses sin tocar). Un ollama list reveló cinco modelos descargados hacía 18 meses, ocupando casi 42 GB: llama-3-8B-programming-questions — 16 GB SuperNova-Medius-Q8_0 — 15 GB uncensored_wizard_7b — 4.1 GB llama3.2 — 2 GB llama3.1 — 4.7 GB En el mundo de la IA, 18 meses son una eternidad. Han salido Llama 3.3 y 4, Qwen 2.5 y 3, DeepSeek-V3 y R1, Gemma 3 y 4, gpt-oss... cualquiera de los nu...

elaprendiz0000

Buscar este blog