Entradas

Mostrando entradas de diciembre, 2023

NPL:RUST: MIN-EDIT-DISTANCE - ALGORITHM

Imagen
 The Algorithm: Rust implementation: use std::cmp::min; fn min_edit_distance (source: & str , target: & str ) -> usize { let n = source. chars (). count (); let m = target. chars (). count (); let mut d = vec! [ vec! [ 0 ; m + 1 ]; n + 1 ]; for i in 0 ..=n { d[i][ 0 ] = i; } for j in 0 ..=m { d[ 0 ][j] = j; } for i in 1 ..=n { for j in 1 ..=m { let cost = if source. chars (). nth (i - 1 ) == target. chars (). nth (j - 1 ) { 0 } else { 1 }; d[i][j] = min ( d[i - 1 ][j] + 1 , min (d[i][j - 1 ] + 1 , d[i - 1 ][j - 1 ] + cost), ); } } d[n][m] } fn main () { let args : Vec < String > = std::env:: args (). collect (); if args. len () != 3 { println! ( "Usage: {} <source> <target>" , args[ 0 ]); ret

[Idiomas][Italiano][Congiuntivo] - 10 frasi da completare in italiano che riguardano il congiuntivo

  Ecco   10 frasi da completare in italiano   che riguardano il   congiuntivo . Completa ogni frase scegliendo la forma corretta del verbo al congiuntivo. Buona fortuna! 🇮🇹 Spero che tu (venire)  alla festa stasera. Desidero che Marco (parlare)  con me del progetto. Preferisco che voi (studiare)  di più prima dell’esame. Temo che lei (perdere)  il treno se non si affretta. Non sono sicura che (essere) la scelta migliore . Hai dubbi che (potere) farlo? Sono felice che tu (essere) qui . Mi rallegra che loro (venire) alla riunione . Sento che lui (non avere) il coraggio di parlare . Spero che voi (raggiungere) i vostri obiettivi . Risposte: Spero che tu  venga   alla festa stasera. Desidero che Marco  parli   con me del progetto. Preferisco che voi  studiaste   di più prima dell’esame. Temo che lei  perda   il treno se non si affretta. Non sono sicura che  sia   la scelta migliore. Hai dubbi che  possa   farlo? Sono felice che tu  sia   qui. Mi rallegra che loro  vengano   alla riunione

[Idiomas][Italiano] Rutina Semanal de Estudio de Italiano (3 horas/semana)

  Día 1: Lunes Duración : 1 hora Contenido : Gramática avanzada : Dedica tiempo a estudiar estructuras gramaticales más complejas, como el uso de subjuntivo, condicional, voz pasiva, etc. Lectura avanzada : Lee artículos, ensayos o fragmentos literarios en italiano. Anota nuevas palabras y expresiones. Práctica de escritura : Escribe un párrafo sobre un tema de tu elección utilizando las estructuras gramaticales aprendidas. Día 2: Miércoles Duración : 1 hora Contenido : Vocabulario específico : Dedica tiempo a aprender vocabulario relacionado con tus intereses o área profesional. Por ejemplo, si trabajas en marketing, estudia términos de marketing en italiano. Comprensión auditiva : Escucha podcasts, entrevistas o programas en italiano. Trata de entender el contexto y las ideas principales. Práctica de conversación : Habla en italiano con un compañero de estudio o un tutor. Practica expresiones idiomáticas y fluidez. Día 3: Viernes Duración : 1 hora Contenido : Revisión de errores comu

NLP: tr and sort - Unix Commands to extract and manipulates word - corpus

  tr -sc 'A-Za-z' '\n' < ./wizard_of_oz | sort | uniq -c you should replace ./wizard_of_oz by the file you want to analyze change lower by upper case letters: tr -sc 'A-Za-z' '\n' < ./wizard_of_oz |tr a-z A-Z | sort | uniq -c order numerically the occurrences: tr -sc 'A-Za-z' '\n' < ./wizard_of_oz |tr a-z A-Z | sort | uniq -c | sort -n -r

NLP: La ley de Herdan

 La ley de Herdan es una ley empírica que describe el número de palabras distintas en un documento (o conjunto de documentos) como una función de la longitud del documento. La fórmula de la ley de Herdan es: V R ​ = K ⋅ n β donde V R ​ es el número de palabras distintas en un documento de tamaño n , y K y β son parámetros libres que se determinan empíricamente. Con un texto en inglés, típicamente K es entre 10 y 100, y β es entre 0,4 y 0,6 1 2 3 . El parámetro K se refiere a la riqueza léxica del documento, es decir, el número de palabras distintas que aparecen en el documento. El valor de K depende del idioma y del tipo de texto. Por ejemplo, un texto técnico tendrá una riqueza léxica más baja que un texto literario. El parámetro β se refiere a la tasa de crecimiento de la riqueza léxica con respecto al tamaño del documento. Un valor de β cercano a 1 indica que la riqueza léxica crece linealmente con el tamaño del documento, mientras que un valor de β menor que 1 indica

AI:LLM:GREP: Regular expressions using "grep"

Imagen
The regular expression [ˆa-zA-Z], which we used to avoid embedded instances of "the", implies that there must be some single (although non-alphabetic) character before the the. We can avoid this by specifying that before the the we require either the beginning-of-line or a non-alphabetic character, and the same at the end of the line:  grep -E "(^|[^a-zA-Z])[tT]he([^a-zA-Z]|^)" wizard_of_oz  The process we just went through was based on fixing two kinds of errors: false false positives positives, strings that we incorrectly matched like other or there, and false negafalse negatives tives, strings that we incorrectly missed, like The. Addressing these two kinds of errors comes up again and again in implementing speech and language processing systems. Reducing the overall error rate for an application thus involves two antagonistic efforts:  • Increasing precision (minimizing false positives)  • Increasing recall (minimizing false negatives) Some aliases for common

MISC: Richard Feynman on Computer Science — Talk at Bell Labs (1985) "I don't believe in computer Science"

Imagen
I don't believe in Computer Science. To me science is the study of the behavior of nature and engineering or applied things is the behavior of things we make.

AI: MATHS: El perceptron (teoría matemática)

Imagen
  La teoría matemática del perceptrón es una rama de la inteligencia artificial que se centra en el estudio de los perceptrones, que son modelos matemáticos de neuronas artificiales. El perceptrón es un algoritmo de aprendizaje supervisado que se utiliza para clasificar objetos en diferentes categorías. El modelo se basa en una función discriminante lineal que utiliza pesos y umbrales para separar las diferentes clases de objetos. La función discriminante se calcula como la suma ponderada de las entradas multiplicadas por los pesos, y se compara con un umbral para determinar la clase a la que pertenece el objeto. El perceptrón se puede utilizar para resolver problemas de clasificación binaria y multiclase, y se ha utilizado en una amplia variedad de aplicaciones, como el reconocimiento de caracteres, la detección de spam y la clasificación de imágenes. Aquí hay una fórmula básica para un perceptrón: El objetivo del aprendizaje del perceptrón es ajustar los pesos y el sesgo para que la