Cambios atómicos: Pequeños cambios que desencadenan grandes cambios. Empecé por levantarme a eso de las 0525 porque me molesta mucho la alarma del despertador. No es de Dios despertarse así, tan violentamente: es una barbaridad, como la comida rápida.
sábado, 16 de diciembre de 2023
cambios atomicos
sábado, 2 de diciembre de 2023
y quien te pego?
Dice la amiga de una amiga cuando algo le sale a pedir de boca: "¿Y quién te pegó?" A fe mía, se la sacó de una cancioncilla de Chico Che y La Crisis: Catalina le pegó. En efecto, en los 80s las mujeres salieron de la cocina y se esparcieron por todas partes. Lola La Trailera dejó de ser una fantasía del cine. Desde políticos hasta mecánicos, las damitas están en todas partes: el próximo presidente de la República será mujer, lo que ni los gringos consintieron. Prófugas de la cocina, probaron la libertad y les gustó.
miércoles, 22 de noviembre de 2023
jq example parse json
Try extract only the field text from a JSON Lines file called example-english-corpus.jsonl:
Dataset Card for MIRACL Corpus
{
"docid": "39#0",
"title": "Albedo",
"text": "Albedo (meaning 'whiteness') is the measure of the diffuse reflection of solar radiation out of the total solar radiation received by an astronomical body (e.g. a planet like Earth). It is dimensionless and measured on a scale from 0 (corresponding to a black body that absorbs all incident radiation) to 1 (corresponding to a body that reflects all incident radiation)."
}
$ jq -r '.text' example-english-corpus.jsonl
Albedo (meaning 'whiteness') is the measure of the diffuse reflection of solar radiation out of the total solar radiation received by an astronomical body (e.g. a planet like Earth). It is dimensionless and measured on a scale from 0 (corresponding to a black body that absorbs all incident radiation) to 1 (corresponding to a body that reflects all incident radiation).
So, the question of the day is: save output as txt or jsonl? NLTK, spaCy, Gensim, etc., suppose a txt input.
lunes, 20 de noviembre de 2023
pato en nahuatl
Cuac. Hay una autopista que te lleva de volada a Tuxtla Gutiérrez, Chis. Se llama Cosoleacaque-Cuacnopalan. Debe atravesar la Sierra Madre Oriental, no sé. Yo ni siquiera conozco.
A fe mía, la naturaleza le proporcionó una idea al hombre salvaje de cómo nombrar las cosas: No fue Adán, fue al revés, mediante onomatopeya. ¡Cuac!
lunes, 23 de octubre de 2023
vete a la porra
Tradicional: Fulano, le presento a Merengano.
Novelesco: Chéfero, te presento a Munra, El Inmortal.
-Vete a la porra -dice Munra al presentador.
Traducción: vete a la verga, míratela (si nos ponemos rocambolescos y tomamos el imperativo vete no literal: ve a la gaver; ve en el sentido de mirar, no como ir, digamos, a La Chingada). Tiene su connotación falocrática: una porra grande, que te puede lastimar por su tamaño. Es el tolete con lo que la policía o los granaderos aporrean a los manifestantes, a los delincuentes y a veces a los borrachos.
lunes, 10 de abril de 2023
wikipedia en un archivo
Para los Jupyter notebooks del Instituto Humai empecé buscando el dataset de Leo Cordoba en Hugging Face y encontré miracl-corpus, lo que parece ser la Wikipedia entera en español: un archivo XML de 3.7 GB. Todavía no termina de bajar, la descarga se ha interrumpido varias veces; aunque wget se reanuda, conforme llega al 98% se va alentando (ralentizando dicen en España, horrible). Empezó mejor que desde Firefox, pero igual y se lleva las siete horas descargando. Apenas he podido liberar espacio en disco. Porque, increíblemente, sí se lo acaba uno nada más en videos.
Desempacado, este corpus llega a los 16.7 GB. Uno comprueba la eficacia de los XML al pasarlo del disco local al externo: se copia en un santiamén. Esa es una de las características de ese lenguaje, la transmisión de datos.
lunes, 27 de marzo de 2023
nombre es destino
Si nombre es destino será peeero no en la onda jipeteca, según la cual si tu nombre vibra mal, genera mala onda, mala vibra, p. ej. si te llamas Dolores estás perdido. Creo, más bien, que así como a veces la cara no ayuda (aunque dinero mata carita diría José López-Portillo) el nombre no ayuda: Teovaldo, Zeus y los hay mucho peores (Aniceto, Hilario, Recaredo, Romualdo, Rosalino). Déjame en la caja de comentarios los nombres que te hayan causado mala impresión.
Desde luego, hay gente que se va por la fácil y le ponen al crío María Félix o Pedro Infante. Sean serios, por favor. Aunque ahora parece que es más fácil cambiar de nombre y de sexo y de cerebro. Bueno no, de cerebro todavía no. Aunque dice el lugar común "Cambiar de chip" (cambiar de manera de pensar), todavía no se llega a eso.
Un nombre que no le gusta a la gente no ayuda. Igual que un mal físico (la gente guapa siempre es consentida) o vestirse mal (por pobreza o comodidad o simple pereza). Las personas nunca se toman la molestia de conocerte a fondo: cuando mucho se meten a husmear en tu Facebook.