miércoles, abril 27, 2005

Manning Publications tiene unos cuantos libros sobre herramientas de apache.org. Disponibles también en formato electronico (eBook).

Java y Python


Tengo un proyecto en mente que es hacerme un buscador sobre los foros de la desni. He empezado a bajarma las paginas con wget:

wget http://desnivel.com/textos/foros/index.php -r -np -nH --cut-dirs=1 --convert-links --wait=5

Pero estoy viendo que la web realmente esta hecha muy cutre. Va a ser mas complicado de lo que pensaba. Bueno de momento empezaré a trastear con ello.

Para hacer el buscador queria usar Lucene, que es de gratis. Todavia no he decidido si usar la version de Java o no. En principio queria hacerlo con pyLucene. De momento me lo he bajado y he empezado a echarle un vistazo. Viene compilado con GCJ.

Para acabar un articulo sobre un buscador hecho con pyLucene y JPython. He estado echando un vistazo a Jpython o Jython y tiene una pinta genial.

martes, abril 26, 2005

lsof (/usr/sbin/lsof) - List Open Files


Este es un comando es muy potente y muy muy interesante. Te sirve para ver que ficheros usa un proceso => muy util para ver que sockets usa un proceso, o que ficheros tiene abiertos o que librerias usa.

Cortesia de JJ. Disponible aparte de Linux para mas plataformas.
ummm, una empresa a fichar, opensistemas.
Han salido hoy en barrapunto.

lunes, abril 25, 2005

rsync


Un comando muy util. Ejemplo:

rsync -azvCne ssh src/ .

con -s ssh le estamos diciendo que use para conectarse ssh; con -v que sea 'verbose'; con -C que ignore ficheros del mismo modo que lo hace CVS; con -a que trabaje en modo archivo; con -z que antes de transferir comprima; y con -n (no run) que no ejecute realmente el comando.

Que el origen lo terminanos con '/' o no es importante, ya que parte del directorio o bien de los contenidos del directorio (en nuestro ejemplo de los contenidos).

Mas sobre vi

^R= en modo inserción: se trata de un buffer que es calculadora entera => te permite meter directamente mientras escribe resultados de operaciones.
shift+h, shift+m, shift+l : Para moverte al inicio de la pantalla, al medio y al final.
^O,^i: Creo que te permiten moverne hacia adelante y hacia atrás, sobre posicionamientos que hayas hecho. Pero no tengo muy claro su funcionamiento.
* y #: Buscan la palabra sobre la que estas posiconado. El primero hacia adelante y el otro hacia atrás (+ o -).
shift+K: te buscan en el man la palabra sobre la que estas posicionado.

Y sobre buffers:

:buffers: te muestra los buffers que tienes
:bn: te mueves al siguiente
:bp: te mueves al anterior
:bd: borras el buffer que estas viendo
:bN: te mueves al buffer N.

viernes, abril 22, 2005

dns´s y undercores



Parece que en linux hay problemas en la resolucion de nombre con underscores.
Buscando en google:

Y para acabar las pruebecillas hechas en linux (donde un GET o un telnet al puerto 80 falla):

$ telnet www._cesar_ortiz_.blogspot.com 80
www._cesar_ortiz_.blogspot.com: Unknown server error

$ telnet cesarob.blogspot.com 80
Trying 66.102.15.101...
Connected to blogspot.blogger.com (66.102.15.101).
Escape character is '^]'.


$ nslookup www._cesar_ortiz_.blogspot.com
Note: nslookup is deprecated and may be removed from future releases.
Consider using the `dig' or `host' programs instead. Run nslookup with
the `-sil[ent]' option to prevent this message from appearing.
Server: 192.168.200.252
Address: 192.168.200.252#53

Non-authoritative answer:
www._cesar_ortiz_.blogspot.com canonical name = blogspot.blogger.com.
Name: blogspot.blogger.com
Address: 66.102.15.101

jueves, abril 21, 2005

Me comenta el bro:
  • Para poner el icono al ladito de la url del navegador hay que poner un fichero favicon.ico en el directorio raiz de tu pagina.
  • Un programita para hacer iconos: Icon Forge.

ACE crawler y mas



Me comento ayer JJ que con ACE viene un ejemplo de un crawler. Es cierto.
He visto tambien un par de assigments de Doug para el curso cs562: la parte1, la parte2 y la parte3.

Desde la ultima vez que use ACE he visto que ahora han metido una herramienta para generar makefiles: MakeProjectCreator.
Definición de troll, enviada por vlady.

miércoles, abril 20, 2005

Generar un programa python autoejecutable



Para hacerlo en unix, hay que usar freeze. En windows se puede usar Py2Exe.
Es util si se va a instalar nuestra aplicacion en un entorno donde no sabemos si está el interprete de python, o incluso no va a estar.

martes, abril 19, 2005

Encontrar memory leaks en python.



Hoy he estado intentado determinar si hay un memory leak en cierto codigo python. En la siguiente pagina he encontrado la mejor referencia al respecto.

En el newsgroup comp.lang.python, he encontrado la orientacion.

He puesto un post, a ver que me dicen...

jueves, abril 14, 2005

XasaMail, una alternativa a gmail, que da hasta 4GBs de espacio.
Unas paginas de linux:
Sirvan los siguientes dos enlaces como muestra de lo que puedes encontrar en 'The Linux Documentation Project' :

Lucene

Forma parte de Apache Software Foundation, y de jakarta. Y se trata de un motor de busquedas sobre texto realizado en Java. Según JJ y JH, que lo han usado es bastante potente.
Por lo que jhe visto, aparte de texto soporta al menos los siguientes formatos: MS Word, PDF, HTML, and XML.

Tiene un portings a C++( CLucene ), ruby, phyton, .NET y perl.

Vamos, que tiene muy buena pinta.

La referencia me la paso, como no, JJ.

Bueno el ultimo link, el tutorial de lucene.

sysctl


Hoy me he encontrado con una nueva aplicacion. Del man:



sysctl is used to modify kernel parameters at runtime. The parameters
available are those listed under /proc/sys/. Procfs is required for
sysctl(8) support in Linux. You can use sysctl(8) to both read and
write sysctl data.



El fichero de configuracion es sysctl.conf.

sysctrl -a -> lista todas las variables que pueden ser cambiadas.

Me lo he encontrado al configurar /proc/sys/vm/pagecache. En este fichero hace lo mismo que /proc/sys/vm/buffermem solo que para mapeo de memoria y cacheo genérico de ficheros.

De Administer Linux on the fly:


This controls the amount of the total system memory (as a percent) that will be used for buffer memory. It
holds three values that can be set by writing a space-separated list to the file:
1. Minimum percentage of memory that should be used for buffers
2. The system will try and maintain this amount of buffer memory when system memory is being
pruned in the event of a low amount of system memory remaining
3. Maximum percentage of memory that should be used for buffers

Default setting: 2 10 60

miércoles, abril 13, 2005

pdftotext


Este producto GNU/GPL es usado por FAST en una etapa de su pipeline. Forma parte del paquete xpdf.
Las opciones usadas parason: -raw -htmlmeta -enc UTF-8 -nopgbrk.

  • -raw: hace que se usen los tags de html 'pre'. Vamos evita que todo salta en una linea sin saltos, basicamente.
  • -htmlmeta: lo que genera es una pagina html. En caso contrario es texto.
  • -enc UTF-8: se genera el texto con dicho encoding
  • - nopfbrk: evita que se genera un salto de pagina.
Si lo que queremos es general en texto, en plan legible al menos yo usaria -raw.
Si queremos texto para meterlo a un procesador de textos, entonces lo mejor es no usar -raw.

viernes, abril 08, 2005

Como todos los dias hay que aprender algo, aqui va lo de hoy: NTP - Network Time Protocol.

Modificar la shell



Hoy me he encontrado algo muy, pero que muy interesante. En mi curro, la shell que estamos usando (bash) esta modificada, de manera que guarda un log con todas las acciones que el usuario realiza en la cuenta de root, con información adicional, como la hora.

Nos ha servido para ver a que hora exactamente hemos lanzado un par de comandos.

La verdad, es una idea para tener en cuenta a futuro.
Brief thoughts on garbage, locks, and lambdas from Herb Sutter.

miércoles, abril 06, 2005

Trucos para google: En esta pagina podemos encontrar links a otras paginas interesantes sobre google como:

  • googlemania.
  • La bitacora 'trucosdegoogle'. Que todavia esta como consulta, pero en la que no se publica desde mediados del 2004.
  • Y en teoria google.dirson.com. Pero parece que ya no va.
Mas noticias calentitas... el buscador Ask Jeeves lanza su version para Español.

Una noticia de barrapunto: eGenDeveloper 2.7

Y ya para acabar un articulo donde se describe la diferencia entre el Modelo 1 y el Modelo 2 de programación con JSPs.

martes, abril 05, 2005

Tenia pendiente meter unos posts de dias atrás.

Sobre Herb Sutter


Sin dudarlo es uno de los tios mas prolíficos en cuanto a publicaciones de C++. Un gurú.

El creador de Guru of the Week (online). De muy interesante lectura (similar pero no de tanto nivel tenemos los cpptips de Allan D. Clarke).

Articulista habitual de CUJ. Acaba de dar por concluida su serie 'Conversations' (hasta la conversacion #60 disponibles online a fecha de hoy de gratis) con el número #60. Estas conversaciones son unos articulos muy interesantes (escritos junto a Jim Hyslop)

En fin, un gran aportador al C++.

Aunque sigue manteniendo su lista de distibución (es de agradecer), ahora se ha pasado a la moda blog.

Bueno, y ya para acabar este peloteo un articulo que me voy a leer ahora mismito: The Free Lunch Is Over: A Fundamental Turn Toward Concurrency in Software.

Exensiones del firefox



Nos envia Vlady la siguiente, para abrir por defecto las paginas en tabs.
También nos pasa la siguiente pagina sobre extensiones, en español