cada cierto tiempo mis estaciones pierden conexion al exterior incluyendo un linux

Forums: 

hace poco puse un post referente a perdida de conexion al exterior, pero habia dejado varias cosas sin resolver como probarlo con una estacion linux y ahora lo tengo en mi equipo y el problema es con todos no solamente con windows con eso descarto algun problema de virus, el asunto es que mi router es un servidor linux, hace nat con un ip fijo todo a trabajado muy bien desde hace bastante pero ultimamente me corta conexion con todo desde web y otros puertos, pero duran solo como 40 segundos y me afecta todas las estaciones, pero no pierdo conexion con el servidor puedo entrar a el directamente via ssh y puedo hacer ping a cualquier lugar del internet pero no puedo hacer nada con puertos 110, 25, 22, y muchos puertos mas practicamente todos, ya que no puedo acceder a ningun lugar sea lo que sea, en varios servidores remotos fuera de mi red tengo el 3128 abierto para mi ip publico, cuando trato de verificar si puedo hacerle un telnet a ese puerto no me responde desde las estaciones pero si funciona dentro del servidor osea el servidor no pierde conexion al internet solo mi red, pero cuando pasa un tiempo empieza a responder todo dura de 40 a 1 min aprox, todo se cae, pero lo raro es que si voy por ssh al servidor desde mi estacion redhat puedo hacer todo desde ahi significa que es mi linux en la parte lan la que falla pero no es la comunicacion fisica de la lan sino que todo el iptables se cae deja de funcionar no tengo nat se me muere totalmente y se viene incrementando ultimamente pero no tengo mensajes en el log de algun error nada, sospechaba de reglas en el iptables pero las puse practicamente sin nada solo tengo el nat para todo el mundo y funciona por horas pero a veces se muere y todas las pc dejan de responder incluso un redhat que tengo en uso dejan de hacer uso del nat es como si mi servidor me castigara y por arte de magia se compone solo. lo extraño es que no puedo hacer nada no puedo navegar a ninguna pagina internacional pero cuando es nacional funciona muy bien si hago un telnet a una pagina nacional desde mi estacion responde pero si lo hago a una internacional no da nada pero ojo si voy adentro del servidor si puedo hacerle telnet a cualquiera. ya agote recursos y me tiene loco este problema no se que mas puedo hacer es rarisimo me gustaria oir alguna opinion y algun consejo ya que estoy quemado con esto.

Extremadamente raro

Imagen de Monkito

Opción 1)
haz probado cambiar las tarjetas de red de tu server? o tal vez si el "cuelgue" se debe al exceso de tráfico

Opción 2)
Otra forma de denegar servicios por un instante es el envío de paquetes arp con información falsa, (eso se hace con nemesis), y posiblemente alguien en en mismo rango de tu eth0 (salida a internet) , le esté informando a la eth0 que el gw ya no tiene la mac que solía sino otra falsa. y como la tabla arp se refresca a cada rato esto solo ocurre por un instante aprox 1 min.

Si es ese el problema prueba lo siguiente:
cuando haya internet pon "arp" como root desde tu server y cuando no haya tambien, la ip de tu gw posible mente tenga la mac cambiada en tu tabla. eso se soluciona agregando esntradas estáticas a la tabla arp "arp -s ip_del_gw mac_real_del_gw"

Nos avisas como te fue..

Cogito Ergo Sum

------------
counter.li.org

Cogito Ergo Sum

voy a revisar gracias te informo que sucede cuando se me caiga

Imagen de juandarcy2000

el internet, pero me llama la atencion que el servidor no pierde el internet el server desde el ssh hace todo incluso si tengo el kde adentro de el carga a la perfeccion todas las web sin problema incluso para descartar que se cargue del cache del firefox de linux cargo paginas que jamas habia entrado y las carga bastante bien, otra cosa bien rara, fue que ayer para verficar unos datos en el bios reinicie el servidor y al inicarlo no tenia internet en la red, el server estaba bien pero la red estaba caida, lo que me llamo la atencion y fue que buscando el porque deje de navegar encontre que cambiando de dns hacia los dns de mi proveedor si navegaba pero con el dns de mi server no y revise el servicio estaba apagado y le di un chkconfig y estaba todo en off raro porque nunca lo habia apagado ese servicio hice un history |grep named y no tenia en ningun lado ese comando para apagar todo los niveles de corrida de named al inciarlo todo volvio a la normalidad, raro le ejecute un chkrookit y no tenia problemas revise el log para ver si alguien habia entrado y nada ademas hace mucho tiempo me puse una clave muy sencilla en mi server, error de principiante y cuando me lo accesaron algun programa de fuerza bruta me salia el ip de la persona que habia entrado y en ese momento tenia muchos errores de iptables reglas con redes desconocidas, bueno al final le di formato y lo reinstale todo, lo que si veo es un error al iniciar la tarjeta de red me dice esto

#dmesg

PCI: Found IRQ 9 for device 0000:00:09.0
e100: eth1: e100_watchdog: link up, 100Mbps, full-duplex

eso pasa cada vez que inicio el servicio de red
pero voy a revisar talvez tenga algun estrella haciendo negacion en mi lan y me bote el server por esa razon me deja de navegar las estaciones.
pero para continuar voy a revisar bien mi arp al momento de navegar y ver si alguien esta de estrella colisionando con el server talvez estan conectando algun equipo con la ip privada del server y lo estan botando. lo raro es que si lo botaran no podria entrar a el por ssh y si entro perfectamente. ahi te cuento como me va monkito. gracias

este mensaje me da el dmesg

Imagen de juandarcy2000

revisando el sistema con el comando dmesg veo este mensaje y dura casi el mismo tiempo que me deja sin internet el servidor
ya busque en google pero solo hablan de problema con el kernel 1.2 y yo tengo centos 4.4 con kernel 2.6.9-42.0.3.EL.
que podria ser?
sera esto el causante de mi caida con el internet.

ip_conntrack version 2.1 (3840 buckets, 30720 max) - 356 bytes per conntrack
ip_tables: (C) 2000-2002 Netfilter core team
ip_conntrack version 2.1 (3840 buckets, 30720 max) - 356 bytes per conntrack
spurious 8259A interrupt: IRQ7.
ip_tables: (C) 2000-2002 Netfilter core team
ip_conntrack version 2.1 (3840 buckets, 30720 max) - 356 bytes per conntrack
UDP: bad checksum. From 201.81.245.162:34072 to 65.9.15.15:39601 ulen 36
UDP: bad checksum. From 201.81.245.162:34072 to 65.9.15.15:39601 ulen 36
UDP: bad checksum. From 201.81.245.162:34072 to 65.9.15.15:39601 ulen 36
UDP: bad checksum. From 201.81.245.162:34072 to 65.9.15.15:39601 ulen 36
UDP: bad checksum. From 201.81.245.162:34072 to 65.9.15.15:39601 ulen 36
UDP: bad checksum. From 201.81.245.162:34072 to 65.9.15.15:39601 ulen 36
UDP: bad checksum. From 201.81.245.162:34072 to 65.9.15.15:39601 ulen 36
UDP: bad checksum. From 201.81.245.162:34072 to 65.9.15.15:39601 ulen 36
UDP: bad checksum. From 201.81.245.162:34072 to 65.9.15.15:39601 ulen 36
UDP: bad checksum. From 201.81.245.162:34072 to 65.9.15.15:39601 ulen 36
UDP: bad checksum. From 201.81.245.162:34072 to 65.9.15.15:39601 ulen 36

ip_tables: (C) 2000-2002 Netfilter core team
ip_conntrack version 2.1 (3840 buckets, 30720 max) - 356 bytes per conntrack
ip_tables: (C) 2000-2002 Netfilter core team
ip_conntrack version 2.1 (3840 buckets, 30720 max) - 356 bytes per conntrack
ip_tables: (C) 2000-2002 Netfilter core team
ip_conntrack version 2.1 (3840 buckets, 30720 max) - 356 bytes per conntrack
ip_tables: (C) 2000-2002 Netfilter core team
ip_conntrack version 2.1 (3840 buckets, 30720 max) - 356 bytes per conntrack
ip_tables: (C) 2000-2002 Netfilter core team
ip_conntrack version 2.1 (3840 buckets, 30720 max) - 356 bytes per conntrack

caida intermitente de conectividad

Imagen de acl

El mensaje es claro: estan llegandote paquetes de UDP deformados. Hay alguna razon para correr algo en esos puertos en UDP? Yo recomendaria revisar si tus reglas de iptables bloquean paquetes con ese direccionamiento y si no, agregar algunas que lo hagan.

Si el problema persiste, entonces no es ese el culpable.