Wordprexy.com y de como clonar todo WordPress.com

Si aún no se han enterando, Wordprexy.com es un sitio que está duplicando el contenido de todos los blogs hospedados en WordPress.com, sin pedir permiso alguno agregando anuncios, duplicando el contenido respecto a buscadores y quedándose con el tráfico de los blogs que han duplicado.

La historia detrás de Wordprexy y del por qué están copiando todos esos blogs, es debido al bloqueo que Turquía le ha impuesto a todo WordPress.com bajo alegatos de que es muy facil crear un blog difamatorio en contra de una persona muy influyente (supongo yo) que presento su queja ante un tribunal y este ordenó el bloqueo de todos los blogs hospedados acá, limitando así la libertad de expresión en aquel país.

Según declaron ellos, no están tratando de robar contenidos si no su intención es evadir el blogqueo impuesto por Turquía, y los anuncios que muestran son solo para pagar las cuentas de sus servidores. Todo creo que estaría bien si no mostrarán anuncios en los contenidos y esfuerzo de otros.

Si bien mantener un sitio con 12 millones de páginas vistas, como aseguran, es algo un tanto difícil; no creo que sea tan difícil pagar los $20 que les costaría el primer año de hospedaje en Dreamhost (si son pilas y buscan descuentos), quienes son los que dan el hosting según se ve en el registro whois del dominio (en la configuración de los nameservers).

A muchos no nos gustan los anuncios en los blogs, peor aún si vemos que alguien más toma el contenido que hemos escrito y se gana algunas monedas extras cuando ni siquiera nosotros podemos ganarlas en WordPress.com. A pesar de que hay una buena intensión en la idea, sigo viendo a Wordprexy.com como otro pinche scrapper/spammer aprovechado. Para mí que ellos deberían detectar la IP de donde viene el visitante, si es de Turquía le presentan la página espejo, sino lo fuera deberían de redirigir al blog legítimo ya que no se vería afectado por el bloqueo y no se afecta al autor original del blog con la perdida de tráfico.

Algo que me pareció bastante curioso fue ver que aquellos blogs que han comprado Custom CSS no muestran correctamente los estilos y los anuncios de adsense, después de todo no clonaron todos los blogs correctamente. Aquellos que tengan un dominio para su blog, pues no perderán todo el tráfico ya que solo están remplanzando *.wordpress.com por *.wordprexy.com, así que aún pueden ganar algunos entrantes adicionales.

Mi blog está duplicado, ¿Qué puedo hacer?

Si no estas de acuerdo con las acciones de Wordprexy.com y sientes que duplicar tu blog no es legar, afortunadamente no todo está perdido. Yo mismo tuve mis reservas de las intenciones de esta gente, así que de todos modos les escribí en el formulario de contacto que ellos proveen y solicite que dieran de baja mi blog en su proxy:

Hi guys,
I’ll ask you to stop mirroring my blog: jaroche.wordpress.com in your servers, I don’t wanna get banned by google and other search engines by your duplicate content; and as I never have been asked for this, now I wanna you stop this.

Thanks for your collaboration,
–Javier Aroche

Al cabo de unas horas la copia de mi blog estaba fuera, mostrando el mensaje que yo les escribí. Otros amigos les han escrito y wordprexy los ha elimando rápidamente, después de todo hay buenas intenciones. Si tienes dudas de si esto es legal o no, yo te recomiendo escribirles (no es necesario que des tu dirección de correo por aquellas) y solicitarles de buena manera que den de baja el espejo de tu blog, parece que atienen estas solicitudes sin mayor problema.

Lo mejor sería que el mismo WordPress.com bloqueara el acceso de los servidores de Wordprexy.com e impidiera que sigan copiando los contenidos de los blogs acá hospedados, pero según me contestaron en los foros y via correo electrónico dicen que esto está fuera de sus manos y que en todo caso hay que escribir a Dreamhost con todo y cartas DMCA solicitando el respectivo cierre. Pienso que WordPress.com podría bloquear la clonación de blogs al limitar las IPs de los servidores involucrados, pero parece que no quieren meterse en esos asuntos…. Quizás sea hora de escribir a Dreamhost.

¿Wordpress.com hackeado si o no?

Inicialmente varios bloggers pensaron que se trataba de algun hack a Worpdress.com o alguien del equipo facilito el acceso a las bases de datos. Pero como se lo mencione a David, el tamaño de WordPress.com es enorme. Tienen unas 4,096 bases de datos distribuidas en 3 DataCenters, con más de un millón de blogs y muchos más miles de posts, toda esa información no la copias de la noche a la mañana y la pones en un hosting como Dreamhost.

Ellos deben estar usando algun tipo de CDN o script que les facilite copiar los contenidos generardos por WordPress.com y hacerlos pasar a nombre Wordprexy.com con algunos anuncios de Adsense; es lo que supongo por el cache que están manejando en las páginas y por los problemas con el Custom CSS que algunos blogs tenemos comprado.

En fin, mientras unos apoyan la protestas, otros ven como su trabajo es duplicado; yo por mi parte ya solucione el problema y veo que cualquiera lo puede hacer basta un mensaje para que te den de baja; aunque sigo pensando que después de todo van a sacar buenas monedas si tienen tanto tráfico como dicen tener. Google como siempre ya los está indexando, casi 20,000 páginas hasta el momento.

Actualización 24 de Septiembre: Según me comentan, Wordprexy.com ha eliminado la publicidad en todos sus copias, seguramente debido a la lluvia de críticas de los últimos días.

Etiquetas de búsqueda: , , , , , , , , , ,

Agrega tu comentario

Lección del día: Si quieres ser indexado, responde rápidamente

Hace semanas atrás logre verificar mi blog de WordPress.com con Google Webmaster Tools, desde entonces tengo activada la opción para que Google indexe mi blog, tan pronto como pueda ya que los servidores respondieron a buena velocidad.

En las ultimas semanas WordPress.com ha tenido problemas con sus DataCenters, reduciendo considerablemente el tiempo de respuesta de los servidores. Como consecuencia a Google le toma más tiempo indexar el sitio. La siguientes son las gráficas de Webmaster tools, acerca de la velocidad de indexado:

Velocidad de indexado segun Google

Es evidente que cuanto más tiempo toma indexar, menos páginas revisa. Probablemente esto sea más sentido común, pero siempre hay que tenerlo en cuenta: Si tu servidor no responde rápido, Google no invertirá más tiempo para indexar tu sitio; no importa si has escogido el indexado rápido, simplemente si no puedes responderle, se irá.

No se que tanto afecte al posicionamiento en general la velocidad del servidor, pero lo que si es cierto es que los contenidos más frescos tardarán más en aparecer en el índice. Siempre intenta mantener el tiempo de respuesta en valores bajos.

Etiquetas de búsqueda: google, webmaster tools, wordpress.com, web crawl, hosting

Agrega tu comentario

Minimizando el Login de las cuentas de Google

Siempre he pensado que si algo no te gusta como es, debes intentar ponerlo a tu gusto; es por ello que inspirado en el trabajo del estilo para Stylish Gmail logon – minimized , he creado un estilo que minimiza el Login de los demás servicios que Google, la razón: contienen demasiada información que se muestra una y otra vez, alejándose de su objetivo principal: Iniciar Sesión en el servicio.

Con este estilo que he creado, el inicio de sesión de Google Analytics se convierte de esto:

Estilo Original de Google Analytics

A esto:

Estilo Modificado de Google Analytics

La diferencia es evidente, todo tan limpio y directo a lo que interesa. Esta modificación funciona con:

  • GMail
  • Google Reader
  • Google Analytics
  • Google Webmaster Tools
  • Google Docs
  • Google Notebook

Si te agrada esta modificación , puedes bajar este estilo desde usersyles.org, el único requisito es tener instalada Stylish, la extensión para Firefox.

Etiquetas de búsqueda: design, , , , , , ,

Agrega tu Comentario

Splogs en Blogger y WordPress.com; y Adsense en WordPress.com

En Guardian Unlimeted ha publicado un artículo de por qué los sploggers escogen Blogger en vez de WordPress.com para crear sus splogs. Ambas plataformas son gratuitas y permiten crear un blog en pocos minutos, pero en resumen la diferencia real está en:

  • WordPress.com es mucho más cerrado, pequeño y reciente que el viejo Blogger. No me sorprendería que los spammers tengan sus herramientas para crear decenas de blogs en pocos minutos dentro de Blogger. Incluso sé de casos en los cuales los sploggers logran tomar blogs legítimos y los convierten en splogs (probablemente capturando la contraseña de sus dueños).
  • El equipo de WordPress.com responde rápidamente ante las denuncias de incumplimiento de los Términos del Servicio. Yo puedo dar fe de ello, he reportado unos 40 blogs y casi todos han sido eliminados en pocas horas.
  • La más importante: WordPress.com no acepta Adsense (por ahora). En Blogger tienes mayor control sobre la plantilla y puedes incluir Java Script para incluir la publicidad de Google Adsense; en WordPress.com apenas se puede modificar la hoja de estilos de cada plantilla por un costo adicional.

Según datos de Guardian Unlimeted tres cuartos del total de blogs en Blogger son splogs, mientras que en WordPress.com la cifrá es del 1% del total.

Adsense en WordPress.com

Matt ya ha declarado que pronto permitirán tener adsense en los blogs de WordPress.com como una mejora de pago. Del mismo artículo de Guardian Unlimeted, Matt ya revelo cuanto costará dicha mejora:

Mullenweg plans to allow users to add Google’s AdSense to their blogs. But will this open the floodgates to sploggers? Part of the WordPress brand is high-quality blogs, and we’re not going to do anything to damage that. We have an extraordinary number of really high-quality blogs, and some of them could do quite well with AdSense, says Mullenweg. We plan to make it a paid upgrade, at least $15 (£7.45) a year per blog, and our policies on splogs or spammy content aren’t going to change.

Precio para tener anuncios en tu blog: $15 al año por blog, o $1.25 al mes por blog, es mucho más barato que cualquier hosting decente que seguramente no se compara a los servidores de WordPress.com.

Es irónico, los blogger quieren que les paguen por mostrar anuncios, no pagar para mostrarlos xD. Yo sigo pensando que esto de premitir Adsense es una llama para que los sploggers se vengan como aves de rapiña, por si no era suficiente ya, el que busquen aprovechar el tráfico de las páginas de tags y el posicionamiento que se puede lograr en aquí. WordPress.com dejará de ser virtualmente libre de spam :S

Mucha gente ha pedido que les permitan hacer dinero con sus blogs: ¿si blogger lo permite, por qué wordpress.com no?. Algunos hasta en tono molesto reclaman por qué Matt hace dinero con sus blogs y ellos no. Yo aún no he visto anuncios de Adsense en mi blog, otros si los han visto en el suyo; ahora me gustaría una opción para mantener mi blog libre de anuncios… ni modo el precio de la gratis.

Actualización:

WordPress.com ya actualizó la páginas de características donde ya hablan abiertamente de los anuncios en los blogs y la futura mejora de pago para mostrar Adsense en el blog:

Wordpress.com y los anuncios

Vía That Girl Again, Matt confirma que:

The official way to turn off or otherwise control ads will be with the forthcoming Adsense upgrade.

Aunque Custom CSS debería servir para ocultar Adsense xD, hay un selector CSS publicado por allí pero no estoy seguro de que funcione… mejor les pregunto a los de WP.com para que no me caiga el ToS.

Etiquetas de búsqueda: , , , , ,

Script para buscar dentro de Google Reader

Siempre ha sido un poco irónico que Google Reader siendo de propiedad un buscador, no tengo opción a buscar algo dentro de los feeds. Ahora con este script para la extensión Greasemonkey de Firefox, ya puedes hacerlo:

Buscador integrado en google reader

Utiliza Google Co-op para las búsquedas, así que solo funciona al ver un solo feed… que ya es bastante.

Etiquetas de búsqueda: , , , , ,

Usando Google Webmasters Tools en WordPress.com

Google Webmasters Tools es una herramienta que te permite conocer algunos detalles técnicos de como google indexa un sitio web en particular, estadísticas de links entrantes y posiciones en los resultados de búsqueda, entre otras cosas que te ayudan a hacer tu sitio más amigable con Google.

Para tener acceso a todas las opciones de esta herramienta, debes demostrar que eres el propietario del sitio. Esto se hace creando un archivo con el nombre que google te indique, o bien agregando un meta tag la página. En WordPress.com no es posible subir archivos al raíz del blog o agregar meta tags; pero dado que Google solo requiere que exista una dirección como blog.wordpress.com/google1234566789.html para dar tu sitio por verificado, si es posible conseguir el estatus de verificado para los blogs acá en wordpress.com

Wordpress - Page Slug

Todo consiste en crear una nueva página con el titulo que mejor te parezca, pero definiendo el page slug (o subtitulo de la página, como ha sido traducido al español) al código que Google te indique. Esto permite que exista la url blog.wordpress.com/google1234566789.html y que google te acceso a todas las opciones.

El haber validado mi blog me ha permito subir la velocidad de indexado a rápido, ahora Google se da una vuelta por acá una vez al día :D, antes era cada 3 o 4 días. La opción de indexado rápido depende del tiempo de respuesta del servidor a las peticiones de la araña de Google; como en WordPress.com el servidor responde en menos de 1 segundo (promedio), Google cree que el servidor puede manejar un trafico adicional al hacer más frecuente el indexado:

Frecuencia del Indexado de parte de Google

Algo que los clientes de Dreamhost no podemos esperar dado que la mayoría de sitios responden en 2 a 5 segundos, por eso no me voy de acá :mrgreen:

Etiquetas de búsqueda: , , herramientas,

visearch.com, busquedas web y comandos vi

Para el listado de páginas geeks, me he encontrado con Visearch.com que es buscador bastante peculiar. Basado en google, utiliza solamente comandos del legendario editor *nix Vi para realizar búsquedas, navegar por los resultados y hacer otras operaciones raras con los mismos.

Visearch.com - busquedas con comandos vi

Todo muy AJAX y bastante usable 😉 Solo no muy me gusto que tenga frames, pero bueno. Para navegar por los resultados basta con usar las flechas del teclado y bien la tecla j para bajar y k para subir. Puedes eliminar un resultado con dd, agregar comentarios con i y guardarlos con :w 😆 . Cuando llegas al final de la página de resultados, automáticamente cargará los siguientes 10 resultados solo hay que esperar un instante.

Entretenido la verdad, al principio requiere algo de disciplina para no usar el mouse. Algo raro es ver los resultados de google basados en el IP de visearch.com, por eso veras que los resultados salen muchos sitios en ingles primero. Por cierto también tiene blog oficial, pero desde el año pasado no publican nuevas notas 😦

Actualización 22 de Septiembre: Según un mensaje en la página de visearch, este proyecto ha muerto… ahora redirigen las búsquedas a snap.com:

visearch.com muerto

Etiquetas de búsqueda: buscadores, internet, editor vi, geek, google

El avance Google Reader

A lo que comenta ayer Lorelle, ahora en WordPress.com ya toman en cuenta a Google Reader (técnicamente conocido como FeedFectcher) para las estadísticas de mi feed:

Google FeedFetcher

Antes la parte de Google Reader en mi caso, quedaba sumado a la parte Navegadores. Ahora los porcentajes andan así:

  • Navegadores, 42.5%
  • Google FeedFetcher, 28.7%
  • Bloglines, 11.5%
  • Netviles, 2.3%
  • El resto con el 1.1%

Me huele a que Bloglines ya se la comió, jejejeje. Bueno ahora, lo que falta es que Google mejor un poco más su Reader, pero que varias veces me pasa que se queda colgado el condenado, tengo que cerrar sesión y volver a entrar.

Etiquetas de búsqueda: , , , , , ,

rel=”nofollow”, ¿ignorado por Google?

Justamente hoy que pruebo el nuevo agregado de google’s webmaster tools, para descubir tus links entrantes, me doy cuenta de como Google ignora (¿?) el atributo rel=”nofollow” en los enlaces. No me lo estoy inventado, me lo dice el mismo Google. Resulta que hace algún tiempo atras, deje este comentario en DesdeGuate, con un enlace hacia, blogschapines.com/top.php. Como DesdeGuate es un blog gestionado con WordPress, el mismo se encarga de agregar el nofollow a todos los enlaces en los comentarios.

Vean los enlaces externos hacia blogschapines.com/top.php que muestra Google:

Enlaces externos

¿WTF? Se supone que si el elace lleva rel=”nofollow”, automaticamente los buscadores Google no van a tomar ese enlace ¿no? Según comprendo si lleva dicho atributo no debería de contar como enlace entrante hacia el sitio en cuestión. Según la definición en microformats.org:

By adding rel="nofollow" to a hyperlink, a page indicates that the destination of that hyperlink SHOULD NOT be afforded any additional weight or ranking by user agents which perform link analysis upon web pages

¿Estaré bien? ¿O es que el tiro va a que si es un enlace hacia determinado sitio al final de cuentas, pero sin trasferencia de PageRank? Suena razonable, pero el que aparezca en Webmasters Tools, me da mala espina 😦 .
¿Será este otro punto a favor de No al rel=”nofollow”?

Etiquetas de búsqueda: ,