Crecimiento de la Comunidad

Como buen ingeniero que voy a ser, es importante analizar el creciemiento de la base de datos de blogschapines para ver cuando voy a necesitar mas espacio u optimizar los algoritmos detras de mi propuesta. Este análisis lo hice hace unos 15 dias pero todavia vale. A continuacion esta es la grafica de posts acumulados en la base de datos y se muestra clatamente el comportamiento del creciemiento de la base de datos:

BlogChapines-Crecimiento

Lo ke hice fue aplicar la funcion logaritmo natural al numero de post acumulados, y de estos nuevos datos aplicar una regresion lineal. Para no aburrirlos con los calculos, aqui esta la ecuación que encontre con la regresion:

EXP(5.65391 + 0.024759*X)

donde x es el numero de dias ke han pasado desde el punto de referencia, en este caso el 1/4/006 es el X=1. Para mostrar la exactitud del modelo aqui esta la grafica comparativa:

BlogChapines-Comparacion

El ajuste del modelo es muy evidente! sufientemente bueno para hacer las respectivas predicciones sobre el crecimiento de la comunidad. El promedio de espacio ocupado por post es de 434 bytes, asi que multiplicado por el numero de posts acumulados nos dara un aproximado del espacio de la base de datos. Estas son las predicciones:

 

dias

registros

espacio (bytes)

2.5 meses (actual)

77

1,920.52

806,619.80

4 meses

120

5,569.11

2,339,024.95

5 meses

150

11,704.87

4,916,044.06

6 meses

180

24,600.70

10,332,292.17

7 meses

210

51,704.49

21,715,887.89

8 meses

240

108,669.89

45,641,352.26

9 meses

270

228,396.86

95,926,680.35

10 meses

300

480,032.94

201,613,833.69

11 meses

330

1,008,908.89

423,741,734.68

1 año

365

2,399,917.69

1,007,965,430.91

Esta es la razon del porke no almacenar todos los posts de los blogs, en una 1 año tendría un 1GB en posts y ke en realidad no seria muy util alamcenarlos, porke solo los ultimos serían vistos por toda la gente y las busquedas no son muy útiles porque no se tiene el post completo. Ahora si veo la importancia de analizar los datos y utilizar regresiones lineales.

Asi que en unos dias procedere a modificar mi algoritmo de captura de posts para que solo se mantengan los ultimos 20 posts de cada blog.

2 thoughts on “Crecimiento de la Comunidad”

Comments are closed.