Los papeles de Bárcenas

La publicación por parte del diario El País de los papeles de Luis Bárcenas, tesorero del PP durante 18 años, ha tenido estos días una gran repercusión mediática.

Me recuerda mi hermano Ramón, brillante abogado del ICAM, que hace algo más de un año publiqué un post acerca de la ley de Benford y su aplicación a la detección de fraude en listas de datos socio-económicos.

La ley de Benford afirma que la frecuencia del primer dígito en una lista de datos obedece a una distribución logarítmica. La aplicación a la detección de fraude se basa en suponer que quien maquilla los datos tiende a distribuir los números uniformemente. Una simple comparación de la frecuencia del primer dígito en los datos con la distribución esperada según la ley de Benford debería mostrar cualquier resultado anómalo.

Así que me he puesto manos a la obra con los datos del diario El País para someterlos a un test de Benford. Me he centrado en los 84 asientos que figuran en el debe desde julio de 2002 hasta diciembre de 2008. Las frecuencias del primer dígito según los papeles de Bárcenas y el valor esperado según la ley de Benford aparecen en la siguiente tabla.

1º dígito Bárcenas Porcentaje Benford
1 42 50.0% 30.1%
2 8 9.5% 17.6%
3 10 11.9% 12.5%
4 3 3.6% 9.7%
5 3 3.6% 7.9%
6 11 13.1% 6.7%
7 2 2,4% 5.8%
8 0 0.0% 5.1%
9 5 5.9% 4.6%

La gran discrepancia entre las frecuencias según Bárcenas y el valor esperado según la ley de Benford lleva a una clara conclusión: Luis Bárcenas miente.

Actualización 08 febrero 2013: La siguiente tabla refleja la frecuencia del primer dígito en la contabilidad del PP desde 2008 hasta 2011. Gracias a Darwin por su aportación.

1º dígito Frecuencia Porcentaje Benford
1 68 30.22% 30.10%
2 40 17.78% 17.61%
3 40 17.78% 12.49%
4 23 10.22% 9.69%
5 10 4.44% 7.91%
6 16 7.11% 6.69%
7 17 7.56% 5.80%
8 7 3.11% 5.11%
9 4 1.78% 4.58%

Actualización 09 febrero 2013: Nigrini [Digital analysis using Benford’s law. Vancouver, BC: Global Audit Publications (2000)] recomienda para el análisis de Benford una medida llamada mean absolute deviation (MAD). Este test calcula la media de las nueve diferencias absolutas entre las proporciones empíricas de un dígito y las esperadas por la ley de Benford, es decir,

\displaystyle{{\rm MAD}=\frac{1}{9} \sum_{d=1}^9 |P(d)-P^e(d)|.}

Nigrini recomienda las siguientes pautas para medir la conformidad de los primeros dígitos con la ley de Benford. MAD desde 0 hasta 0.004 implica conformidad estrecha; desde 0.004 hasta to 0.008, conformidad aceptable; desde 0.008 hasta 0.012, conformidad marginalmente aceptable; y finalmente, mayor que 0.012, no conformidad. Los valores MAD=0.062 para Bárcenas y MAD=0.015 para la contabilidad del PP implican no conformidad en ambos casos.

Referencia. Bartolo Luque, Lucas Lacasa, The first-digit frequencies of prime numbers and Riemann zeta zeros, Proceedings of the Royal Society A (2009) 465, 2197–2216.

Acerca de Miguel Lacruz

Gijón, Asturias, España, 1963
Esta entrada fue publicada en Miscelánea. Guarda el enlace permanente.

165 respuestas a Los papeles de Bárcenas

  1. Antonio dijo:

    He juntado todas las cantidades que proporciona el mundo desde el 8 de enero del 97 hasta diciembre del 2008:

    http://pastebin.com/pXTFS7Sc

    En esa lista de cantidades se incluyen tanto las que van tanto en Euros como en Pesetas, independientemente de si son de entrada o de salida.
    El test de Bendford originalmente se aplica contado el número de esas cantidades que empiezan con cada dígito concreto, según:

    https://en.wikipedia.org/wiki/Benford's_law#Accounting_fraud_detection

    Estas son las estadísticas que me salen a mí para cada dígito:

    Digito Cantidades
    1 172
    2 113
    3 86
    4 41
    5 40
    6 70
    7 14
    8 7
    9 18

    Igual me he equivocado en alguna cuenta, pero esos datos se ajustan más a una distribución estadística de datos reales, que los datos que has obtenido tú. Un saludo.

  2. Antonio,
    1º Yo he considerado solamente asientos en euros, por eso van desde julio de 2002 hasta diciembre de 2008. Al mezclar euros con pesetas se falsea la estadística.
    2º Yo he considerado solamente asientos en el debe; al mezclarlos con el haber también se falsea la estadística.
    3º Tus estadísticas no valen para un test de Benford por lo que he comentado.
    Saludos,
    Miguel

    • mvicmoure dijo:

      Mezclar unidades de medida no afecta al test Benford, ya que este sólo depende de la base en la que estén los números, y de que ambas distribuciones mezcladas sigan una distribución de Benford. Valores en euros y pesetas, escogidos aleatoriamente, las siguen, con lo cual sería correcto mezclarlos.

      De todas formas, sin una medida concreta de cuánto se ajusta a la distribución (Pearson Chi-Square, o algo así) y datos empíricos de cuánto se debería desviar para considerarlo falsado, esto no tiene sentido. Aún así, me parece bastante evidente que esto es una distribución Benford. Normalmente, el fallo que suelen tener los falsificadores que no lo tienen es poner sus números de acuerdo a una distribución uniforme, no el no poder simular correctamente una Benford.

      • La ley de Benford es invariante frente a cambios de escala; por lo tanto se debe cumplir ya sea en euros o en pesetas, pero no se pueden mezclar datos en unidades distintas, porque según ese criterio podríamos seleccionar 84 unidades monetarias distintas, lo cual es un sinsentido.

        Sin entrar en una medida estadística de la desviación respecto a la ley de Benford, es evidente que hay una gran discrepancia desde un punto de vista cualitativo.

      • A Miguel Lacruz,
        Si las cantidades en euros por si solas cumplen la ley de Benford, y las cantidades en pesetas tambien la cumplen, obviamente si las juntamos también la van a cumplir. Por eso mismo mezclar 2 o 1000 divisas no supone ningun problema

      • warmize dijo:

        Sí que afecta: 100.000 pesetas (1) pasaron a ser 600 euros (6). Fíjate en el gran número de 6 en tu estadística.
        También habría que considerar que cuando se pasó de pesetas a euros se tradujo directamente unas cantidades a su equivalente pero cuando nos hemos acostumbrado a la nueva moneda hemos redondeado. Por ejemplo, 150.000 pts (1) pasaron a ser 900 euros (9) y ahora todos hablaríamos de 1000 (1) o 1500 (1) euros para importes de equivalencia similar (debido a la inflación).

  3. ramon lacruz dijo:

    Miguel, muchas gracias por el comentario,
    un abrazo,
    RAMON

  4. Conrado Carretero dijo:

    Con 84 puntos un test de Benford no es estadisticamente significativo. En todo caso, el hecho de que haya un pico en el “1” (50% de ocurrencias) ya es un buen sintoma de que la distribucion es mas proxima a una de Benford que a una distribucion normal.

    La interpretacion de su analisis no tiene ningun fundamento estadistico.

    Saludos

    • Conrado,
      Precisamente el pico del 50% muestra una gran discrepancia con el 30.1% esperado por la ley de Benford, y esto es bastante significativo aunque el conjunto de 84 datos no sea muy grande.
      Saludos,
      Miguel

      • Francisco C. Ceballos dijo:

        Estadisticamente significativo por que test?… acabamos de aplicar un Chi cuadrado a los datos… y da no significativo… No hay razones para sospechar que los datos se desvian de una distribucion de Benford!!!. Por favor, Miguel, especifica los analisis y los resultados… hagamos un peer review!

      • Francisco, pues si tienes la amabilidad, le haces un test de Kolmogorov-Smirnov y nos cuentas los resultados.

      • Francisco, si sigues el hilo de discusión, más abajo Patillotes dice que “con los datos en pesetas y euros la hipotesis de que sigue la distribucion observada por Benford es totalmente rechazable (solo se aceptaria a un 1e-11 de significación).”

  5. Ramon dijo:

    Miguel gran entrada. Dejando de lado apreciaciones como que quizás los datos no son suficientes para decir nada seguro y que haría falta un análisis estadístico más profundo, mi duda es la siguiente. Entiendo que la ley de Benford es aplicable siempre y cuando los datos que analizamos vengan determinados en cierto modo por sucesos que tienen su propia dinámica, es decir, que siguen una serie de leyes internas. En el caso de las finanzas entiendo que pueda ser aplicado al falseo de datos de por ejemplo valores del mercado en la bolsa, sin embargo, en la contabilidad de un partido, que entiendo que se basa en las donaciones de particulares y no tanto en la dinámica de un mercado, realmente todos los datos no podemos asegurar que surjan de manera natural. Lo que quiero decir es que hasta donde entiendo, la ley de Benford ayuda en esos casos donde los números siguen la tendencia que tengan que seguir (ya sea valores de mercado…) y donde un intento de falsear los datos llevara a que la distribucion no sea la esperada y por lo tanto no estoy tan seguro de que sea aplicable a la contabilidad de un partido.

    • Ramón,
      La ley de Benford es aplicable a listas de datos socio-económicos que cumplan la premisa de oscilar entre varios órdenes de magnitud. Esa premisa se cumple con la contabilidad de Bárcenas, porque las cantidades oscilan desde la centena hasta los cientos de miles de euros.
      Saludos,
      Miguel

  6. AsVHEn dijo:

    “La gran discrepancia entre las frecuencias según Bárcenas y el valor esperado según la ley de Benford lleva a una clara conclusión: Luis Bárcenas miente.”
    Con dos cojones y un palito claro que sí, que valen más que dar el margen de error y el nivel de confianza…

    • Tienes razón en que se podría haber hecho un análisis más profundo, como un test chi cuadrado para medir la discrepancia entre la distribución de Bárcenas y el valor esperado según la ley de Benford. Además, decir groserías le da más contundencia a tus argumentos.

      [Editado a las 22:30 Más abajo migeruet ha hecho un test chi cuadrado que indica que los datos de Bárcenas no obedecen una distribución de Benford.]

      • AsVHEn dijo:

        Las palabras malsonantes no quitan razón a ningún argumento, son una forma de expresión, las estadístisticas mal hechas sí. No necesitas realizar ningún análisis más profundo cuando el básico ya contradice tu conclusión. A parte de que la ley de Benford si se cumple para la unión aleatoria de elementos de otras “colecciones de Benford”, y aunque no fuera así siempre se podría pasar pesetas a euros para tener una muestra más decente.
        Pero aún con una muestra de 84 individuos, si tratamos la frecuencia de cada dígito por separado, tomamos un nivel de confianza usual del 95% y aceptamos un error suficiente para que la muestra sea tan escasa como 84 (en el caso del “2” por ejemplo debemos tomar un 8.13% de margen de error dado que el nivel de heterogeneidad nos lo da la propia ley de Benford y es del 17.6%, estando dentro del intervalo de confianza, ya que 9.5 + 8.13 > 17.6), no daría que solo se salen del intervalo de confianza de cada dígito, los valores para el “1” y el “8”, lo cual dista mucho de ser matemáticamente una clara conclusión (Lo cual es la razón que me ha hecho llegar aquí, ya que es noticia en periodicos y estaba más convencido de que sería fantasía periodística y no mala matemática).

      • Jose GJ dijo:

        No lo entiendo. A ver si me puedes aclarar una duda. Yo creo que no es esperable que los datos se ajusten a una distribución de Benford si el que asigna las cantidades es un ser humano, con independencia de que los datos oscilen en varios órdenes de magnitud ¿no? Es decir, si yo tengo una empresa pequeña con 15 empleados y a lo largo de varios años les pago a cada uno un sueldo diferente, pero fijado por mi de antemano, (cumpliendo lo de los órdenes de magnitud), no esperaría el ajuste a la distribución de Benford y por tanto no consideraría aplicable el test para comprobar si he falsificado la contabilidad. Si por el contrario, el sueldo lo fijan múltiples factores y no yo (mercado, coste de la vida, dividendos, etc.), entonces sí sería esperable. ¿Se cumple en este caso? Esa es mi duda.

        Sacado de la wiki:
        “Distributions that would not be expected to obey Benford’s law:
        – Where numbers are assigned: e.g., check numbers, invoice numbers
        – Where numbers are influenced by human thought: e.g., prices set by psychological thresholds ($1.99)
        – Accounts with a large number of firm-specific numbers: e.g., accounts set up to record $100 refunds
        – Accounts with a built-in minimum or maximum
        – Where no transaction is recorded”

        Otra duda. En caso de ser correcto tu ejercicio ¿demostraría que Bárcenas a falseado los datos o que los datos son falsos? Es que creo que es una conclusión muy precipitada decir que los datos son falsos. Si el falseamiento consistió en omitir siempre 2-3 nombres/asientos, entonces el test demostraría falseamiento de datos, pero no que los datos que hay en la lista sean falsos (es un matiz importante). En todo caso, yo no creo que el test sea aplicable en este caso porque no es esperable de entrada que se ajuste a la distribución de Benford naturalmente.

      • Quirce dijo:

        ¿Chi cuadrado? migeruet no es estadístico ¿verdad? Menos mal que la propia aplicación estadística que usa le dice que el test “puede no ser adecuado”. Las aplicaciones informáticas siempre tan correctas. ¡De hecho es espantosamente inadecuado!

  7. Yo tengo una duda. En una contabilidad de este tipo, el debe suele contener pagos periódicos de igual cuantía. ¿Tiene sentido hablar la Ley de Benford? Entiendo que si en una empresa hay 20 curritos que cobran 1200 euros al mes y un jefe que cobra 3000 (aquí no hay gastos de luz ni nada de eso) las ocurrencias van a ser 20 unos y 1 tres (mensualmente), ¿no? Luego si hay gastos no periódicos añadirán una variabilidad a las frecuencias, pero básicamente habrá siempre un pico en el uno.

    De tener escoger entre debe y haber, yo creo que sería más significativo para “determinar” su falsedad o no coger el haber (las donaciones) que el debe, fuertemente determinado por pagos periódicos de similares cuantías por ser “nóminas” en su mayoría.

  8. danibishop dijo:

    Con la misma contundencia entonces, si se acogiera a la logarítmica, ¿dirías que Luis Bárcenas dice la verdad? Porque se puede decir eso… o que quien falsificó los números conocía la ley de Benford. El asunto no es ni criticar el análisis con tan poca muestra y sin aportar métricas analíticas, sino el llegar a conclusiones de manera tan, tan, tan arbitraria. Entiendo perfectamente al compañero de las ‘groserías’ de antes.

    • Si obedeciera la ley de Benford, solamente podría opinar que de acuerdo con ese test estadístico no se podría afirmar que la contabilidad estuviera falseada.

  9. Fedeguico dijo:

    Haz una lista con tu sueldo neto mensual de los últimos 8 años…..y me cuentas

    • Esa lista no se ajusta a la ley de Benford porque no se cumple la premisa de que los datos oscilen entre varios órdenes de magnitud. Esta premisa sí se cumple con los papeles de Bárcenas.

  10. NP-completo dijo:

    Hola, Miguel. Hoy me has respondido a un mensaje mío en ABC en relación a tu análisis, te lo agradezco. Te he respondido después también en ABC dándote parcialmente la razón, no sé si lo habrás visto. Ciertamente, allí hay mucho hooligan (como en cualquier otro periódico on-line), así que me ha parecido mejor venir aquí para un debate tranquilo.

    En mi comentario en ABC, me preguntaba si un cambio de unidades o de base podría “romper” la Ley. Por ejemplo,, 1000 pesetas pasan a 6 euros, 1166 pesetas pasan a 7 euros, 1330 pesetas pasan a 8 euros, etc, así que los numerosos empezando por 1 en pesetas se dispersarían en números empezando por las cifras 6,7,8,9,1,1 al pasar a euros. Tú me has contestado hoy que la ley es invariante a cambios de escala, y tu referencia a la wikipedia me ha hecho salir de dudas. Efectivamente, dado que no podemos distribuir homogéneamente todos los números entre 0 e infinito, es lógico que lo más parecido a una distribución homogénea que podamos conseguir sea una distribución donde las cantidades más pequeñas son más probables. Este principio es, lógicamente, independiente de unidades o base. Ahora encuentro la siguiente explicación a mi supuesto “contraejemplo” de las pesetas y euros: aunque las cantidades que empiezan por 1 en pesetas se “dispersarán” en números con primeras cifras altas al pasar a euros, otras cantidades de pesetas que empiezan por 2,3,4,…,9 darán lugar, al pasarse a euros, a muchos nuevos números que empiecen por 1, de forma que se compensará la pérdida de ellos sufrida antes por números que, expresados en pesetas, empezaban por 1.

    Hasta aquí, bien. No obstante, me surgen las siguientes dudas sobre la validez de tus conclusiones:

    1.- Como otros están diciendo aquí, creo que la muestra es pequeña. Además, debes aplicar un contraste de hipótesis serio para llegar a tal conclusión.

    2.- Dudo que podamos considerar que un conjunto de donaciones y comisiones, especialmente siendo tan pequeño, cumpla las condiciones para aplicar la Ley de Benford. Por ejemplo, imaginemos que tenemos delante la facturación que hace Apple en España vendiendo sólo ipads y iphones (ambos cuestan entre 300 y 700 euros). Sólo veríamos la cifra 1 en cantidades de compras de gente que compró varios de ellos a la vez. Pero, muy probablemente, la inmensa mayoría de las facturas son por un sólo item comprado. Me atrevería a decir que (por ejemplo) podría haber una sola compra “múltiple” por cada diez personas que compran un sólo item. ¿No podemos asumir que un conjunto de donaciones y comisiones podría seguir, también, un patrón sesgado similar?

    3.- Por último, cabe destacar que, según algunos medios de comunicación, los “papeles de Bárcenas” podrían ser sólo un extracto de una contabilidad mucho más minuciosa llevada a cabo por Bárcenas que podría constar de cientos o miles de páginas. Si efectivamente las páginas publicadas fueran solo un extracto (por haberse escogido sólo lo relevante o por proteger a algunos, por ejemplo), entonces el criterio de selección habría sido bastante “humano”, y por tanto sería esperable que dicha selección se hubiera cebado particularmente en pagos que están dentro de determinados rangos, que se corresponderían precisamente con pagos de determinado “tipo” que el seleccionador consideró pertinentes. En este caso, lógicamente la Ley de Benford no sería aplicable, y no podríamos concluir que los papeles de Bárcenas muestran datos falsos.

    • 1º. Estoy de acuerdo contigo en que la muestra es pequeña. Mi análisis es solamente un indicio que podría complementar el estudio de un perito calígrafo.
      2º. Como ya he dicho más arriba, la premisa para que una distribución obedezca la ley de Benford es que los datos oscilen entre varios órdenes de magnitud. Éste es el caso con los papeles de Bárcenas.
      3º. Si la contabilidad completa consta de miles de páginas, sería muy interesante someterla a un test de Benford. Estoy seguro que esto lo harán los auditores.

      Muchas gracias por tu crítica y un saludo,
      Miguel

      P.D. NP=P? ;)

      • NP-completo dijo:

        Muchas gracias por tus explicaciones, Miguel.

        En cualquier caso, el hecho de que los métodos matemáticos estén en boca de todos gracias a asuntos de rabiosa actualidad es una gran noticia para todos los que disfrutamos con las mates, gracias por lograrlo.

        Y respecto a tu post-data, me temo que todavía seguimos en la misma incertidumbe y el mismo sinvivir que desde hace cuarenta años. ;-)

  11. Matemáticamente esto duele a los ojos, y espero que nunca tengas que dar clase de estadistica o probabilidad…

    Como todo el mundo sabe, los salarios no son aleatorios. Por ejemplo, en mi facultad, todos los estudiantes de doctorado reciben salarios que empiezan o con un 1 o con un 8. Ahi no va la ley de Benford? Pues claro que no, pues los sueldos y sobresueldos no son sucesos aleatorios (hay una broma aqui en alguna parte, pero no me sale). Es tu salario aleatorio? O los de tus colegas de facultad? Saca el decano un dado para decir en que nivel te pone?

    Luego, además, tu analisis se basa en parte en que para el 6 el numero está disparado el porcentaje. Surprise, surprise, 6 euros son 1000 pesetas, y 6000 es un kilo. Esos asientos se basan en prácticas que empezaron en pesetas. Si quieres que el analisis valga medio duro, mas vale que conviertas todo primero a pesetas, pues muchos de aquellos asientos se repiten en el tiempo pasando de pesetas a euros por la cantidad equivalente.

    Finalmente, la ley de Benford se basa en los ordenes de magnitud (a poco que lo pienses un ratito te daras cuenta de por que). Los salarios de altos cargos no varian mas de dos ordenes de magnitud en base 10, generalmente (por ejemplo, de 1000 euros al mes a 10000), asi que aqui la ley de Benford no ha de funcionar.

    En fin, que si Gallardo ha rectificado y se jugaba mucho mas, por los Principia de Newton, rectifica tu también, que rectificar es de sabios. Esto recuerda a la demostracion de la existencia de Dios de Rodriguez-Salinas. En caso contrario debemos de darte la enhorabuena por tu innovacion: como pasar de manipulacion informativa a manipulacion matematica.

    • Los papeles de Bárcenas no son una nómina, son una lista de pagos en dinero negro. ¿Tú los has visto? Yo sí. Echa un vistazo y verás cómo oscilan los órdenes de magnitud, desde los 50€ hasta los 250.000€. Y después te retractas.

      • En haber, legibles (i.e. con el euro al lado), y quitando 6 outliners de menos de 1000 euros, todos van de 1000 a 280000 euros, 3 ordenes de magnitud, que dificilmente hace aplicable la ley de Bender (deja de lado todo lo demas, si quieres). Lo de las nominas era solo un ejemplo, podria darte mi lista del super donde ningun concepto pasa de 10 libras, pero vamos que no hay peor sordo que el que no quire oir.

      • Yo he hecho el análisis sobre el DEBE, donde los datos oscilan entre cinco órdenes de magnitud, una situación ideal para un test de Benford.

      • Debemos de hablar de bases de datos distintas, en http://elpais.com/especiales/2013/caso_barcenas/todos_los_papeles.html todos los debe que tienen registros legibles (i.e. con un simbolito de euro al lado) todos los importes ban de 3000 a 280000 euros para el debe. 3 ordenes de magnitud.

      • Jesús, estamos hablando de la misma base de datos.

        22-febrero 2008 Luis Gálvez 50.00 €

        Cinco órdenes de magnitud. Y si eliminamos este dato, tres órdenes de magnitud son suficientes – longitudes de ríos, poblaciones de ciudades, etc.

  12. josemaria dijo:

    Las “listas de pago en dinero negro” tampoco es un suceso aleatorio, lo conduce el factor humano.

    • Las listas de datos socioeconómicos siempre están conducidas por el factor humano, y la mayoría de las veces obedecen la ley de Benford, siempre y cuando los datos oscilen entre varios órdenes de magnitud.

  13. Abelardo dijo:

    Es evidente que aplicar una Chi cuadrado a una tabla de 2 x 9 es fácil, mas para un matemático. Es posible que se haya hecho y salga que la diferencia no es significativa, entonces estropea la noticia. Por otra parte en caso de que fuera significtiva podríamos decir que la serie no es aleatoria y es posible que existan otros motivos para la no aleatoriedad que el del engaño, los pagos, lan nóminas ¿son aleatorios? ¿podríamos decir que si examinamos las nóminas de los profesores de universidad o de los médicos se cumplirían la ley? NO, es decir hay series no aleatorias, Ya lo sabíamos. Esta serie ¿lo es?. No se pero creo que es indiferente.

    • Ya he dicho varias veces que los datos tienen que oscilar entre varios órdenes de magnitud. Esto ocurre con los papeles de Bárcenas y no con la nómina de una empresa.

  14. laberinto dijo:

    No entiendo la conclusión de que Bárcenas miente. Si los datos correspondieran a una contabilidad real, seguirían la ley de Benford, si son inventados no. El hecho de que no sigan la ley de Benford, ¿no da la razón a Bárcenas? ¿No significa que son falsos?

    Siento como si lo entendiera todo al revés. :-(

    • Yo pienso que Bárcenas miente porque los datos de su contabilidad aparecen maquillados.

      • laberinto dijo:

        Pero Bárcenas dice que no es su contabilidad, que los datos son inventados, que los cuadernos son falsos. Si él dice que los datos están manipulados, y la ley de Benford lo corrobora, le estaría dando la razón, ¿no?

        Si están maquillados son falsos, que es lo que él dice. ¿Dónde miente?

        Ojo, no me fío nada de Bárcenas. Pero me parece que tu análisis, en lugar de acusarle, le exculpa.

      • Tienes razón. Mi análisis indica que los datos del cuaderno podrían estar falseados. Yo tampoco me fio de alguien que tiene 22 millones de euros en una cuenta en Suiza.

  15. madrid1882 dijo:

    En el periódico ABC si te fijas dicen exactamente lo contrario de lo que se observa: que unos datos inventados tienden a ser más uniformes que lo sugerido por la ley de Benford. Eso mismo dijiste en tu post sobre la ley de Benford: que instintivamente al falsear números se tiende a hacerlos más uniformes, no menos, de lo que indica la ley de Benford. Y en cualquier sitio que trate el tema del uso de esta ley para detectar fraude fiscal hacen la misma premisa. Precisamente los datos de Bárcenas son tan poco uniformes (porque sobreabunda el que tiene que ser más abundante) que gracias a tu análisis se confirma que básicamente en su mayor parte son reales.

    • Tienes razón en que quien maquilla los datos tiende a distribuirlos de manera uniforme, cosa la cual no ocurre con la distribución de Bárcenas. Sin embargo, hay una gran desviación con respecto al valor esperado por la ley de Benford.

  16. Manuel dijo:

    laberinto tiene razón. El estudio dice que mienten los papeles, no que miente Bárcenas. Aquí parece que se ha sacado obtenido la conclusión antes del análisis de los datos. Digo

  17. La verdad es que, se ponga como se ponga, el análisis carece de cualquier rigor. Y es un poco lamentable que haya llegado a los medios de comunicación sólo porque el autor es un profesor universitario de matemáticas.

    Ya otros han hecho notar que falta el requisito mínimo de aletoreidad. Si una persona fija unos pagos a unas personas, es normal que se produzcan secuencias que no cumplen la Ley citada. Muchas cifras coinciden, porque se fijan niveles. Otras se diferencian en números enteros, etc. Lo mismo ocurre cuando se piden cifras a los sobornadores.

    Es además probable que se asignen valores redondos, no aleatorios. Una buena demostración es la mayor proporción de cantidades que comienzan por el dígito 6 de lo que sería esperable, lo que, curiosamente, valida de alguna forma la Ley de Benford, ya que es muy probable que se trate de conversiones de cifras que comenzaban por 1 en pesetas y se han convvertido a 6 al entrar en vigor el euro. También por esa razón hay más cantidades que comienzan por 3 que por 2.

    Lo dicho, es interesante comprobar que incluso los cálculos matemáticos no son inmunes a las anteojeras ideológicas, y espero que los señores del Partido Popular tengan argumentos mejores en su defensa.

    • Yo solamente he calculado la frecuencia del primer dígito, lo he comparado con el valor esperado según la ley de Benford, y he observado una gran discrepancia. Los datos obedecen la premisa de oscilar entre varios órdenes de magnitud.

    • Ya otros han hecho notar que falta el requisito mínimo de aletoreidad. Si una persona fija unos pagos a unas personas, …
      Mi análisis no se basa en pagos (salida) sino en donativos (entrada).

  18. El pobrecitoahorrador dijo:

    Dice “El Pais”:
    Los secretos de Luis Bárcenas Gutiérrez, manuscritos en 14 hojas de un cuaderno cuadriculado en el que registró durante 18 años como gerente y tesorero algunos episodios contables de la vida del partido.
    El cuaderno ha salido bueno, 18 años. No obstante es mucho tiempo, parece que Bárcenas es meticuloso, y ahorrador, no gasta en cuadernos y el que tiene lo cuida.

  19. migeruet dijo:

    Antes de gritar, me he preocupado de hacer el test chi-cuadrado que varios han mencionado en comentarios (con R)

    	Chi-squared test for given probabilities
    
    data:  barcenas$barcenas 
    X-squared = 30.8717, df = 8, p-value = 0.0001481
    
    Mensajes de aviso perdidos
    In chisq.test(x = barcenas$barcenas, p = barcenas$benford.pct) :
      Chi-squared approximation may be incorrect
    
    • migeruet dijo:

      Um, pensaba que el comentario anterior no se habia publicado por problemas accediendo a la cuenta de wordpress… Se puede borrar uno de los dos duplicados.

      • No entiendo cuál es la conclusión del test chi cuadrado.

      • ¿Es negativo?

      • migeru dijo:

        La ley de Benford se refiere a la frecuencia de 9 digitos. Esto resulta en una tabla con 8 grados de libertad (para un numero dado, en este caso n = 84) de observaciones.

        El estadistico de chi cuadrado en este caso tiene 8 grados de libertad, con lo que deberia valer en torno a 8 si los numeros de Barcenas son consistentes con Benford. El estadistico vale 30, que es obviamente excesivo, luego se rechaza la hipotesis de que los numeros de Barcenas siguen a Benford.

        Se puede cuantificar la discrepancia por el p-valor, que en este caso es 1 parte en 7 mil.

        El nivel de confianza de 95% corresponderia a p-valor = 0.05

  20. migeru dijo:

    Como otros comentaristas, yo me imaginaba que una fuente de error podia ser que los pagos de los supuestos sobresueldos eran periodicos y constantes para cada persona que los recibia. Sin embargo, esas entradas estan en el ‘haber’, no en el ‘debe’. Las entradas del ‘debe’ corresponden a los ingresos procedentes de supuestas donaciones ilegales, que no tienen que ser periodicas ni en principio repetirse en cuantia. Sin embargo, observo lo siguiente:

    Tres entradas de Manuel Contreras por 120.000
    12 entradas de Jose Luis Sanchez por 100.000
    6 entradas de Manuel Contreras por 60.000 (euros, y una por 60 mil ptas ???)

    Y asi sucesivamente.

    No esta claro que en estas condiciones se aplique la ley de Benford.

    • ¿Qué dice el test chi cuadrado? ¿Que no es una distribución de Benford?

      • migeru dijo:

        Que no es una distribucion de Benford. Pero si hay entradas repetidas no esta claro que la hipotesis nula sea razonable para empezar. El hecho de que Jose Luis Sanchez tuviese el habito de pagar 100 mil periodicamente ya multiplica el numero de ocurrencias del digito inicial ‘1’.

      • migeru dijo:

        Por cierto, como regla heuristica se suele recomendar no aplicar chi-cuadrado cuando alguna de las categorias contiene menos de 5 elementos (en valor esperado). Con n = 84, las categorias 7, 8 y 9 contienen menos de 5 entradas en valor esperado.

        Si se agregan las categorias 7, 8 y 9 se sigue rechazando la hipotesis de igualdad, porque la discrepancia mas grande esta en el digito 1.

  21. Darwin_ov dijo:

    Creo que el documento no es la contabilidad B real sino un extracto. Es muy probable que haya sido escrito recientemente y de una sentada. Se han seleccionado una serie de datos mientras que la contabilidad B verdadera se mantiene a buen recaudo. Si el extracto consigue que los destinatarios reciban el mensaje, no es necesario sacar la contabilidad B real. Es similar al secuestrador que envía una oreja o un dedo del secuestrado, para anunciar que la cosa va en serio.
    Si se admite la teoría del chantaje, no tendría ningún sentido hacer un informe falso pues falsear los datos en su totalidad o mezclar datos verdaderos y falsos, quitaría credibilidad al mensaje y que sus destinatarios no se tomasen en serio la amenaza.
    No olvidemos que para cada dato sólo el tesorero y el receptor son conocedores de su veracidad o falsedad.

  22. Manu dijo:

    La última afirmación del post es una burrada como la copa de un pino. Una tabla de valores esperados y obtenidos no demuestra nada, y mucho menos con n=84. Hasta un proceso regular como la sucesión de Fibonacci requiere al menos doscientos términos cualesquiera para verificar la ley. Y, en todo caso, un test permitiría hacer afirmaciones con una determinada certeza, no tajantes como “lleva a la clara conclusión de que Bárcenas miente”.

    ¿Un test de Benford es aplicable en este caso para confirmar la falsedad de las cifras? No. Al menos no como lo plantea Miguel.

    Un par de consideraciones antes:
    Si mezclas pesetas y euros, las muestras de cada tipo son demasiado pequeñas como para satisfacer no ya la ley de Benford, sino ninguna otra. Por tanto, su combinación no tiene por qué cumplirla. Eso se soluciona pasando a una de las dos unidades, preferiblemente pesetas si se pretende demostrar que no la verifica.La discusión de los órdenes de magnitud se soluciona cambiando de base, por ahí tampoco hay problema.

    El problema, aparte de lo pequeño de la muestra, es que no podemos saber si esos datos son todos los datos, y cualquier purga (acotación o selección en la muestra, equivalente, por ejemplo, a no incluir los habitantes de las ciudades que empiecen por F o los pagos a Menganito) invalida Benford. Además, todo redondeo de datos lo echa por tierra, y parece evidente que esa lista funciona con números más bien redondos.

    Incluso en el caso de que fuese aplicable, un Chi-cuadrado no sirve para muestras pequeñas. Habría que usar Kuiper o Kolmogorov, pero, dado que llegados a este punto considero que es una discusión académica y no tengo el shosho pa farolillos, que lo haga otro.

    Un saludo.

  23. mrtomacco dijo:

    Pervertidos.

  24. Pingback: L’ABC s’empara en la Llei de Benford per demostrar la falsedat dels papers de Bárcenas, però sense massa èxit | Media.cat - Observatori crític dels mitjans

  25. Patillotes dijo:

    Dejo un archivo con los calculos de un contraste entre la distribucion de Bedford y la mostrada en los papeles (tomo como datos http://pastebin.com/pXTFS7Sc, sin comprobar, si hay dudas dejadme otro conjunto):

    https://docs.google.com/file/d/0B6SnmYBeLY81cGQyNlM4SkcyN2c/edit?usp=sharing

    Los resultados son bastante aplastantes. No se puede decir que el conjunto de datos de Barcenas sea incompatible con la regla de Benford (p. aprox de 1e-11 de rechazo de hipotesis)

    PD: he hecho el archivo muy rapido. Si veis errores en los datos o procedimiento indicadmelo.

    • Yo he utilizado datos distintos: 84 apuntes en euros en el debe de los papeles publicados por el diario El País http://goo.gl/fu65l

      Mas arriba en los comentarios, migeruet ha hecho un test chi cuadrado que indica que no es una distribución de Bendford.

      • Patillotes dijo:

        Voy a mirarlo que hay muchos comentarios. Luego rehare los calculos con los 84 datos en euros.

  26. Patillotes dijo:

    Donde digo Bedford quiero decir Benford

    [Editado y corregido. Miguel Lacruz]

  27. Patillotes dijo:

    Me parece que he confundido numero de datos y grados de libertad. Luego miro mejor.

    • Patillotes dijo:

      https://docs.google.com/file/d/0B6SnmYBeLY81VVNuRjJvelZOd0U/edit?usp=sharing

      Efectivamente había cometido errores gordisimos en todas partes. Con los datos en pesetas y euros la hipotesis de que sigue la distribucion observada por Benford es totalmente rechazable (solo se aceptaria a un 1e-11 de significacion).

      Como cosa curiosa, la mayor parte de la divergencia entre ese modelo y los datos esta en la sobrerrepresentacion del “6” como primera cifra. ¿Muchos datos que empezaban por “1” han sido pasados a 6000 y algo?

  28. Darwin_ov dijo:

    Conservo los datos de mis gastos desde que entramos en el euro. Son unos 1800 datos. Les he aplicado la ley de Benford y este ha sido el resultado:

    1 2 LEY
    1 556 32 30,1
    2 181 10,4 17,6
    3 161 9,3 12,5
    4 158 9,1 9,7
    5 159 9,2 7,9
    6 123 7,1 6,7
    7 247 14,2 5,8
    8 112 6,4 5,1
    9 40 2,3 4,6

    1) Valores brutos 2) Porcentaje de datos que empiezan por el valor indicado 3) Valores esperados

    Propongo que se hagan hipótesis sobre el 7 (obtenido 14,2, esperado 5,8) ; el 2 (obtenido 10,4 esperado 17,6).

    • Darwin_ov dijo:

      ¿Podría deducirse de esta tabla que los datos de mi contabilidad referidos a los datos cuyo primer dígito es 7 son falsos o han sido falseados? No, simplemente, que ha habido una cantidad cuyo primer dígito empezaba por 7 (en concreto 750 euros) que se ha estado abonando todos los meses durante esos 12 años. Lo mismo podría estar pasando con los datos de los papeles de EL PAIS.

  29. Darwin_ov dijo:
    1º dígito frecuencia Porcentaje Benford
    1 556 32.0% 30.1%
    2 181 10.4% 17.6%
    3 161 9.3% 12.5%
    4 158 9.1% 9.7%
    5 159 9.2% 7.9%
    6 123 7.1% 6.7%
    7 247 14.2% 5.8%
    8 112 6.4% 5.1%
    9 40 2.3% 4.6%
  30. Darwin_ov dijo:

    Imposible poner la tabla, lo siento.
    [Editado y tabulado con html. Miguel Lacruz]

  31. Patillotes dijo:

    Yo tambien voy a jugar, en vista del picazo que sale en el 6 voy a poner dos distribuciones del mismo tipo solapadas y que se peguen en el 6 y el 1 a ver que sale.

  32. Darwin_ov dijo:

    Pongo un enlace con la tabla y el grafico: http://pinzon-de-darwin.blogspot.com.es/

  33. migeru dijo:

    Otro articulo sobre Barcenas y Benford, en la web de Sintetia.

    Una cosa que hacen es convertir todos los numeros a pesetas, observando que hay muchas entradas de 6000 o 60000 euros, que en pesetas serian 1 o 10 millones.

  34. Blanco Saco dijo:

    Yo soy catedrático de estadística y en mi vida había oído hablar de la ley de Benford. Acabo de mirar el tema en la wikipedia y veo que es una teoría de origen físico… Me gustaría tener a mano los articulos cientificos en donde sale publicada para ver las hipótesis exactas en las que se mueve… Porque a mi todo esto me huele a chamusquina: como muchas teorías de tipo economico que se cumplen siempre hasta que se dejan de cumplir, o que predicen crisis economicas a toro pasado… y que son tan cientificas como la ley de Benford, me imagino.

    Aquí la única ley que me parece que se cumple es la ley de Barcenas; Yo robo, tu robas, el roba, todos los del pp robamos, y los españoles son tontos que nos votan igual

    • Habrás visto en la WikiPedia el fenómeno del desgaste de las tablas de logaritmos, que las potencias de dos siguen la ley de Benford, que ésta ley fue utilizada para detectar fraude electoral en las elecciones de Irán en 2009, y que hay dos españoles, Bartolo Luque y Lucas Lacasa, que hace poco descubrieron que la distribución de los números primos obedece la ley de Benford.

      • Blanco Saco dijo:

        ¿tu eres titular por acreditacion o por la lru? me imagino lo segundo, ya que la wikipedia no figura en el SCI que yo sepa… En cualquier caso repito que como matematico quisiera ver las hipotesis teoricas en las que se basa, no que nadie me diga que en irán fue utilizada para detectar fraude (eso lo sabe Benford y Homer Simpson), y que Bartolo y Lucas descubrieron que los numeros primos son sobrinos de Benford ¿Lo descubrieron escrito en una pintada, en una excavación, o después de haber fumado con Andy y Lucas? ¿Qué argumentos cientificos son esos?

  35. Bartolo Luque, Lucas Lacasa: The first digit frequencies of primes and Riemann zeta zeros
    Proceedings of the Royal Society A 465 (2009) 2197-2216
    Featured in Physorg.com Top 10 Proc. Royal Society articles in 2009

    Prueban que el primer dígito de los números primos obedecen una ley de Benford generalizada y se basan en el teorema de los números primos, aunque quizás esto no lo comprendas tú, un catedrático de estadística que nunca había oído hablar de la ley de Benford.

  36. Blanco Saco dijo:

    Gracias por responder. Acabo de mirar, y en efecto, Proceedings of the Royal Society A esta en el SCI, pero es una revista de fisica, no de estadística ni matemáticas.
    Y tu eres de analisis matematico. Lo cual es como si opina de los huesos de los hijos de Bretón un otorrino que ha leído trabajos de urología.

    La física estadística o estadística fisica dista mucho de la estadistica SERIA, esa ley de Benford no aparece en ningun libro de estadistica SERIO (ni de risa, alguno hay).

  37. MathSciNet >> Benford’s law

    hay 72 artículos recensionados

  38. Y el artículo de Luque y Lacasa también está en MathSciNet

    MR2515637 (2010g:11215) Reviewed
    Luque, Bartolo(E-UPMAE-AM); Lacasa, Lucas(E-UPMAE-AM)
    The first-digit frequencies of prime numbers and Riemann zeta zeros. (English summary)
    Proc. R. Soc. Lond. Ser. A Math. Phys. Eng. Sci. 465 (2009), no. 2107, 2197–2216.
    11Y35 (11A63 11B05 11M26)

    PDF Clipboard Journal Article Make Link

    Benford’s law states that for many data sets, the probability of a first digit being d is not 1/9 but rather log10(d+1d). There are many explanations for the prevalence of this phenomenon, ranging from scale invariance arguments to central limit type theorems. This law has numerous applications, occurring in diverse fields from computer science to accounting to electrical engineering.
    The present paper discusses a generalization of Benford’s law for the leading digits of prime numbers (and zeros of the Riemann zeta function as well), and provides numerical support for the claims. Unlike previous work (see, for instance, Bombieri’s comment in Serre’s classic [A course in arithmetic, Translated from the French, Springer, New York, 1973; MR0344216 (49 #8956)]), the authors do not work with analytic density and thus all primes simultaneously, but rather truncations of the integers at 10D for some integer D (as such truncations, a priori, have all digits equally likely to be a leading digit).
    Reviewed by Steven Joel Miller

  39. Blanco Saco dijo:

    Como estoy en mi casa no tengo acceso a mathscinet. He buscado al Bartolo en google y me salen una pagina de él: en la lista de publicaciones veo sólo revistas de física e ingenieria, quizá alguna de matematica (cosa que dudo porque en el curriculum pone que es fisico).
    De nuevo vuelvo a lo mismo, es como si un otorrino publica algo referente a genetica forense en una revista de otorrinolaringologia.
    No es EStadistica. Esa tal ley de Benford (que no aparece en ningun libro de estadistica serio, no se si en alguno… ) me huelo que es totalmente empirica, con lo cual su credibilidad deja mucho que desear. Si eres matematico entiendes de sobra lo que estoy diciendo.

    • ¿Has leído mi comentario anterior? La ley de Benford no es una ley empírica. Hay muchas explicaciones para la prevalencia de este fenómeno que van desde argumentos de cambio de escala a teoremas del tipo del teorema central del límite.

      P.D. ¿Quieres acceso a MathSciNet desde casa? Instala un cliente de VPN como he hecho yo.

    • bluque dijo:

      “Es como si un otorrino publica algo referente a genetica forense en una revista de otorrinolaringologia”… más o menos así fue el descubrimiento de la estructura del ADN, entre otros miles…

      • Es como si un empleado de una oficina de patentes publicara un artículo sobre la electrodinámica de los cuerpos en movimiento.

  40. Blanco Saco dijo:

    ¿Y tu has leido lo que he puesto varias veces? Esa ley no aparece en ningun libro estadistico, ahí pondrá lo que quiera, pero si apareció en revistas de fisica lo mismo los referees tenian tanta idea de estadistica y el teorema central del limite como yo de fisica cuantica… vaya usted a saber…

    • BENFORD ONLINE BIBLIOGRAPHY

      This Bibliography is intended to provide a continuing up-to-date list of articles, books and other resources related to Benford’s Law, including theoretical, applied and human-interest aspects of this rapidly evolving field.

      http://www.benfordonline.net

    • Hola, catedrático! Ahí van unas referencias de tu cuerda. Como verás la más antigua es de 1995. Igual ese es el problema :-)

      Hill, T. P. 1995a Base-invariance implies Benford’s law. Proc. Am. Math. Soc. 123, 887–895. (doi:10.2307/2160815)

      Hill, T. P. 1995b A statistical derivation of the significant-digit law. Stat. Sci. 10, 354–363.

      Leemis, L. M., Schmeiser, W. & Evans, D. L. 2000 Survival distributions satisfying Benford’s law. Am. Stat. 54, 236–241. (doi:10.2307/2685773)

  41. Pingback: datanalytics » La ley de Benford en muestras pequeñas: algunas evidencias

  42. Patillotes dijo:

    Como fisico siempre me han llamado la atencion estas cosas de matematicos, lo reconozco. Por otro lado, casi cualquier fisico conoce el teorema central del limite y demas.

    • Patillotes dijo:

      Añado que eso de sacar a pasear el argumento de autoridad, asi con tanta soltura, me tiene un poco alucinado.

  43. Demos dijo:

    Miguel, prueba a pasarle la distribucion a la contabilidad del PP desde 2008 a 2011 a ver que te sale.

    http://noticias.terra.es/el-pp-publica-sus-cuentas-desde-2008-a-2011,32b67d1a989bc310VgnVCM20000099cceb0aRCRD.html

    • Darwin_ov dijo:

      ESTOS SON LOS DATOS

      table.tableizer-table {
      border: 1px solid #CCC; font-family: Arial, Helvetica, sans-serif;
      font-size: 10px;
      }
      .tableizer-table td {
      padding: 4px;
      margin: 3px;
      border: 1px solid #ccc;
      }
      .tableizer-table th {
      background-color: #104E8B;
      color: #FFF;
      font-weight: bold;
      }

      1er digitofrecuencia 2008frecuencia 2009frecuencia 2010frecuencia 2011suma 2008 – 2011  
      1202015136830,2230,1
      21078154017,7817,6
      310111274017,7812,5
      448652310,229,7
      51333104,447,9
      67324167,116,7
      72348177,565,8
      8223073,115,1
      9100341,784,6

    • Darwin, ahora edito tu comentario para darle formato a la tabla, que por cierto, ya he visto en tu blog http://pinzon-de-darwin.blogspot.com.es
      Muchas gracias por tu colaboración y un saludo,
      Miguel

    • Darwin_ov dijo:

      En esta dirección están los cálculos ya hechos:

      http://pinzon-de-darwin.blogspot.com.es/

      • Darwin, he actualizado el post con tu tabla. Parece que la contabilidad oficial del PP sí se ajusta a la ley de Benford.
        [Editado 09 feb 2013: El test MAD da no conformidad.]

  44. Ramon dijo:

    Solo quiero decirle a Blanco Saco que hace uso de la falacia ad hominem en todos los comentarios que ha publicado y eso en un matemático parece que choca un poco…

    además de ir contra todas las leyes empíricas (“me huelo que es totalmente empirica, con lo cual su credibilidad deja mucho que desear”) me parece poco científico

  45. Ramon dijo:

    Queria añadir en el comentario anterior este enlace

    http://es.wikipedia.org/wiki/Argumento_ad_hominem

  46. Pingback: Sintetia » La Ley de Benford y la presunta contabilidad B del PP

  47. Darwin_ov dijo:

    La contabilidad oficial del PP de 2008 a 2011 y los papeles de Bárcenas no son documentos comparables . Los papeles de Bárcenas corresponden a una serie de datos de entradas y salidas de fondos. Mientras que la contabilidad oficial sel PP son datos globalizados.

  48. Daniel Arenaza dijo:

    Miguel, tras haber leído y releído su conclusión y los comentarios de los usuarios, sigo teniendo la duda. En un principio, pensaba que su conclusión era que los papeles de Bárcenas reflejan una contabilidad real puesto que los porcentajes de aparición del primer dígito no se asemejan con los de una contabilidad falsa (o así he creído entender yo la ley de Benford). Pero también he visto que en 13 TV han mencionado su artículo y ellos afirman que los papeles no tienen credibilidad, es decir: que los papeles son falsos, que Bárcenas está diciendo la verdad cuando afirma que esa no es su letra y que El País se metería en un buen lío por publicar documentos falsificados.

    Bien, como yo mismo me estoy liando, intentaré hacerle la pregunta de manera que su respuesta aclare mi duda: ¿concluye usted que los papeles reflejan una contabilidad real y que, por tanto, se han producido pagos en ‘B’ en el PP?

    Aprovecho para felicitarle por haberle dado un toque matemático a todo este asunto tan feo y por hacer ver a un alumno cuán necesarias son las matemáticas.

    Saludos, Daniel.

  49. Daniel,
    Mi conclusión es que los datos de Bárcenas no se asemejan a una contabilidad real porque no pasan el test de Benford. Aparte de esto, tengo derecho a poner en duda la mitad de lo que diga Bárcenas, porque la otra mitad es mentira.
    Gracias por tu comentario.
    Saludos,
    Miguel

    • Darwin_ov dijo:

      Que no se asemejen a una contabilidad real, no quiere decir que los datos no sean verdaderos. Si yo, por ejemplo, tengo una empresa de 1000 empleados de nivel 1 a los que les pago un sobresueldo en negro de 60 euros al mes, 100 de nivel 2 a los que les pago 200 y 10 directivos a los que les doy 600 a cada uno al mes y reflejo cada uno de esos datos en una contabilidad paralela, esa contabilidad no seguirá la ley de Benford, pero los datos reflejados serán completamente ciertos y deducir de todo esto que yo no he pagado los sobresueldos sería incorrecto.

    • José Luis dijo:

      ¿84 datos y llega Ud a la conclusión de que la contabilidad no es real? Cuando en la tabla de los primeros dígitos hay 5 casillas con frecuencias menores de 5
      1 2 3 4 5 6 7 9
      41 8 10 3 3 12 2 5
      y no hay ningún asiento que empiece con 8.. no sé, no sé. Me parece un poco arriesgado concluir que la contabilidad no es real.

      Saludos

  50. vicente dijo:

    He dibujado un gráfico con los 84 datos del post de Miguel.

    http://bit.ly/X8iqNY

    El gráfico representa en una línea roja las frecuencias observadas del primer dígito de la contabilidad, la línea negra representa las frecuencias esperadas si estos dígitos siguieran una distribución de Benford, y la franja verde, delimitada por líneas punteadas, representan un intervalo de confianza al 95% para una muestra de una distribución de Benford de tamaño 84. Como se puede ver los dígitos 1, 6 y 8 se salen de la franja y los puntos 2 y 4 caen justo en la frontera. A pesar de eso y del test chi-cuadrado, la distribución de los dígitos en los papeles de Bárcenas da la impresión que tiende a parecerse a una distribución de Benford, pero como no domino este tema no me atrevo a descartar ni a afirmar la autenticidad de la contabilidad basándome en la ley de Benford.

    Un saludo

  51. vicente dijo:

    Perdón, creo que me he hecho un lío con los conceptos y mi anterior comentario no tiene sentido. Agradecería que lo eliminaran. Disculpen.

  52. Pingback: La contabilidad del PP no está conforme a la ley de Benford

  53. Pingback: Francis en ¡Eureka!: Las matemáticas también son protagonistas de las noticias « Francis (th)E mule Science's News

  54. Santiago Camblor dijo:

    Yo he cogido 80 movimientos de mi cuenta bancaria. He calculado la frecuencia de los primeros dígitos y se alejan aún más de la distribución teórica. Redondeando, estos son los resultados:
    1….38%
    2….37%
    3….14%
    4….1%
    5…5%
    6….2%
    7…0%
    8…0%
    9…2%
    Estos datos son reales, así que supongo que la diferencia con la distribución teórica es por que son muy pocos datos, como en el análisis que haces tú.

  55. Hola Miguel,

    En primer lugar decir que me ha encantado este aplique matemático a tal situación de circo que vivimos en esta degenerada España.
    Seguidamente, tengo entendido, por lo que estudiamos en la matemática de la física, si una distribución de números aleatoria sigue la ley de Benford, un estracto aleatorio de la misma, ¿debe seguir cumpliendo dicha ley? Si esto es correcto, el extracto de 84 datos deben de asemejarse a la ley si son totalmente aleatorios aunque no con la misma “definición” que sí tuviésemos todos los datos. (Al igual que una distribución tipo Gauss con pocos números, se intuye en su gráfica la campana)

    Por otra parte, tengo que expresar mi pena por los comentarios que he visto aquí de algunas personas, sobre todo aquellas que estoy seguro que tienen un gran conocimiento del ámbito estadístico, pero se pueden ver cegados a la realidad por sus “férreos” ideales.

    Un saludo,
    Antonio Angulo

  56. Antonio,
    Una muestra aleatoria debe obedecer aproximadamente la misma distribución, a no ser que la muestra esté sesgada, como podría ser el caso de la contabilidad de Bárcenas.
    Miguel

  57. Ya,ya,ya dijo:

    Leído todos los comentarios, y por el mínimo sentido común que he necesitado para estudiar una carrera de químicas, la clave,anterior a cualquiera otra discusión, la da Ramón en su post: “Miguel gran entrada. Dejando de lado apreciaciones como que quizás los datos no son suficientes para decir nada seguro y que haría falta un análisis estadístico más profundo, mi duda es la siguiente. Entiendo que la ley de Benford es aplicable siempre y cuando los datos que analizamos vengan determinados en cierto modo por sucesos que tienen su propia dinámica, es decir, que siguen una serie de leyes internas. En el caso de las finanzas entiendo que pueda ser aplicado al falseo de datos de por ejemplo valores del mercado en la bolsa, sin embargo, en la contabilidad de un partido, que entiendo que se basa en las donaciones de particulares y no tanto en la dinámica de un mercado, realmente todos los datos no podemos asegurar que surjan de manera natural. Lo que quiero decir es que hasta donde entiendo, la ley de Benford ayuda en esos casos donde los números siguen la tendencia que tengan que seguir (ya sea valores de mercado…) y donde un intento de falsear los datos llevara a que la distribucion no sea la esperada y por lo tanto no estoy tan seguro de que sea aplicable a la contabilidad de un partido.”

    Y la respuesta de Miguel Lacruz no responde a lo que le plantea Ramón: “Entiendo que la ley de Benford es aplicable siempre y cuando los datos que analizamos vengan determinados en cierto modo por sucesos que tienen su propia dinámica, es decir, que siguen una serie de leyes internas”.

    Quizás haya que entender de física para interpretar leyes traducidas a “leyes” matemáticas.

    Ha sido un placer leer todas las intervenciones. Gracias

  58. Ada dijo:

    Miguel, hoy el economista y matemático vigués, residente en Paris, Juan José R. Calaza, en binomio con Guillermo de la Dehesa, publica un artículo en Faro de Vigo (Ley de Benford y Teorema de Hoeffding) en el que te citan y hacen una nueva propuesta al respecto:

    http://www.farodevigo.es/opinion/

    http://www.farodevigo.es/opinion/2013/02/24/ley-benford-teorema-hoeffding/763215.html

  59. Maria dijo:

    Como dicen en onda cero si los pagos son periódicos y relativos a unas mismas cantidades consistentes en una cifra q comienza en 1, es lógico q el 1 se repita con mas frecuencia… Entiendo q la ley de Bedfor no valdría en este caso. Si Vd. Estudia la contabilidad de una empresa de mileuristas también el 1 se repetiría con mas frecuencia q el previsto en la L B . Si todos los empleados cobraran 1200 euros, igualmente se repetiría el. 2…

  60. viances dijo:

    Para un ingeniero este procedimiento empleado para aplicar el test de Benford a los datos que se ha aplicado es totalmente inaceptable y solo cabe interpretarlo como tendencioso, con interés de llegar a conclusiones previamente previstas. No es admisible la notoriedad que se le está dando a un tema tan mal planteado. No es admisible el protagonismo que ha adquirido la noticia cuando hay tantas variables que no lo son. Se debería retirar la información, y no tratar de condicionar a la justicia ni a los jueces que no entienden de matemáticas y pueden caer en el error de aceptar algo que no parte de una salida correcta de datos de sucesos independientes y aleatorios. Es una lástima que alguien que posee un gran genio matemático pierda el tiempo de esta manera cuando debería estar luchando contra la corrupción, venga de donde venga, con todas las armas posibles. Usar las matemáticas para defender unos intereses políticos no es ético. Acabaremos todos contaminados.

  61. Fernando Salguero dijo:

    Enhorabuena Miguel por tu trabajo. Despues de leer todos los comentarios, solo se me ocurre recordar a grandes genios como Galileo o Servet. La diferencia es que estamos en el S. XXI. Y es triste que siga habiendo personas que tratan de imponer sus ideales sobre la ciencia.
    PD: Reconozco que he alucinado cuando veo que un catedratico de estadística afirma sin la menor vergüenza que no habia oido nada de la Ley Benford. ¡Hasta mi hija que está en bachiller la conoce!

    • Fernando,
      Gracias por tu comentario.
      Saludos,
      Miguel

    • Jorge dijo:

      Ni soy matemático, ni estadistico, pero éste asunto me ha despertado la curiosidad y pronto buscaré algún libro al respecto,pues creo que puede tener aplicaciones en la gestión de empresas. En consonancia con Fernando, quiero mostrar que nunca dejará de sorprenderme hasta dónde puede llevar el fanatismo ideológico a las personas.Pido perdón por adelantado si ofendo a alguien(catedrático o no) intentando crearme una opinión independiente sobre la aplicación de la ley de Bendford, desde lo limitado pero, sobre todo, falto de adoctrinamiento ideológico, de mi intelecto.

  62. lordnena dijo:

    yo haré sólo una precisión informativa: Bárcenas fue gerente del PP hasta 2008 y tesorero de 2008 a 2010… no fue tesorero durante 18 años… Un saludo

  63. carlos dijo:

    Soy Ingeniero, no sé lo suficiente de matemáticas, ni de física, ni de estadística como para opinar sobre vuestros comentarios matemáticos pero sí puedo plantearme preguntas. Supongamos que es correcta la aplicación de la Ley de Benford a sucesos como una contabilidad B, supongamos que el error de una muestra tan pequeña no es tan elevado como para no poder sacar conclusiones con un nivel aceptable de fiabilidad, supongamos que el estudio esta bien hecho y por tanto que las conclusiones de que esos datos han sido manipulados es por tanto correcta.

    Ahora mi pregunta, ¿quien manipulo en este supuesto los datos de esa contabilidad B?, ¿Terceras personas desde que los papeles salen del despacho de Barcenas hasta que fueron publicados? ¿El mismo Barcenas? en el primer supuesto puede no haber caso, en el segundo sí, si Barcenas miente en esto, queda claro que puede mentir en cualquier cosa.

    El estudio entonces solo podría llegar a demostrar que esa contabilidad B es falsa, el estudio caligráfico de esos manuscritos parece ser que sí podría demostrar la autoría o no de Barcenas. Si demostrase que si es, Barcenas es un delincuente en ese caso ademas de su delito, el estudio de la aplicación de la ley de Benford y sus conclusiones, si son correctas, solo indicaría que ademas miente hasta en la contabilidad B. No veo entonces tanta trascendencia en las conclusiones de este estudio. Lo que si me gusta es ver que las matemáticas puedan ayudarnos a comprender el comportamiento humano.

    Gracias por tu aportación Miguel.

  64. Creo en la libertad de expresión y no borro ningún comentario. Tus argumentos basados en el insulto te califican a ti mismo.

  65. Gracias por tu comentario.
    Saludos,
    Miguel

  66. Darwin_ov dijo:

    Una cuestión que me planteo. Supogamos que tenemos una serie de datos que cumplen la ley de Benford. Supongamos ahora que suprimimos la primera cifra de cada uno de los datos, la segunda cifra de cada dato pasaría a ser la primera ¿cumpliría esta segunda serie la ley de Benford? A falta de comprobación, no veo ninguna razón para que esta segunda serie también la cumpliese. Si eliminásemos al azar la primerea cifra de algunos de los datos, la segunda de otros, la tercera de … etc… obtendríamos una serie de datos que no veo porqué razón no deberían de cumplir la ley. Luego , me pregunto ¿una contabilidad no falseada que cumpliese la ley podíamos falsearla eliminando dígitos de cada una de las cantidades? ¿cumpliría ley?

  67. El dígito n-ésimo obedece una ley de Benford generalizada que tiende rápidamente hacia una distribución uniforme cuando n aumenta. La aplicación de la ley de Benford en auditorías para la detección de fraude usa de forma rutinaria más que el primer dígito.

    • Darwin_ov dijo:

      He contabilizado la aparición en segunda posición de cada uno de los dígitos de una contabilidad real cuya primera cifra sigue la ley y me ha dado lo iguiente para un total de 1193 datos:

      1……6,6%
      2……8,2%:
      3 …..8,9%
      4……9,6%
      5…..35,5%
      6……8,0%
      7……9,6%
      8……5,3%
      9……8,1%

      • Darwin_ov dijo:

        La prevalecia del 5 se debe a que hay muchos datos de reintegros por valor de 750 y 150. Los demás datos parece que responden bien a una distribución aleatoria y la segunda cifra no seguiría la ley de Benford

  68. anonimato849 dijo:

    soy un niño que me entere por onda cero de la ley de benford y me parecio interesante (solo a mi )
    entonces me meti en cafematematico.com y bueno voy a descubrir como se aplica. Me metere en esta pagina (minimo mensualmente)

    • Te felicito porque, a pesar de tu corta edad, demuestras inquietud por la aplicación de las matemáticas a problemas cotidianos y te animo a que participes en mi blog a través de los comentarios.
      Saludos,
      Miguel

  69. Ada dijo:

    Juan José R. Calaza, coautor del artículo que pegué ayer en relación con la ley de Benford y el teorema de Hoeffding, me comunica lo siguiente. Aun considerando que el trabajo de Miguel Lacruz no es concluyente se solidariza absolutamente con él ante los ataques e insultos recibidos, que no deberían tener cabida en este tipo de debate.

    Por otra parte, añade Calaza, no hay que confundir las series de números –en general surgidas de la aritmética pura- que se ajustan perfectamente a ley logarítmica y aquellas otras surgidas del mundo real que se adaptan más o menos a ley de Benford. La ley de Benford es una observación, una aproximación que no es general, mientras que la ley logarítmica es una ley matemática.

    Finalmente, aunque Miguel Lacruz probablemente ya los conoce, los trabajos de P. Scott y M. Fasli atemperan grandemente el entusiasmo suscitado por la ley de Benford. Los autores, después de examinar 230 series estadísticas, incluyendo 500.000 datos de más de cuatro cifras cada uno, llegaron a la conclusión que la probabilidad de decrecimiento de frecuencia de un dígito significativo al siguiente en la serie 1,.., 9 era general pero que solo 29 series se ajustaban a la ley de Benford. Esto es, lo que es general en el mundo real es la ley de decrecimiento de la probabilidad en relacion con 1,.., 9 no la ley de Benford en tanto ley logarítmica.

    • Guillermo,
      Gracias por tu comentario. A pesar de los trolls que se han colado en los comentarios, me parece divertido el debate que se ha suscitado.
      Saludos,
      Miguel

  70. Jose Luis dijo:

    Lo que queda meridianamente claro con tus dos comentarios es que eres un hooligan, y eso, si que es un insulto a la inteligencia. Como puedes ver, es un calificativo.

  71. Mikisvaz dijo:

    Fijaos en los picos en 6 y 3. Parece un artefacto debido a la herencia de la peseta.

    Leer esto no me ha cambiado gran cosa mi opinión, pero es una idea muy interesante. Aún con toda la discrepancia de opiniones, me alegra ver que haya gente que mire a los datos para formarse una opinión. Gracias!

  72. Ya,ya,ya dijo:

    ¿Qué enttendemos por aleatorio? ¿Son los matemáticos unos creyentes?¿Debería un matemático tener conocimientos de física ,biología o psicología,para calibrar la aplicación de sus algoritmos? Salud

  73. Pingback: Los papeles de Bárcenas- Ley de Benford | Serendipiteam

  74. Pingback: El paso del tiempo. Grado 361

  75. Joaquim Perramon dijo:

    La conclusión de que Barcenas mentia me parece errónea. La ley no se da porque las retribuciones son arbitrarias. Por ejemplo se suelen emplear numeros redondos (mil, dos, mil, tres mil euros; 1278 euros). Tambien se equipara: 1000 euros a todos los del nivel x, etc.
    Partimos de la hipotesis que la ley de Benford es aplicable cuando no es así.

  76. Gasparsius dijo:

    Sigo diciendo que sin dudar de Benford, que seguramente era un matemático honesto, en este caso creo que no es aplicable, nos dice Don Miguel que se aplica en procesos aleatorios naturales, y el reparto de pasta en la sede de un partido no debe ser ni natural ni aleatorio, en este caso parece que natural si era, pero no creo que los políticos que se llevaban la pasta en sobres, y los empresarios que hacían las donaciones para que les dieran sustanciosos contratos, lo hicieran con un bpmbp prestado por loterías y apuestas del Estado.

    Ahora, si alguien no quiere que se conozca mi opinión, que lo censure y que me llame troll.

  77. Joaquim dijo:

    Estoy absolutamente de acuerdo con Gasparius y les propongo otro problema.
    La contratación pública de cualquier administración pública (ministerio, consejería autonómica, ayuntamiento) manifiesta irregularidades (puntas) en los tramos anteriores a los 18.000 euros, los 60.000 euros y en general antes de los tramos donde la ley de contratación es más exigente en lo que se refiere a publicidad y competencia. En estos puntos se rompe cualquier ley estadística !!!!
    La contratación debería hacerse atendiendo a unas necesidades técnicas y no los condicionantes legales y seria muy fácil paro los auditares y tribunales de cuentas examinar los expedientes en dichos tramos (inmediatamente inferiores a 18000 euros, 60000 euros, etc.) y comprobar los informes técnicos y los precios de mercado. En tiempos de crisis mejor seria aplicar el rastrillo a los que contratan mal que las tijeras a la generalidad.
    Saludos a todos

    • Tu comentario no aporta nada y está completamente off site porque no tiene nada que ver con la ley de Benford.

      • Joaquim dijo:

        Si tomamos una muestra de adjudicaciones de una determinada (cualquiera) administración pública de cero a 2 millones de euros encontraremos una proporción extraordinariamente alta de contratos de 18 mil euros, luego 60 mil así sucesivamente segun los tramos que marca la Ley de Contratos y que implican mayores exigencias en la contratación. Por exemplo menos de 18 mil euros es una adjudicación directa; no ha ce falta ni pedir varios presupuestos. Menos de 60 mil euros es adjudicación sin publicidad; se piden tres presupuestos a cualquiera y es suficiente y asi sucesivamente.
        Este hecho – la desproporción de determinados contratos de determinadas cuantias- rompe una serie de leyes, una es la de Benford, por supesto. Otra, más importante es que la contratación deberia seguir unas regularidades. En principio cabe esperar más contratos de 15 mil a 16 mil euros que no de 17 mil a 18 mil.
        Y si se rompen estas leyes es porque hay un elemento de arbitrariedad en la adjudicación. Esta es la conclusión.
        ///En el caso de los apuntes de estracción de dinamita en la mina de Asturias (atentado 11M) si no se cumple la ley e Benford (que no tengo ni idea si se hizo el test) es porque los apuntes se inventaron /// Creo que Hacienda utiliza la ley de Benford para conocer la verosimilitud de las cuentas de una empresa /// En el caso de los apuntes de Barcenas no debe cumplirse la ley de Benford porque es el quien fija los importes de los sobresueldos. Cojan los apuntes de gastos y posiblemente si se cumpla la Ley

Deja un comentario

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s