DEV Community

Henri de la Hoz
Henri de la Hoz

Posted on

Falacias en el uso de datos

GIGO

El principio de garbage in garbage out, sostiene que, la calidad de los resultados obtenidos, es consecuente con la calidad de los datos de entrada para el proceso. En otras palabras, si le metemos basura al algoritmo, el resultado que obtendremos, también va a ser basura. Entonces, es importante tener cuidado con los datos de entrada para el algoritmo.
Por muy bueno, eficiente y acertado que sea el cómputo, de nada vale si los datos no tienen un valor conceptual o son datos inexactos.

Gráficas engañosas

Imágenes o gráficas engañosas, cuando se juega con la escala se puede llegar a una conclusión incorrecta.

Cum Hoc Ergo Propter Hoc

Cum Hoc Ergo Propter Hoc, hace referencia al error de asignar causalidad cuando en realidad hay solamente correlación.
Para evitar este error es importante que pensemos out of the box, es decir tratar de ver que posible causas puede haber del fenómeno o evento que estoy analizando.

Prejuicio en el muestreo

Para que un muestreo sea significativo y por ende, permita generar inferencias a partir del mismo, debemos asegurarnos que el muestreo sea representativo y aleatorio.
Se evita al asegurar que nuestra muestra no se enfoque en un subconjunto del universo, más bien es importante que nos preocupemos porque nuestra muestra sea representativa.

Falacia del francotirador de TX

Básicamente esta falacia aparece al omitir la aleatoriedad al momento de obtener los datos. Adicionalmente, esta falacia surge cuando nos enfocamos en un detalle y sacamos conclusiones basados en dicho detalle, como resultado se sacan conclusiones sesgadas, que no toman en cuenta todo el universo de datos.
Es común caer en este error si, obtenemos datos antes de plantear una hipótesis.
No debemos adelantarnos a conseguir datos y luego plantear hipótesis. Primero debemos diseñar un experimento con hipótesis y luego extraer datos aleatorios y representativos.

Porcentajes confusos

Hace referencia a porcentajes confusos por que no se le da contexto a los datos porcentuales.

Falacia de regresión

Cuando un proceso estadístico fluctúa de manera natural, la falacia de la regresión es aquella en la que se concluye que, al ocurrir un evento extremo que represente una fluctuación en el comportamiento estadístico de los datos, si se toma una medida correctiva se podrá retornar los datos a su comportamiento normal y que si se presenta la corrección es precisamente debido a las medidas correctivas y no debido al proceso natural de regresión a la media.

Por ejemplo un atleta que le fue muy mal en una semana y cambia de alimentación y luego mejora. Puede llegar a creer que mejoró debido al cambio de alimentación y no debido a un proceso natural de regresión a la media.

Por supuesto, hay comportamientos estadísticos que no fluctúan de manera normal o de manera natural y que, dicho comportamiento sí puede ser afectado al introducir una medida "correctiva" que modifique los resultados obtenidos.

Latest comments (0)