Cada claim pasa por 5 capas. El score es 0-10. El veredicto es lo primero que ves.

Principio clave: ausencia de estudios no es ausencia de efecto. Un compuesto con 500 años de uso independiente en 3 culturas pesa aunque no tenga RCT. Lo que no puede compensar ninguna capa es la ausencia de todas — ese es el patrón de la pseudociencia.

Segunda distinción: "no verificable aún" ≠ "falso". Hay claims que no son pseudociencia — son preguntas abiertas que la ciencia actual no puede responder todavía (conciencia digital, universo infinito, mecanismos biológicos sin estudiar). Esos reciben score bajo por falta de evidencia, no por ser imposibles. La diferencia con pseudociencia es si hay mecanismo físicamente imposible o si simplemente la tecnología/investigación no ha llegado.

1
Estudios peer-reviewed — RCTs, meta-análisis, cohortes. Peso máx: 4/10. Check obligatorio: ¿quién financia? Industria financiando su propio producto requiere réplica independiente para valer igual que un estudio neutral. Crisis de replicabilidad: solo ~0,1% de los estudios se replican alguna vez. La ciencia premia la novedad, no la confirmación. Un meta-análisis independiente vale más que 10 estudios del mismo laboratorio. Un press release de empresa sin réplica externa no cuenta como evidencia.
2
Convergencia histórica — ¿Varias culturas sin contacto llegaron a lo mismo? Eso pesa. Una sola fuente con 3.000 años no es convergencia — es una sola tradición.
3
Plausibilidad mecanicista — ¿Hay mecanismo físico o biológico conocido? No necesita estar demostrado, pero no puede contradecir química o física básica.
4
Experiencial — usuarios reales
  1. Reddit (Pullpush, comentarios con score)
  2. YouTube — si hay vídeo relevante, hacemos transcript
  3. TikTok / Instagram — si YouTube no da señal
Upvotes ≠ verdad. Miden consenso de comunidad. El peso varía: comunidades especializadas (r/medicine, r/longevity) con 100+ upvotes pesan más que comunidades generales con 10.000. Testimonios de usuarios afectados sin interés comercial (dolor crónico, PTSD) pesan más que testimonios de vendedores. Múltiples relatos independientes de mejora en condiciones objetivamente medibles acumulan más que relatos en condiciones difusas. Uso correcto de la capa social: un post de 300 upvotes en r/askscience diciendo "esto no replica" pesa más que un press release de la empresa que vende el producto. La comunidad especializada puede ser la primera señal de que la evidencia oficial está viciada — como en el caso del fármaco de Alzheimer de Biogen (FDA 2021), donde 3 científicos del comité asesor dimitieron públicamente.
5
Origen comercial — ¿Quién inventó esto y qué gana con que te lo creas? Red de venta activa: −1 pt. Todo el ecosistema vive de vender el método: −2 pts.
ZERO 0–3

Sin evidencia en ninguna capa, o el mecanismo es físicamente imposible.

BAJO 4–5

Señal débil o en usos muy específicos. El claim general está inflado.

MODERADO 6–7

Efecto real en al menos 2 capas, con limitaciones conocidas.

ALTO 8–10

Convergencia sólida en múltiples capas. Limitaciones documentadas.

Sesgo conocido del framework

Este framework, como cualquier sistema de evaluación, tiene sesgos que documentamos en lugar de ocultar. El más importante: en su forma estricta penaliza tres rasgos que también son típicos de descubrimientos genuinos en su momento de máximo rechazo:

  1. Falta de mecanismo conocido — los mecanismos se descubren después de los efectos, no antes (Aspirina: 80 años de uso clínico antes de descubrir COX en 1971).
  2. Rechazo institucional — las instituciones rechazan novedad por defecto (Semmelweis murió en asilo defendiendo el lavado de manos quirúrgico, 1850).
  3. Datos limitados sin replicación masiva — la replicación viene años después del primer hallazgo.

Test histórico ejecutado: aplicado a H. pylori (1985), continental drift (Wegener 1925), Semmelweis (1850), trasplante fecal (FMT, 2008) y cannabis para epilepsia (2010), el framework habría asignado LOW/3-4 en su momento de rechazo. La realidad final fue HIGH/8-10. Error sistemático: ~5 puntos para descubrimientos genuinos contra-mainstream.

Operacionalización del de-bias: cuando un caso muestra (a) mecanismo plausible publicado en revista top, (b) replicación parcial en grupos diferentes, (c) rechazo institucional sin razón física fuerte, considerar score 1-2 puntos más alto que el "default mainstream" sugeriría. Casos en este sitio donde se aplicó: Wim Hof (LOW/4 → MODERATE/6), Metileno azul (LOW/4 → MODERATE/5), Terapia luz roja (LOW/5 → MODERATE/6), Inmortalidad (LOW/4 → MODERATE/5 tras aprobación FDA del trial Life Biosciences ER-100 en enero 2026).

Test simétrico para cualquier evaluación nueva: "¿daría el mismo score si esto viniera de un lab pharma con la misma evidencia, en lugar del biohacker actual?" Si la respuesta es "subiría", hay sesgo institucional que corregir.

Cuando ausencia de estudios NO equivale a falsedad

Crítica recibida de un usuario en abril 2026: "con que no haya estudios no quiere decir que no valga, lo usan psicólogos colegiados — el algoritmo a la hora de decir si es estafa o no no está siendo del todo correcto." Razón. El framework antiguo colapsaba dos cosas distintas en ZERO: (a) refutado por física/RCTs, (b) simplemente no estudiado. Ahora distinguimos cinco tipos de evidencia en cada tesis:

El test del usuario: "si no existieran estudios y solo confiaras en consenso Reddit + adopción profesional + mecanismo + convergencia histórica, ¿qué saldría?" Aplicado: constelaciones familiares pasaría de ZERO/2 a LOW/4 (uso por psicólogos colegiados + base en psicodrama + experiencial mixto). EMDR ya está HIGH. Homeopatía mantiene ZERO porque la física la refuta, no la ausencia de estudios. La distinción es importante.

La paradoja del científico (analogía Avatar)

El usuario añadió una imagen concreta: en la película Avatar, los científicos humanos llegan a Pandora con sus instrumentos y queriendo estudiar a los Na'vi por reducción experimental — muestras, sondas, datos. Pero los Na'vi tenían un conocimiento evolutivamente más profundo que los científicos no podían acceder con sus herramientas. Los científicos terminaron aprendiendo de los Na'vi e integrando ese conocimiento, no al revés.

El paralelo es directo: un framework que solo valida vía RCT puede fallar a la hora de reconocer formas de conocimiento legítimo que no encajan en el paradigma experimental:

Por eso este framework asigna peso explícito a Capa 4 (experiencial) y Capa 2 (convergencia histórica) además de la Capa 1 (estudios). El equilibrio no es perfecto y este sitio lo va corrigiendo cuando se identifican errores. La regla: no caer en la paradoja del científico — no descartar conocimiento legítimo solo porque no se puede medir con un RCT, pero tampoco aceptar lo no falsificable solo porque suena profundo.

Grados de evidencia por fuente

Cada fuente citada lleva un grado visible al final, inspirado en Cochrane GRADE + Examine.com: