LLM Benchmark Dashboard

Evaluacion practica de modelos — 5 tests, 100 puntos, resultados reales