Cómo probamos las computadoras

Pruebas de computadoras

En ENBLE revisamos muchos ordenadores, y lo hemos estado haciendo durante mucho tiempo. A lo largo de los años, parte de la metodología ha cambiado, pero nuestro compromiso central con las reseñas de productos exhaustivas no lo ha hecho. Nuestro proceso de revisión para portátiles, ordenadores de sobremesa, tabletas y otros dispositivos similares a ordenadores consta de dos partes: pruebas de rendimiento en condiciones controladas en los Laboratorios de ENBLE y uso extenso por parte de nuestros expertos revisores. Esto incluye evaluar la estética, ergonomía y características de un dispositivo. El veredicto final de la revisión es una combinación de juicios objetivos y subjetivos.

Cuando un ordenador, generalmente un portátil, ordenador de sobremesa, híbrido dos en uno o Chromebook, llega a los Laboratorios de ENBLE, lo configuramos como lo haría un usuario típico del producto. Como mejor práctica, durante la configuración, desactivamos tantas opciones invasivas de privacidad y recopilación de datos como sea posible. Luego actualizamos el sistema operativo, los controladores de la GPU, el BIOS y las utilidades del fabricante según sea necesario y utilizamos aplicaciones como Sandra de SiSoftware, CPU-Z de CPUID, GPU-Z de TechPowerUp, etc., para recopilar información sobre los componentes del sistema, como la CPU, GPU, RAM, SSD y placa base.

Nuestras pruebas de referencia consisten en un conjunto principal que ejecutamos en cada sistema compatible, además de un conjunto extendido de pruebas para casos de uso específicos, como juegos o creación de contenido, donde los sistemas pueden tener GPUs más potentes o pantallas de mayor resolución que deben evaluarse.

Dan Ackerman/CNET

La lista de software de referencia que utilizamos cambia con el tiempo a medida que los dispositivos que probamos evolucionan. Las pruebas principales más importantes que estamos ejecutando actualmente en cada ordenador compatible son:

Primate Labs Geekbench 5 y 6 Ejecutamos pruebas tanto de CPU de un solo núcleo como de múltiples núcleos, y la prueba de cómputo Vulkan (Windows) o Metal (MacOS). En Android, dispositivos Apple y Chromebooks, ejecutamos las pruebas de la CPU y la prueba de cómputo. Las pruebas de la CPU de Geekbench miden el rendimiento de una carga de trabajo mixta. (Ejecutamos ambas versiones de la prueba para poder comparar con los modelos probados antes de que estuviera disponible Geekbench 6.)

Cinebench R23 Ejecutamos tanto las pruebas de un solo núcleo como de múltiples núcleos en dispositivos Windows y MacOS. Cinebench mide el rendimiento de procesamiento puro de la CPU para renderizado 3D.

PCMark 10 Estamos eliminando gradualmente esta prueba de referencia de Windows, pero en este momento aún ejecutamos la versión de la generación anterior, que simula una amplia gama de funciones, incluyendo navegación web, videoconferencias, edición de fotos, edición de video y más.

3DMark Wild Life Extreme Ejecutamos esta prueba en sistemas MacOS (silicio de Apple), Windows, Android y iPadOS; es una de las pocas pruebas de referencia multiplataforma disponibles para evaluar el rendimiento gráfico. Además, también la ejecutamos en modo ilimitado, lo que elimina la resolución de la pantalla como variable al realizar comparaciones entre dispositivos.

3DMark Fire Strike Ultra, Time Spy y Port Royal Ejecutamos estas pruebas en cualquier sistema con una GPU discreta para evaluar el rendimiento gráfico de DirectX 11 y DirectX 12 de un sistema, lo cual es especialmente importante para ordenadores de juegos. Estamos eliminando Port Royal, que está diseñado específicamente para probar el rendimiento de trazado de rayos de Nvidia, y cambiando a DXR de 3DMark o Speed Way (la primera prueba el rendimiento de trazado de rayos de DX12 Ultimate y la segunda prueba una mezcla de las características de DX12 Ultimate). También hemos agregado pruebas de Perfilador de CPU, Almacenamiento y Características de PCI de 3DMark para comprender los resultados que obtenemos de pruebas con cargas de trabajo más mixtas.

Prueba de referencia de Shadow of the Tomb Raider Este es un juego más antiguo que puede funcionar bien en hardware de juegos de gama baja. Equilibra las cargas de CPU y GPU en lugar de depender exclusivamente de la GPU, y muestra cómo se utilizan ambas. Ejecutamos la prueba incorporada en el juego en sistemas con una GPU discreta utilizando el ajuste de calidad más alto en una resolución de 1.920×1.080.

Prueba de referencia de Guardians of the Galaxy Un juego más moderno que aún puede ejecutarse en hardware de juegos de gama baja, esto mide el rendimiento puro de la GPU. Ejecutamos la prueba principal en una resolución de 1.920×1.080 píxeles en Alta Calidad, pero en hardware relevante podemos ejecutarlo a resoluciones más altas y mayor calidad (como con trazado de rayos completo habilitado) para comparación.

Pruebas de CPU y GPU de The Rift Breaker The Rift Breaker incorpora tanto acción como simulación compleja, lo que significa que puede depender en gran medida de la CPU y la GPU para diferentes aspectos del juego. Ejecutamos la prueba principal en una resolución de 1.920×1.080 píxeles en Alta Calidad, pero en hardware relevante podemos ejecutarlo a resoluciones más altas y mayor calidad (como con trazado de rayos completo habilitado) para comparación.

Benchmarks UL Procyon Si un sistema cumple con los requisitos básicos para ejecutar Adobe Premiere Pro y Photoshop con Photoshop Lightroom Classic, utilizamos estos dos benchmarks con una resolución de 1.920×1.080 píxeles para medir la idoneidad de un sistema para la creación de contenido. También proporcionan una imagen de cómo se manejan las cargas mixtas de CPU y GPU, a diferencia de los benchmarks puramente de GPU.

Prueba de duración de la batería Para todas las computadoras con batería, cambiamos la configuración para evitar que el sistema se suspenda o hiberne, desactivamos las ventanas emergentes y notificaciones que puedan interferir con la prueba, y ajustamos el brillo de la pantalla y el volumen (salida a auriculares) al 50%. Luego transmitimos un video personalizado de YouTube en bucle a través de Wi-Fi en Chrome y utilizamos una aplicación de temporizador para controlar cuánto tiempo permanece activo el sistema.

JetStream 2, MotionMark y WebXPRT 3 Ejecutamos estas pruebas basadas en el navegador para evaluar el rendimiento de las Chromebook y, ocasionalmente, las ejecutamos en sistemas Windows para comparar.

Josh Goldman/CNET

Pruebas adicionales

Podemos realizar varias pruebas adicionales o variaciones en las pruebas estándar; por ejemplo, ejecutaremos Geekbench y Cinebench con la batería para poder ver el impacto que tienen las configuraciones de ahorro de energía de una computadora portátil en el rendimiento. Para sistemas con componentes potentes, podemos ejecutar bucles de otros benchmarks para ver qué tan estable es el sistema y qué tan calientes pueden llegar a ser los componentes bajo una carga completa.

Las pruebas discrecionales también pueden incluir las tecnologías de escalado y optimización de juegos DLSS 2 y 3 (en Nvidia), FidelityFX Super Resolution 2.x (en AMD) o XeSS (para hardware de Intel) en 3DMark, así como en juegos que las admitan. Para sistemas con GPU de gama media y superior, a veces ejecutamos SpecViewPerf 2020 (creación y análisis de contenido profesional más allá de la edición de fotos y videos) o pruebas anecdóticas con OBS Studio (transmisión).

Como parte de una reseña, generalmente incluimos un gráfico de comparación de puntuaciones de pruebas relevantes entre productos comparables. Cuando realizamos un cambio importante en las pruebas, como pasar de una versión de una prueba a otra, probamos ambas versiones o el conjunto completo de pruebas antiguas y nuevas para construir una base de datos de datos de comparación.

Actualmente estamos evaluando dos conjuntos más de benchmarks para incluir en nuestra suite de pruebas: las pruebas de inferencia de IA recientemente agregadas de UL Procyon y Returnal, un juego con gráficos de alta calidad y un benchmark informativo.

Con tantas computadoras que utilizan el mismo puñado de CPUs y GPUs, los mismos sistemas operativos y cantidades similares de RAM y almacenamiento, estos resultados de benchmarks generalmente se ajustan a nuestras expectativas. Eso significa que, al observar las especificaciones de un sistema, podemos tener una idea razonable de cómo se desempeñará en comparación con sistemas con especificaciones mejores o peores. Es cuando comparamos con sistemas con especificaciones similares que una marca en particular puede destacar como buena, no tan buena o simplemente promedio. Especialmente en el caso de las computadoras portátiles, el rendimiento refleja las decisiones del fabricante sobre dónde asignar la energía, incluso cuando está enchufada. Se ha vuelto especialmente confuso, porque puede haber múltiples formas de cambiar configuraciones o ajustes automáticos impulsados por “IA” que hacen imposible saber qué está sucediendo realmente.