Todos los que están familiarizados con el aprendizaje profundo saben que el aprendizaje profundo requiere capacitación. El llamado entrenamiento es el cálculo para encontrar el mejor valor entre miles de variables. Esto requiere constantes intentos de identificar el valor final no es un número determinado manualmente, sino una fórmula formal. A través de este tipo de aprendizaje a nivel de píxeles y resumen continuo de reglas, las computadoras pueden pensar como humanos. Por lo tanto, las GPU, que son mejores en computación paralela y gran ancho de banda, se han convertido en el centro de atención.
Mucha gente piensa que la configuración de los servidores GPU de aprendizaje profundo es algo diferente a la de los servidores normales, al igual que mucha gente piensa que las máquinas utilizadas para el diseño deben ser muy caras. De hecho, siempre que la tarjeta gráfica o la CPU cumpla con la aplicación del aprendizaje profundo, se puede realizar el aprendizaje profundo. Debido a que el número de núcleos y la arquitectura de la CPU son mucho menos eficientes que la GPU para el aprendizaje profundo, la mayoría de los servidores de aprendizaje profundo funcionan con tarjetas gráficas de alta gama.
Los siguientes son algunos principios y sugerencias sobre cómo elegir un servidor GPU de aprendizaje profundo y cómo elegir un servidor de aprendizaje profundo:
1. Fuente de alimentación: calidad garantizada, potencia suficiente, 30~40 redundancia.
Estable, estable, estable. Una buena fuente de alimentación puede garantizar que el host funcione durante mucho tiempo sin apagarse ni reiniciarse. Es posible que si reinicia repentinamente durante el proceso de cálculo, tenga que empezar de nuevo, lo que no sólo reducirá la eficiencia, sino que también afectará su estado de ánimo. Algunas fuentes de alimentación pueden funcionar bien cuando se utilizan con cargas bajas, pero son propensas a tener problemas cuando se utilizan con cargas elevadas. Al elegir una fuente de alimentación, asegúrese de elegir una fuente de alimentación con redundancia y excelente calidad, y no la sobrealimente casualmente.
2. Tarjeta gráfica: la RTX3090 convencional actual y la última RTX4090 también estarán en el mercado.
Las tarjetas gráficas juegan un papel importante en el aprendizaje profundo y también suponen una gran parte del presupuesto. Si tiene un presupuesto limitado, puede elegir RTX3080/RTX3090/RTX4090 (recién lanzado el mes pasado y disponible el 12 de diciembre de este mes). Si tienes presupuesto suficiente, puedes elegir la tarjeta profesional de aprendizaje profundo Titan RTX/Tesla v 100/a 6000/a 100/h 100 (suministro suspendido temporalmente), etc.
3.CPU: Ambos son dominantes. De lo que quiero hablar aquí es del posicionamiento de los procesadores a nivel de PC y de servidor.
Los procesadores Intel incluyen Xeon, Core, Celeron, Pentium y Atom5, y el servidor utiliza Xeon. El más común actualmente en el mercado es Core. Actualmente se trata de la tercera generación de procesadores de la serie Xeon Scalable, que se dividen en tres tipos: platino, oro y plata.
Los procesadores AMD se dividen en Ryzen Ryzen, Ryzen Ryzen Pro, Ryzen Threadripper y Snapdragon EPYC Snapdragon es la CPU del lado del servidor, y Ryzen es el más común. Actualmente es el procesador EPYC (Snapdragon) de tercera generación y la serie EPYC 7003 de tercera generación de AMD tiene hasta 64 núcleos.
La elección entre unidireccional o bidireccional depende del software. El simple hecho de usar cálculos de GPU en realidad no supone mucha carga para la CPU. Considerando más usos, por supuesto que la CPU no puede ser tan mala. Las CPU convencionales de múltiples núcleos y subprocesos de alto rendimiento son suficientes.
4. Memoria: única 16G/32G/64G opcional. La memoria a nivel de servidor tiene función ECC, pero la memoria a nivel de PC no. Esto es muy importante.
La memoria inicial es de 32G y se puede ampliar, lo cual es suficiente. Si no es suficiente, puedes agregar más más adelante. Comprar demasiado también es un desperdicio.
5. Disco duro: disco de estado sólido y disco duro mecánico. Por lo general, el disco del sistema utiliza una unidad de estado sólido para mayor velocidad y el disco de datos utiliza un disco mecánico para el almacenamiento.
No hay mucha diferencia en los protocolos Nvme o SATA entre las opciones de estado sólido de nivel empresarial de las grandes marcas, así que no consideres varios de estado sólido, ya que de repente se estropearán cuando se utilicen. .
6. Plataforma del chasis: A nivel de servidor, se recomienda elegir la plataforma de placa base Super Micro. La estabilidad y la confiabilidad son los primeros requisitos.
Reserve suficiente espacio para facilitar las actualizaciones, como usar una sola tarjeta gráfica ahora y agregar otra tarjeta gráfica más adelante; la estructura debe ser razonable y el espacio razonable es más propicio para la circulación del aire. Es mejor agregar algunos ventiladores del chasis con buenos efectos de enfriamiento para ayudar en el enfriamiento. La temperatura también es un factor de inestabilidad.
7. Soporte/soluciones de software y hardware: Sí.
Direcciones de aplicación: aprendizaje profundo, computación cuantitativa, dinámica molecular, bioinformática, procesamiento de señales de radar, procesamiento de datos sísmicos, adaptación óptica, transcodificación y decodificación, imágenes médicas, procesamiento de imágenes, descifrado de contraseñas, análisis de valores numéricos, computacional. dinámica de fluidos, diseño asistido por computadora y muchos otros campos de investigación científica.
Software: Caffe, TensorFlow, Abinit, Amber, Gromacs, Lamps, Namd, VMD, Materials Studio, Wien2K, Gaussian, Vasp, CFX, OpenFoam, ABAQUS, ANSYS, LS-DYNA, Maple, MATLAB, Instalación, depuración, optimización, capacitación, mantenimiento y otros servicios y soporte técnico de Blast, FFTW, NASTRAN.
————————————————
Declaración de derechos de autor: este artículo es un artículo original del blogger de CSDN “AI 17316391579” y sigue CC 4.0 Contrato de Copyright BY-SA. Adjunte el enlace de la fuente original y esta declaración al reimprimir.
Enlace original:/AI 17316391579/article/details/12753617.