디지털 라이프 電子的生活 My Digital Life/슈퍼컴퓨터 (HPC)

제 52회 (2018.11) TOP500 슈퍼컴퓨터 랭킹 분석

미친도사 2018. 11. 25. 08:21

서버와 슈퍼컴퓨터(이하 HPC) 관련 일하면서 사는 미친도사입니다...

매년 6월과 11월에 발표되는 세계 슈퍼컴퓨터 TOP500 랭킹이 이번 11월에도 어김없이 발표되었습니다.

이 랭킹을 한번 훑어봄으로 해서 세계 HPC 시장의 분위기를 파악해 보려 합니다.


지난 주 초에 발표되었지만, 슈퍼컴퓨팅쇼 (이하 SC18) 출장으로 조금 분석이 늦어졌습니다.

모든 자료는 www.top500.org 사이트의 랭킹 자료를 근거로 제가 재구성한 것임을 알립니다.


자, 한번 보죠. 내용이 좀 깁니다.


자료의 순서는 다음과 같습니다. 


이번 회차 랭킹의 상위 20대입니다.


잘 안 보이니, TOP500 사이트에서 가져와 봅니다. 


RankSiteSystemCoresRmax (TFlop/s)Rpeak (TFlop/s)Power (kW)
1DOE/SC/Oak Ridge National Laboratory
United States
Summit - IBM Power System AC922, IBM POWER9 22C 3.07GHz, NVIDIA Volta GV100, Dual-rail Mellanox EDR Infiniband 
IBM
2,397,824143,500.0200,794.99,783
2DOE/NNSA/LLNL
United States
Sierra - IBM Power System S922LC, IBM POWER9 22C 3.1GHz, NVIDIA Volta GV100, Dual-rail Mellanox EDR Infiniband 
IBM / NVIDIA / Mellanox
1,572,48094,640.0125,712.07,438
3National Supercomputing Center in Wuxi
China
Sunway TaihuLight - Sunway MPP, Sunway SW26010 260C 1.45GHz, Sunway 
NRCPC
10,649,60093,014.6125,435.915,371
4National Super Computer Center in Guangzhou
China
Tianhe-2A - TH-IVB-FEP Cluster, Intel Xeon E5-2692v2 12C 2.2GHz, TH Express-2, Matrix-2000 
NUDT
4,981,76061,444.5100,678.718,482
5Swiss National Supercomputing Centre (CSCS)
Switzerland
Piz Daint - Cray XC50, Xeon E5-2690v3 12C 2.6GHz, Aries interconnect , NVIDIA Tesla P100 
Cray Inc.
387,87221,230.027,154.32,384
6DOE/NNSA/LANL/SNL
United States
Trinity - Cray XC40, Xeon E5-2698v3 16C 2.3GHz, Intel Xeon Phi 7250 68C 1.4GHz, Aries interconnect 
Cray Inc.
979,07220,158.741,461.27,578
7National Institute of Advanced Industrial Science and Technology (AIST)
Japan
AI Bridging Cloud Infrastructure (ABCI) - PRIMERGY CX2570 M4, Xeon Gold 6148 20C 2.4GHz, NVIDIA Tesla V100 SXM2, Infiniband EDR 
Fujitsu
391,68019,880.032,576.61,649
8Leibniz Rechenzentrum
Germany
SuperMUC-NG - ThinkSystem SD530, Xeon Platinum 8174 24C 3.1GHz, Intel Omni-Path 
Lenovo
305,85619,476.626,873.9
9DOE/SC/Oak Ridge National Laboratory
United States
Titan - Cray XK7, Opteron 6274 16C 2.200GHz, Cray Gemini interconnect, NVIDIA K20x 
Cray Inc.
560,64017,590.027,112.58,209
10DOE/NNSA/LLNL
United States
Sequoia - BlueGene/Q, Power BQC 16C 1.60 GHz, Custom 
IBM
1,572,86417,173.220,132.77,890
11DOE/NNSA/LLNL
United States
Lassen - IBM Power System S922LC, IBM POWER9 22C 3.1GHz, Dual-rail Mellanox EDR Infiniband, NVIDIA Tesla V100 
IBM / NVIDIA / Mellanox
248,97615,430.019,904.4
12DOE/SC/LBNL/NERSC
United States
Cori - Cray XC40, Intel Xeon Phi 7250 68C 1.4GHz, Aries interconnect 
Cray Inc.
622,33614,014.727,880.73,939
13Korea Institute of Science and Technology Information
Korea, South
Nurion - Cray CS500, Intel Xeon Phi 7250 68C 1.4GHz, Intel Omni-Path 
Cray Inc.
570,02013,929.325,705.9
14Joint Center for Advanced High Performance Computing
Japan
Oakforest-PACS - PRIMERGY CX1640 M1, Intel Xeon Phi 7250 68C 1.4GHz, Intel Omni-Path 
Fujitsu
556,10413,554.624,913.52,719
15Eni S.p.A.
Italy
HPC4 - Proliant DL380 Gen10, Xeon Platinum 8160 24C 2.1GHz, Mellanox InfiniBand EDR, NVIDIA Tesla P100 
HPE
253,60012,210.018,621.11,320
16Commissariat a l'Energie Atomique (CEA)
France
Tera-1000-2 - Bull Sequana X1000, Intel Xeon Phi 7250 68C 1.4GHz, Bull BXI 1.2 
Bull, Atos Group
561,40811,965.523,396.43,178
17Texas Advanced Computing Center/Univ. of Texas
United States
Stampede2 - PowerEdge C6320P/C6420, Intel Xeon Phi 7250 68C 1.4GHz/Platinum 8160, Intel Omni-Path 
Dell EMC
367,02410,680.718,309.2
18RIKEN Advanced Institute for Computational Science (AICS)
Japan
K computer, SPARC64 VIIIfx 2.0GHz, Tofu interconnect 
Fujitsu
705,02410,510.011,280.412,660
19CINECA
Italy
Marconi Intel Xeon Phi - CINECA Cluster, Lenovo SD530/S720AP, Intel Xeon Phi 7250 68C 1.4GHz/Platinum 8160, Intel Omni-Path 
Lenovo
348,00010,384.918,816.0
20National Center for High Performance Computing
Taiwan
Taiwania 2 - QCT QuantaGrid D52G-4U/LC, Xeon Gold 6154 18C 3GHz, Mellanox InfiniBand EDR, NVIDIA Tesla V100 SXM2 
Quanta Computer / Taiwan Fixed Network / ASUS Cloud
170,3529,000.015,208.2798


20위 안에 독일 라이프니츠의 연구소의 시스템과 미국 에너지부 산하 국가 핵보안국, 로렌스 리버모어 국립 연구수의 시스템이 각각 8위와 11위에 각각 새롭게 올랐습니다.

우리나라 KISTI의 시스템이 지난 회차에 11위에 등재된 이후 현재 13위에 위치하고 있습니다.

더 많은 얘기는 TOP500 사이트에서 이번 회차에 대해 요약한 부분에서 다뤄보겠습니다.


위의 자료가 잘 안 보일 것 같아 다시 텍스트로 옮겼습니다.

  •  52TOP500 리스트는 상위 10위 안에 미국 에너지부(Department of Energy, DOE) 슈퍼컴퓨터 다섯 대가 등재되었습니다. 1위가 Oak Ridge 국립연구소(ORNL)Summit, 2위에는 Lawrence Livermore 국립연구소 (LLNL)Sierra가 차지했습니다.
  •  Summit1위 시스템으로의 우위를 연장했는데, HPL 성능을 20186월에 등재되었을 때의 122.3PF/s에서 143.5PF/s로 향상시켰습니다. 2위인 Sierra 역시 6개월 전의 성능인 71.6PF/s에서 94.6PF/s로 향상된 결과를 등재하여 3위에서 2위로 올라섰습니다. 이 시스템들은 IBM 에서 제조하였으며, Power9 CPUNVIDIA V100 GPU를 탑재하였습니다.
  •  Sierra의 순위 상승은 지난 6월 이전까지 93.0PF/s의 성능으로 2년 동안 TOP5001위 자리를 지켰던 중국의 Wuxi의 국가 슈퍼컴퓨팅 센터에 설치되어 있는 Sunway TaihuLight 슈퍼컴퓨터를 3위로 밀어냈습니다. TaihuLight는 중국의 National Research Center of Parallel Computer Engineering & Technology (NRCPC)에서 개발되었습니다.
  •  중국 광저우의 국가 슈퍼컴퓨팅 센터에 설치된 Tianhe-2A 는 이제 61.4PF/sLNPACK 성능으로 4위입니다. 이번에 중국의 National University of Defense Technology (NUDT)에 의해 오래된 Intel Xeon Pho 가속기를 자체 개발한 Matrix-2000 칩으로 업그레이드되었습니다.
  •  5위는 Cray가 스위스의 Lugano에 위치한 스위스 국가 슈퍼컴퓨팅 센터(CSCS)에 설치한 XC50 장비인 Piz Daint입니다. 21.2PF/s의 성능으로 유럽에서 가장 강력한 시스템 위치를 지켰습니다. 이 시스템은 Intel Xeon 프로세서와 NVIDIA Tesla P100 GPU가 탑재되어 있습니다.
  •  Los Alamos National LaboratorySandia National Laboratory에서 운영중인 Cray XC40 시스템인 Trinity20.2PF/s로 성능을 향상시키면서, 6위로 한 단계 상승했습니다. TOP10 이내에서는 유일하게 인텔 Xeon Phi를 사용하는 시스템입니다.
  •  일본의 국립 연구소인 Advanced Industrial Science and Technology (AIST)에 설치된 AI Bridging Cloud Infrastructure (ABCI)19.9PF/sLinpack 성능으로 7위에 올랐습니다. 일본 후지쯔가 Intel Xeon Gold 프로세서와 NVIDIA Tesla V100 GPU를 이용하여 구축하였습니다.
  •  독일이 SuperMUC-NG로 새롭게 TOP10에 등장했습니다. 이 시스템은 뮌헨 근처의 GarchingLeibniz Supercomputing Centre (Leibniz-Rechenzentrum)레노버가 구축하였습니다. 311,040개의 Intel Xeon 코어와 19.5PF/sHPL 성능으로 8윌를 차지하였씁니다.
  •  미국 에너지부의 Oak Ridge National Lab에 설치된 CrayXK7Titan은 현재 9위입니다. 이전에 미국에서 가장 강력한 시스템이었습니다. NVIDIA K20x GPU 가속기로 17.6PF/s를 달성했습니다.
  •  2011년에 17.2PF/s의 성능으로 처음 등재된 IBMBlueGene/Q 장비인 에너지부의 LLNL에 설치된 Sequoia10위에 위치했습니다. 


TOP500의 뉴스 요약을 그대로 번역한 것입니다.

특이할 만한 점은 ...

- 지난 회차에 1, 3위였던 IBM의 Summit과 Sierra가 시스템 설치가 완료되어서인지, 전체 성능이 조금씩 더 향상되어 1, 2위에 올랐습니다. 

- 미국의 시스템이 1, 2위가 되면서, 중국 시스템이 3, 4위가 되었는데 이게 주목할 만합니다.

  3위는 중국에서 자체 개발한 CPU로 만들어진 시스템으로 이미 1위를 했던 시스템이고,

  4위 역시 수년간 1위를 했던 시스템인데 이번에 가속기를 Xeon Phi에서 자체 개발한 가속기로 업그레이드하면서 성능이 향상되었습니다.

  국가 주도로 HPC와 관련한 원천 기술 연구가 꾸준히 이뤄지고, 그 성과물이 나오고 있는 것 같습니다.

  굉장히 중요하다 보이는 부분입니다.

- 업그레이드한 시스템이 많이 보입니다. 10위 안에 다섯 대가 시스템 업그레이들 한 시스템들입니다. 모두 한 성능하는 시스템들이지만, 더 잘 쓸 수 있도록 노력하는 모습이네요.


 


지난 회차(오른쪽 그래프)에서  예측한 것에서 크게 변화는 없어 보입니다.

단일 시스템으로 엑사(Exa-, 10의 18제곱 Flops/sec) 스케일 시스템이 나오는 것은 2020년 정도 될 것으로 보입니다.

현재 1위가 이론값 200PF/s, 실측값 144PF/s이니 2년 내에 현재 1위 시스템보다 5배 이상의 성능인 시스템이 등장한다는 예측입니다.

성능 추이를 보면 가운데 갈색 점들이 1위 시스템의 성능 추이인데, 몇년에 한번씩 훅! 뛰어난 성능의 시스템이 등장하는 것을 보면 실현 가능한 예측인 것 같습니다.

몇 년 전에 미국 에너지부에서 엑사스케일로 준비하던 3대 프로젝트 중 2개가 Summit, Sierra로 등장하여 1, 2위를 차지하고 있고, 크레이의 Shasta가 정식으로 이번 SC18에서 공개되어 초대형 HPC 등장을 예고하고 있습니다.


인텔이 멀티 코어 프로세서 라인업인 Xeon Phi의 개발을 포기함으로써, 차기 Xeon 프로세서 라인업의 성능과 NVIDIA의 Volta 이후의 GPU 프로세서의 성능이 이 경쟁에 어떤 영향을 줄 지가 무척 관심이 갑니다.

IBM의 Power9 프로세서로 IBM이 아닌 서드 파티 제조사들이 서버를 만들어 공급하기 시작한 점도 흥미롭고, 향후 랭킹에 어떤 영향을 줄 지 궁금해집니다.


지난 회차부터 레노버가 많은 수의 시스템을 구축하여 등재하여 이번엔 2위와의 격차를 많이 벌려 놨습니다.

HP가 수년간 이런 형태의 점유율을 유지하고 있었는데, HP가 하락한 만큼을 레노버가 확보하는 것 같습니다.

중국 내에서만 구축하고 있는 inspur와 Sugon은 꾸준히 점유율을 높이고 있습니다. 중국에 얼마나 많은 시스템이 구축되고 있는 건가요. 놀랍습니다.


하지만, 100위까지의 대형 HPC에 대해서는 사실 큰 변화는 없는 편입니다.

여전히 슈퍼컴퓨터의 아이콘 Cray의 점유율이 제일 많습니다. 


시스템 댓수의 점유율도 중요하지만, 말그대로 슈퍼컴퓨터인데 성능이 중요하죠!

얼마나 강력한 시스템을 공급했는지 보면, 역시 1, 2등을 보유한 IBM이 점유율이 가장 높습니다. 그리고, 자잘하지만 수량을 많이 늘린 레노버가 2위네요.


100위 안에서는 IBM의 비중이 더 크게 보이며, 역시나 대형 시스템 보유가 많은 Cray가 2위입니다.

NRCPC와 NUDT는 #3, #4인 중국 시스템 제조사입니다. 여러 대 등재시킨 HPE에 꿀리지 않습니다. 하~

상대적으로 전체 댓수가 많은 Lenovo는 100위 안에서의 성능으로 보면 좀 밀리죠. 상대적으로 작은 규모 시스템이 많다고 할 수 있겠습니다.


수많은 컴퓨터를 병렬 연결하는 HPC에서 네트워크는 매우 중요하다 하겠습니다. 시스템 댓수로 보면 저렴하게 구현 가능한 10G, 40G 이더넷이 많습니다.

최근 인텔이 주력 10G 이더넷 어댑터 라인업을 25G로 업그레이드해서인지, 25G 이더넷 비중도 많이 높아졌습니다.


하지만, 성능이란 측면에서 보면 역시나 인피니밴드입니다. 100G 속도의 인피니밴드 EDR이 점차 비중이 높아지고 있습니다.

인텔의 100G 고속 네트워크 솔루션인 옴니 패스 역시 조금씩 점유율이 높아지고 있습니다.

이번 SC18에서 만난 미국의 HPC 공급 업체와 인텔 본사의 관계자 얘기로는 올해 옴니 패스 꽤 선방했다 하네요.


인텔 진영이 아직 PCI Express가 3세대인데 반해, IBM의 Power9 프로세서는 PCI Epxress 4세대를 지원하며 인피니밴드 역시 200G인 HDR을 지원할 수 있게 되었습니다.

이번 SC18 전시장에서 멜라녹스가 인피니밴드 HDR의 데모를 보였는데 인상적이더군요.

멜라녹스에서는 PCI Express 3세대를 위한 HDR 솔루션을 제공하고는 있지만, 대역폭 문제로 PCI 슬롯을 2개 차지합니다.

Power9 시스템 + 인피니밴드 200G로 구성된 HPC가 다음 회차 정도에 등장하지 않을까 예측해 봅니다.


국가별 점유율은 역시나 중국이 6개월 전보다도 더 많이 구축했습니다.

큰 시스템 많은 미국이 성능 점유율은 더 높고요.


큰 점유율을 차지하는 나라들 외에 저는 이번 차트에서 프랑스와 이탈리아가 눈에 띕니다. 특히 이탈리아.

우리보다 늘 조금 적은 댓수와 규모였던 것 같은데, 이번 차트에서는 상당히 크고 많아졌습니다.

20위에 처음 등재된 타이완의 시스템을 덕에 타이완도 성능 차트에서 보이기 시작하는 것도 제겐 좀 특이했습니다.


프로세서는 인텔의 새로운 라인업인 Skylake가 점유율을 높여가고 있습니다. 전체적으로 인텔의 서버 라인업인 Xeon 제품군이 85% 가량 차지합니다.

하지만, 성능이란 측면에서는 IBM의 Power 라인업의 비중이 증가하는 게 보입니다.

1, 2위가 IBM의 Power9이기도 한데, NVIDIA GPU와의 최적 연결 인터페이스(물론 NVIDIA 주장이긴 합니다만)인 NVLINK의 탑재, 현재 PCI Exress 3세대보다 2배의 대역폭을 가진 PCI Express 4세대 등을 탑재한 Power9은 인텔의 Xeon 프로세서에 위협이 되는 것은 확실해 보입니다.

거기에다가 IBM 뿐만 아니라 서드 파티 서버 보드 제조업체에서도 Power9을 탑재하는 시스템들이 출시되고 있어 HPC 시장에서의 인텔 독재가 위협을 받을 수도 있겠다 싶은 생각이 듭니다.

그리고, 이번 SC18에서 보면, AMD의 EPYC 프로세서 라인업에 대해서도 관심이 높아지고 접근하고 있는 서버 제조사가 증가하고 있는 것도 주목할 만했습니다.

EPYC가 HPC에 그닥 매력적이라 생각하지 않았는데, 좀 관심 갖고 스터디해봐야 할 아이템이 되어가는 것 같습니다.

특히나 오래동안 AMD의 강력한 지지자였던 Cray가 AMD 프로세서로 제품 라인업을 추가한 것을 보면 다음 랭킹에서는 AMD의 괄목할만한 성장을 보게 될 지도 모르겠습니다.

 

NVIDIA Tesla 라인업으로 대표되는 가속기를 탑재한 시스템은 점점 더 늘어나고 있습니다.

시스템 수로 보면 27% 정도 점유율이지만, 성능으로 보면 41%를 넘는 점유율로 점차 그 세력을 넓히고 있음 확실합니다.

NVIDIA GPU 외에도 용도에 맞게 자체 개발하는 가속기도 조금씩 늘어나고 있는 부분도 흥미롭습니다.

특히 현재 #4인 중국의 Tianhe-2A은 자체 가속기로는 가장 높은 성능을 보이는 시스템이네요.

NVIDIA는 거의 10년 전부터 CUDA란 환경을 홍보하고 발전시켜 오고, Machine Learning (이하 ML)의 붐으로 점차 점유율을 높여갈 것으로 보입니다.


현대 HPC의 형태인 병렬 슈퍼컴퓨터는 사실 누가 더 많이 연결해서 쓰느냐가 중요하긴 합니다만, 소비 전력 역시 큰 문제가 됩니다.

고효율 시스템의 중요성이 점점 더 커지는 것은 당연한 것이지요.

그런 면에서 가속기를 쓴 시스템들이 성능당 전력 효율이 확실히 좋습니다.

그렇다고 해서, 가속기가 만능은 아니기에, 용도에 따라 일반 CPU만으로만 구성하는 HPC가 여전히 많은 것도 당연하다 하겠습니다.

NVIDIA의 Volta 코어가 확실히 성능이 좋아서, 같은 소비 전력의 Pascal 코어 제품을 거의 다 밀어내고 고효율 부문을 거의 싹쓸이 하고 있습니다.

그 사이에 자체 가속기를 쓴 제품들도 인상적이네요.


HPC의 수요와 활용은 확실히 늘고 있습니다. 6개월 전에 비해 최근(1년 이내) 구축한 시스템이 더욱 늘었습니다. 앞으로 더 많아지겠지요?


우리 나라의 HPC입니다. 지난 랭킹에서 400위 권에 있던 시스템들이 모두 밀려 나고, 2대가 새롭게 진입했습니다.

올해 우리나라 HPC 시장이 조금은 위축되었던 것 같긴 합니다.

하지만, 그 와중에도 조금씩 도입에 대한 관심이 늘고 있고, 작은 시스템이지만 구축이 이뤄지고 있는 것을 체감한 해였습니다.


이번 52회차 TOP500 랭킹을 정리해 보았습니다.


위에서도 대개는 언급했던 내용이지만, 수년간 이 랭킹을 정리해 오고 이번 SC18에 다녀와서 느낀 점을 다시 정리해 보자면...

- 인텔 이외의 CPU의 약진 - IBM Power9, AMD EPYC, ARM 계열의 서버 프로세서 등의 확대가 예상된다.

- 가속기에서는 NVIDIA Tesla V100의 독주! 하지만, ML 위주라면 새로운 Turing 코어인 Tesla T4도 주목!

- 중국의 꾸준한 성장, 특히나 자체 기술 확보를 위한 노력이 아주 인상적입니다.


이 정도로 해서 이번 52회차 TOP500 랭킹을 정리해 보았습니다.

감사합니다.

반응형