支持7块RTX3090静音级深度学习工作站硬件配置方案2021v2

时间:2020-10-05   来源:   网友评论:0   人气: 1719 作者:

本方案中,推荐配置报价更新日期:2021/03/06

变更原因:

1)近期唯利是图的厂家将RTX显卡大部分卖给挖矿的,造成断货、暴涨

2)RTX A6000上市、增加新GPU配置方案

3)GX630M保证6块GPU卡全部在Pcie 16X(6个 16x)带宽,而不是市场其他品牌机型是4个16x+2个8x

 

nvidia的 Ampere架构-RTX 3090上市,该卡是第一个拥有超1万个流处理器的最强算力GPU卡,由于该卡外形尺寸巨大,长度达313mm,厚度3个槽,另外功耗到350w,常规GPU计算机/工作站最多支持1~2块,市场上是否有支持更多RTX3090的硬件配置?
西安坤隆公司的UltraLAB GX630M深度学习工作站可支持到最大6块RTX3090卡或7块RTX3070,用于深度学习训练和推理,该配置的深度学习工作站的张量计算单元(Tensor Core)FP16性能达到1.7PTflops(理论上),这是目前最快的。

(一)UltraLAB深度学习工作站支持RTX30情况

No

机型

关键配置

备注

1

GX380i

/GX390i

intel9/10代高频

(8@5Ghz-105.2GHz

最大2RTX30系列

内存最大128GB

静音级

2RTX3090性能超4Titan RTX

2RTX3080性能超4RTX2080ti

2

GT410P

intel10代至尊处理器

(104.6GHz-184.2GHz),

内存最大256GB

最大5RTX30系列,

20个硬盘位

静音级

4RTX3080性能超7Titan RTX82080Ti

3

GX630M

2Xeon(最大56核)

最大6-7RTX30系列

20个硬盘位

静音级

是目前具有最高GPU算力的工作站


UltraLAB深度学习工作站-GPU配备规格

下表是UltraLAB深度学习机型可供配置组合(按最高性能指标降序)

 

No

型号

卡数

CUDA核数

FP32 (单位Tflops

张量计算FP16(单位Tflops)

显存带宽GBs

显存合计GB

应用推荐

1

A6000

7

75264

280

2184

768

336

CNN+RNN

2

RTX3090

7

73472

249

1995

936

168

CNN+RNN

3

A6000

6

64512

240

1872

768

288

CNN+RNN

4

RTX3080

8

69632

238

1904

760

80

CNN

5

Tesla V100

16

81920

238

1760

653

192

CNN+RNN

6

RTX3090

6

62976

213

1710

936

144

CNN+RNN

7

RTX3080

6

52224

179

1428

760

60

CNN

8

RTX3090

5

52480

178

1425

936

120

CNN+RNN

9

A6000

4

83968

160

1248

768

192

CNN+RNN

10

RTX3080

5

43520

149

1190

760

50

CNN

11

RTX3090

4

41984

142

1140

936

96

CNN+RNN

12

RTX3070

7

41216

142

1141

448

56

CNN

13

RTX2080Ti

9

39168

121

990

616

99

CNN

14

RTX3070

6

35328

122

978

448

48

CNN

15

RTX3080

4

34816

119

952

760

40

CNN

16

Titan RTX

7

32256

114

910

672

168

CNN+RNN

17

RTX2080Ti

8

34816

108

880

616

88

CNN

18

RTX3090

3

41984

107

855

936

72

CNN+RNN

19

RTX3070

5

29440

102

815

448

40

CNN

20

RTX3080

3

34816

89

714

760

40

CNN

21

RTX3070

4

23552

81

652

448

32

CNN

22

A6000

2

21504

80

624

768

96

CNN+RNN

23

RTX3090

2

20992

71

570

936

48

CNN+RNN

24

Titan RTX

4

18432

65

520

672

96

CNN+RNN

25

RTX3070

3

23552

61

489

448

24

CNN

26

RTX3080

2

17408

60

476

760

20

CNN

27

RTX2080Ti

4

17408

54

440

616

44

CNN

28

RTX2080s

4

12288

44

252

496

32

CNN

29

RTX3070

2

11776

41

326

448

16

CNN

30

A6000

1

10752

40

312

768

48

CNN+RNN

31

RTX3090

1

10496

36

285

936

24

CNN+RNN

32

Titan RTX

2

9216

32

260

672

48

CNN+RNN

33

RTX3080

1

8704

30

238

760

10

CNN

34

RTX2080Ti

2

8704

28

220

616

22

CNN

35

RTX2080s

2

3072

22

126

496

16

CNN

36

RTX3070

1

5888

20

163

448

8

CNN

37

Titan RTX

1

4608

16

130

672

24

CNN+RNN

38

TITAN V

1

5120

14.90

110

652.80

12

 

39

RTX2080Ti

1

4352

13

110

616

11

CNN

从上述表格看:

(1) 6块RTX3090(6个全pcie 16x)已经接近nvidia DGX-2性能

(2) 4块RTX3090性能超9块RTX2080Ti或7块Titan RTX

(3)2块RTX3080性能超4块Titan RTX


 

文章评论