Hỗ trợ

Mọi thắc mắc cần hỗ trợ xin liên hệ với chúng tôi.


- Email: support@1raovat.vn

- Hotline: 0989248186

- Yahoo: lekiet250986

|Liên hệ |Sitemap

Bên trong cụm siêu máy vi tính AI DGX SaturnV của NVidia

ID tin: 7666604
Đã xem: 15
Nơi đăng: Toàn Quốc
Đăng lúc:
Giá: Call
Thông tin liên hệ
Khách vãng lai

nhìn toàn diện, những đơn vị phân phối chip lớn số 1 quả đât khá kín mít về những siêu máy tính xách tay (supercomputer) khổng lồ mà họ sử dụng để thiết kế và thử nghiệm các dòng thiết bị của họ. Nhưng thi thoảng, Intel và AMD cũng đã bật mí một vài manh mối về các hệ thống đặc biệt quan trọng này của mình.

Chúng tôi không rõ NVidia đã sử dụng loại khoáng sản nào cho những hệ thống EDA của mình – chúng tôi đang cố gắng nỗ lực đào bới về điều này – nhưng chỉ biết rằng họ vừa upgrade một siêu laptop rất mạnh để cải tiến và phát triển trí tuệ tự tạo, & cũng để tiến hành mục tiêu kép của họ với mảng kinh doanh họa tiết thiết kế chip.

Là 1 phần của Họp Báo Hội nghị siêu máy tính SC17, NVidia đã trình làng thế hệ tiếp theo sau của hệ thống điện toán lai CPU-GPU có tên gọi là “SaturnV”, có hiệu năng cao hơn nữa, đa chủng loại hơn, nhờ vào việc sử dụng bộ tăng tốc GPU Tesla V100 dựa vào phong cách xây dựng Volta đặc quyền của Nvidia phía bên trong nền tảng gốc rễ sever AI DGX-1.

khối hệ thống Saturn V phiên bản đầu tiên, được reviews tại Hội Nghị SC16 năm kia, dựa trên những sever DGX-1 và bộ bức tốc GPU Tesla P100, có ít oomph hơn và không hỗ trợ Tensor Core, chức năng hiện có trên dòng GPU Volta chuyên cho các giải quyết và xử lý machine learning. Hệ thống này có 124 sever DGX-1P, mỗi sever có hai bộ giải quyết 20 nhân Broadwell Xeon E5 tốc độ 2,2 GHz, bộ lưu trữ CPU 512 GB & tám GPU P100 ở dạng SXM2 form-factor được cho phép chúng được cắm trực tiếp vào bo mạch chủ & thực hiện liên kết NVLink 1.0. Mỗi bộ bức tốc GPU Tesla P100 đều sở hữu stack memory HBM2 16 GB và đã được links trong một mạng lưới hybrid kết nối khối lập phương với nhau.

Sử dụng lưu trữ tài liệu FP16 half-precision trong bộ nhớ lưu trữ GPU, tám GPU Pascal có thể cung ứng 170 teraflop hiệu suất tổ hợp cho các thuật toán học sâu và tổng cộng 42,5 teraflop cho các phép toán double-precision. Mặt chính trên hệ thống DGX-1P có trang bị PCI-Express Switch để links GPU với cặp bộ điều hợp InfiniBand hai cổng 100Gbps từ Mellanox Technologies và cặp đôi cổng Ethernet 10Gbps đi ra từ những bộ giải quyết và xử lý Xeon. Khối hệ thống này có bốn ổ SSD flash 1,92 TB để tàng trữ băng thông cao, thiết yếu để làm cho CPU & GPU làm việc & quan trọng là bộ nhớ cache cực nhanh cho những thuật toán học máy. DGX-1P hợp với chassis 3U và tiêu hao 3200 watt trên toàn bộ các phần tử của nó.

>>> Xem thêm: Lenovo SR550

 

Trên 124 node DGX-1P đó, hệ thống Saturn V lúc đầu có 4,9 petaflops năng suất dấu chấm động “peak double precision” và, chạy thử nghiệm toán học ma trận Linpack Fortran có thể đem lại kết quả giám sát và đo lường 67,5% ở 3,31 petaflops, giúp đem đến địa điểm số 28 trong danh sách 500 siêu máy tính hàng đầu của tháng 11 năm 2016. Có tổng số 350 kilowatt cho tất cả hệ thống, vận động lên đến 9,46 gigaflops mỗi watt, đây là máy Linpack tiết kiệm năng lượng nhất được thí điểm một thời gian trước. Mỗi sever DGX-1P có giá niêm yết 129.000 $ và bao gồm giá trị của người nào software-stack, gói tư vấn, và thêm vào một mạng InfiniBand có chức năng kết hợp toàn bộ những máy chủ trong mạng EDR InfiniBand hai tầng, chúng tôi nghĩ rằng Saturn V phiên bản thuở đầu có mức giá khoảng 18 triệu USD theo niêm yết, hoặc khoảng tầm 3,750 $ mỗi peak teraflop. Máy này hoàn toàn có thể được giảm giá trong môi trường xung quanh thực ra, nhưng do sự hiếm hoi và nhu cầu cao của nó, có thể là không.

Nếu Intel có cổng NVLink trên Xeons, hiệu năng khẳng định sẽ cao hơn nữa không ngờ vực gì nữa, và có 1 Nguyên Nhân thuyết phục để Nvidia dự trù tạo ra một biến thể Power9 của DGX-1. Ví dụ, chúng ta cũng có thể gọi nó là DGP-1V, có nghĩa là sự phối kết hợp của bộ giải quyết và xử lý Power9, liên kết NVLink 2.0 và bộ tăng cường Volta. Với những cổng NVLink trên CPU & sự phối kết hợp bộ nhớ lưu trữ cache trên bộ nhớ CPU và GPU, công suất hiệu suất sẽ tiến hành cải tổ đáng chú ý.

điều đó đưa chúng ta đến bước lặp mới của hệ thống Saturn V, dựa vào các khối hệ thống DGX-1V được tăng cấp đóng gói GPU Volta. Theo như chúng tôi biết, những khối hệ thống DGX-1V chưa được tăng cấp lên bộ giải quyết của Sk Skakeake Xeon SP của Intel & không có Vì Sao nào để làm như vậy khi xem xét rằng chúng có giá bán đắt hơn thế hệ Xe Broadwell trước loại việc làm .

hệ thống máy Saturn V phiên bản mới sẽ giống một con mãnh long hơn, với 660 nodes và nó sử dụng bộ tăng tốc Tesla V100, rõ rệt có nhiều oomph hơn. Hệ thống Saturn V thế hệ thứ 2 cùng có tám bộ tăng tốc GPU cho từng node, nhưng lần này là sử dụng liên kết NVLink 2.0 nhanh hơn để liên kết những GPU, san sẻ bộ nhớ và luồng xử lý. Cụm này có tổng số 5.280 bộ bức tốc GPU Volta, đưa về 80 petaflops hiệu suất cực lớn ở single-precision và 40 petaflops ở double-precision, theo định hướng sẽ khiến cho nó Nằm trong số mười khối hệ thống bậc nhất trên nhân loại ngay cả ở “double precision floating point”. Nhờ công dụng hỗ trợ Tensor Core, hệ thống sẽ sở hữu năng suất tác dụng đối với cân nặng công việc học máy của 660 petaflops (đó là sự việc xáo trộn giữa FP32 & FP16).

so với bảng xếp hạng Green 500 & Top 500 hồi tháng 11, Nvidia chỉ thử nghiệm một phần 33 nút của máy Saturn V thế hệ tiếp theo. Hệ thống đặc biệt quan trọng này còn có công suất cực to về mặt lý thuyết là một,82 petaflop với độ chính xác gấp rất nhiều lần & mang lại 1,07 petaflop trong thử nghiệm Linpack, cho hiệu quả giám sát và đo lường là 58,8%. Dù rằng hiệu suất đo lường và thống kê đó thấp hơn đáng kể so với Saturn V ban sơ, khối hệ thống này chỉ đốt cháy 97 kilowatt và dù sao cũng dành được 15,1 gigaflop tuyệt vời trên mỗi watt trên Linpack. Với 1 loạt các kiểm soát và điều chỉnh, năng suất rất có thể tăng đều và hiệu quả thậm chí còn cao hơn.

>>> Xem thêm: Lenovo SR530

 

Nvidia không cung ứng giá cho kế hoạch upgrade cho Saturn V thế hệ tiếp theo, nhưng DGX-1V có niêm yết là 149.000 đô la một pop, được tải lên. Mạng InfiniBand phức tạp hơn một chút trong khoảng time này & chúng tôi nghĩ rằng sẽ đắt hơn & ước tính rằng, tùy thuộc vào cách mạng đó được định giá (và Không bao gồm khối hệ thống tệp Luster hoặc GPFS bên ngoài), Saturn V mới này rất có thể có giá chỗ nào đó 100 triệu đến 110 triệu đô la theo niêm yết với bổ trợ ngăn xếp AI không thiếu thốn, không tồn tại bộ nhớ lưu trữ ngoài và mạng EDR InfiniBand khá mạnh. Nếu các mật độ Linpack được giữ – và không có Nguyên Nhân gì để tin rằng nó sẽ không – trên tất cả 660 nút, vẫn không được xây dựng, thì đôi khi Nvidia sẽ có xếp hạng khoảng chừng 22,3 petaflop trên Sao Thổ hoàn toàn thế hệ tiếp sau V trong bài kiểm tra Linpack, hệ thống đó sẽ trở thành hệ thống hiệu suất cao thứ ba được thí điểm cho Top 500 & rõ ràng trong số những siêu laptop hàng đầu trên trái đất (bao gồm cả các hệ thống chưa chạy Linpack & đưa chúng nó vào Top 500). Và với mức giá 90 triệu USD, bộ máy Saturn V thế hệ tiếp sau sẽ cung ứng Linpack điểm nổi DP với Ngân sách chi tiêu khoảng tầm 40.300 USD mỗi teraflop – nhiều hơn một chút đối với Saturn V dựa trên Pascal – nhưng đưa về hiệu quả đội giá / hiệu năng rất cao cho máy khối lượng việc làm học hành. DGX-1P có 170 teraflop công suất học máy tại FP16, nhưng DGX-1V có 960 teraflop sử dụng Lõi kéo, hoặc hệ số 5,6X. Ngay cả khi khối hệ thống Saturn V thế hệ thứ hai có giá bán đắt hơn rất nhiều, thì việc kiếm tiền từ các việc làm huấn luyện và đào tạo và suy luận về máy học đó sẽ tốt hơn ít nhiều. Sẽ rất hấp dẫn khi chứng kiến tận mắt đường phố sự thật định giá những khối hệ thống này & những hệ thống hybrid khác sử dụng bộ tăng cường GPU Volta ra sao. Nó sẽ là gian khổ, thực sự.

Dù khối hệ thống máy Saturn V thế hệ tiếp sau có túi tiền Nvidia để xây đắp & kế tiếp bán cho chính nó, điều này bộc lộ một số vốn khá lớn cho bất kể Doanh Nghiệp nào. Mỗi cá nhân rất có thể nghĩ rằng Nvidia đang bán máy cho chính nó với giá cả, nhưng không quá nhanh về điều này. Nvidia có thể có 1 bộ phận hoặc nhiều bộ phận đang sử dụng nó mua nó từ nhóm trung tâm dữ liệu Tesla với cái giá đầy đủ & tăng đáng kể lợi nhuận được báo cáo trong đơn vị chức năng Tesla đó. Chúng tôi nghĩ rằng Công Ty sẽ phân bổ sự khác hoàn toàn. Nhưng nó sẽ không ở đâu thấp như những gì Bộ năng lực Hoa Kỳ đang chi trả cho những khối hệ thống của Họp Báo Hội nghị thượng đỉnh Hồi giáo và số lượng giới hạn Sierra cho Phòng thí nghiệm đất nước Oak Ridge và Phòng thí nghiệm nước nhà Lawrence Livermore. Họ đang nhận được hai máy với đỉnh phối kết hợp là 325 petaflop với giá $ 325 triệu. Nếu hai phần ba flops thực sự có thể chạy Linpack trong số máy này, đấy là khoảng 15.000 đô la mỗi teraflop. Cơ quan chỉ đạo của chính phủ Mỹ đang nhận được 1 thỏa thuận khá, sự thật. Tiếp đến, một lần tiếp nữa, chú Sam đã trả tiền cho sự sáng tạo ra công nghệ này, chính vì thế có điều đó.

ngoài ra nguồn cấp tài liệu và vận tốc và giá cả mục tiêu của khối hệ thống Saturn V thế hệ tiếp sau, có những xem xét về bản vẽ xây dựng khối hệ thống & mạng để nghĩ đến khi xây cất một hệ thống như thế. Phil Rogers, một kiến trúc sư máy chủ tại Nvidia, đã mô tả tại 1 phiên tại SC17 về kiểu cách cấu tạo của máy Saturn V mới.
Khối kiến thiết căn bản là cụm mười hai nút trông như vậy này:

Điều đầu tiên bạn lưu ý từ hai Bức Ảnh Saturn V là bạn không còn, ở các mật độ năng lực này, làm quá tải các giá đỡ và vẫn sử dụng làm mát không khí. Chính vì thế, Nvidia chỉ đặt sáu nút DGX-1P vào trong 1 giá đỡ. Có 1 công tắc nguồn EDR InfiniBand 36 cổng từ Mellanox Technologies ở đầu mỗi giá để link những nút với nhau trong giá và trên những giá đỡ. Có một công tắc Ethernet 24 cổng 10 Gb / giây để liên kết những nút ra với bộ lưu trữ ngoài & với người dùng khối hệ thống, và một công tắc nguồn 24 cổng 1 Gb / giây được dùng để cai quản những nút DGX-1P trong cụm này .

cấp độ tiếp sau, ba trong những các cụm nhỏ đó được tổ chức thành một cụm có kích thước bình quân, mà Nvidia gọi là một đội, như thế này:

để tạo nhóm, một công tắc nguồn Giám đốc EDR InfiniBand của cổng 216 được dùng để tạo một tầng khác trong mạng cây béo và ghép chéo ba bộ giá đỡ với nhau.

các nhóm này sau này được coppy và links bởi những công tắc nguồn mô-đun lớn hơn nhiều trong tầng thứ ba của mạng cây béo, trong trường hợp này sử dụng bộ biến đổi Giám đốc EDR InfiniBand gồm 324 cổng, như sau:

Hình trên của Saturn V thế hệ tiếp theo cho thấy bốn hàng gồm 22 giá đỡ, mỗi hàng có tổng số 528 khối hệ thống & Hình ảnh này không ánh xạ vật lý tốt với các gì được nói trong bài thuyết trình của Nvidia trừ lúc các nhóm được tạo nên trên sáu hàng ( tức là tất cả chúng ta không hề nhìn thấy tất cả), không nằm bên cạnh nhau trong những hàng nơi có rõ ràng 11 giá đỡ trong 1 hàng. Một chiếc gì đó là sôi nổi, và chúng tôi không khẳng định chắc chắn những gì. Chúng tôi nghi hoặc rằng vì bản nâng cấp Saturn V không được thiết đặt không thiếu, đó là lỗi của 1 nghệ sĩ đồ họa, người có nghĩa là đặt 24 giá đỡ tiếp tục và 12 giá đỡ liên tiếp. Tiếp nối, tất cả vận động như nó cần.

Rogers đã giải thích một vài khoảnh khắc của a-ha-mai trong những công việc xây dựng các hệ thống Saturn V tại Nvidia. Mặc dầu chuyên môn của HPC rất có thể hỗ trợ, ngay cả với điều này, các điểm giống hệt bị hạn chế. Bạn tách các thứ không giống nhau cho khối lượng công việc AI dựa vào năng lực chuyên môn mở rộng của những khung máy học. Nếu bạn rất thích tinh chỉnh và điều khiển năng suất Gia Công, thì mật độ năng lực không hề khá cao, ít đặc biệt là không hẳn cho trọng tâm tài liệu làm giảm nhiệt độ bằng không khí mà Nvidia có vẻ như đang sử dụng. Ngoài ra, đối với trọng lượng việc làm học máy tại Nvidia, bộ dữ liệu ở bất kỳ đâu từ hàng chục nghìn đến hàng triệu đối tượng, có thêm tới terabyte dung tích lưu trữ trên các máy Saturn V & bộ đệm đọc mà các ổ flash đó cung cấp cho các nút đặc biệt so với những nút công suất học máy ngay cả những lúc nó không làm ra khác hoàn toàn cho Linpack.

>>> Xem thêm: sever Supermicro

nhìn toàn diện, những đơn vị phân phối chip lớn số 1 quả đât khá kín mít về những siêu máy tính xách tay (supercomputer) khổng lồ mà họ sử dụng để thiết kế và...
Ben trong cum sieu may vi tinh AI DGX SaturnV cua NVidia
Bên trong cụm siêu máy vi tính AI DGX SaturnV của NVidia
Có thể bạn quan tâm
x
x