Re: [開箱] 打造高階工作站(4)-Xeon E5-2650 x2

看板	PC_Shopping
作者	s6414073 ()
時間	2013-08-12 01:48:18
留言	40則留言 (17推 0噓 23→)

看板PC_Shopping

我也是做理論計算的Group 主要都是跑DFT 如果有接觸的人應該都知道他的計算量非常龐大底下開了個話題那我也一起加入討論好了XD 順便供後人參考最近老闆也是買了5台這樣的機器我是負責將這些電腦叢集串起來我的規格跟h大幾乎相同機器規格: CPU Intel Xeon Processor E5-2650 * 2 MB SuperMicro X9DRi-LN4F+ * 1 RAM SuperMicro 16GB DDR3-1600 2Rx4 ECC REG * 8 HD WD 500G 64MB RE4 5003ABYX * 1 HD WD 2TBMB RE4 2003FYYS * 1 CHASSIS SuperMicro 825TQ-563LPB *1 OS用 SuSE Linux Enterprise Server 11 SP2 使用OpenMPI-1.6.5 MPI Library 使用Intel Fortran Composer XE 2013 for Linux (2013.5.192) 有使用Composer XE 2013內的 Intel Math Kernel Library 主要是BLAS LAPACK FFT 我有關掉HT 因為對於計算來說HT沒任何幫助反而還會變慢預留記憶體插槽之後要擴充用之前job太大使用的記憶體超過御風者fat node的上限(256GB) 就死掉了用2個node才解決此問題... NFS的主要規格: Adaptec 6805 8-port PCIe SAS 2.0 RAID Kit Seagate ST3300657SS SAS 15000RPM, 300GB (HD & Kit) * 8 做RAID0 為何不用SSD? 因為當file system多人讀寫 SSD的緩衝一定不夠撐 SCSI硬碟支援多人讀寫因此多人多工的環境加上SSD壽命問題完全不用考慮SSD 主要的軟體是VASP5.2和Gaussian09 這些軟體都是用Fortran寫的 Makefile 編譯參數 OFLAG 御風者用-O2 -ip 效能最好 Xeon用 -O3 -ip -axAVX 效能最好 AMD機器用他們的編譯器效能沒比較好連GotoBLAS效能也比MKL差結果AMD機器用intel的編譯器和MKL效能最好... 我們也是御風者的用戶御風者的是使用AMD的CPU 浮點運算效能頗弱(以DFT計算來說) 御風者是強在使用InfiniBand的網路架構所以還是要看程式怎麼寫程式寫得不好平行效率就非常差這裡的平行主要是MPI架構不討論SMP架構所以Code還是很重要因此影響到體系以VASP來說單純算結構Opt的話御風者單機24core效率最佳或是一台12core 走InfiniBand跨2個node 效率也不錯如果使用超過12core 只會變慢不會變快用越多core 會越慢如果VASP是做找過渡狀態使用NEB方法平行效率非常好 core越多計算越快御風者96core(2個node)是極限了效率這裡最好 Xoen的話5個node(共80core)效率最好我們也只有五台這樣的機器所以沒辦法測下去所以還是看你的體系決定用什麼電腦以結構Opt來說同一個job(學長從以前測到現在所以就以他的標準) Xeon E5-2650 *2 共16core 只需要8分鐘御風者 24core 需要32分鐘以上是單機跑跨node 我以NEB計算為基準的job Xeon E5-2650 *2 用5個node 80core 只要7小時御風者用2個node 共96core 將近7小時(不到7小時) 可能原因是1Gbps和InfiniBand的速度比起來根本是天壤之別... 所以這個比較沒啥意義... 新的CPU強是強在新的AVX指令集 Xeon的Cache也比較大跟廠商借了ivy的i7的頂級款用AVX2 還是一樣被sandy的Xeon E5 打假的.... 所以時脈似乎不是重點也難怪Xeon的CPU特別貴(廢話XD) 所以還是看你要算什麼體系而定... Gaussian09的話是使用OpenMP架構所以單機跑效能比較好 Linda那個跨node的library效能超差的所以就不裝了不過i7就夠用了如果用新的CPU 程式沒有重新編譯過效能是一定跑不出來的還有我不是資訊相關科系的人如果我專業術語有錯誤煩請糾正... 附上機房機器的兩張圖:http://ppt.cc/R9YV http://ppt.cc/pAYW 獻醜了... -- ◆ From: 220.136.177.243

※ 批踢踢實業坊(ptt.cc)
※ 文章網址: https://www.ptt.cc/bbs/PC_Shopping/M.1376243301.A.C32.html

→ ckgegg :快推雖然我真的看不懂 08/12 01:51

推 FTICR :專業!! 08/12 02:12

推 georgei0 :同理論計算淚推 08/12 02:18

推 NeedGem :想到這個... 因為自己工作上遭遇挫折, 所以只能... 08/12 07:03

→ NeedGem :眼睜睜看別人已經在玩多機器了,多機一定要碰上 MPI. 08/12 07:04

→ NeedGem :至於 openmp 只能單機使用... (默) 08/12 07:17

推 cerberus4523:以前弄伺服器曾經很想買個機櫃回家用，現在回頭想想 08/12 07:50

→ cerberus4523:我這種想法真是太智障了 08/12 07:50

推 abc0922001 :推~ 08/12 10:06

推 stupidfox :化學或生化嗎? 御風者不是在新竹的國家高速網路與 08/12 10:23

→ stupidfox :計算中心所以原po是交大的囉XD? 08/12 10:24

推 stupidfox :BTW 你們有試過更換I/O嗎，同樣的預算下跑SSD raid0 08/12 10:26

→ stupidfox :或丟ramdisk 時間/JOB的提升效果很明顯喔! 08/12 10:27

→ stupidfox :另外請問御風者7小時是算什麼樣的JOB呢@@? 08/12 10:28

→ s6414073 :SSD不適合多人多工 buffer不夠大 08/12 10:31

→ s6414073 :同時間有人讀有人寫 I/O一下就塞爆了 08/12 10:31

→ s6414073 :七小時就用NEB Method 找TS的JOB 08/12 10:33

推 stupidfox :Soga 了解:D 08/12 10:34

→ s6414073 :御風者在新竹科學園區沒錯但遠端過去就可以送JOB了 08/12 10:34

→ stupidfox :我們實驗室人少一個人大約可以分到一台工作站一一 08/12 10:34

→ stupidfox :不過工作站大概就原po那台的一半而已orz...虛弱 08/12 10:35

推 touyalin :只能說實驗室有那麼多預算真好.. 我們lab買不起.. 08/12 10:35

推 soem :By the way, 在這種應用下DFS會不會比NFS適合呢？ 08/12 10:36

→ s6414073 :可是軟體安裝這些我都是自己來很累... 08/12 10:36

→ s6414073 :請廠商弄還需要多個50萬吧 08/12 10:36

→ s6414073 :DFS有考慮要架了目前正在看相關的文章 :-) 08/12 10:38

→ touyalin :不過DFT比起CSD, CCSD來說, 計算量算是很小了.. XD 08/12 10:39

→ s6414073 :應該不會哦一個晶胞 500多個原子一次就要一個禮拜 08/12 10:41

→ s6414073 :丟fat node的long queue還算不完= = 08/12 10:41

→ s6414073 :因為御風者有設wall time 所以時間到就把你砍掉 08/12 10:42

推 QuentinHu :完全看不懂先推 QQ 08/12 13:14

推 KrisNYC :有神快拜 .... 08/12 15:28

推 cckkyle :快推 08/12 18:06

推 smkingpk :咦我想問的是~現在SCSI不都已經轉為SAS了? 08/12 21:51

→ s6414073 :是所以用的是SAS 只是我拿SCSI來舉例 08/12 22:16

推 maniaque :樓主有講SAS 先呀,只是說真的還是習慣稱之為SCSI 08/12 22:45

→ maniaque :而且 SAS 的第二個 S ,也還是 SCSI 沒有錯.... ^_^ 08/12 22:46

→ s25g5d4 :Serial Attached SCSI! 08/12 23:26

推 hotdogee :Cool! 08/13 14:07

推 tsstho : 感覺超屌的我推 09/10 17:22

Re: [開箱] 打造高階工作站(4)-Xeon E5-2650 x2

您可能感興趣

熱門文章