MPI并行計(jì)算錯(cuò)誤求教
仿真設(shè)置錯(cuò)誤方法CST按照這個(gè)帖子的方法設(shè)置
read-htm-tid-29508-page-1.html
不過這個(gè)帖子的圖看不到,所以不清楚第四步(4 點(diǎn)MPI properties... 我的配置如下圖所示)有沒有設(shè)對。
然后我也通過運(yùn)行-cmd-cst安裝路徑執(zhí)行 mpiexec -register 注冊輸入帳戶和密碼(我用的是管理員帳戶administrator)
但仿真出現(xiàn)錯(cuò)誤。
Error starting MPI cluster due to non active service or missing credentials. please check the online help to correctly configure the MPI cluster. 8mLP5s!7
奇怪啊。兩臺電腦都裝了MPI, 也都注冊了的。怎么不對呢。
請各位大俠不吝賜教!
剛看了下HELP
按照If network does not provide access to a DNS, please specify all cluster nodes in hosts file, located in c:WindowsSystem32driversetc. For each cluster node, enter IP address and machine name as described in hosts file.
把另外一臺電腦的IP和計(jì)算機(jī)名輸入到Hosts
結(jié)果變成了另外一個(gè)錯(cuò)誤,不知道怎么解決了。
這個(gè)錯(cuò)誤是:Run aborted. Time Out reached after 19[s] Starting MPI cluster.
我又將殺毒軟件和防火墻都關(guān)了,但錯(cuò)誤依然出現(xiàn),這是怎么回事???
求教高手。
對于“Run aborted. Time Out reached after xx[s] Starting MPI cluster.” CST的官方解釋:(就寫在MPI Computing Guide的最后一段)
No More TCP Connections Possible
If your simulation seems to start and aborts after a while with a timeout error this might be due to a limitation of your operating system. Windows XP is quite restrictive regarding the number of TCP connections which can be established at a time. Thus, increasing the number of TCP connections allowed at a time probably solves this problem. Please ask your system adminstrator to increase this limit.
感興趣的問題:樓主用的是那個(gè)版本的CST?在Accelaration里面樓主的Token數(shù)目是幾個(gè)?
我也看到這個(gè)問題了,并把TCP的并發(fā)連接數(shù)改到999,依然出現(xiàn)這個(gè)問題。
我用的是CST2009 SP7,
專家說的,ACCelaration Token是什么?怎么改?
從CST 2010開始,CST公司使用acceleration token來統(tǒng)一為MPI Computing、Distributed Computing和GPU Computing做授權(quán)。2009還沒有token的概念。
第一個(gè)問題,版本。
第二個(gè)問題,SP是否一樣
第三個(gè)問題,MPI Properties設(shè)置是否正確。cluster nodes是要自己寫進(jìn)去的,寫上Host Name,還有每個(gè)節(jié)點(diǎn)的安裝路徑,緩存路徑,以及計(jì)算機(jī)構(gòu)架(估計(jì)都是Windows IA32或者IA64,構(gòu)架必須是相同的,每個(gè)節(jié)點(diǎn))。這些都設(shè)置好了,別忘了每一行后面有個(gè)Active要勾上!如果是2010版,可以點(diǎn)擊Test。。。來看看設(shè)置的是否正確。
第四個(gè)問題,樓主確認(rèn)你的問題是應(yīng)該用MPI來算嗎?用MPI在我們平時(shí)的百兆網(wǎng)里,未必比單個(gè)節(jié)點(diǎn)的快啊。。。
那些我都設(shè)置了。
應(yīng)該是學(xué)校的網(wǎng)絡(luò)太差的原因吧。
網(wǎng)絡(luò)太差?你的意思不會是在因特網(wǎng)里干MPI吧。。。
就是,看來只能把幾臺電腦組成一個(gè)小局域網(wǎng)或許可以
用普通廣域網(wǎng)要是能成功的話,CST的人就可以全解雇回家了……
CST原文:“via a fast interconnection network”……