LinuxSir.Org  
| 网站首页 | 论坛帮助 |

欢迎来到LinuxSir.Org!
您还未登录,请登录后查看论坛,或者点击论坛上方的注册链接注册新账号。


发表新主题 回复
精华主题  
主题工具
旧 06-12-19, 10:41 第 1 帖
troyme
 
troyme 的头像
 
 
注册会员  
  注册日期: Dec 2004
  帖子: 593
  精华: 1
 

标题: 用debian建立beowulf架构的高性能运算平台(无盘)


前一段时间给实验室做集群时写的一个大概的过程,包含无盘节点的建立,任务调度工具pbs后续开发版本torque和maui的安装,大概写了个流程,有时间的话会写一个详细的过程,还会把一个集群账户管理工具golden配置一下。具体过程可以到我的bolg http://troyme.spaces.live.com/ 来看看,也可直接邮件联系
上传的附件
文件类型: rar Beowulf架构集群建立.part1.rar (180.0 KB, 301 次查看)
文件类型: rar Beowulf架构集群建立.part2.rar (135.3 KB, 220 次查看)







__________________
IBM T23 升级X200了
  troyme 当前离线   回复时引用此帖
旧 06-12-19, 12:12 第 2 帖
molucule 帅哥
 
molucule 的头像
 
 
注册会员  
  注册日期: Jul 2003
  我的住址: NJ
  帖子: 1,371
  精华: 0
 

两台机器能不能做成一个并行的群?







__________________
T43 Etch 2.6.30-1
  molucule 当前离线   回复时引用此帖
旧 06-12-23, 00:16 第 3 帖
troyme
 
troyme 的头像
 
 
注册会员  
  注册日期: Dec 2004
  帖子: 593
  精华: 1
 

当然是可以的了
  troyme 当前离线   回复时引用此帖
旧 07-09-25, 10:35 第 4 帖
dollchow
 
 
 
注册会员  
  注册日期: Sep 2007
  帖子: 1
  精华: 0
 

安装好了。但maui显示找不到CPU资源是什么原因呢????
  dollchow 当前离线   回复时引用此帖
旧 07-09-25, 11:27 第 5 帖
FireMeteor
 
 
 
注册会员  
  注册日期: Jul 2004
  帖子: 324
  精华: 1
 

谢谢分享经验。
我想问一个问题。以前登录过一个基于nfs机群,发现nfs不稳定,经常有节点失效的情况发生。搞不清到底什么原因,你的机群使用过程中有遇到类似的问题么?







__________________
Customed kernel 2.6.16
testing+unstable
Gnome

Asus L1400B
PIIIM 1G
384M
  FireMeteor 当前离线   回复时引用此帖
旧 07-09-25, 12:47 第 6 帖
fender010 帅哥
 
fender010 的头像
 
 
注册会员  
  注册日期: Apr 2007
  我的住址: [天津]
  帖子: 2,445
  精华: 0
 

我就喜欢搞大的计算

对并行计算很有兴趣

感谢你的文章了
  fender010 当前离线   回复时引用此帖
旧 07-09-25, 13:17 第 7 帖
favoyun
 
favoyun 的头像
 
 
注册会员  
  注册日期: Mar 2003
  帖子: 1,697
  精华: 1
 

引用:
作者: FireMeteor
谢谢分享经验。
我想问一个问题。以前登录过一个基于nfs机群,发现nfs不稳定,经常有节点失效的情况发生。搞不清到底什么原因,你的机群使用过程中有遇到类似的问题么?
你要检查一下你的nfs server是否设置了网关?如果cluster和nfs不是在同一网络,那么nfs server最好不要设置网关。
  favoyun 当前离线   回复时引用此帖
旧 07-09-26, 12:25 第 8 帖
FireMeteor
 
 
 
注册会员  
  注册日期: Jul 2004
  帖子: 324
  精华: 1
 

引用:
作者: favoyun
你要检查一下你的nfs server是否设置了网关?如果cluster和nfs不是在同一网络,那么nfs server最好不要设置网关。
不是我配的系统,是做并行计算实验的上机环境,所以只能看到现象,不知道原因。
不过印象中那批机器内网环境都是192.168.1.0网段的
  FireMeteor 当前离线   回复时引用此帖
旧 07-10-16, 21:16 第 9 帖
troyme
 
troyme 的头像
 
 
注册会员  
  注册日期: Dec 2004
  帖子: 593
  精华: 1
 

引用:
作者: dollchow
安装好了。但maui显示找不到CPU资源是什么原因呢????

在/usr/local/maui/maui.cfg文件中加入红色的配置语句

# primary admin must be first in list
ADMIN1 root

# Resource Manager Definition

RMCFG[base] TYPE=PBS

这可能是我以前遗漏的一个细节,
现在我这里碰到个问题就是如何避免用户绕过pbs系统而私自提交任务,不知道大家有什么想法?
  troyme 当前离线   回复时引用此帖
旧 07-10-16, 22:51 第 10 帖
favoyun
 
favoyun 的头像
 
 
注册会员  
  注册日期: Mar 2003
  帖子: 1,697
  精华: 1
 

引用:
作者: troyme

这可能是我以前遗漏的一个细节,
现在我这里碰到个问题就是如何避免用户绕过pbs系统而私自提交任务,不知道大家有什么想法?
以前有位高手给我两个脚本,也是torque的手册里有的两个文件,可以限制用户私自提交任务,可惜我那时不认为有素质不高之徒,所以就没保留下来。
  favoyun 当前离线   回复时引用此帖
旧 07-10-17, 02:55 第 11 帖
d00m3d
 
d00m3d 的头像
 
 
资深版主  
  注册日期: Nov 2004
  帖子: 14,541
  精华: 10
 

奇怪,为何好文会走漏眼了







__________________
nO ^^4+73R wH1<h d!5+R0z j00 42E U$1N9 7r% LpHZ 4+ l3457 oN(&
  d00m3d 当前离线   回复时引用此帖
旧 07-10-17, 09:17 第 12 帖
troyme
 
troyme 的头像
 
 
注册会员  
  注册日期: Dec 2004
  帖子: 593
  精华: 1
 

引用:
作者: favoyun
以前有位高手给我两个脚本,也是torque的手册里有的两个文件,可以限制用户私自提交任务,可惜我那时不认为有素质不高之徒,所以就没保留下来。
看来还是要去翻翻torque的手册了。
我的理解是不通过pbs提交任务就不让用户通过rsh登陆节点,只有pbs分配了节点以后才允许用户通过rsh登录到那些分配好的节点。不知道这个思路合不合适
  troyme 当前离线   回复时引用此帖
旧 07-10-19, 17:03 第 13 帖
troyme
 
troyme 的头像
 
 
注册会员  
  注册日期: Dec 2004
  帖子: 593
  精华: 1
 

这几天看了下torque的用户邮件列表,基本上把问题解决了
编译torque的时候还有加上参数 --with-pam

这样安装的时候就会把一个pam控制文件安装到系统
然后修改/etc/pam.d/common-account文件
加入下面2行
account sufficient pam_pbssimpleauth.so debug
account required pam_access.so

在修改/etc/security/access.conf文件,加上
-:ALL EXCEPT root admgroup:ALL
这样节点就不能直接登陆了,只有通过pbs提交作业后分配的节点才能让用户直接登陆
  troyme 当前离线   回复时引用此帖
旧 10-12-10, 16:01 第 14 帖
realasking
 
realasking 的头像
 
 
注册会员  
  注册日期: Sep 2008
  帖子: 859
  精华: 0
 

找了好久,终于找到了,谢谢楼上所有的朋友^_^







__________________
CPU: Pentium Dual-Core T4400
RAM: DDR 3 1333 3G
M/B: Nvidia MCP79+ Geforce 310M

Desktop:
1.Windows 2008R2 with OFFICE 2010+Tex Live 2011+KDE 4.7.0
2.Fedora 12 x86_64+KDE 4.5.2 + fvwm with OpenOffice+Tex Live 2011
3.Arch Linux + fluxbox + KDE 4.7.0

My blog:
http://hi.baidu.com/realasking
  realasking 当前离线   回复时引用此帖
旧 10-12-10, 23:55 第 15 帖
zswlb9999
 
 
 
注册会员  
  注册日期: Jan 2005
  帖子: 878
  精华: 0
 

感谢掘墓者.兴趣所在,记下.
  zswlb9999 当前离线   回复时引用此帖
发表新主题 回复


主题工具

发帖规则
您 [不可以] 发表新主题
您 [不可以] 回复主题
您 [不可以] 上传附件
您 [不可以] 编辑您的帖子

已 [启用] BB 代码
已 [启用] 表情符号
已 [启用] IMG 代码
已 [禁用] HTML 代码
[论坛跳转…]


所有时间均为[北京时间]。现在的时间是 11:31


Powered by vBulletin 版本 3.6.8
版权所有 ©2000 - 2012, Jelsoft Enterprises Ltd.
官方中文技术支持: vBulletin 中文
版权所有 ©2002 - 2011, LinuxSir.Org