您当前的位置:首页 > 计算机 > 软件应用 > 网络应用

HTCondor下多台Linux计算集群的搭建

时间:03-12来源:作者:点击数:

环境:四台同网段的Linux虚拟机

  • 一台当作Central Manager
  • 一台用来Submit
  • 两台用来Execute

(一)对四台虚拟机分别进行此操作

apt-get update && apt-get install -y curl
在这里插入图片描述

(二)对三个角色分别进行如下操作

1)充当Central Manager角色的虚拟机

首先,查找此虚拟机的IP

命令行输入ifconfig -a,红框的即为虚拟机IP

在这里插入图片描述

将此IP替换192.168.87.132,输入如下命令

sudo curl -fsSL https://get.htcondor.org | GET_HTCONDOR_PASSWORD=wmcoder /bin/bash -s -- --no-dry-run --central-manager 192.168.87.132
2)充当Submit 角色的虚拟机

192.168.87.132用Central Manager角色虚拟机的IP来替换

sudo curl -fsSL https://get.htcondor.org | GET_HTCONDOR_PASSWORD=wmcoder /bin/bash -s -- --no-dry-run --submit 192.168.87.132
3)充当Execute角色的虚拟机(两台)

192.168.87.132用Central Manager角色虚拟机的IP来替换

sudo curl -fsSL https://get.htcondor.org | GET_HTCONDOR_PASSWORD=wmcoder /bin/bash -s -- --no-dry-run --execute 192.168.87.132

(三)执行condor_status查看

登录到提交计算机上的用户应该能够查看池中的执行计算机(使用condor_status),提交作业(使用condor_submit)以及运行(使用condor_q)。显示的为两台执行角色的虚拟机。

在这里插入图片描述

(附)部分bug及解决方案

因未设置密码问题无法使用root权限
在这里插入图片描述
如提前安装了htcondor,使用此命令卸载
sh -c "apt-get -y remove --purge htcondor && apt-get -y autoremove --purge && rm -fr /etc/condor"
方便获取更多学习、工作、生活信息请关注本站微信公众号城东书院 微信服务号城东书院 微信订阅号
推荐内容
相关内容
栏目更新
栏目热门