IT办公室的故事 2022-02

computers_2653005_1920.jpg
[封面源自:https://pixabay.com/]

一个人的办公室还在运营者。新学期出乎意料,并没有多少问题。虽然每天都有整整8个小时的工作,不过并不是很忙碌。

开学一周之后,所有应急的跟上课有关的事情基本上都处理完成;现在可以回到解决科研那边不是对解决问题需要的时间很苛刻的事情了。

趁还没有新的ticket,专门花时间了解一下高性能计算机群HPC需要做的事情。

之前对于HPC我需要做的事情就是处理一下预算,设备的维护,以及管理申请调用资源的申请人员等等管理层非技术方面的事情。同事J处理Slurm等等技术方面的事宜。

机械和航空航天工程系在去年年底通过NSF方面的资金购买了一套戴尔全新的HPC系统。

本来设备是放在校OIT的数据中心中,也由OIT管理。不过校方没有管理科研方面的设备的经验,所以要与我们IT办公室合作。

OIT知道同事J可以帮助他们处理系统内的问题。而我一般做的事情已经被校方包揽了,于是可以拍拍手,很悠闲的在“看台”上看着他们忙乎。最多是做几个申请账户,资源的页面,制作一个方便审核的平台而已。

但是同事J辞职了。任务一下子转到了我的头上……

首先要处理的事情就是在系统上面安装不同版本的软件。比如说有用户处理数据的程序是按照Python 3.7版本下运行的,并不是最近版本。那么系统上就需要有两个不同版本的Python同时运行。用户可以挑选自己中意的版本。

按照我其他工作的经验,我们都是用Docker,或者在Window系统的个人电脑上用Vagrant。在系统中架设一堆容器就行了,每个容器中只安装需要的软件。

我现在就要研究一下如何安装一个不影响HPC操作系统本身已经预安装的同一个程序。

像Python,MPI等数据分析使用的软件戴尔都已经安装好了。而目前用户现在需要的是几个不同版本的Git。

这个其实我有点搞不懂,编译器compiler需要不同的版本我可以理解,这个Git干嘛不用最新的?不过用户的要求就必须解决,反正那这个练练手,以后再复杂的也能办到。

同事J不是一个喜欢写工作日志和知识库文件的人。由于我们俩平时工作都很繁忙,我没有太过多的要求他做记录。

现在他走了,我只能通过戴尔留下的说明寻找解决方案。

花了几个小时翻阅xCat,lmod等等指令的文档;啥也没有。油管视频上也只是介绍如何调用已经安装好的模块;没人介绍怎么安装。

Git是RPM下载并安装的;我不可能用dnf或者yum安装。使用lmod又没有看到任何编译的介绍。

要不是从小在美上学,基本上专业知识看不懂中文,我都想搜索中文的文章了。

为啥没有任何介绍呢?不会就是用的Red Hat自己的安装方式编译源代码,跟HPC没关系吧?

潜意识中总感觉自己一直没有在正确的方向寻找方法。

到Github上面下载Git指定版本的tarball。Make加prefix设置存放编译后的可执行文件放到lmod目录下。看lmod现成的lua脚本文件无非就是价格可执行文件的链接,以及一大堆对此文件的介绍。

10分钟过后,编译完成;再抄了一个现成的脚本文件。测试HPC lmod模块。

一次性成功了!

真是踏破铁鞋无觅处,得来全不费工夫。没想到一个高大上的系统,原来是用了这么一个原始的方法管理。

唉,突然觉得很没有成就感。不管那么多了,完成任务就行了。校OIT看到我安装并测试成功,对我说:“写一个教程存下来。”

我心理想这么真的没啥可写的,就是手动编译安装程序啊。嘴上却说:“有点复杂,不写……”

这时候,突然明白了为啥当时同事J没写知识库文件:实在是没啥可写的……



0
0
0.000
5 comments
avatar

很厉害大佬👍👍👍

0
0
0.000
avatar

多谢夸奖,写得玄乎,其实没啥😁

0
0
0.000
avatar

身兼数职,不对,是两个人的活😂

0
0
0.000
avatar

一边干活一边想,如果和孙悟空,或者火影里的那乳头Naruto的影分身就好了~~

0
0
0.000
avatar

🤣还是别太累了吧 活是干不完的,而你只有一个😂

0
0
0.000