锐单电子商城 , 一站式电子元器件采购平台!
  • 电话:400-990-0325

转:AIX菜鸟成长日志

时间:2023-01-10 22:30:00 pi5c3257q集成电路

一、机器检查的基本知识


;X c2[!G7OFb0
检查通常由制造商或代理商进行。
B&XM7X%G;]0
首先是检查机房的温度和湿度。当然,这些一般都没有问题。
dCx;e5u x1J0
参考值:温度(摄氏度1040
g T [t HqqfJ3UV0
湿度8%80%ITPUB个人空间\ ]5Y&F"f!f
二是电源检测,只要不是新安装的,一般都没问题。ITPUB个人空间UH)upNH?*C)P3q(~
参考值:零-地电压小于1V
/|^ _$@2\? Y0
-地电压200-240V
mxTCw;YE T0
补充:当然59系列的机器相间380V,相地240VITPUB个人空间_]G XO*ShcXM
第三报错。
,M d6ne%JOyZ/gq0
主要检查硬件的永久性报错#errpt-dH|pg
{i!k%OK6O0h F~I(i0
软件永久性报错#errpt-dS|pg
@si b _3n;k^f0
还有系统又没又报警灯(如果不正常,在后面的帖子将会细讲)ITPUB个人空间'hM H Z,V U9I|
第三:机器的序列号:#uname -MuITPUB个人空间 o+Qt{ Y.EJ.b(? ?"Y
第四:操作系统版本:#oslevel -r      注:又时候不能使用是因为系统版本低的原因
We.r{3uL5z T0
第五:其他检测
;v9~dA:Y0
ITPUB个人空间 _Y(T+Fyq"}p?+e D
执行sysdumpdev –l 检查dump是否设置为always allow sysdump
'nWQ GxL+L*r0
执行sysdumpdev –e检查当前dump大小应该为主dump设备的大小的80%以下
^ a3E9N |6AGY0
执行lsvg -l rootvg检查有否"stale"状态的逻辑卷
%O){7~{/NX0
执行lsps -s检查内存交换区占用情况
g"b,k*kJ8q0
执行df –k检查文件系统的分配状况,一般不要超过80%
6nbDtxw0
执行lsdev –Ccdisk检查硬盘状态为available
Hhz1a*thQ0
执行lsdev –Ccadapter检查PCI卡状态为availableITPUB个人空间`v&t.PR3ed!vU G
执行lsdev –Cctape检查磁带机状态为availableITPUB个人空间#t7p.bA.s(r
执行lsdev – Ccprocessor检查CPU状态为available
,I[T KE6`0
执行 lsattr –El sys0|grep autorestart  检查系统crash后是否自动重新启动 ITPUB个人空间Iy}(AT8d8X
执行lsattr –El sys0|grep cpuguard检查CPU GUARD是否开启ITPUB个人空间%t;{ Y/H(GH\gQ1] I
执行lsattr –El mem0检查内存状态正常size=goodsizeITPUB个人空间? r#~[)u{f8@
执行 vmstat 2 
(Yj wEMH6~ph0
iostat,topas观察us,sy,pi,po,内存占用率,硬盘读写速度等检查是否有性能瓶颈
U;uT&|1wI%W5tr0
执行netstat –innetstat –rn观察网络状态
PR`nXkU%kJ0
执行entstat –d enX检测网卡运行速率与交换机速率是否匹配(网卡速率由10M半工改为自适应时,缺省网关会丢失。更改网卡速率后需要在系统中执行smitty route操作重新激活缺省路由。如果进行网卡速率的调整,请务必小心。)ITPUB个人空间p Z5ZEA
执行ping命令检查网络连接状况ITPUB个人空间gWwas#B
执行lsdev –C|grep aio 检查异步IO是否可用
\#W$_,OHs?0X0
执行lssrc –g cluster查看是否有三个进程均为active状态(这个主要看起了几个HA的进程了,有的时候是一个或两个)ITPUB个人空间)im jd"EE
执行/usr/sbin/cluster/clstat –a查看cluster状态是否正常ITPUB个人空间&e*D7Ue rI @
检查/etc/hosts确保双机配置中IP别名不会存在包含关系(share_ip1包含了share_ipITPUB个人空间0R ykss5s9?/X+o q
执行
4X ~u%c:j8_ @)~-i q0
more /usr/es/adm/cluster.logITPUB个人空间_3rZ(v m^!b1S
more /usr/es/sbin/cluster/history/*
*@J)l-K-xhL0
cat /tmp/hacmp.out
+h0rc'O`8Tc-L q0
检查这三个日志中是否有error或者fail.ITPUB个人空间-|i([lneV U jo
检查7133面板上的指示灯,如果黄灯亮则需要诊断问题ITPUB个人空间'wycq&CC:qR_5g
HOTspare 磁盘检测
S$A(lT`]0
1、检查是否有raid保护 # smitty ssaraid--->List All Defined SSA RAID Arrays
M[3vZA(^.G0
2、检查是否有Hot Spare # smitty ssaraid--->List Components in a Hot Spare Pool
/h$ZRL}?C.r6I$z0
 List All Defined SSA RAID Arrays查看7133à对于7133,执行Smitty ssaraid raid状态,正常应该为good状态。ITPUB个人空间i*e4Ld.cR%f
Change/Show Use of an SSAà对于7133,执行Smitty ssaraid Physical Disk查看7133硬盘状态,正常应该为member或者spare状态ITPUB个人空间 g7],{J%Hy
对于FastT,分别登录上两个controller (登陆方法后面详细讲解),查看是否有错误日志。
GOX-hSc f)n0
记录检查结果
ru h0t!@p,~0

3X_ Z v*Q:n%J0
基本就是这些命令吧,如果我有遗漏后面继续补充。
&TE#Hz+aKR2~ _e\0
ITPUB个人空间g:J w3jLf.g8b%Dh
对了,如果是华为和IBM的联合巡检就会多出几个项目:ITPUB个人空间 o4oP#j/} w6g6w8`

}LX8?@r En0
cpu (主频*数量)    #lsattr -El proc0
!Cb.u[yF4M0
内置磁盘个数:  #lsdev -Ccdisk     
9np/V3B&L l/?0
网卡信息:        #lsdev -CcadapterITPUB个人空间T7zJ#dd} S!u
-------------------------------------------------------------------------------------------------------------

二、DS8300 硬盘更换 

当前状况:DS8300硬盘损坏
[-nGH"?F9`E$}0

:Wsu o}x5~ `0
首先要在HMC上查看具体的报错信息,一般会有多个,先看最早的,因为一般可能几个错误报的都是同一个硬盘的错误。ITPUB个人空间N3a't*~XD
在报错中我们可以看见报错的Location Code,上面一般都是U****-D*-P*-T* 还有笼子号
ND^ d n4x ?0
顺着这个号找到错误的硬盘,DS83003个机柜,里面有控制台和两台570的是主柜,一般编号是D0,顺着就是D1\D2
J'iMK)p,yc$qe]d0
每个笼子有16块硬盘,找到笼子以后按T后面的数字数就行了,这个是前话,因为这个时候你还不能把盘。ITPUB个人空间apNY:i6r3|Oy

*I6?&vh5dU/[0
现在你在报错信息上面右键 Repair,(后面的步骤必须看清楚系统提示)然后弹出一个确认,你next,它就会提示说要切断该硬盘的电源,然后的界面不要急着NEXT,应该这里提示你更换后NEXT,这个时候也会弹出一个系统的帮助文件
EXg3eA}%O0

1Wni'y$l&MU0
现在你就可以拔硬盘了,正确的方法就是将卡扣拉松后等待70秒,然后硬盘角度微向上将硬盘慢慢抽出,这样可以避免将盘底部的电路划伤,在弹出的HELP上有图示。
vY#UO$GU0

s?#BY [8H0
然后插入新的硬盘,现在点NEXT,后面的基本就是漫长的等待了,大概2个小时左右会告诉你数据将会重建,如果有问题会CALL HOME等信息,关了走人就可以了,后面失败的几率很小了。
zzfs$yi B0
ITPUB个人空间k,E7h ^6[GV`|
这个就是DS8300的换盘步骤,希望有错误请老鸟们提出,我好改正。

三、630机器升级微码

ITPUB个人空间NmRr9Z!hg,n)]O.X6kk
ITPUB个人空间h}!_?~L!GX^P
这次是要将一台630微码升级到07045这个版本。ITPUB个人空间c5O,P"CX1h/b v&iV#L
首先下载微码了,这个不用说了,到IBM的网站上一步一步找就可以了。
%k tG#NF0
下载完是一个70286C4F.BIN 的文件ITPUB个人空间bVT5]9I? f~+c
ITPUB个人空间,f.Kx}L,V]_|a
然后在机器的  /tmp目录下新建 目录 /fwupdate  ,如果存在这个目录就一定要清空里面的内容,然后 把70286C4F.BIN 上传到这个目录。ITPUB个人空间_Fy/a~3?H

n)FaVM9^1T0
Ftp的命令都会哈:
7vU`'` ]m0
ftpITPUB个人空间 eJ8R!IM2I/K.o
open ***.***.***.***
r-y.bL3U+Py$^4H0
user/password
S$O9VM$n;S ?5{9Q0
prompt          关回显ITPUB个人空间5t.j(rY(BH r-eg
bin                二进制
*aH |4|#|c&ETz7T1{0
lcd F:/ITPUB个人空间&M0SfhND1_#t
cd /tmp/fwupdateITPUB个人空间9j1K L d x`R8p+e
mput 70286C4F.BIN
p i4AB#X jc0
byeITPUB个人空间!mpkhz`0I
-----------------------------------------------------------ITPUB个人空间3G`!Yz(H{Q&aF
升级前需要注意几个问题:ITPUB个人空间 K)r;},[;X6K
1.系统必须升级到5103版本以后
9~4EW T#t3V b0e0
2.HMC的版本必须是3.12 或更高,我这里用KVM,所有不管这个事情ITPUB个人空间4o;}!y8t M
ITPUB个人空间3n$v!w4N~ m(M/E.\
现在要确认客户已经停了所有业务,并且有除rootvg外其他的VG都没已经umount下去了。
;U q#jI S&E'] x6T0

7t-mke:G#[0
确认OK,如下:
2]/z&okU#vl0
#cd /tmp/fwupdateITPUB个人空间~/|8Q@G^Q;C
#chmod +x 70286C4F.BIN           加上执行权限ITPUB个人空间YJsKW c8QN"D E3^|

spoh_#k(u4Y,RY0
#./70286C4F.BIN            解压缩ITPUB个人空间E?1i)G$P2Wpqn&_
解压缩后会出来一个文件 3R070425.img
u^D2u{4N T ow0
然后最好校验一下这个文件ITPUB个人空间e8~ O }-EG
#sum 3R070425.img
2|'Y7~3dRB/y0
对比微码给出的校验值,这个最好还是要做,我们一个老大经常教导我们:警钟长鸣,事故为零
j'm Hu|n9fx0
这个的校验码好像是47728,详细的自己再查一下,以网站上的为准ITPUB个人空间2}[l:\]~
ITPUB个人空间f1Q7q V;|#y"LmH
校验没问题,现在就开始升微码
Cr5g1@:bwoE+Yy0
ITPUB个人空间7M {%L;ilL
#cd /usr/lpp/diagnostics/bin
4BG+Cq7wxXb/S0
#./update_flash –f /tmp/fwupdate/3R070425.img
m7_(Uwb W^5[j0

{6jUU5^2Op0
这个两个命令下去,机器重新启动,要大概半个小时,启动后就是新的微码了。ITPUB个人空间'Hb@\*d[;b Q3j
ITPUB个人空间q(UY'q"Fc0nx
启动后:
;LdP'jr]0
#lsmcode –cITPUB个人空间c IH4S![9WP/GR
那么ITPUB个人空间L!v%R.ldq
Platform firmware level is 3R070425

四、DS4700更换硬盘


.P#KB1n#i d0
首先谢谢各位的支持了。ITPUB个人空间YD/|2_&qX2} fY
今天继续.......
x!b-I&Z*ta0
今天客户的一台DS4700一个硬盘挂了,拿到备件后就到现场了。ITPUB个人空间 A)vLK+~2WI9s$? }J C

q H} ?K?0
先打开本本,然后找到那台出问题的DS4700,然后连到控制器A上。ITPUB个人空间#n/j^5xt0k R!F
这里我细说一下,DS4700后面左面的是控制器A,右边的是控制器B
6HL"z*I$I8VH0
每个控制器有两个电口,右边的为1号,左边为2号。IP地址如下:
&PD0A(vz~A,c|0

Lu.P'f6q RT0
控制器A--1 左口默认IP地址:  192.168.129 .101
fKl;[ s:Np _/o0
控制器A--1 右口默认IP地址:  192.168.128 .101
#]4^6Xf pl4Ks(Z4] U0

F#F/Y K*y0

W yq dx m'A0
控制器B--1 左口默认IP地址:  192.168.128 .102
4MoQk/~0
控制器B--1 右口默认IP地址:  192.168.129 .102ITPUB个人空间Wt7N1Q(Y(^6D5R-h2^0^

3mPDt.Lz,NG1G0
我连了控制器A的右口,然后配置IP地址为192.168.128 .102,掩码为255.255.255.0
nW!Jmq0
ITPUB个人空间q4r&N1l/ZQ*?YL;C#}
ping 192.168.128 .101 ,PING 的通的话打开Storage Manager ClientITPUB个人空间%X;?x/cL j
可以直接让它自动检测,检测不到的话你输入192.168.128 .101就连上了ITPUB个人空间,QFh6cm ~
ITPUB个人空间d;]4gSa|"et7y
然后先点上面的听诊器图标,这里报了两个错误,一个是PowerSupply的,另一个是Disk FailedITPUB个人空间;K"P8b ^ {4l
硬盘挂了是今天的主题,但是出了个电源的报错,先处理下
)K/@+n&U1B:e0
仔细看了一下说冗余电源没有连通什么什么的,仔细检查了下发现冗余电源的开关没打开,将开关按下,冗余电源点亮了,重新看出错,只剩下硬盘的。ITPUB个人空间1h l.R'Le LNy

T a7n#Z:f)c2Il#Mx0
这里多说一句,做任何操作最好严格的按照ServiceGuide一步一步来,不要急,尤其是搞硬盘这些,乱搞是会出问题的。
$I gT b9q:fv7H0
现在从SM里面先看看情况,明显的看到Slot 13上的硬盘已经是Failed的状态了,一个红色的叉,这个时候你千万要看清楚Hotspare盘是不是已经成功接管了,鼠标放到一个全灰底部有十字的盘上看看是不是写了已经是In Use状态,并且接管的是Slot13的盘,当这一切确认后,开始换盘。
'A*[P \i5JV0
ITPUB个人空间^8P@w@_&Ox-t:q
先仔细确认坏盘的位置(有黄色警示灯的,这个拔错了就没法说你了)
\d.E;Kl`0
先把手在机架上随便摸摸,或者带上机架上的防静电手腕
!E)~_;T'N:o[x(x0
把卡扣拉松,等待70秒,然后把坏盘小心抽出,再等待70秒插入新盘,推紧,然后推上卡扣。
H4GH.w%}'vfUny0

ohn Z^g0
这个过程中不要断开你的SM软件,这个时候你看SMSlot13上的那个盘上面会出现一个旋风的图案,那是盘开始Building了,等待大概2个小时左右,等这个盘的状态变成了和其他盘状态一样就可以了。这个时候Hotspare盘会恢复为空闲状态。
8Mt)Jy#q;{0
ITPUB个人空间x [2b+B}k~ iI
整个过程就完了。

五、IBM SVC 的基本安装步骤

ITPUB个人空间}|0s%s ^ i
SVC我还是先简单介绍一下吧,因为今天我也是第一次接触这个东西。
f/M eXYM7tZw0

"_,A{ L ]z.C1u&W0
SVC通俗的理解可以认为是一个统一的容灾平台,就是可以把各个厂家的存储产品虚拟成IBM存储管理格式进行统一管理。SVC有一种Image mode运行模式,可以透明的加入SAN SVC的基本功能,当SVC被加入到一个现有的SAN 环境中时,不需要做数据迁移,SVC 把现有的磁盘配置原封不动的继承下来(这是SAN VCImage mode),这样对服务器上的应用是完全透明的。
(_^:^I:j/UC\&e |8q0

P+M~#i?4}0
摘抄一段专业点的解释:ITPUB个人空间8|-v)J v|7u
    – 高扩展性,可以多结点cluster结构并行扩展ITPUB个人空间DD+Ws9B
    – 高开放性,支持所有主流的存储和主机ITPUB个人空间5]K/X)xx9K TxR
    – 独立性,位于中间层,不占用主机的CPU和存储资源ITPUB个人空间J;L6E(or#@X [
    – 高性能,IBM SVC目前具有业界第一的SPC-1测试性能,具有单独的处理器和CACHE帮助存储分担压力ITPUB个人空间L4U+z4gx2y
    – 出色的功能,SVC具有统一的容灾和虚拟存储的功能等,是不同存储具有相同功能。ITPUB个人空间3Pp#~zN&d AR
    – 集中管理,为用户提供统一的存储管理接口,不同存储平台可以统一管理ITPUB个人空间K(kZLo2XKuCl

{ [0g5_7u0
因为今天我的任务上架并调试OK,具体的配置慢慢来掌握吧。ITPUB个人空间K{'?V8Z3j
现在客户这里是两套SVC,具体的组件有这些,一个X机的服务器,一套显示屏+鼠标键盘,两个UPS电池,两个SVC服务器。ITPUB个人空间)jGb'cA1W a&rt)R

H!K k(y(p0^0
上架没什么说的 ,我的方式就是,最下面是两个1UUPSUPS间空了一个U保证散热,然后装上管理的服务器和显示屏,最上面装两个SVC。对了,有一点就是UPS上架前需要把前面板拆下,然后把电源线接上,接的时候会蹦出火花,是正常的,我当时接的时候吓出一身冷汗 ,赶紧看ServiceGuide,上面说这是正常的,我才松了一口气。
!Z4g_CxS`,BoR0

rm$N7{yQ:Er3D`0

9eC"g6a@ {v0
上架完了就比较重要了,这里有些讲究,SVC要最后上电!!!
]qn$G:}hyS2HF0
步骤如下:ITPUB个人空间;yJ*\E dy4`S
1.先连接控制台服务器和显示屏还有鼠标键盘
3?ZZ/N*o0
2.然后两个SVC与两个UPS分别用带的一个双头线连起来(每端一个视频接口一个电源接口)
f$w&Zh&C9G0
3.将每个SVC的电口和控制台的电口接到一个交换机上!
~2r o:t }n }$S0
4.分别将两台SVC13光纤口接入一台SAN交换机,另外的24口接入另一台SAN交换机。ITPUB个人空间:[.Cd1V\)q*ta$p
ITPUB个人空间/S G*ta^p p5W
这样准备工作就基本完了,注意:你如果没做34步骤直接点SVC那么会提示出错的,后面再调很麻烦。
Y/n5WN o @!{0F ^ V2qa@0

{lx^3G0
现在给UPS加电,理论上UPS加电后会充电3个小时才能起SVC,但是一般都是充好的,你点上个几分钟就看到绿灯正常了。
Fxp SO0
现在起控制台,控制台是装的Windows2003,一般不会有什么问题,直接就进系统了。ITPUB个人空间!}4ozi2`6W
现在要起SVC了,确认上面34步骤已经完成。点亮SVC后,几分钟后如果正常就会在前面板上显示"Cluster"字样,这样整个安装就完成了。
|/Z:m G }0

,e)OH R;R(piJ0
接下的就是添加节点和IP地址什么的了,都是在SVC的面板上完成,但是到现在为止我的工作就完成了,遗憾的是后面的安装没机会参加,也不太清楚了!ITPUB个人空间_K^j,Y

y~7OoK$|6]#]0
SVC目前的应用并不是很多,所有先写这些让大家了解一下,如果那位有更详细的安装经验,请共享吧!

六、DS4300控制器电池的更换

ITPUB个人空间 q$~QN9w|%W
先对关注的朋友们说声抱歉,很久没更新了,年前前后实在太忙了,没有整块的时间来整理笔记,现在继续吧。
I3F"w8h `X1bH!p,e0
ITPUB个人空间_t%Nq!ypV
下午是到一个客户现场更换一个Ds4300的控制器的电池,当然也叫FAStT600。这个是很简单的,但是我还是那句话,我写的是新手日记,让新手和我一起成长。ITPUB个人空间;C%{g+\?6}.H
ITPUB个人空间"GU1FeUsdk3ya
我先说下概念的东西,一会FAStT600一会DS4300,也许很多新手会晕,其实这是同个型号的机器,DS4000系列原本叫FAStT系列,IBM2004年将其更名成DS4000系列。新的DS4200DS4700DS4800因为是在更名之后才推出市场的,因此没有所对应的FAStT型号。ITPUB个人空间2OfXT9m+\.d
而旧的比如:ITPUB个人空间2Ex%UL9p5o*Z s
FASt100——>DS4100ITPUB个人空间 p,c(q }1k,{z5Y6y;L:v
FASt600——>DS4300ITPUB个人空间+V7O$Oj.Sl~J~qS
FASt700——>DS4400ITPUB个人空间Nri.b vL/Z%b,k
FASt900——>DS4500ITPUB个人空间3AF|cVc/~:h3MM`5C7E
......
H Ak?

锐单商城拥有海量元器件数据手册IC替代型号,打造电子元器件IC百科大全!

相关文章