《Docker容器常见故障排查及处理.docx》由会员分享,可在线阅读,更多相关《Docker容器常见故障排查及处理.docx(24页珍藏版)》请在优知文库上搜索。
1、近年来,以Docker和kubernetes为代表的容器技术日新月异,但我们在容器的使用过程中,也会碰到各种困扰和难题。本文针对DoCker容器部署、维护过程中,产生的问题和故障,做出有针对性的说明和解决方案,希望可以帮助到大家去快速定位和解决类似问题故障。Docker是一种相对使用较简单的容器,我们可以通过以下几种方式获取信息:1通过dockerrun执行命令,或许返回信息2、通过dockerlogs去获取日志,做有针对性的筛选3、通过Systemctlstatusdocker查看docker服务状态4、通过journalctl-udocker.service查看日志以下是整理的docker
2、容器类问题故障,分为9个类一、启动类故障1docker:CannotconnecttotheDockerdaemonatunixvarrundocker.sock.Isthedockerdaemonrunning?原因:DOCkeI未正常启动解决方式:Systemctlstartdocker2、can,tcreateunixsocketvarrundocker.sock:isadirectory原因:docker.sock不能创建解决方式:rm-rfvarrundocker.sock然后重新启动docker3、Jobfordocker.servicefailed.FailedtostartDo
3、ckerApplicationdocker.service:mainprocessexited,.REFa1edtoStartDOCkerAPC1XCatOnCOUnitdocker.serviceenteredfailedstate.原因:Selinux引起解决方式:etcsysconfig/selinux,把selinux值改为disabled重启docker解决4、docker:ErrorresponsefromdaemonvarlibdockeroverlayXXXXXXXXXXXXXXXXXXXXXXX:nosuchfileordirectory.原因:docker没有指定目录或文件
4、解决方式:Systemctlstopdockerrm-rfvarlibdocker*systemctlstartdocker重启run镜像启动容器5、docker:Errorresponsefromdaemon:Conflict.ThecontainernameXXXisalreadyinusebycontainerXXXn.Youhavetoremove(orrename)thatcontainertobeabletoreusethatname.原因:dockername重名解决方式:改名容器或者删除重建容器6、Error:Connectionactivationfailed:Nosuita
5、bledevicefoundforthisconnection原因:网卡配置问题解决方式:重启网卡7、系统重启后docker无法启动报错为:dockerO:iptables:Nochain/target/matchbythatname原因:docker服务iptables问题解决方式:重启docker服务systemrestartdocker8、Errorstartingdaemon:errorinitializinggraphdriver:drivernotsupported使用OVerIay2存储驱动启动dockerdaemon报错原因:daemon缺少配置解决方式:添加配置:etcdoc
6、kerdaemon.jsonstorage-driver:overlay2,storage-opts:overlay2.override-kernel-check=truen)9、Failedtostartdocker.service:Unitdocker.serviceismasked.未知原因:docker被mask解决方式:Systemctlunmaskdocker.Servicesystemctlunmaskdocker.socketsystemctlstartocker.service10Failedtostartdocker.service:Unitisnotloadedprope
7、rly:Invalidargument,etcsystemdsystemdocker.service:1Assignmentoutsideofsection.Ignoring.docker.servicelacksbothExecStart=andExecStop=setting.Refusing.未知原因:docker服务无法正常load解决方式:卸载docker,删除docker.service重新安装docker11docker-compose启动容器时报错:usrlibpython2.7site-packagesrequests/init.py:80:RequestsDependenc
8、yWarning:urllib3(1.22)orchardet(2.2.1)doesntmatchasupportedversion!RequestsDependencyWarning)未知原因:PiP相应组件版本不支持解决方式:pipuninstallurllib3pipuninstallchardetpipinstallrequests12docker容器重启故障强杀docker进程后,重启dockerodocker中的容器无法启动并报错dockerrestartXXXXXXXErrorresponsefromdaemon:CannotrestartcontainerXXXXXXX:con
9、tainerXXXXXXXXXXXXXXXXm:alreadyexists原因:旧容器未安全退出解决方式:docker-containerd-ctraddressrundockercontainerddocker-containerd.socknamespacecrmdockerstart容器13、docker重启错误-重启命令一直卡住Systemctlrestartdocker卡住未知原因:可能是启动的容器数量过多,或者磁盘IO问题解决方式:Systemctlstartdocker-cleanup.servicesystemctlstartdocker二、权限问题报错14Gotpermiss
10、iondeniedwhiletryingtoconnecttotheDockerdaemonsocketatUniX:varrundocker.sock解决方式:查看varrundocker.sock所在用户组将用户重新加入docker组中,usermod-aGdocker$USER15、chownsocketatstepGROUP:Nosuchprocess::FailedtochownsocketatstepGROUP:Nosuchprocessdocker,socketntrolprocessexited,code=exitedstatus=:FailedtolistenonDocker
11、SocketfortheAPI.原因:docker无法找到GroUP组信息,docker组有可能被误删除解决方式:groupadddocker16原因:非ROot用户管理DOCkeI时,权限不足解决方式:groupadddockerusennod-a-Gdockeruser17、dockercommit镜像时报错Errorprocessingtarfile(exitstatus1):unexpectedEOF原因:可能是权限问题引起解决方式:chmod+x加一个执行权限三、镜像和仓库问题报错18、原因:DOCker仓库无法访问解决方式:修改Docker仓库源为国内或者自建的仓库源修改etcdo
12、ckerdaemon.json19、推送本地镜像报错ThepushreferstoarepositoryXXXXGet原因:dockerregistry未采用https服务所致解决方式:etcdockerdaemon.json文件写入:insecure-registries:)20usrbindocker-current:Errorresponsefromdaemon:ociruntimeerror:container_linux.go:startingcontainerprocesscaused,exec:7binbash:executablefilenotfoundin$PATH.原因:D
13、OCker镜像自身问题或者DOCker引擎版本比较低导致解决方式:可以升级DOCker版本服务21、构建镜像,执行ChoWn-R非常慢原因:DOCker使用写时复制策略,所以ChOWn命令执行时,会将上层镜像文件全部复制到当前层,然后再修改权限,再写入文件系统。解决方式:不应该使用ChoWn-R这类大批量修改文件的命令22、dockerbuild构建镜像的时候报错:Messagefromsyslogdkernel:unregister_netdevice:waitingforIotobecomefree.Usagecount=1原因:dockerengine版本过高解决方式:dockereng
14、ine版本需要和docker内部镜像的内核版本匹配23、docker:Errorresponsefromdaemon:containerd:containerdidnotstartbeforethespecifiedtime-out.ERRO0133errorgettingeventsfromdaemon:contextcanceled原因:修改完dockerrootdir,重启后,下载镜像报错解决方式:重启docker服务或者重启服务器四、资源问题报错25、Dockernospaceleftondevice原因:空间不足解决方式:清理空间,删除未被使用的容器,镜像等资源dockersyste
15、mprune-a26varlibdockercontainers占用过大原因:日志文件占用过大解决方式:catdevnull*-json.log或者增加dockerd启动参数ZetcZdockerZdaemon.json,log-driver:json-file,log-opts:,max-size,2G,max-file,10n27maxvirtualmemoryareasvm.max_map_count165530istoolow,increasetoatleast(262144原因:系统参数默认配置过小解决方式:修改etcsysctl.conf里面的Vm.maxnap_count调大28Gotstartingcontainerprocesscausedprocess_linux.go:301:runningexecsetnsprocessforinitcausedexitstatus40:unknown.fromtimetotime