MySQL下PID文件丢失的相关错误的解决方法 |
本文标签:MySQL,PID 今天同事A找到我,说是Mysql server X的负载很高,查询很慢 。他自己捣鼓了一阵未果后,我们一起看了下 。 [root@redhat var]# uname -a Linux xxx 2.6.18-128.el5 #1 SMP Wed Dec 17 11:41:38 EST 2008 x86_64 x86_64 x86_64 GNU/Linux [root@redhat var]# mysql -u root -p -e “select version();” +------------+ | version() | +------------+ | 5.1.32-log | +------------+ 同事A的操作: [root@redhat var]# /var/lib/mysql/libexec/mysqld restart ----操作① 100708 14:43:53 [ERROR] Fatal error: Please read "Security" section of the manual to find out how to run mysqld as root! 100708 14:43:53 [ERROR] Aborting 100708 14:43:53 [Note] /var/lib/mysql/libexec/mysqld: Shutdown complete 发现问题后,他又想起来应该是用下面的命令重启 [root@redhat var]# service mysql restart ----操作② MySQL manager or server PID file could not be found! [FAILED] Starting MySQL...... CTRL+C取消 这时候 [root@redhat var]# ps aux | grep mysql 可以看到,系统又启动了一个Mysql进程,但是过一会后,会自动消失,这时候看日志可以发现以下错误: 100708 15:26:52 [ERROR] Cant start server: Bind on TCP/IP port: Address already in use 100708 15:26:52 [ERROR] Do you already have another mysqld server running on port: 30017 ? 100708 15:26:52 [ERROR] Aborting 然后后面我们一起看 。 [root@redhat var]# mysql -u root -p 提示: Enter password: ERROR 2002 (HY000): Cant connect to local MySQL server through socket /tmp/mysql.sock (2) 这时候同事A提醒我,可以重启服务没关系 。囧,o(╯□╰)o,他在建议我重启解决问题 。 [root@redhat var]# service mysql stop MySQL is running but PID file could not be found 然后去mysql data dir下面查看,果然没有pid file 。 复制代码 代码如下: show processlist;
可以看到里面有很多locked的查询,其中等待时间最久的一个是一个select查询,显示正在sending data,然后其余都是locked 。 复制代码 代码如下: kill 799
然后再运行 复制代码 代码如下: show processlist;
可以看到前面locked的线程在一个个依次执行,后面还有好多个跟线程U类似的select线程,全部kill掉后,被堵塞的别的正常的几个Update,select,insert操作很快就执行完了 。 [root@redhat var]# top <shift+m 按内存使用排序> <1 显示cpu使用情况> 这时候可以发现server负载恢复正常 。 下面解决无法正常关闭重启的情况 。 ERROR 2002 (HY000): Cant connect to local MySQL server through socket /tmp/mysql.sock (2) 和MySQL manager or server PID file could not be found! [FAILED] 的错误 。 [root@redhat var]# diff /etc/my.cnf /etc/my.cnf.bak 发现,配置文件没有问题 。 #我的server的hostname,mysql pid文件默认名字为hostname.pid,如果没有在/etc/my.cnf里面指定特定和pid filename和pid file path的话,这个文件是跟mysql数据在一起的 。 [root@redhat var]# diff /etc/my.cnf /etc/my.cnf.bak 这时候通过 #切换到mysql data dir(mysql的数据文件目录下) #你们的mysql data dir或许跟我的不一样哦,我的是/var/lib/mysql/var/ [root@redhat var]# cd /var/lib/mysql/var/ 获取mysql用户运行的mysql进程的 pid,然后导入到hostname.pid文件里面 [root@redhat var]# echo `ps aux | grep mysql | grep "user=mysql" | grep -v "grep" | awk {print $2}`>> redhat.pid #注意这里的redhat.pid跟hostname相关,这里是我的hostname.pid 将文件的属主和属主组改为mysql:mysql [root@redhat var]# chown mysql:mysql redhat.pid 然后运行 [root@redhat var]# mysql -u root -p 还是会提示: Enter password: ERROR 2002 (HY000): Cant connect to local MySQL server through socket /tmp/mysql.sock (2) [root@redhat var]# ls /tmp | grep sock 果然没有mysql.sock这个文件 但是这时候运行 [root@redhat var]# service mysql status 显示 MySQL running (10949) [ OK ] 恩,pid file文件恢复正常,然后运行 [root@redhat var]# service mysql restart Shutting down MySQL. [ OK ] Starting MySQL. [ OK ] 这时候再运行 [root@redhat var]# ls /tmp | grep sock 可以发现重启后,/tmp下有了mysql.sock这个文件 。 大家可以搜索下mysql.sock的用途以及使用产生等等 。 同事A的 操作① 导致pid 文件丢失, 操作② 导致mysql.sock文件丢失,大家感兴趣可以去vi mysqld脚本和server mysql脚本,然后导致service mysql status/stop/start/restart运行异常,导致命令行下mysql -u root -p登录mysql异常 。 Thats all. |